科大讯飞携港立法会破“AI+粤语”难题

原创 <{$news["createtime"]|date_format:"%Y-%m-%d %H:%M"}>  乐居财经 6782阅读 2025-08-09 22:30

Ai快讯 日前,香港特区立法会宣布,与科大讯飞联合打造的搭载AI实时字幕功能的智慧誊录系统“智识听”正式上线。

“智识听”深度适配会议场景,运用科大讯飞中英粤混读引擎,结合声纹识别和字幕与帧画面对齐压制技术,能实现会议直播中文字和视频画面同轨显示。公众可通过网站平台收看带实时字幕的会议直播,无障碍获取资讯。

此前,机器转写、同传因延迟高、专业术语错误率高、不同语种切换不便等问题,在大型会议活动中仅作参考。但随着AI技术快速发展,谷歌、科大讯飞等企业在多语种智能语音技术上发力。在中国,多种地方方言和民族语言给会议记录转写、同传翻译等智能语音场景带来挑战,传统语音转写工具在多语种夹杂场景中会频繁出现转写断层。

针对粤语、普通话、英语混合使用常见的香港场景,科大讯飞项目团队整理2.5亿汉字的中英文对照和20万个高频粤语词汇作为语料库,提升技术实际应用效果。目前,“智识听”实时字幕准确率达96%,人机结合后准确率可达99%,能将1分钟发言稿处理时间从8 - 12分钟缩短至3 - 4分钟,摘要整理效率提升10倍。后续还将推出繁体字幕生成、一键会议概要生成等功能,在“AI + Power 2025”活动上获评“年度AI项目大奖”。

以“智识听”为代表的讯飞听见多语种会议系统,支持粤普、中英、粤英混合识别及三语双向互译,提供多语种操作界面,支持私有化部署确保数据安全。其同传功能可快速传达会议信息,结构化数据管理便于回溯查找,上传音频转写处理高效,能智能区分发言人,辅助快速成稿。

这一系列成果背后,是科大讯飞在智能语音技术领域的深厚积淀。2024年,其牵头的“多语种智能语音关键技术及产业化”项目获2023年度国家科学技术进步奖一等奖,构建起具有中国自主知识产权的多语种智能语音技术体系。早在2014年,科大讯飞就开始研究小语种智能语音技术,与高校合作积累资源、沉淀技术。针对小语种训练难题,团队设计全新多语种通用音素体系和基本语言单元;为解决复杂场景难题,提出多源知识增强的可信文本生成技术。

科大讯飞相关负责人认为,大模型时代的语音技术是推动万物互联和原有人机交互场景重构的产业机会。未来,大模型技术将提升语音识别、合成和翻译效果,拓展智能语音技术使用场景和应用价值,加速通用人工智能时代到来。目前,科大讯飞在香港形成多元化业务布局,以香港为“桥头堡”推动中国人工智能技术出海,其多语种智能语音技术支持69个语种,为众多中国企业设备提供语音交互支持,保障“中国智造”走出去。

(AI撰文,仅供参考)

相关标签:

Ai滚动快讯

重要提示: 以上内容由AI根据公开数据自动生成,仅供参考、交流、学习,不构成投资建议。如不希望您的内容在本站出现,可发邮件至ljcj@leju.com或点击【联系客服】要求撤下。未经允许,任何单位或个人不得在任何平台公开传播使用本文内容。

网友评论