查看原文
其他

冬奥进行时丨科大讯飞打破沟通界限 向世界传递中国科技温度

iFLYTEK 科大讯飞集团 2023-10-22

1932年洛杉矶奥运会,自动计时系统首次将误差精确到0.01秒;1980年美国普莱西德湖冬奥会,一次尝试开启了“人工造雪”时代;2018年平昌冬奥会,迎来了5G技术的全球“首秀”……


奥运会不仅是体育技能的较量比拼,也是科技进步的集大成者,新技术、新成果的盛大“秀场”。充斥于各个角落且又相互较量的最新科技应用,无不让世界级赛事更具看点。而今,冬奥会正式进入“北京时间”,“科技冬奥”再次站在了舞台中央。


赛事成绩多语种呈现,跨国界交流无障碍,让视障人士“听见”文字,让听障人士“看见”文字……作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,科大讯飞为北京2022年冬奥会提供自动翻译和相关的多语种语音转换、语音识别以及语音合成等硬核技术,用技术说话,助力实现赛场内外的沟通交流无障碍。



凝科技之智、聚科技之力,科大讯飞希望能向世界传递“中国智慧”的温度,为北京2022年冬奥会和冬残奥会增绘人文色彩。


突破“语言关”,交流无国界


无障碍交流是人类千百年来的梦想,北京2022年冬奥会和冬残奥会不仅实现了这个梦想,还让奥运精神的落地更有温度、更显人文关怀——科大讯飞面向冬奥会场景的多语种自动语音及语言处理关键技术无处不在,全方位保障了来自不同国家和地区选手、教练、游客及志愿者等人群之间的语言交流。


早在2019年,科大讯飞就组建了北京2022年冬奥会和冬残奥会示范应用专项团队,借助先进的机器翻译和多语言语音转换技术,围绕“人和人之间沟通无障碍、人和组织之间沟通无障碍、人和赛事之间沟通无障碍”三大方向,加速应用场景落地。


两年多来,已先后研发了面向冬奥场景的多语种智能语音识别与合成、具有冬奥特征的多语种机器翻译和基于交互问答的冬奥多语种信息获取及交互等核心技术,构建了面向冬奥会场景的语音及语言服务平台,提供语音识别、语音合成、机器翻译、自动问答等技术能力,支撑冬奥虚拟志愿者、便携式终端设备、赛事多媒体办公和信息发布系统等产品应用。



为实现“人和人之间沟通无障碍”,科大讯飞的双屏翻译机可支持60个语种的在线语音翻译、16个语种的语音离线翻译、中英16个垂直行业的翻译,翻译效果好、响应时间快、操作便捷自然。特别是针对冬奥会使用场景,加入了数十万专业词汇以及行业术语,覆盖各类体育运动和裁判用语,可有效满足各类人群的跨语言沟通需求。



突破“手速关”,交流无障碍


更快、更高、更强、更团结,这是奥林匹克精神,也是奥运科技的变革,更是讯飞赋能冬奥的追逐。


为保障“人和组织之间沟通无障碍”,科大讯飞面向冬奥办公与信息发布应用场景,基于中英文语音转写及翻译核心技术,推出听见转写系统,支持现场上屏发布、媒体采访等,实现及时的新闻稿发布,中英文整体转写准确率可以做到97%以上。



讯飞听见转写系统,可支持语音实时识别、翻译、记录,并将识别和翻译结果形成字幕投屏展示,转写和同声传译的效果、实时性突破了实用门槛。利用机器自动翻译及转写,减轻了对翻译人工服务的依赖,让现场工作人员不必再过“手速关”,大幅提高了多语种沟通效率与视听体验,在大会场景下具备很好的展示度。


在此前的奥组委日常办公中,讯飞听见转写系统已经入驻了交通部、志愿者部、服务部等各个部门累计近50间办公室,迄今已提供超过1000场沟通无障碍服务保障。


突破“技术关”,交流无限制


“北京明天的天气如何?”

“速度滑冰女子1000米比赛的场地在哪儿?”

“高山滑雪的男子全能是什么?”


冬奥虚拟志愿者“爱加”堪称是个“全能通”,不仅能进行“面对面”的冬奥赛事、赛程实时互动交流,还能陪你玩一把冬奥知识游戏大PK,周边交通、文化、旅游等咨询问答也不在话下。这背后,是科大讯飞提供的语音识别、语音合成、机器翻译和自动问答等技术能力支撑。



语言是一门艺术、一种智慧,也是促进世界相知相融的重要工具。北京2022年冬奥会和冬残奥会上,科大讯飞担纲官方自动语音转换与翻译独家供应商,是科技发展的大势所趋,也是自身核心技术发展的水到渠成。然而,由于自动语音转换与翻译涉及技术众多,难度和挑战非常大,科大讯飞在为赛事提供技术支持的过程中,也遇到了不少难点。


在多语种语音语言技术研发领域,由于涉及60多个语种的语音识别合成翻译等技术研发,除了中英文之外,针对其他语种(比如瑞典语、波兰语等)语料比较少的问题,通过源头核心技术创新,在端到端建模和无监督、弱监督训练方面取得重大突破,例如在多语种语音识别方面,100小时有监督数据加上大量无标签语音和文本数据可以达到1万小时有监督训练的效果。这项技术也在OpenASR国际低资源多语种语音识别挑战赛的15个语种受限赛道和7个语种非受限赛道系统,全部取得第一名的成绩。


在语音同传技术实时性和效果的平衡上,我们知道,同传要解决两个问题,第一是要将语音识别转写出来,第二是将转写的内容翻译出来,以前这两个任务是单独建模先后完成的,现在我们提出“流式的CAAT语音翻译框架”模型,在一个模型内解决这两个问题,从而实现同传效果的“又快又好”。这些技术创新,对于保障冬奥场景下的语音同传应用效果起到非常关键的作用。


在多语种自动问答中,融合了数字人生成、语音识别、语音合成、自然语言理解等多项技术,并结合FAQ问答、文档集合问答、知识库问答和基于文本蕴含识别的多源答案验证等技术进行知识库构建,最终实现人们可以和冬奥虚拟志愿者“爱加”用六种语言自由互动交流。



当技术的种子落在中国的土地上,每一个中国人都能听见花开的声音,因为我们的理想,正在点亮每一种生活;越过语言的边界,打破时间的极限,跨过次元的壁垒。我们相信,技术总能冲出沟通障碍的重围;文字可以被听见,声音可以被看见,站在冬奥会赛场上,我们用技术为世界温暖赋能,共享冰雪盛会。


科技冬奥,是竞技体育与技术创新的碰撞与交融,科大讯飞将为纯洁的冰雪、激情的约会添上一份智慧的魅力,让中国声音、中国故事传得更远、更清晰,助力创造北京冬奥会和冬残奥会精彩、非凡、卓越!


*文中数据来源于实际应用反馈

更多回顾







知道你“在看”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存