查看原文
其他

讯飞输入法用户突破6亿 人工智能持续赋能【转发】

科大讯飞 语言资源快讯 2020-01-18



随着“人工智能”(AI)第三次浪潮的到来,AI不断渗透人类生活方方面面,赋能各行各业,越来越多的领域正在开启新的篇章。我们每天用的输入法与AI如何结合,让输入更便捷、更智能?6月12日下午,讯飞输入法在京成功举办了主题为“爱输入•更懂你”的媒体见面会,同期启动“方言发音人招募”公益行动。通过AI赋能讯飞输入法,给出确切的答案。讯飞输入法内置智能语音交互、图像识别让整个输入过程更自然;语音识别、语音合成以及机器翻译与各类场景大融合,不只提升输入效率,更懂你的表达。







讯飞输入法诞生之初,便确定以语音为核心,业界首家加入智能语音输入。近一年来,讯飞输入法在输入效率和智能化方面取得了长足的进步,不仅做到一分钟识别400字,还支持多语种实时语音翻译、超长语音输入、耳语输入、离线语音输入等功能。值得一提的是,科大讯飞在感知智能、认知智能以及两种智能深度结合等领域均取得达到国际领先的研究成果,而这些AI黑科技正应用到讯飞输入法上,率先在行业内做到通用语音识别率98%。经过8年的成长,如今讯飞输入法用户数突破6亿,语音渗透率保持逐年上升态势。



01



语音识别率从97%提升至98% 更懂你的表达


“讯飞输入法之父”翟吉博表示,输入法本质是一种人机交流的媒介,也是人与人沟通的重要工具。语音作为最自然、最便捷的输入方式,深刻改变用户习惯。语音输入更精准的方法离不开数据和算法。讯飞输入法从人脑神经科学入手对人类记忆进行仿生,实现大量无监督的数据去辅助有人工标注的数据。受图像领域CNN应用的启发,科大讯飞独家研发了DFCNN语音识别框架,相比传统语音特征作为输入,有效降低信息损失,非常出色地表达语音的长时相关性。同时,借鉴图像识别中效果最好CNN模型,从而使通用语音识别准确率提升至98%的水平


此外,讯飞输入法以自然语言交互方式——语音修改来解决当前技术束手无策的 2% 不准确。针对中文复杂多样性,讯飞输入法语音修改结果加入多候选,有效提升了识别准确率。



02



方言识别拓展至23种 启动方言发音人招募

https://v.qq.com/txp/iframe/player.html?vid=k06840jtnl5&width=500&height=375&auto=0


依托科大讯飞对AI技术及语言深度研究的积累,采用Multi-lingual多语言建模,通过多方言数据共享方式训练;辅以Global Phone全球音素集,从声学层面的相似性统一各方言的音素定义,对方言“语图谱”模型做进一步精进,从而有针对性地提升方言语种的识别能力。截至目前,讯飞输入法已支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。本月底,讯飞输入法即将上线苏州话识别,方言识别语种将扩充至23种


随着经济、文化活动的全球化现状以及区域经济的迅速发展,导致主流语言或通用语言更加强势,同时也使弱势语言的交际功能不断衰弱,甚至濒临消亡。目前世界上的语言大约有6000~10000多种,据语言学家预测,大部分语言将于本世纪末消失。因此,濒危语言保护(以下简称为“语保”)已经成为了一项极重要而迫切的工作。



讯飞输入法品牌负责人李强军现场介绍,2017年讯飞输入法对外发起“方言保护计划”,建立“中国方言库”,用智能语音留存、发展承载传统文化积淀的方言,积累了海量方言数据,是讯飞输入法得天独厚的深度学习素材,方言识别率日趋精准。本次见面会上,讯飞输入法启动“方言发音人招募”公益行动



科大讯飞多语种高级研究员祖漪清在现场讲述了方言势微的现状。现在我们身处人工智能崛起的时代,利用人工智能技术进行濒危语言、方言系统地研究一个语言的语音结构、语言结构,实现对一个语言的完整“复制”迫在眉睫。


科大讯飞提出的“人类语言大互通计划”,用AI为人类在语言能力上赋能,点亮全人类的语言互动和命运共同。方言保护作为至关重要的一环,讯飞输入法肩负起方言保护的重任,通过“方言发音人”采集的标准方言语料,持续优化增添方言识别能力,并开放给用户使用,有着极其重要的文化和社会价值。



03



新增面对面翻译  英日韩俄即时对话无障碍

https://v.qq.com/txp/iframe/player.html?vid=w0685k61cnt&width=500&height=375&auto=0

为践行“人与人无障碍交流”的目标,同时也让更多用户体验AI便利,讯飞输入法尝试将语音识别、语音合成以及机器翻译等新技术融合在一起,新增面对面翻译,支持中文与英日韩俄多语种即时翻译。值得一提的是,对话双方各讲母语时,另一方就会同步看到翻译结果;同时加入语音播报,让输入法有了“嘴巴”。




04



新增拍照输入 图片文档所拍即所得


以往从文件、图片中提取文字,需要手工录入,不仅效率低下而且可能出现错字。讯飞输入法新增了拍照输入,利用OCR智能扫描相当于给输入法安装了“眼睛”,不仅能识别各类印刷体,对于手写识别准确率也高达90%以上,方便用户编辑、归类、管理,省去大量录入时间。



作为高效输入的一种补充,拍照输入可以捕捉输入过程中多场景下的文字,满足用户多样的需求,助力讯飞输入法成为未来最智能化的输入法。


未来,讯飞输入法将继续结合AI,不断提升语音识别、语义理解、机器翻译、图像识别、语音合成技术能力,赋予输入法更多想象空间。

以上内容均转自科大讯飞

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存