查看原文
其他

科技前沿|计算机语音识别率首次媲美人类

2016-10-31 科技日报 慧天地


(更多行业资讯,请留意文章后“推荐”)

科技日报北京10月28日电 (记者姜靖)据麻省理工学院网站近日报道,微软雷蒙德研究院开发出一种机器学习算法,使计算机对指定主题对话的语音识别率增至94.1%,首次与人类水平相当;对亲戚朋友日常对话的识别率达88.9%,甚至比人类略胜一筹。

美国国家标准与技术研究所2000年时曾发布一个数据库,以帮助解决语音识别难题。该数据库包含的电话录音有些是个人之间既定话题的谈话,其余则是亲戚朋友间的随意交谈。

结果显示,人类在转录语言时的出错率约为4%,即每一百个字中人类会错误地转录4个字。过去,机器的表现距这一数字相去甚远。如今,计算机在把个人之间既定话题的谈话内容转录成文字时,出错率为5.9%,而转录亲戚朋友间任意主题的随意交谈时,出错率为11.3%。“这比预想的还要好。”微软研究人员茨威格表示。

随后,茨威格基于不同层数的卷积神经网络来优化他们自己的深度学习系统,从而让系统的每一层能够识别语音的不同方面。然后他们用训练数据作为标准来设置机器,以便识别普通语音并且让他们能够适应测试数据库。

总的来说,微软的语音识别系统与人类具有相似的错误率,但它造成的错误类型与人类截然不同。微软机器最常见的错误是混淆反馈声音。 相比之下,人类很少犯这样的错误。对此,茨威格认为,原则上机器没有不能通过训练来识别反馈声音的理由,出现误差可能与噪声在训练数据集中标记的方式有关。

微软研究人员表示,计算机语音识别能力正超越人类水平,“这对计算机行业的重要意义不亚于图形用户界面”,其中既包括Xbox这样的消费娱乐设备,也包括即时语音转文字等可访问性工具,以及“小娜”这样的个人数字助理。

【慧天地】敬告

【慧天地】是服务测绘地理信息行业的公共公益平台,旨在:传递政府声音;发现行业亮点;增强学术交流;共享优质资源;关注本硕博学子的学习、就业;重视地理信息文化的传播、弘扬。【慧天地】有一小小的梦想:让更多的人了解测绘地理信息在国计民生中的重要作用;【慧天地】有一浅浅的认识:我们要跳出本行业固有的思维局限,才能有更广阔的天地!跨界融合是必然趋势,具有国际化视野才能做大做强!【慧天地】高度重视版权,对于原创、委托发布的稿件,会烦请作者、委托方亲自审核通过后才正式推发;对于来自网站、期刊、书籍、微博、微信公众号等媒介的稿件,会在作者栏或者文章末尾显著标明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的优质作品,转载时如出现侵权,请及时后台留言,我们会在第一时间内删除。先做人,后做事;心有多大,舞台有多大。感谢大家一直以来对【慧天地】的关注和支持!


欢迎大家推荐精品稿件

 【投稿邮箱】

 geomaticshtd@163.com

“有兴趣加入【慧天地】交流群的朋友请扫描下方二维码与赵楠@Zn联系。”

编辑:陈   兴  李茂永

审核:李茂永  朱林烨

指导:万剑华教授(微信号928135614)



推荐

(限于篇幅 更多精彩不再全部列出 请在相关系列中查看)


点击下文直接阅读

科技前沿|颠覆性技术和社会变革

科技前沿|北京大学国家发展研究院院长姚洋:中国应走颠覆性创新与连续性创新相结合的创新道路

科技前沿|谷歌、Facebook、微软等各大巨头纷纷进军VR行业,苹果可能后来居上!

新闻报道|同济教授成功研发“高精度室内定位技术” 实现1米精度定位

传统地图新机会:开发文化创意产品“挖”财富

小慧推荐|机器学习的前世今生:一段波澜壮阔的历史

小慧推荐|颠覆自然!智能鸟(SmartBird)从德国飞来!

小慧推荐|这条全国欢呼的重大新闻中,一个与袁隆平同样重要的人却被忽视了

喜欢的话别忘记点击小手给小慧点赞哦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存