查看原文
其他

Microsoft Translator:消除面对面交流的语言障碍

2016-12-14 John Roach 微软丹棱街5号





James Simmonds-Read 在伦敦的儿童福利会工作,他的工作是向移民和难民提供帮助,而他的工作对象大多是贩卖人口罪行的年轻受害者。对于 James Simmonds-Read 而言,克服语言障碍是至关重要的。

 

“他们都是来寻求避难的,其中相当多数人都面临语言障碍,” 他说,“我们不得不频繁借助翻译。” 然而,人工翻译的介入又带来了额外的挑战,因为它意味着这些年轻人必须面对第三方译员说出一些敏感信息。

 

最近,儿童福利会找到了一个更好的解决方案。他们开始使用 Microsoft Translator 的现场翻译功能(Live Feature),可借助已联网的智能手机、平板电脑和个人计算机等设备为多人、多语言、面对面交谈提供现场翻译。


https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=s0355r8gpga

Simmonds-Read 说,这项技术让他不再需要第三方译员就可以与儿童福利会所服务的年轻人直接沟通。

 

支持多人、多语言、跨设备的现场翻译技术由位于华盛顿州微软雷德蒙研究院机器翻译组开发。这项技术提供了丰富多样的使用场景,解决了用户在面对面时由于语言不通而导致交流不畅的痛点。例如帮助身处异国的旅行者更方便地与酒店前台、出租车司机和博物馆导游等进行交流。教师也可借助该项技术与只会说其他语言的学生家长进行沟通。在纽约市的一个试点项目中,这项技术还被用于帮助非英语人群申请由州政府颁发的身份证。



微软研究院 Microsoft Translator 产品战略总监 Olivier Fontana 说:“我们的终极目标是打破语言障碍。” 这项技术适用于一对一交谈(例如旅行者向酒店前台问询)、一对多互动(例如一名导游与一群游客交谈)以及多对多沟通(例如多语言的商务会议和学术讨论)。只需要每个人在手机上打开 Microsoft Translator 移动端的 App,扫描二维码并进入聊天界面,就可以开始交流了。



个人通用翻译器


这一功能以 Microsoft Translator 语音翻译技术为基础,该技术已先用于 Skype Translator,后者让使用不同语言的人群能在网上进行实时交流。

 

“Skype Translator 能让被地区和语言阻隔的人顺畅交流,但它不能满足面对面交谈的需求。” 微软人工智能及微软研究事业部机器翻译组研究经理 Arul Menezes 说。他和他的同事们都认为, 面对面跨语种交流所要用到的技术,应该更接近于《星际迷航》和其他科幻作品中随处可见的“通用翻译器”。

 

对于“个人通用翻译器”,团队决定利用业内已广泛采用的移动设备,而不再开发专用的翻译硬件。Microsoft Translator 团队项目经理 Tanvi Surti 说:“眼下,智能手机随处可见,几乎人手一只。” Surti 负责领导 Microsoft Translator 现场翻译功能的开发。

 

该团队开发了一项技术,让现有的 Microsoft Translator 手机应用与网站形成了一个整体。“我们花了很多时间思考用户体验设计。” Surti 说,“比如我们俩说着两种不同的语言,我们如何做到快速对接以便有更多的时间和注意力用于考虑交谈内容?”

 

新功能使用起来非常简单。首先,用户通过手机端应用或网站登录这项服务,选择自己的语言并发起新会话。这一过程将生成一个代码以及一个二维码,其他参与者可以输入这代码或扫描二维码加入,然后选择自己的语言,谈话就可以开始了。




交谈一方在发言时要按下键盘空格键或屏幕上的虚拟按钮,就像使用对讲机一样。几秒钟后,他们所说话语的翻译文本就出现在其他对话参与者的设备屏幕上,当然是以其各自的母语呈现。对于部分语言,系统还提供有声的语音翻译。

 

与大多数尖端前沿技术类似,它目前还不够完美。

 

“毫无疑问,目前该技术的应用在质量和设置上都有很多提升的空间。但毫无疑问的是,一旦你完成设置,就能在多人使用多种语言面对面交谈的过程中获得‘通用翻译器’体验。” Fontana 说。


深层神经网络


机器翻译技术本身是由运行在云中的算法所驱动的,通过使用基于深层神经网络的翻译技术,与先前所谓的“统计型机器翻译”相比,它能够提供更流畅、听起来更有“人味”的翻译。

 

两种方法都涉及根据早前经专业人士翻译的文档文本数据对算法进行训练,以便让系统了解一种语言中的单词和短语如何用另一种语言来表达。然而,统计型方法局限在由一两个邻近词语形成的上下文范围内对某个单词进行翻译,这可能会导致翻译出来的语句笨拙而迂回。

 

“神经网络”受到了掌握多门语言的人类在翻译过程中大脑中发生的模式识别过程的启发,实现了更自然的语音翻译。

 

例如,在非神经世界中,“一群猫”和“一只猫”被视为不同的实体;而人类大脑以及神经网络则把这两者视为密切相关的词。神经网络也可以解析“住宿”和“星宿”两个词中“宿”字的含义区别。Menezes 解释说:“单词已经不再被视为它所代表的事物,而是一个包含 500 个维度的向量,其本质是 500 组数字,而每一个数字都反映了这个单词的某一个方面。”

 

神经网络在开始翻译之前,首先用 1000 个维度的向量对每个单词在整个句子语境下的含义进行建模,无论这句话有 5 个词还是 20 个词都是这样处理的。这一包含 1000 个维度的模型(而非单词)随后被翻译成另一种语言。


此外,Fontana 表示,随着该技术被使用的次数越多,翻译的质量也会不断提高。他希望看到 Microsoft Translator 能被包括旅行者、导游、教师和社会工作者在内广泛的用户群体所采用。

 

在儿童福利会供职的 Simmonds-Read 说,他已经可以预见到这项技术的多种用途,包括陪同非英语移民和难民一道参加与政府官员和潜在雇主的会面等。




“人们在不能沟通的时候几乎是被隔绝的。”他说。

 

触手可及


Microsoft Translator 凝聚了微软研究院 20 多年自然语言处理领域的研究成果,汇集了机器学习(特别是深度学习人工智能)、大数据、 语言学、云计算等几种前沿技术。Microsoft Translator 目前支持包括中文普通话在内的 9 种语言的语音输入,近 60 种语言的文字翻译。而且这个数量还在不断增加。目前全球已有数千间企业在使用微软自动翻译技术,提高业务效率和服务质量。




支持多人、多语言、跨设备的现场翻译功能已通过现有的 Microsoft Translator App 更新发布,包括 Windows、iOS 和 Android 版本。你可以在相应的应用商店搜索“微软翻译”或 “ Microsoft Translator ” 下载。交谈发起者将获取的交谈专属二维码分享给其他参与者就可以交流了。



Windows 版


点击以上图片长按识别二维码,即可下载 Windows 版 Microsoft Translator。





iOS 版

点击以上图片长按识别二维码,即可下载 iOS 版 Microsoft Translator。





Android 版(Google Play)

点击以上图片长按识别二维码,即可下载 Android 版 Microsoft Translator。

本文转载自微信公众号:微软研究院 AI 头条


了解更多:




后台入驻微软小冰

如果你很萌,请跟她一决高下!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存