其他

腾讯共享AI战略之翻译AI

2017-11-10 中国语言服务产业技术创新战略联盟

11月8日,腾讯2017全球合作伙伴大会在成都举行。会上,腾讯公布了其“AI in all”战略,让AI与各行各业结合。此外,腾讯还公布了其“基础研究——场景共建——AI开放”三层AI架构,落地社交、内容、游戏、医疗、零售、金融、安防、翻译这八大场景。

在「创想·人工智能」论坛中,腾讯 AI Lab 机器翻译平台侧负责人杨月奎则带来了他们在机器翻译中的最新进展,而在现场,他的演讲内容同样进行了实时翻译。

《翻译AI:重建巴别塔》

时至今日,翻译已成为具有千亿规模的巨大市场。一方面,人工翻译价格高昂、供给不足,机器翻译的水平则在日益提升带来了更低的成本和更高的效率;另一方面,机器翻译的研究牵涉到自然语言的分析、转换与生成,可作为NLP的重要研发平台,也是人工智能的里程碑式目标。

2014年,随着神经网络机器翻译(NMT)的出现,错误率大幅下降,各互联网巨头也陆续推出了自己的机器翻译平台。可惜NMT也未提供完美的解决方案,面临众多挑战。首先是译文忠实度问题,存在译文丢失或跑飞的可能。其次是对低频词的训练难度更大,一些实体词很可能翻译不出来;最后是对训练数据的规模,也有着更高的要求。

针对NMT面临的这些挑战,我们也相对应地做了一些优化工作。为了提高译文忠实度,我们使用交互式的Attention模型来增强Attention机制,利用重构模型加强翻译完整性的学习,利用Rerank模型选取更优的译文;为了加强对低频词的训练,我们引入子词模型;为了提升训练效率,我们采取并行训练框架,支持多机多卡并行训练。除此之外,我们也加入了深层网络、残差网络和模型融合等技术。

目前我们已支持中文、英语、粤语、日语、韩语、法语、德语、西班牙、越南语等多种语言。

有了这样的机器翻译技术,我们也在公司内外积极谋求应用落地,包括结合语音识别技术的同声传译、结合图像识别技术的拍照翻译、结合人机交互能力的辅助翻译等。一方面应用于公司内部的微信、手机QQ和微云等产品,另一方面开放能力,赋能更多合作伙伴。

这些能力我们都已经在腾讯开放平台(AI.QQ.COM)上推出了,而在出境游、商务会议、跨国交流等场景上我们期待能有更广泛应用。

(来源:翻译技术与研究微信公众号)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存