“机器翻译”会抢同声传译的饭碗吗？

查看原文

其他

“机器翻译”会抢同声传译的饭碗吗？

2015-06-03 科大讯飞

随着科技和社会经济的快速发展，全世界的互联互通已经成为不可阻挡的发展趋势，那么不同国家之间如何实现低成本的有效交流呢？

人工翻译所耗费的成本巨大，也许最好的解决方法就是：充分利用机器翻译技术提供智能自动翻译服务。

机器不会累、学习快，一个系统同时掌握十几种语言互译也不是问题，也许永远不会像人一样出现翻译盲点。

但是语言的复杂性众所周知，人尚且会有误解的时候，那么冰冷的机器究竟是怎么翻译一种语言的呢？它会思考吗？

今天，就让讯飞带领大家一起走进“机器翻译”的世界。

目前机器翻译的主流方式叫“统计翻译”。

统计机器翻译的基本原理是：从语料库大量的翻译实例中自动学习翻译知识，然后利用这些翻译知识自动翻译其他句子。

比如，为了让机器顺利实现中英文之间的翻译，首先需要收集大量中英文双语句对，然后使用计算机从这些双语句对中统计并学习翻译知识。

看到这里你也许会觉得，机器翻译好像也不难，不就是要收集到足够多的词汇和例句吗？

当！然！不！是！

让机器学习翻译知识可不是一件简单的事。

人类语言具有很大的复杂性。首先，很多用词和表达方式是多义的、模糊的、跟特定应用环境相关的。即使是同一个句子，在不同语境下的意思也不相同。例如，碰到这样的情况，不仅仅是老外，机器估计也会“迷茫”。

其次，不同语言的语序也不一样。例如“最好的朋友之一”，翻译成“one of the best friends”，其中“之一”的翻译被提前了。

再者，对于同一个句子，它可能有很多种正确的翻译方法。这样增加了机器学习过程的不确定性。例如“你好”可以被翻译成“Hello”，或者“How do you do”等。

因此，一个优秀的机器翻译系统，对于词的翻译知识，短语的翻译知识、语法结构的翻译知识、语义的翻译知识等等全部都要掌握。

以中英翻译方向为例，系统首先要掌握中英文之间词、短语、语法结构的翻译知识。有了这些翻译知识之后，系统就会把这个中文句子切分成各种词、短语、或者语法结构的组合（这个过程中，有成千上万种切分可能，每个单元也有多种翻译备选），然后分别翻译每一个单元，最后组合起来形成最终的英文翻译。

万万没想到吧，在电光火石的一瞬间，系统已经经历了这么一个“千回百转”的过程。

近几年，谷歌、微软、IBM、百度、科大讯飞等国内外科技企业都成立了机器翻译团队从事此项研究，矢志打破语言障碍。机器翻译技术也在飞速发展，微软在skype上应用同声传译技术让人大呼“逆天”，去年的国际机器翻译（IWSLT）比赛直接采用了TED演讲的真实语料，在口语化严重、专业名词多的情况下，参赛队伍依然表现不错，科大讯飞更是在中英和英中两个翻译方向均获第一。

随着机器翻译技术的进步，另一种担心也在悄然蔓延：“机器会抢同声传译的饭碗吗？会让从事这一行业的人类失业吗？

（图：应用于skpye的翻译技术让两个不同国家的人实时沟通。）

我们认为，担心这个问题还为时尚早。虽然现在可以通过一些实用的技术让机器去模拟人的智能活动，模拟人对语义的理解。但相对于彻底的人工智能和语义理解，还有相当长的道路。如果有一天机器真的能够实现准确的实时翻译，它们的角色更可能是辅助相关产业的工作人员更轻松、便捷地开展工作，而不是取代他们。

技术的发展会让人类的生活更加便捷、美好，期待全球沟通无障碍的时代早日到来！

（编/zmwang4）

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！

“湿冷魔法”攻击！鸟家三合一冲锋衣、羽绒服、软壳裤帮你抵挡