查看原文
其他

“机器翻译”会抢同声传译的饭碗吗?

2015-06-03 科大讯飞

随着科技和社会经济的快速发展,全世界的互联互通已经成为不可阻挡的发展趋势,那么不同国家之间如何实现低成本的有效交流呢?


人工翻译所耗费的成本巨大,也许最好的解决方法就是:充分利用机器翻译技术提供智能自动翻译服务。


机器不会累、学习快,一个系统同时掌握十几种语言互译也不是问题,也许永远不会像人一样出现翻译盲点。


但是语言的复杂性众所周知,人尚且会有误解的时候,那么冰冷的机器究竟是怎么翻译一种语言的呢?它会思考吗?


今天,就让讯飞带领大家一起走进“机器翻译”的世界。


目前机器翻译的主流方式叫“统计翻译”


统计机器翻译的基本原理是:从语料库大量的翻译实例中自动学习翻译知识,然后利用这些翻译知识自动翻译其他句子。


比如,为了让机器顺利实现中英文之间的翻译,首先需要收集大量中英文双语句对,然后使用计算机从这些双语句对中统计并学习翻译知识。


看到这里你也许会觉得,机器翻译好像也不难,不就是要收集到足够多的词汇和例句吗?


当!然!不!是!


让机器学习翻译知识可不是一件简单的事。


人类语言具有很大的复杂性。首先,很多用词和表达方式是多义的、模糊的、跟特定应用环境相关的。即使是同一个句子,在不同语境下的意思也不相同。例如,碰到这样的情况,不仅仅是老外,机器估计也会“迷茫”。


其次,不同语言的语序也不一样。例如“最好的朋友之一”,翻译成“one of the best friends”,其中“之一”的翻译被提前了。

 

再者,对于同一个句子,它可能有很多种正确的翻译方法。这样增加了机器学习过程的不确定性。例如“你好”可以被翻译成“Hello”,或者“How do you do”等。


因此,一个优秀的机器翻译系统,对于词的翻译知识,短语的翻译知识、语法结构的翻译知识、语义的翻译知识等等全部都要掌握。


以中英翻译方向为例,系统首先要掌握中英文之间词、短语、语法结构的翻译知识。有了这些翻译知识之后,系统就会把这个中文句子切分成各种词、短语、或者语法结构的组合(这个过程中,有成千上万种切分可能,每个单元也有多种翻译备选),然后分别翻译每一个单元,最后组合起来形成最终的英文翻译。


万万没想到吧,在电光火石的一瞬间,系统已经经历了这么一个“千回百转”的过程。


近几年,谷歌、微软、IBM、百度、科大讯飞等国内外科技企业都成立了机器翻译团队从事此项研究,矢志打破语言障碍。机器翻译技术也在飞速发展,微软在skype上应用同声传译技术让人大呼“逆天”,去年的国际机器翻译(IWSLT)比赛直接采用了TED演讲的真实语料,在口语化严重、专业名词多的情况下,参赛队伍依然表现不错,科大讯飞更是在中英和英中两个翻译方向均获第一。


随着机器翻译技术的进步,另一种担心也在悄然蔓延:“机器会抢同声传译的饭碗吗?会让从事这一行业的人类失业吗?


(图:应用于skpye的翻译技术让两个不同国家的人实时沟通。


我们认为,担心这个问题还为时尚早。虽然现在可以通过一些实用的技术让机器去模拟人的智能活动,模拟人对语义的理解。但相对于彻底的人工智能和语义理解,还有相当长的道路。如果有一天机器真的能够实现准确的实时翻译,它们的角色更可能是辅助相关产业的工作人员更轻松、便捷地开展工作,而不是取代他们。


技术的发展会让人类的生活更加便捷、美好,期待全球沟通无障碍的时代早日到来!


(编/zmwang4)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存