“机器翻译”会抢同声传译的饭碗吗?
随着科技和社会经济的快速发展,全世界的互联互通已经成为不可阻挡的发展趋势,那么不同国家之间如何实现低成本的有效交流呢?
人工翻译所耗费的成本巨大,也许最好的解决方法就是:充分利用机器翻译技术提供智能自动翻译服务。
机器不会累、学习快,一个系统同时掌握十几种语言互译也不是问题,也许永远不会像人一样出现翻译盲点。
但是语言的复杂性众所周知,人尚且会有误解的时候,那么冰冷的机器究竟是怎么翻译一种语言的呢?它会思考吗?
今天,就让讯飞带领大家一起走进“机器翻译”的世界。
目前机器翻译的主流方式叫“统计翻译”。
统计机器翻译的基本原理是:从语料库大量的翻译实例中自动学习翻译知识,然后利用这些翻译知识自动翻译其他句子。
比如,为了让机器顺利实现中英文之间的翻译,首先需要收集大量中英文双语句对,然后使用计算机从这些双语句对中统计并学习翻译知识。
看到这里你也许会觉得,机器翻译好像也不难,不就是要收集到足够多的词汇和例句吗?
当!然!不!是!
让机器学习翻译知识可不是一件简单的事。
人类语言具有很大的复杂性。首先,很多用词和表达方式是多义的、模糊的、跟特定应用环境相关的。即使是同一个句子,在不同语境下的意思也不相同。例如,碰到这样的情况,不仅仅是老外,机器估计也会“迷茫”。
其次,不同语言的语序也不一样。例如“最好的朋友之一”,翻译成“one of the best friends”,其中“之一”的翻译被提前了。
再者,对于同一个句子,它可能有很多种正确的翻译方法。这样增加了机器学习过程的不确定性。例如“你好”可以被翻译成“Hello”,或者“How do you do”等。
因此,一个优秀的机器翻译系统,对于词的翻译知识,短语的翻译知识、语法结构的翻译知识、语义的翻译知识等等全部都要掌握。
以中英翻译方向为例,系统首先要掌握中英文之间词、短语、语法结构的翻译知识。有了这些翻译知识之后,系统就会把这个中文句子切分成各种词、短语、或者语法结构的组合(这个过程中,有成千上万种切分可能,每个单元也有多种翻译备选),然后分别翻译每一个单元,最后组合起来形成最终的英文翻译。
万万没想到吧,在电光火石的一瞬间,系统已经经历了这么一个“千回百转”的过程。
近几年,谷歌、微软、IBM、百度、科大讯飞等国内外科技企业都成立了机器翻译团队从事此项研究,矢志打破语言障碍。机器翻译技术也在飞速发展,微软在skype上应用同声传译技术让人大呼“逆天”,去年的国际机器翻译(IWSLT)比赛直接采用了TED演讲的真实语料,在口语化严重、专业名词多的情况下,参赛队伍依然表现不错,科大讯飞更是在中英和英中两个翻译方向均获第一。
随着机器翻译技术的进步,另一种担心也在悄然蔓延:“机器会抢同声传译的饭碗吗?会让从事这一行业的人类失业吗?
(图:应用于skpye的翻译技术让两个不同国家的人实时沟通。)
我们认为,担心这个问题还为时尚早。虽然现在可以通过一些实用的技术让机器去模拟人的智能活动,模拟人对语义的理解。但相对于彻底的人工智能和语义理解,还有相当长的道路。如果有一天机器真的能够实现准确的实时翻译,它们的角色更可能是辅助相关产业的工作人员更轻松、便捷地开展工作,而不是取代他们。
技术的发展会让人类的生活更加便捷、美好,期待全球沟通无障碍的时代早日到来!
(编/zmwang4)