行业观察｜AI时代，口译员如何突出重围？

语言服务行业

2024-09-09

The following article is from 广外高翻口译教育与研究中心 Author 谭诗忆

IS下午茶 · 第23篇

○

最近在网络媒体上引发热议的AI聊天程序ChatGPT又一次将大众的目光吸引到了人工智能上，惊叹人工智能的飞速发展。在翻译领域，人工智能即将替代人类译员的声音更是不绝于耳，但事实真的如此吗？今天这杯下午茶就让我们来品一品一本有关口译员和人工智能的书。

书本简介

这本书名为Interpreters vs Machines: Can Interpreters Survive in an AI-Dominated World?，2019年出版，作者是咨询口译员兼研究员Jonathan Downie博士。

图1. 书本封面

首先让我们看看整本书都在讲些啥。

全书分为5个部分，共14章。

第一部分依次探讨了什么是口译、人如何口译、计算机如何“口译”。

第二部分讲述了口译如何成为一种职业，而如今又如何在机器口译面前日渐失去上风。口译员的公共关系、自我营销方式、机器口译提供商所宣传的主张和益处都在这一部分得到呈现。

在第三部分，作者没有直接给出自己对于口译未来走向的看法，而是展示了多种可能，让读者来选择。第6章——待机器口译发展完备之时，终将替代人类译员。第7章——通过健全的法律保障，人类译员还是可以保住自己的饭碗。第8章——人类译员被限制在少数几个领域。第9章——口译新未来：人类口译成为质量标准。

第四部分指出，如果人类口译要成为未来口译行业的标准，口译员就需要改变自我宣传、营销和完成口译工作的方式。

最后一部分提出了问题——当我们决心争取人类口译的未来时，我们是否会错过一个皆大欢喜的结局？

以上就是这本书的全貌。现在让我们切换近景，仔细了解一下计算机如何“口译”。

机器口译

该书作者指出，在了解机器口译的工作原理之前，我们需要先理解其背后的假设，即口译是一个序列到另一个序列的通道模型问题。

图2. 序列到序列模型运行示意图

简单来说就是，机器口译开发人员认为口译是理解一个语言组块，然后在一种新的语言中，创造一个能够表达相同意义的语言组块。

作者认为，这种看法忽视了一种语言使用的社会语境、使用该语言的原因和使用该语言的人群。例如，英文中的第二人称代词只有you，当目的语的第二人称代词根据正式程度、复数形式或社会地位的不同而有多种表达时，人类译员会根据当下的社交需求，选择最合适的代词进行口译，而机器则受制于数据库，数据库有啥翻啥。

所以该书作者指出，将机器口译视为带有音频的机器翻译并不为过，当前的机器口译或许应该被称为“语音翻译（speech translation）”。至少在现阶段，机器口译或语音翻译应当被视为机器翻译的子集。无论一个系统的语音识别有多么强大，合成的声音有多么自然，语音翻译的质量上限都取决于所使用的机翻引擎的能力。因此在这一章，作者着重介绍了机器翻译的原理和发展历程。

书中指出，机器口译主要涉及三个阶段。

首先语音识别软件将源语解码为文本，文本再由机器翻译引擎翻译，最后借助语音合成器将译文编码为音频（见下图）。

图3. 机器口译基本操作模型（Jonathan, 2019: 37）

接下来让我们分别了解每一个阶段。

第一阶段：语音识别

作者指出，要想获得最好的语音识别效果，需要有一个最佳的环境，在该环境中用语音识别系统熟悉的语言发言。否则，语音识别软件很可能“cannae git whit ah’m yabberin’ aboot”（苏格兰口音，实际是“cannot understand what I am talking about”）。

相应地，提升语音识别系统性能就需要不断收集关于“特定地区的口音、口语、习语”的数据。这一点很有可能借助Alexa和Siri这样的语音助手实现。

除此之外，语音识别系统还存在另一个bug。那就是当前的语音识别系统仅能识别字词，无法识别语调、重读和语气这样的副语言信息。

在一些语言中，这些细节可能无关紧要，但在像英语这样的语言中，这些细节至关重要。例如“I only told her I loved her”，重读的词不同，意思也会发生变化。在法庭、谈判及咨询等场景中，这些细微的差别可能还关乎成败。

当语言发生变化，语音识别系统也需要再次训练。作者认为除非有预测性算法可以用于语音识别，否则语音识别会永远滞后于语言使用。

现在，假设一个人的口音、语言表达都能为语音识别系统识别，且没有任何语调，那么我们就来到了机器口译的重头戏——机器翻译。

第二阶段：机器翻译

作者提出，了解机器翻译，首先需要了解其工作原理和质量评价方式。

当前有三种实现机器翻译的方法：

👉1.基于规则的机器翻译（Rules-Based Machine Translation, RBMT）。

原理：

· 程序员和语言学家一同为每一种语言制定规则，如词性、词法、句法等。

· 规则与双语词汇表结合。

具体过程：

RBMT系统先根据规则分析源语文本中的每一句话，然后完成每一个词的词根和每一个语法结构的翻译，最后改正存在的错误。

优点：

利用语言学家的专业优势，完成一种语言的解构和另一种语言的建构。

缺点：

· 光是建立起规则还不足以实现准确翻译。

· 人使用语言时常常打破语言学家书写的语言规则，当语言使用发生变化，RBMT系统也需要得到调整。也就是说，规则和实际语言使用之间存在差异。

· RBMT系统难以处理习语和歧义。

👉2.由于这些缺陷以及处理器和存储技术的发展，机器翻译领域迎来了统计机器翻译（Statistical Machine Translation, SMT）。

原理：

· 收集大量双语平行语料和目的语单语语料训练SMT系统。

· SMT系统借助统计概率和数学符号，计算出不同翻译结果的概率，最后产出概率最大的译文。

举例：

假设有一个庞大的法英双语平行语料库，对于“Marie est une femme”这句法语，这个语料库中有1000条这句话的英语译文，其中999条都译为“Mary is a woman”，只有1条是“Mary is a lady”。那么SMT引擎就会由此推断，下一次见到“Marie est une femme”这句话时，它很有可能需要将其译为“Mary is a woman”。

优点：

· 不需要人编写规则。

· 当用来训练SMT系统的语料库库容够大、涵盖语言对够多、语言质量够好时，SMT产出的译文质量会很不错。

· 一些组织机构常常需要翻译许多语言表达相似的文件，此时就可以使用SMT替代人的重复工作。

缺点：

· SMT非常依赖预测和高频率词组，用于机器口译时，口语的创造性、无序性和多样性会成为一个难点。

· SMT缺乏文化意识和百科知识。

· SMT无法解读译文的意义或语气。

· SMT产出译文的清晰程度和质量极其依赖其系统内现有数据的质量。

👉3.2015年以来，基于机器学习的神经机器翻译（Neural Machine Translation, NMT）方法兴起，给机器翻译领域带来了新变革。

从广义上讲，NMT是一种基于人工神经网络的方法，它把翻译过程描述为可以用人工神经网络表示的函数，所有的训练和推断都在这些函数上进行（肖桐，朱靖波，2021：331）。

作者认为要了解NMT，首先需要了解机器学习（machine learning）。

那么啥是机器学习？

作者用下井字棋（如下图）来解释机器学习。

图4. 井字棋示意图

为下井字棋编写一个包含所有规则和已知策略的程序相当于建一个RBMT系统。将井字棋的255168种棋局输入计算机，输入指令，运行统计分析、找出规律，这就相当于SMT方法。机器学习则全然不同。

1961年，人工智能先驱Donald Michie创造了一个由304个火柴盒和许多珠子组成的“机器”（并非真正的机器）来下井字棋。

图5. 井字棋“机器”（图源Wikipedia）

准备9种颜色的珠子若干，不同颜色的珠子代表了在3x3棋面上的位置。准备304个火柴盒，在每个火柴盒上写上一种3x3的棋局，每个盒子表示一种不同的棋局，每个盒子里再放一些颜色各异的珠子。

首先放一个空棋盘在桌上，操作者找出代表空棋盘的火柴盒并摇晃它，从中随机抽取出一颗珠子，按照珠子颜色代表的位置开始走棋。在对手走了一步后，操作者又找出写有相同棋局的火柴盒，摇晃盒子，随机取出一颗珠子，按照珠子的颜色又走一步。然后不断重复该过程直至该局结束。

如果代表“机器”的操作者输了，棋面上的珠子就留在火柴盒外（可视为一种惩罚），减少再次出现失败棋局的概率。

如果代表“机器”的操作者赢了，“机器”走的每一步的珠子的数量会乘以3，依次放回原来的盒子（可视为一种奖励）。

如果是平局，珠子会被一一放回原来的盒子里，不增也不减。

这样一来，因为赢了之后珠子增多，这个“机器”就能“学会”下出更好的棋；反之，输了之后珠子减少，“机器”就能“学会”减少下错棋。关键点就在于，一次棋局的结果可以立即影响后面的棋局，从而提升表现。

所以，机器学习指的是一个系统通过学习过往任务的结果，更好地完成未来具体任务的能力。相应地，基于机器学习的NMT可以提升机器翻译的表现。

那么NMT的工作原理到底是什么呢？

· NMT的本质是使用语言中的规律或特征，预测一个序列中的下一个词。

· 和SMT系统一样，训练NMT系统也基于现有的双语和单语语料库。但不同的是，神经网络可以结合规律，寻找更大的趋势，也可以将过往任务的结果融入未来任务，提升表现。

提升表现是机器学习的功劳，

那么NMT又是如何发现并使用新规律的呢？

这还得说到人工神经网络。人工神经网络模拟人脑的结构，和人脑中的相互连接的神经元一样，所有的人工神经元也联结在一起。

只要有正确的数学函数和输入数据，人工神经网络就可以进行复杂运算，比如哪些词更经常一同出现，这又和这些词的翻译有何联系。

优点：

由于机器学习和神经网络，比起其他的机翻模型，NMT系统往往能够产出更流畅的译文。

缺点：

· 和其他的机翻方法一样，NMT只能涉及到一个词的上下文，无法处理词语带有的社会背景或意图。

· NMT优化的是数学方程，而非语言文字本身。

小结

在以上三种机器翻译方法中，基于规则的机器翻译是最古老的一种，现已很少使用，统计机器翻译和神经机器翻译是当前的主流。当前我们熟知的百度翻译、DeepL、谷歌的GNMT等等翻译器都基于神经网络架构。

至于评价机器翻译的质量，目前主要有两种方法：一是使用BLEU（Bilingual Evaluation Understudy）、TER（Translation Edit Rate）等自动评价机器翻译的指标；二是使用人工评价。

最后，作者指出，如果一个机器翻译系统的质量只取决于用来训练它的数据和用来评价它的指标，那么语音翻译面临的问题可就还多了去了，离替代人类译员也还早得很。机器翻译最大的问题可能还是在于对通道模型思想的依赖。

第三阶段：语音合成

语音合成是语音翻译的最后一步。

在这一环节，计算机或应用程序得到机翻译文，将译文与其数据库中的词、音位或整个词组的录音进行匹配、合成，再加上最有可能的语调，产出音频。

作者指出，这一环节也存在一些问题。最大的问题在于书面文字本身难以体现发音、语调、重音等等，无法完全传递发言人的言语意图。

举例：

· “read” 可以是现在时也可以是过去时，在口语中可以通过发音区分，而在书面文字中则难以辨别。

· “SAD isn’t just about being sad.”

如果一个人知道SAD 是Seasonal Affective Disorder（季节性情绪失调）的缩写，消除这句话的歧义就不难。计算机则需要知道何时单独拼出字母，何时把首字母缩略词视为一个单词。

所以，所有语音合成软件的目标都在于产出自然清晰、和人类声音难以区分的声音。

该书作者认为，要想理解发言人传递的信息，所处的社会、政治、法律、文化和地理背景和发言人实际使用的词句同样重要。没有这些背景线索，语音合成如何能够产出既易于理解又正确恰当的音频，还有待观察。

总结

作者认为，整体来看，这几个环节融合在一起已经可以完成口译任务了，但因各个环节存在的不足，机器口译应用于现实生活的效果并不理想。机器口译最大的困难不是理解语言，而是将语言和语境联系起来。在口译时，人类译员不仅可以理解发言人在说些什么，还知道发言人在对谁说，发言人为什么这样说，发言人如何说，发言人的目的是什么，而机器口译则很可能识别不出这些细微但关键的线索。所以作者总结道，机器口译的问题不在于语言，而在于人。

在讨论和应对AI给口译行业带来的影响和冲击前，我们或许要先做到“知己知彼”。对于大多数职业译员、学生译员和口译研究者而言，“知己”这一方面可能无需多言，每个人都对口译的过程有所了解或有自己的见解。但“知彼”呢，我们对基于AI的机器口译又了解多少？

这本书就为想要了解口译与AI但又苦于不懂复杂数理概念的人提供了一个入门的机会。作者在书中常常穿插自己的口译经历，解释复杂概念时往往也使用了一些生活化的例子，读起来相对简单。但也正因为是入门级的书籍，这本书对于一些概念解释得并不细致，比如机器翻译的三种方法实际上还可以进一步细分。作者在讨论机器翻译方法的优缺点时，也更侧重产出的译文，较少从技术更迭的角度做出评价。

最后，如同作者所言，“在读这本书时，最重要的是我们要意识到，无论我们从新闻报道或社交媒体上读到什么内容，口译的未来始终掌握在译员的手中”，与其终日被质疑或自我怀疑，不如先打破迷思。

声明：本公众号转载此文章是出于传播行业资讯、洞见之目的，如有侵犯到您的合法权益，请致信：chongchong@lingotek.cn，我们将及时调整处理。谢谢支持！

-END-
本文转载自：广外高翻口译教育与研究中心转载编辑：Pickey

关注我们，获取更多资讯！

往期回顾

行业动向1. 行业资讯丨2022下半年CATTI1—3级考试证书线上查询验证工作开始！
2. 行业资讯 | 云译科技荣膺2022年深圳市『专精特新』中小企业
3. 国际口译峰会｜ Cymo Note在目笔记：ChatGPT时代下人机合作的意义
4. 行业资讯 | 38所高校外国语言文学或翻译硕士调剂信息
5. 行业资讯丨往年MTI调剂信息汇总参考
行业洞见

行业技术

精品课程

资源干货

招聘就业1. 招聘快报 | 硬核语言专业线上实习就等你来！
2. 招聘快报 | 韩语、葡语口译招募 3. 就业干货 | 理工科也能做翻译吗？4. 不知道去哪找优质实习？硬核语言专业线上实习机会来了！5. 实习资讯 | 疫情阻隔优质实习？硬核语言专业线上实习机会来了！

继续滑动看下一个

语言服务行业

向上滑动看下一个

市管干部“龚书记”免职迷局

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

行业观察｜AI时代，口译员如何突出重围？

您可能也对以下帖子感兴趣

市管干部“龚书记”免职迷局

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

生成图片，分享到微信朋友圈

行业观察｜AI时代，口译员如何突出重围？

您可能也对以下帖子感兴趣