查看原文
其他

文献精读|Explicitation in Neural Machine Translation

张一孟 翻译圈
2024-09-09


研究背景Backgorund

神经机器翻译(NMT)如今成为机器翻译主流,在翻译的流利性以及充分性上比之前的其他机器翻译模型都要好,受到广泛好评,甚至有人认为微软最新研发的NMT系统的翻译可以与人工翻译媲美。这一观点同样有人持反对意见,有人批评研究使用的方法论,有人强调NMT的语用局限。这表明机翻与人翻之间仍有较大差距。

研究问题Purpose

①神经机器翻译如何实现显化转换 

②这些转换是如何在语言学方面实现的


“to what extent does neural machine translation (NMT) 一 a relatively new approach to machine translation (MT), which can draw on richer contextual information than previous MT architectures perform explicitation shifts in translation and how are these shifts realized in linguistic terms?”

报告及原文Download

论文原文和报告可在翻译圈后台回复文献精读获取!

全文展示Passage

Explicitation in Neural Machine Translation

文献基本信息

文献题目

Explicitation in Neural Machine Translation

文献作者

Ralph Krüger  

文献期刊

Across   Languages and Cultures

关键词

neural   machine translation, human translation, explicitation, translational   text-context interaction

摘要

This paper is concerned with the   following question: to what extent does neural machine translation (NMT) – a   relatively new approach to machine translation (MT), which can draw on richer   contextual information than previous MT architectures – perform explicitation   shifts in translation and how are these shifts realised in linguistic terms?   In order to answer this question, the paper attempts to identify instances of   explicitation in the machine-translated version of a research report on   carbon dioxide capture and storage. The machine-translated text was created   using the publicly available generic NMT system DeepL. The human translation   of the research report was analysed in a prior research project for instances   of explicitation and implicitation (Krüger 2015). After a brief quantitative   discussion of the frequency and distribution of explicitation shifts identified   in the DeepL output as compared to the shifts identified in the human   translation of the research report, the paper analyses in detail several examples   in which DeepL performed explicitation shifts of various kinds. The   quantitative and qualitative analyses are intended to yield a tentative   picture of the capacity of state-of-the art neural machine translation   systems to perform explicitation shifts in translation. As explicitation is   understood in this article as an indicator of translational text–context   interaction, the explicitation performance of NMT can – to some extent – be   taken to be indicative of the “contextual awareness” of this new MT architecture.

文章大纲

                                                                              

研究背景

神经机器翻译(NMT)如今成为机器翻译主流,在翻译的流利性以及充分性上比之前的其他机器翻译模型都要好,受到广泛好评,甚至有人认为微软最新研发的NMT系统的翻译可以与人工翻译媲美。这一观点同样有人持反对意见,有人批评研究使用的方法论,有人强调NMT的语用局限。这表明机翻与人翻之间仍有较大差距。

研究问题

①神经机器翻译如何实现显化转换 ②这些转换是如何在语言学方面实现的

“to what extent does neural machine translation (NMT) 一   a relatively new approach to machine translation (MT), which can draw on   richer contextual information than previous MT architectures perform   explicitation shifts in translation   and how are these shifts realized in linguistic terms?”

文献内容

文献创新

本文认为语用方面的因素会给NMT带来巨大影响,因此,该文旨在补充有关专业翻译在语用方面研究,从认知语言学的角度对显性、隐化和显化进行了分析。

文献综述

  1. 1.      NMT语境中有关显化的文献相对较少,迄今为止,机器翻译的研究者们关注于更基本的问题,例如词汇和结构性歧义、术语一致性、文体流畅性等。

  2. 2.      机器翻译中的显化研究主要集中在机翻文本中语篇连接词的使用上。

  3. 3.      除了语篇连接词之外,Ahrenberg ( 2017 )在其一篇文章中重点讨论了人工译者使用的特定翻译程序以及机器翻译系统在这些程序下的表现。

研究方法

研究内容:机翻与人翻文本中的显化转换,以此来检验NMT文本的语用表现

(原因:1.显化是翻译文本与语境互动的指标当;2.NMT相较于之前的机翻架构有着更丰富的上下文语境)

研究对象:关于二氧化碳捕获和储存的研究报告

NMT引擎:DeepL

人工翻译来源:之前的一个研究项目中被分析为显化和隐化的实例(Krüger 2015)

研究流程

  1. 1.      对显化转换进行分类(以在目标语中显化转换在语言方面的实现形式分类):lexical insertion, lexical specification and relational   specification.(词项插入,词项规范,关系规范);

  2. 2.      定量分析:对机翻文本中与人工翻译中显化转换的频率和分布进行分析;

  3. 3.      定性分析:对机翻文本中三个类型显化转换的例子进行分析。

研究发现

定量分析

  1. 1.      NMT,特别是DeepL在有关歧义的错误类别中表现优于PBSMT:MT有解决结构性歧义(以及一些词汇歧义)的能力;

  2. 2.      NMT往往不能将新的、自主的词汇单位引入到目标语文本中:在关系规范方面,DeepL 表现与人工翻译差距较小,但在另外两方面差距较大,尤其在词项插入方面较差。

定性分析

  1. 1.      DeepL可以从底层数据中学习特定的显化转换,在显化结构性歧义方面表现很好;

  2. 2.      当没有明确的触发语时,DeepL很难自主地在目标语文本中插入词语单位:尽管NMT相较于之前的MT架构有着更加丰富的上下文信息,但是其对上下文的感知仍然零碎;

先前研究的发现(Kruger 2015)

  1. 1.      人工翻译文本中的显化转换似乎是按照特定的策略进行,而DeepL进行的转换更加随意,多为通过底层训练数据而学习的函数。

研究结论

能够进行有针对性且合理的显化(和隐化)转换是专业的翻译能力的重要部分,因此显化和隐化是正体现了NMT翻译在语用方面限制。所以,说NMT系统可以媲美人工译员仍为时尚早。

感悟与启发

在这篇文章中,作者以非文学文本为例,探究机器翻译文本中显化转换的实现。作者首先对显化转换进行分类,再以定量分析讨论机翻和人翻中转换数量的差别,之后定性分析转换在机翻中是如何实现的。

通过作者的定量分析了解到,在三个显化转换类别中,机翻在词项插入方面表现较差。由机翻实现的词项插入是系统学习了这种特定的词汇诱导和常规化显化翻译模式,并在翻译当前源句时应用了这种模式。但是当系统没有识别到明确的触发语时,这一转换很难实现。因此,机翻现在需要解决的问题是如何插入内容词项,而这些词与源文本或目标语中的其他词之间又没有机翻系统可识别的联系。

我认为这一问题的根源在于机翻系统仍然没有完全的上下文语境分析框架,系统的语境意识不够充分。这个问题同样会导致机翻无法识别与显化源文本的隐含意义等,所以,现在的机器翻译需要探究在语用方面的发展,以提升机翻系统对上下文语境的分析能力,产出更加高质量的译文。

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。


- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


原文作者:张一孟

推文编辑:尹如云

指导老师:朱华

核:吴志雄、刘一葶

项目统筹:吴志雄


资讯推荐


口译符号

▶精品课程

精品课程|从进阶到精通:基于Python的语言数据分析实战

精品课程|从入门到进阶:语料库建设与统计分析实务

新课来袭 | 开启倒计时!AI时代掀起影视字幕翻译的智能革命

▶资源宝库

翻译技术|提升 ChatGPT 翻译质量的简单 prompt

翻译技术|以Sketch Engine为船遨游语料海洋(二)

翻译技术|The Free Dictionary-多语在线词典搜索引擎

翻译技术|字幕翻译配音恐失业,Ai翻译配音超逼真

资源宝库|小鹤音形输入法——打字,你还能更快!

资源宝库|集合Ai、多语种翻译等上百种功能的超强输入法

资源宝库|1.7亿篇科技文献 PubScholar公益学术平台向社会开放

▶翻译百科

翻译百科|《中国大百科全书》中的“消歧”

翻译百科|《中国大百科全书》中的“翻译学”

翻译百科|《中国大百科全书》中的“神经网络机器翻译”

翻译百科|《中国大百科全书》中的“翻译层次”

翻译百科|《中国大百科全书》中的“范化”

翻译百科|《中国大百科全书》中的“可比语料库”

▶代码分享

翻译技术|代码分享——KWIC

翻译技术|代码分享——删除文本中的空段落

翻译技术|代码分享——删除停用词

翻译技术|代码分享:合并多个文本文件

翻译技术|代码分享——清除符号

▶文献精读

精读报告|Ralph Krüger:对机器翻译质量评估方法的建议

文献精读|口译、第二语言和第一语言的句法复杂性:受限语言视角

▶译界动态

译界动态|专业揭秘:申请横向课题全面指南系列(二)

论坛预告 | 2023翻译技术与语言服务人才培养高端论坛

译界动态|2023“理解当代中国”多语种国际翻译大赛

译界动态|美国文学翻译协会 ( ALTA )简介

译届动态|公益沙龙之ChatGPT时代译者的搜商体系构建之道

  关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存