查看原文
其他

2020语言服务展望之七|李光华:神经网络机器翻译时代,我们需要一款什么样的笔译工具?

Editor's Note

21世纪的第二个十年已然开启,我们汇集推出“2020年语言服务业展望系列”。这些来自语言服务专业人士不同视角的观察和思考,值得我们关注和记录。

本期作者:李光华——中科凡语兰亭译产品负责人。原译酷联合创始人、中译语通语言数据负责人。

The following article is from 兰亭译 Author 兰亭译

预测未来最好的方式是创造未来”
——彼得·德鲁克

人机合译路漫漫


基于深度神经网络算法带来的机器翻译质量大幅跃升已成为业内共识。机翻质量在部分领域已经逼近人工翻译结果,特别是新闻领域,微软2018年已宣布“我们研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,达到了可与人工翻译媲美的水平”。


另一方面,当机器翻译取代人工翻译的论调不再甚嚣尘上,巴别塔即将建成之类的狂妄逐渐止息,我们必将重新冷静地审视人类语言的复杂度。作为承载文化和思维的载体,一种语言转换为另一种语言,即使在信息交换和日常阅读层面,我认为人机合译是一条绕不过去且漫长的路。

那么,在神经网络机器翻译时代,我们需要一款什么样的人机合译工具?特别是笔译工具?

看似有许多工具可选择,比如到谷歌翻译框里复制粘贴,或者用近年出现的文档翻译——上传文档,下载机翻后的文档,初步解决和机翻和格式问题。但记忆库术语库不能复用,不能去重,不能协作,其实某种程度上还停留在word文档的翻译时代,用来辅助阅读可以,作为一款笔译工具,显然还远远不够。


笔译工具面临革新



计算机辅助翻译工具已经有30余年的历史,从Trados到目前基于云端的CAT工具,具备机器翻译、格式解析还原、记忆库术语库管理、多人协作等功能,但上手门槛高,版本复杂,让非专业译者、甚至对技术不够敏感的专业译者望而却步。此外,大部分CAT还停留在“模板”时代,套用和匹配记忆库术语库,译后编辑的结果无法反馈给机器,机器下次还犯同样的错误……

特别是编辑器翻译体验,丢掉格式和上下文的陌生翻译环境,某种程度上是时代的局限,对于大部分时间都停留在编辑器的译者显然不够友好。

30年未变的传统CAT编辑器界面

从时代的大背景看:依据摩尔定律,人类的信息存储能力每18个月翻一番。在海量的信息中,我们见到的世界,仅是一个翻译过的世界,一个只有母语承载的信息茧房。

随着信息的爆发,世界在拉平,可以预见,一个多语的、更多场景和维度的、变化更快的世界在向我们展开。机器翻译虽然可以解决速度问题,但无法解决精准度和人们对所读到信息的信赖问题。

传统CAT工具,囿于高专业门槛、人机无法互动等局限,无法走下“专业工具”的高台,俯身为更多各行各业专业人士赋能,从而也不能解决译者资源的问题。

因此我们认为,神经网络机器翻译时代,用户需要更简单、更智能、更普惠的笔译工具,能将语言和工具的能力赋予译者,特别是那些没有掌握工具和语言的各行业专业人士,进而从根本上解决译者资源的问题。

全球数据增长规模(2010-2025)


译者核心能力之变



20年前,输入法变得易用,使得人人具有打字的能力,而不再依赖于少数以打字为业的打字员,因为人人皆打字员。

20年后,基于现在“编程从娃娃抓起”的现状,可以预见人人将具有编程的能力,将自己的更多想法用代码实现,而不仅仅依赖以编程为业的开发者,因为人人皆开发者。

同样,10年后,更多的人士将被赋予语言和工具的能力,在某些信息交换层面,消化越来越多的翻译需求,而不仅仅依赖以翻译为职业的译者,因为人人皆译者。

当然,我相信打字员(速记员)、译者、开发者作为一种专业职业将会长期存在,但越来越多的碎片化场景和市场需求必将催生更多的供应端资源。

译者核心能力对比

传统译者核心能力模型主要由语言能力(中文能力+外语能力)、工具能力(信息检索能力、翻译工具应用能力)、专业知识(所翻译领域的背景知识积累或快速获取能力)构成。随着机器翻译和翻译工具的进一步发展,对译者语言能力和工具要求将进一步降低,而专业背景知识的重要性日益凸显。

这一趋势演化的结果,将产生新的译者群体——各行业专业人士。被赋予语言和工具能力的各行业专业人士,运用自己背景知识,将在某种程度上、在更多的场景解决快速增长的语言需求。


所见即所得的人机合译平台



顺应这一趋势,2019年11月10日,我们发布兰亭译——一款所见即所得的人机合译工具。希望将语言和工具的能力赋予译者,赋予更多各行业专业人士,实现人人皆译者的愿景。

兰亭译首页(lightingyee.com)

兰亭译整合了高质量的神经机器翻译引擎,部分程度上打破了表格式编辑器的传统,实现了全程保留格式的所见即所得的创新。同时结合公司算法优势,探索闭环互反馈、人机合译之道。

“兰亭集序”作为“天下第一行书”,代表书法作品、代表中国文化、也代表人文精神。我们希望结合科技与人文,以让用户感到亲切的方式,做用户的朋友,为用户创造愉悦的翻译体验。

兰亭集序局部图

神经网络机器翻译时代,我们需要一款什么样的笔译工具?

兰亭译就是我们的一点尝试。

诚惶诚恐,但充满动力。借用一句话:“我们的动力是什么?我们试图用我们仅有的天分去表达我们深层的感受,去表达我们对前人所有贡献的感激,去为历史长河加上一点什么。”

我们也用这一点尝试,对Trados这样开创辅助翻译先河的前辈、对致力于改进各种翻译工具的同仁、对那些推动了机器翻译质量提升的计算机科学家和工程师、对那些为跨越人类沟通障碍而努力的译者和语言服务从业者,表达我们的敬意和感激。

-End-

【往期精选】

2018机器翻译产品全景图

2019西湖机器翻译论坛的几点杂感

2020语言服务展望之一|蒙永业:2020中国语言服务行业发展趋势

2020语言服务展望之二|吴永波:5G元年开启语言数字世界新十年

2020语言服务展望之三|王民杰:2020年同声翻译市场展望

2020语言服务展望之四|崔启亮:中国语言服务40年回顾与展望

2020语言服务展望之五|韦忠和:全球语言服务行业2019回顾

2020语言服务展望之六|韦忠和:全球语言服务行业2020展望

2019全球语言技术谱系图

2019中国语言服务业发展报告摘录

机器翻译什么时候跟人工翻译一样好

机器翻译全球市场观察|Unbabel获6000万美元C轮融资

机器翻译全球市场观察|语言技术全球版图

机器翻译全球市场观察|语料平台Flitto翻易通近日上市

机器翻译全球市场观察|日本Rozetta公司加码机翻投入

机器翻译全球市场观察|Videolocalize发布多语配音平台

机器翻译全球市场观察|金融机器翻译公司Lingua Custodia

机器翻译全球市场观察|德国Lengoo获投660万美元A轮

2019机器翻译“胡说”系列之八|周兴华

2019机器翻译“胡说”系列之七|蔺伟

2019机器翻译“胡说”系列之六|江伟

2019机器翻译“胡说”系列之五|邹剑宇

2019机器翻译“胡说”系列之四|袁行远

2019机器翻译“胡说”系列之三|李光华

2018机器翻译“胡说”系列之二|娄东来、黄国平、魏勇鹏

2018机器翻译“胡说”系列之一|朱靖波、崔启亮、韦忠和

2019全球语言服务业的一组关键数据

2019全球语言服务供应商名录


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存