查看原文
其他

学术观点 | 王清然、徐珺. 技术进步视域下机器翻译技术对语言服务行业的影响分析

学术观点


技术进步视域下机器翻译技术对语言服务行业的影响分析

王清然 徐珺

(中国政法大学)

摘    要:十九大报告提出,中国要坚持和平发展道路,推动构建人类命运共同体。语言服务可以促进国与国之间的交流,是实现人类命运共同体构想的有力推手,而语言服务技术的进步,尤其是机器翻译技术的创新与变革,是促进语言服务业发展的重要因素。本研究基于技术进步视角,重点探讨了以下三个问题:(1)神经机器翻译技术对语言服务企业绩效产生何种影响? (2)面对机器翻译技术进步时的决策如何影响语言服务企业的未来发展? (3)机器翻译技术进步如何驱动全球语言服务业内的并购重组? 研究发现:神经机器翻译技术对语言服务企业绩效具有显著的积极影响;相较于未采用机器翻译技术的语言服务企业,采用机器翻译技术的企业业绩增长明显;机器翻译技术进步推动了语言服务业内的并购重组,并显著提升了相关企业的绩效。研究结果表明,机器翻译技术进步是现代语言服务业飞速发展的主要原因之一,语言服务企业应顺应时代变化,积极拥抱新技术,促进自身与行业的发展。

关键词:语言服务;技术进步;机器翻译;事件研究

文献来源:王清然,徐珺.技术进步视域下机器翻译技术对语言服务行业的影响分析[J].中国外语,2022,19(01):21-29.

基金项目:2021年北京市社科基金规划项目“跨文化传播与中国话语的全球建构研究”(编号:21YYB005); 中国政法大学青年教师科研启动项目“国际贸易、神经机器翻译与语言服务企业绩效”(编号:10821654)的阶段性成果。


1

引言

语言服务产业的主要驱动力是技术进步,尤其是以机器翻译为代表的语言服务技术的创新与变革。2013年,Nal Kalchbrenner & Phil Blunsom提出了端到端神经机器翻译的“编码-解码”框架,催生了神经机器翻译研究的热潮。百度和谷歌分别于2015年和2016年上线了各自研发的神经机器翻译系统,标志着神经机器翻译技术的正式商业应用。近年来,神经机器翻译的发展使机器翻译的质量得到了革命性的提升,在多个指标上显著超越了传统的统计机器翻译并逐渐向人工翻译靠近,并在谷歌翻译、必应翻译、百度翻译等多个机器翻译平台上被快速推广应用,被视为重大的语言技术突破。

机器翻译技术的发展与应用,为语言服务业带来了深远的影响,主要体现在以下两个方面:首先,机器翻译对人工翻译的辅助作用越来越大。神经机器翻译的译文输出质量已经达到较高的水平,这使“机器翻译+译后编辑”生产模式中译后编辑的工作量和工作时间大大减少。因此,采用新技术可以提升工作效率,从而扩大增加业务量与提升市场竞争力的空间。其次,语言服务产业的整体市场不仅不会萎缩,反而可能会因为机器翻译的应用而扩大。一些原来因为人工翻译不方便、成本过高等原因而被忽视甚至被放弃的语言服务细分业务,如出国旅行的翻译服务、信息量庞大的电商网站的本地化、社交媒体信息的即时翻译等,其业务量随着机器翻译技术的成熟获得了较快增长。

语言服务业作为实现人类命运共同体构想、推动“一带一路”沿线各国的合作与发展、助力脱贫攻坚、参与全球抗疫的中坚力量,日益受到学界和各级政府部门的关注。本文从技术进步视角出发,采用定量与定性相结合的分析方法,全方位考察机器翻译技术进步对语言服务行业的影响。

2

文献回顾

语言服务是实现知识和经验人际或组织间转移的社会经济过程(李瑞林,2017)。语言服务业是以实现跨语言的文化交流和融合为目标,提供翻译、本地化服务、语言技术工具开发、语言培训和教学、多语言信息咨询等服务的行业(赵军峰、寇莹瑾,2017)。现阶段,语言服务业已成为全球产业链中非常重要的一环(邵珊珊,2017),相关研究方兴未艾。

在技术创新不断为不同行业带来产业范式变迁(Paradigm Shift)的时代背景下,以机器翻译技术为代表的语言服务技术也在持续重塑语言服务行业。截至目前,语言服务业内共出现了三次主要的技术变革:自20世纪80年代末期开始的计算机辅助翻译工具(Computer-Assisted Translation Tool)的广泛应用,20世纪90年代末期统计机器翻译技术(Statistical Machine Translation)的普及应用,以及目前神经机器翻译技术(Neural Machine Translation)的推广和应用。在推动语言服务产业结构升级的同时,机器翻译技术的不断进步与创新也为语言服务企业与产业带来了范式变迁。而频繁的国际经贸活动使得各国对语言服务的需求与日俱增,这对语言服务产业的生产力水平带来了前所未有的挑战,进一步推动了机器翻译技术的快速发展(Hutchins,1998;Chatzikoumi,2020)。

既往研究语言服务技术(以机器翻译为代表)与语言服务产业关系的文献中,一部分研究表明技术进步显著地影响了语言服务产业的发展。司显柱、郭小洁(2018)认为语言服务业发展的源动力在于技术进步。Luo et al.(2018)指出,技术创新将会重塑语言服务业的产业结构和增长模式。另一部分研究则认为语言服务技术仍不足以显著影响语言服务业。Drugan & Babych(2010)发现机器翻译难以妥善处理语言距离较远的两种语言的互译,对语言服务业的影响有限。崔启亮(2014)指出,原始的机器翻译产品仍存在较多错漏,因此机器译文的译后编辑环节仍是不可或缺的。以上研究主要探讨的是统计机器翻译的影响,而统计机器翻译的准确度显著低于神经机器翻译(Bentivogli et al.,2018),因此对前者的分析不一定适用于后者。此外,过往文献以定性分析为主,缺乏定量分析,且未对语言服务企业所受到的影响进行深入研究。

有鉴于此,本文将通过事件分析法与案例分析法,在系统梳理语言服务业主要技术类型的基础之上,从技术进步的视角探讨当前语言服务业面临的机遇与挑战,并聚焦于以下三个问题:(1)神经机器翻译技术对语言服务企业绩效产生何种影响? (2)面对机器翻译技术进步时的决策如何影响语言服务企业的未来发展? (3)机器翻译技术进步如何驱动语言服务业内的并购重组?


3

语言服务业技术类型及现状分析


近年来,技术在语言服务业中的作用与日俱增,且很大程度上决定了语言服务业未来的走向。本节将从语言技术业务出发,介绍当前语言服务业中主要的技术类型。如图1所示,2015—2019年间,全球语言技术市场规模呈稳步增长趋势,在神经机器翻译技术正式商业应用的2016年更是出现了爆发式增长。

根据CSA Research的分类方法,语言技术业务主要提供三大类型的语言服务技术:(1)管理与处理(此类技术主要负责对翻译项目进行支持和管理,可以细分为三种类型:内容管理集成连接器、笔译管理系统、口译管理系统);(2)翻译与交付(此类技术为具体的翻译过程提供帮助,主要包括机器翻译、语音处理、本地化工程、术语管理、质量评估和检查、翻译记忆、翻译环境等);(3)内容创建与发布(此类技术能够对翻译结果进行润色提升,主要包括视听工具、内容管理系统、风格检查、信息提取和发现、出版辅助、自动内容丰富等)。图2—图4呈现了2015—2019年间,以上三大类语言技术细分类型占语言技术业务总营收的比例情况。

图1 语言技术市场规模(2015—2019)

图2 管理与处理类技术细分占比(2015—2019)

图3 翻译与交付类技术细分占比(2015—2019)

图4 内容创建与发布类技术细分占比 (2015—2019)

图5 四类主要语言技术业务占技术总营收比例趋势(2015—2019)

近年来,笔译管理系统、机器翻译、内容管理集成连接器和口译管理系统是语言技术总营收占比最高的四项技术,图5总结了五年间(2015—2019)这四项技术占比的发展趋势。由图5可知,自2016年后(即神经机器翻译技术正式商业应用后),机器翻译技术的营收占比出现了明显的上升,而其他三种技术所占营收份额或出现明显的下降(口译管理系统),或基本维持不变(笔译管理系统、内容管理集成连接器)。

4

机器翻译技术进步对语言服务业

的影响:机遇与挑战

上一节的分析表明,近年中,以机器翻译为代表的语言服务技术营收出现明显的上升趋势。一方面,新技术惊人的学习速度可以帮助语言服务企业大幅提高翻译效率,另一方面,高科技公司也在借助这些新技术进入语言服务行业,成为语言服务企业的竞争者。因此,语言服务技术进步对语言服务业而言,既是机遇,也是挑战。本节将从三个不同维度,采用定量与定性分析相结合的方法,探讨机器翻译技术进步对语言服务业的影响。小节4.1将采用事件研究法分析谷歌正式发布其神经机器翻译系统对语言服务业上市公司的冲击;小节4.2采用案例分析的方法进一步探讨企业面对机器翻译技术进步时的决策如何影响其未来发展;小节4.3探讨机器翻译技术进步如何驱动语言服务业内的并购重组。

4.1 技术进步与语言服务企业绩效:基于神经机器翻译技术的事件研究

2016年11月15日,谷歌宣布将其研发的谷歌神经机器翻译系统(Google Neural Machine Translation,GNMT)正式应用于谷歌翻译,取代原先使用的统计机器翻译系统;同时,谷歌还在免费翻译服务的基础上,提供付费的API服务,使得第三方机构(包括语言服务企业)也可以在它们的业务中使用谷歌的神经机器翻译系统。这个事件标志着神经机器翻译具有全球影响力的首次大规模商业应用,对语言服务业具有深远的影响3。一方面,这标志着以谷歌为代表的高科技公司借助技术进步进入语言服务行业,与语言服务企业形成竞争关系,从而对后者的市场份额与经营绩效产生负面冲击。另一方面,语言服务企业可以通过采用新技术来提高翻译效率,降低成本,提升业绩。换言之,神经机器翻译技术对语言服务业既有负面冲击,也有正面影响。

为了量化神经机器翻译技术的净影响,本小节聚焦于语言服务业上市公司的股价变化。由于神经机器翻译技术是语言技术的一项重大突破,所以投资者应该会意识到该技术对语言服务企业经营绩效的正面与负面影响,并通过股票交易将影响反映到语言服务上市公司的股价上。具体而言,谷歌的公告向资本市场提供了丰富全面的信息,使所有人(包括投资者)都可以直观地体验新技术对翻译质量的提升,从而能更好地评价该技术的应用前景及其为语言服务企业带来的潜在竞争和潜在收益,所以此公告导致的语言服务上市公司的股价变化能够准确地反映该技术未来对企业绩效的影响。因此,本小节将通过事件研究法来量化神经机器翻译技术的影响。所用到的语言服务上市企业的股票数据来自于标准普尔的Capital IQ数据库。以下是对这一方法的简单介绍。

该方法首先选定公告日为事件日0,然后选取[–210,–11],即事件日前第210个交易日到前第11个交易日作为估计窗口,共200个交易日。接着运用估计窗口的数据对每一家公司分别估计如下的市场模型:

其中,Rjt为企业j在t日股票收益率,Rmt为企业所在国家在t日的市场收益率,ejt是除了市场收益率之外的影响公司股票收益率的其他因素。由此可以得到两个系数的估计值:

将这两个系数的估计值带入上面的市场模型,可以计算出每天的预期收益率,即,

实际收益率减去预期收益率可得到异常收益率(abnormal return):

随后选定事件窗口[t1,t2],即股价会被公告所影响的时间段。由于消息可能会提前泄露,使得股价提前做出反应,同时市场有时候也需要一些时间来理解和消化公告的信息含量,所以文献上一般选择公告日前后一至几个交易日作为事件窗口,如t1=–1,t2=1。事件窗口的累计异常收益率(cumulative abnormal return,CAR)可由异常收益率加总得到:

然后,对所有样本企业的CAR求均值,这里均值代表了某一类型事件对样本企业的平均影响。最后,使用t检验来检验以下原假设:CAR的均值等于0。如果能拒绝原假设,即CAR的均值在5%水平下显著地不等于0,则代表投资人预期神经机器翻译技术将对语言服务企业绩效产生显著影响;反之,如果不能拒绝原假设,则代表投资人预期神经机器翻译技术不能对语言服务企业绩效产生显著影响。

语言服务上市公司的股价在GNMT技术正式商业应用的公告期间出现显著上涨。基于以上事件研究法的分析表明,CAR的均值在事件窗口[–1,1]这三个交易日期间为0.81%,在[–1,2]这四个交易日期间为0.88%,并且都在1%的水平下显著( t 统计量分别为2.77和2.60)。这说明投资者在见识到神经机器翻译技术的商业应用之后,预期神经机器翻译技术将显著提升语言服务企业的绩效,即投资者认为新技术对语言服务企业的正面影响大于其负面冲击。

4.2 基于机器翻译技术进步视角的案例分析

GNMT事件研究的结论是通过对一个较大样本进行计量分析得到的,虽然不失一般性,但计量分析无法描述新技术对单个企业的具体影响过程。为弥补这一不足,本小节选取两个典型的语言服务企业,采用案例分析的方式进一步探讨企业面对机器翻译技术进步时的决策如何影响其未来发展。

案例一:Lionbridge公司

Lionbridge公司成立于1996年,是一家全球领先的语言服务提供商,主要营业范围涵盖翻译和在线营销,并提供全球内容和测试解决方案,在不同语言环境中,都可以确保客户的品牌一致性、本地性和技术的可使用性。

Lionbridge是翻译和本地化专业服务的领导者。2005年,Lionbridge收购了Bowne Global Solutions (其规模曾在2000年排名全球第二),一举成为最大的语言服务企业。目前,超过800个全球品牌依靠Lionbridge来管理跨渠道、跨平台和跨语言的关键业务内容,应用程序和通信。如表1所示,在CSA Research发布的语言服务行业报告中,Lionbridge连续多年位列榜单前三名,在语言服务领域具有非常强的综合实力。

表1 CSA Research报告中Lionbridge历年的排名情况

Lionbridge营业收入的持续增长和在语言服务行业稳固的龙头地位得益于其长期战略的实践,即通过新的垂直行业、新的客户和新的平台来获得增长。这些业务增长的关键原因之一就是对最新机器翻译技术的利用。

Lionbridge在机器翻译领域的投入最早可以追溯到20世纪90年代末期。这一时期,传统的统计机器翻译方法初步形成,Lionbridge便进行积极的尝试和探索。在2004年之后,其已经形成了全面的机器翻译译后编辑能力。

2009年,Lionbridge推出了Workspace,这是一款面向译者和机构、基于云端的CAT工具,允许译者进行合作、知识共享和提供一致的结果。

2011年,Lionbridge和IBM合作,基于IBM的机器翻译引擎推出了GeoFluent。这是一种面向普通客户的、基于云的可定制第二代实时自动翻译技术,在原始的机器翻译的基础上加入了语言增强技术,可以识别并适应俚语、简写和拼写错误;同时更加考虑客户体验,可立即将内容和通信翻译成多种语言。

2014年,Lionbridge发布了onDemand API,这是第一款可以为多种专业级别的文本提供机器翻译及译后编辑服务的API。

2018年,Lionbridge宣布与亚马逊AWS合作,新推出的产品可以利用深度学习和神经网络技术提供快速、高质量、经济实惠的翻译服务。服务质量和性价比的提升帮助Lionbridge在翻译和本地化领域巩固了市场地位。

2019年1月,Lionbridge收购了总部位于东京的语言技术服务公司Gengo,后者的主营业务是人工智能数据培训和服务,例如数据注释、搜索相关性、聊天机器人数据培训等。

截至目前,Lionbridge已经拥有了以机器翻译、人工智能和云计算技术为核心的,包括内容连接器、API、项目门户与在线平台、任务管理与工作流平台、质量测评技术等在内的一整套完备的技术体系。一方面,这些技术的应用极大提升了Lionbridge翻译服务的质量,将语言、文化、行业专家们更紧密地连接在一起,满足了客户种类繁多的需求,帮助客户实现其任务的实时管理,另一方面,机器翻译技术的运用帮助Lionbridge提高了翻译的效率,并且随着翻译数量、范围和时间的增长,云端可利用的数据越来越多,神经机器翻译的过程会变得更加高效。翻译质量和效率的不断提升使Lionbridge的竞争力进一步加强。

在近20年的时间里,Lionbridge与时俱进,不断拥抱新技术,在语言服务行业长期保持领先地位,持续将自己的业务拓展到新的垂直行业、客户和平台。如图6所示,除个别年份,Lionbridge的营业收入一直在稳步增长。

图6 Lionbridge历年营业收入


案例二:AAC Global公司

AAC Global是北欧领先的全球语言服务提供商之一,提供的服务主要包括翻译和本地化服务、培训和学习服务、营销内容服务等。在翻译服务方面,AAC Global是芬兰翻译服务市场的领导者,拥有广泛的合作伙伴网络和长期积累的术语库,立足于芬兰语这样的小众语言,面向北欧以及全世界的企业提供服务。在财务数据方面,AAC Global营业收入总体上呈不断下滑的趋势。如图7所示,相比于在巅峰时期的营业收入(2008年,4 900万美元),2017年其营业收入已经下滑至1 800万美元。

图7 AAC Global历年营业收入

与此同时,AAC Global在CSA Research报告的排名中,虽然一直位列全球50强,但其排名在不断下滑,接连被同行超越(如表2所示)。

表2 CSA Research报告中AAC Global历年的排名情况

2017年,欧洲语言服务市场占全球市场的49%,连续多年成为全球最重要的语言服务市场。其中,北欧市场占全球总份额的24.51%,由此可知,AAC Global所处的外部总体环境并没有出现明显恶化。与此同时,北欧的另一家语言服务企业Semantix,在2007年营业收入与AAC Global大致相当,为4 373万美元,到2017年则增至1亿美元左右,是AAC Global的五倍有余。

究其原因,AAC Global业绩的下滑与其对待机器翻译技术的战略不无关系。Semantix重点推出了机器翻译系统,依靠其高效和便捷性获取了大量的市场份额。与竞争者相比,AAC Global对机器翻译技术基本采取了忽视的态度。据其官网介绍,AAC Global认为芬兰语这样的小众语种不适宜采用机器翻译,所以其翻译服务主要基于人力团队和传统翻译技术,而未重视机器翻译和云计算等新技术。从发展结果来看,未采用机器翻译技术的AAC Global的表现并不理想。

从上述两个案例可以看出,机器翻译技术的出现对于语言服务企业来说,是一把双刃剑,随着技术的不断更新,全球语言服务提供商都面临着新的挑战,如何应对新的变化成为重要的课题之一,但与此同时,新的机器翻译技术也意味着新的机遇和新的可能。

4.3 语言服务业基于机器翻译技术进步的并购重组

一直以来,并购重组都是语言服务业的热门话题。在美国及欧洲的语言服务市场上,行业内的领军企业频繁通过并购活动进行扩张,以占据更大的市场份额(Olohan,2007)。

CSA Research(2007)的全球语言服务市场并购报告指出,语言服务业的并购浪潮始于2005年Lionbridge并购Bowen Global Solutions。2008年以来,全球大型语言服务企业的并购活动此起彼伏,SDL, Lionbridge, Merrill, RWS, TransPerfect, Welocalize等语言服务企业均进行了多次并购,目的多为增强技术实力、进入新的领域和市场、扩大规模、增强竞争优势等。纵观近年全球语言服务市场的并购案例可以发现,技术是产业内并购重组活动频发的重要驱动因素。在由技术驱动的语言服务并购重组活动中,并购标的公司通常为技术类公司,收购方主要以获得新技术、提升技术含量和科技竞争力等为目的。以下将通过一个具体的案例说明对机器翻译技术的需求如何驱动语言服务行业内的并购活动。

2010年7月15日,全球领先的语言服务提供商SDL宣布将以4 250万美元现金收购统计机器翻译领域先驱Language Weaver公司85%的股权。

SDL成立于1992年,在语言和内容管理解决方案领域是全球的领导者与创新者,主要提供全球信息管理解决方案。SDL在全球38个国家和地区设有70余个分公司,全球100强品牌中有90家是SDL客户,包括Adobe、DELL、Intel、Siemens等。Language Weaver作为统计机器翻译领域的先驱,起源于美国南加州大学信息科技研究所,该研究所由统计机器翻译领域著名教授Kevin Knight领导。Language Weaver主要提供企业级的用户服务。

为探究此次收购事件是否创造价值,图8对比了2010年1月1日至2010年12月31日SDL的股价和FTSE 100指数。在并购之前,SDL股价的走势与市场指数基本一致。并购之后,SDL股价的总体趋势是上行,而市场指数却在下行。这说明此次并购得到了市场的认可,为公司创造了价值。

图8 SDL与FTSE 100 Index股价示意图(数据来源:Capital IQ)

表3展示了SDL公司2008年至2012年的营业收入和增长率。在并购之前,SDL公司的营业收入持续下降,但在并购之后显著回升,说明并购提升了企业的经营绩效。

表3 SDL公司的营业收入 

数据来源:笔者根据CSA Research的年度报告汇总整理而成

Language Weaver作为典型的依靠机器翻译技术进步而发展起来的新型语言服务企业,与SDL整合之后可以产生巨大的协同效应,这是这起并购能够创造价值的主要原因。传统的语言服务业属于人力密集型产业,一家语言服务企业能承接的业务基本是由公司人员规模决定的,并且由于人员管理问题,公司管理人员的边际成本非但不会随着公司规模变大而减少,反而会增大。但是机器翻译技术不仅可以大幅度减轻公司对翻译人员的依赖程度,提高翻译人员的语言处理效率,同时随着处理业务数量增多,翻译算法的准确率也会不断提高,属于边际成本递减的模型。此外,伴随互联网的发展,全球正处于信息爆炸的时代,信息的呈现方式越来越纷繁复杂。互联网用户需要以快捷的方式阅读更丰富的内容,若仅依靠人工翻译将难以满足。因此,SDL需要Language Weaver的机器翻译技术,而且后者在机器翻译技术领域的专长可以和SDL在内容与语言技术解决方案方面的经验实现较好的互补,产生协同效应。

5

结语

本研究首先系统梳理了语言服务业的主要技术类型,以深化读者对处于技术变革时期的语言服务业的认识。在此基础上,本文从技术进步的视角探讨了当前语言服务业面临的机遇与挑战。因为神经机器翻译是近年来最重要的语言技术突破,本文聚焦于该技术进步,采用事件分析法实证检验了GNMT正式商业应用对语言服务企业绩效的影响,发现神经机器翻译技术的正式商业应用显著提升了语言服务企业绩效。通过案例分析法,本文进一步探讨了语言服务企业面对机器翻译技术进步时的决策如何影响其未来发展,并发现相较于未采用新技术的语言服务企业,拥抱新技术的企业业绩增长明显。由于市场集中度低、竞争者数量多、竞争较为激烈是语言服务业的主要特点,而兼并收购是语言服务企业成长扩张的重要途径,因此本文结合具体案例深入分析了由机器翻译技术进步驱动的业内并购重组活动的价值创造模式,发现基于技术的并购显著提升了语言服务企业的经营绩效。

近年来,我国人工智能、云计算等技术正处于快速发展阶段,为语言服务业带来了新的机遇。十九大报告提出“推动互联网、大数据、人工智能和实体经济深度融合”,表明推动人工智能发展已上升至国家战略层面。自2010年至2020年的10年中,国务院、工信部先后出台相关政策,大力发展云计算产业链,进而推动云计算的实质性应用。这些政策都为我国语言服务业的发展提供了驱动力。鉴于此,我国语言服务企业应顺应时代变化,积极拥抱以神经机器翻译技术为代表的各类新时期语言服务技术,促进自身与行业的发展;在“构建人类命运共同体”“一带一路”倡议的背景下,继续在促进各国之间的互联互通、推动各国增进共识与深化合作、让各国的文化与经济联系更加紧密等方面起到重要作用。


文献来源 | 《中国外语》2022年1月第19卷第1期

扫描下方二维码获取完整原文


继续滑动看下一个
语言服务研究院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存