引言 近年来,随着经济全球化的深入发展以及“一带一路”倡议和文化“走出去”策略的实施,中国语言服务市场需求激增,语言服务项目日益呈现海量化、碎片化、多模态、交付快的特征。如果没有现代技术的帮助,译者在处理大量、复杂的翻译数据时无疑会逐渐力不从心。同时,在大数据时代下,借助人工智能、深度学习等技术,机器翻译技术进步迅速,进入了神经网络机器翻译(Neural Machine Translation,NMT)时代,质量和效率都得到了极大的提高,NMT成为提高翻译生产力的有效工具。那么,中国语言服务企业将如何应对海量的翻译需求?语言服务企业使用机器翻译与译后编辑的现状如何,问题有哪些,未来应如何更好地利用机器翻译技术?本文将阐述对上述问题的调研情况。一、研究现状 根据国际标准化组织(International Organization for Standardization,2015)的定义,机器翻译是“使用计算机系统将文本或语音从一种自然语言自动翻译成另一种自然语言”。自20世纪50年代机器翻译被正式发明以来,机器翻译的模型不断进步,经历了从基于词典、基于规则、基于统计到基于神经网络的演变。神经网络机器翻译以人工智能和深度学习技术为基础,相比之前的模型在翻译效率和质量上都有极大的提高,是当今主流机器翻译系统普遍采用的模型。但是,目前机器翻译的质量还远远无法与专业人工翻译相提并论。因此,为了使机器自动翻译的译文达到质量要求,机器翻译译后编辑(Machine Translation Post-editing,MTPE)就显得尤为重要。根据International Organization for Standardization(2017)的定义,MTPE是指对机器翻译译文进行修改和加工以使其符合客户质量要求的过程。作为平衡翻译效率和质量的一种手段,MTPE已经成为语言服务行业中的一种新型有效的生产模式并逐渐得到广泛应用。 1.国外研究国际上,一些机构如美国语言公司协会(Association of Language Companies,ALC)、卡门森斯咨询公司(Common Sense Advisory,CSA Research)、欧洲语言行业协会(European Language Industry Association,ELIA)、SDL公司、翻译自动化用户协会(Translation Automation User Society,TAUS)等都对全球语言服务业的机器翻译使用情况进行了调研,主要关注机器翻译和译后编辑的市场规模、使用前景等方面的问题。 2015年,ALC发布了《ALC2015行业调查报告》,调查了其全球120家会员企业的技术运用情况。调查发现,78%的企业认为机器翻译带来了“显著影响”(5分权重下选择4或者5),50%的欧洲企业和36%的美国企业部署了机器翻译引擎,25%的欧洲企业和20%的美国企业在翻译项目中使用机器翻译。具体到项目比重,美国企业平均在21%的项目中使用了机器翻译,为有史以来的最高值(Association of Language Companies,2015)。 2016年,SDL调查了来自全球2 784家语言服务企业、机构和自由从业者,其中40%的受访者使用机器翻译,而这部分受访者中有64%认为机器翻译提高了工作效率,值得推广(SDL,2016)。 2016年,CSA发布了报告《译后编辑进入主流》,对全球383家语言服务企业进行了调查。调查发现,共有46%的企业采用译后编辑模式或提供译后编辑服务,并且这一占比还在继续增加。该报告还指出,采用译后编辑对于多数语言服务企业来说是不可避免的趋势(Lommel & DePalma,2016)。 2017年,TAUS发布了《2017年TAUS机器翻译市场报告》,对全球机器翻译的市场规模和发展机遇进行了调查,并强调在未来十年内机器翻译的广泛应用是大势所趋(Translation Automation User Society,2017)。 2019年,ELIA发布报告《语言行业调查——2019年欧洲语言行业的期望和关注》,调查了来自55个国家的语言服务企业和译者,共收集了1 404份问卷。数据显示,51%的公司计划增加对机器翻译的投资,而18%的公司正准备使用机器翻译(European Language Industry Association,2019)。 2019年,CSA Research发布了《2019年全球语言服务市场报告》,指出2018—2019年语言服务和技术市场增长了6.62%,规模达到496亿美元,其中机器翻译译后编辑的市场份额占3.81%。与此同时,在17种主流语言技术的市场份额中,机器翻译排名第二,占17.60%。2016—2018年,提供机器翻译译后编辑的语言服务企业平均占比为36.53%(DePalma et al.,2019)。 同年,CSA还发布了另一份报告《机器翻译在语言服务提供商的应用》,调查发现,有51%的受访企业使用机器翻译,其中81%部署了NMT。在使用NMT的企业中,69%采用商业通用系统,13%使用自主定制系统。此外,企业对机器翻译的使用率与其收入、规模、年限呈正相关关系(Pielmeier & Lommel,2019)。 2.国内研究中国翻译协会于过去5年间发布了多份语言服务行业发展报告,多次涉及语言服务企业对机器翻译的使用率和态度等方面的问题。 中国翻译协会(2018)发布的《2018中国语言服务行业发展报告》显示,2018年,在402家受访语言服务提供商中,27.1%使用机器翻译。使用率最高的机器翻译系统为谷歌翻译,比例为36.7%;其次为百度机器翻译和有道机器翻译,占比分别为22.9%和21.1%;其他机器翻译工具的使用率均低于一成。在319家受访语言服务需求方中,近九成并不反对在日常语言服务业务中使用机器翻译,仅有不足一成(4.8%)明确表示禁止使用机器翻译。在144名受访自由译者中,72.9%表示在翻译工作中会使用免费的在线翻译系统与字典。 中国翻译协会(2019)发布的《2019中国语言服务行业发展报告》显示,机器翻译在语言服务行业中的应用较为普遍。在受访的300家语言服务提供商、300家语言服务需求方和100名语言服务自由从业者中,41%的语言服务提供商表示经常使用机器翻译,45%的语言服务从业者表示偶尔使用机器翻译,75%的语言服务需求方对使用机器翻译持积极态度。同时,调查还发现,机器翻译质量满意度偏低,机器翻译结果易给译者带来困扰;约75%的语言服务需求方比较相信人工翻译会被机器翻译取代,而仅约25%的语言服务从业者认同上述观点。王华树、李智(2020)于2018年11月至2019年4月共调查了337名中国笔译从业人员,其中18.4%来自语言服务提供商。调查发现,机器翻译发展迅速,译后编辑正在成为主流模式;与此同时,面临的挑战和困境也非常突出,虽然译员技术和认知水平较高,但实践与认知脱节现象严重。 中国翻译协会(2020)发布的《2020中国语言服务行业发展报告》显示,机器翻译在语言服务行业的应用越来越广泛。在受访的304家语言服务提供商、300家语言服务需求方以及173名语言服务自由从业者中,5.6%的语言服务提供商受访企业表示经常使用机器翻译,36.8%表示经常使用,45.7%表示偶尔使用,9.9%表示极少使用,2.0%表示从不使用;11.6%的受访语言服务从业者表示总是使用机器翻译,28.3%表示经常使用,49.7%表示偶尔使用,其余10.4%表示极少或从不使用;8.3%的语言服务需求方选择机器翻译来满足翻译需求的可能性较高,为67%-99%;其余大部分语言服务需求方选择机器翻译的可能性在34%-66%之间。 3.国内外研究简评从研究现状来看,国外相关机构的调研更全面、深入,并且分别对机器翻译和译后编辑进行了专项调研,针对性更强。相比之下,国内的调研虽然覆盖了语言服务行业机器翻译的基本应用情况,从中可看出机器翻译正逐渐普及的基本趋势,但专项调研较少,对于细节层面的问题(如企业如何使用机器翻译和译后编辑,对其有何建议和期望,以及有哪些因素可能促使或阻碍企业对该技术的使用等方面)调查不够深入。本文拟在已有研究的基础上,针对上述问题展开进一步的调查。二、研究设计1.调查对象根据中国翻译协会(2019)的统计,截至2018年12月底,中国以翻译服务为主营业务的在营企业共9734家。鉴于时间和成本等方面的限制,笔者选择了218家具有代表性的中国语言服务企业作为调研对象,问卷受访者角色设计涵盖语言服务企业决策人员、管理人员、译员和审校人员等,调查对象角色具有多样性和层级区分,从而使调查数据更具可信度。2.问卷设计笔者在专业问卷平台“问卷星”上设计调研问卷,该问卷由32个题目组成,其中包括17个单项选择题和15个多项选择题。为确保调研结果有效可信,问卷题目严格围绕调研主题设计,遵循清晰性、单一性、中立性、简洁性等原则,且无预设立场;采用李克特量表,以更准确地调查程度类题目;同时设置了前后照应的题目,以检验问卷的反馈是否前后矛盾。3.问卷实施在正式开始调研前,笔者将问卷发送给10名资深专家(来自CSOFT、SDL、Lionbridge等公司)进行预测试;随后,通过电话和会议软件的方式就问卷设计问题对专家进行了访谈,并根据专家反馈对问卷进行了修订。本次调研从2019年12月持续至2020年2月,历时2个多月,共收到225份问卷。经过筛选,去除了7份无效问卷(包括答题用时过短、前后矛盾以及同一单位重复的问卷),最终得到218份有效问卷。三、数据分析与讨论1.数据概括笔者根据筛选过后的218份有效问卷,分析了受访人士和受访企业的基本信息,包括受访人士的职位分布以及受访企业的分布区域、人员规模、经营性质、经营年限、年均收入和业务特点等。详细情况见表1。