2020全球语言技术全景图发布,这些现状和趋势你都了解吗?
The following article is from 机器翻译观察 Author 周子琦、吴泽闽
2020年Nimdzi 语言技术谱系图发布。让我们来看看在过去的一年里语言技术有什么新的发展和变化~~
(图片来源:Nimdzi)
调研方法论
在今年的Nimdzi语言技术全景图中,我们收集了700多个技术解决方案提供商的数据。
分布图的数据有以下四大来源:
1. 语言技术调查问卷。这项调查于2020年4月至5月进行,从全球25个国家的技术供应商那里收集了答复
2. 2020年春季和语言技术公司举行的50多次简报会和会议
3. 公开的数据(公司网站,研究文章,博客文章等)
4. 经常使用数十种语言工具的 Nimdzi 团队成员的个人经验
这些资料使我们全面了解了该行业的技术发展现状,我们很想与大家分享。
语言技术调查结果: 来自25个国家的技术供应商
(图片来源:Nimdzi)
与2019年版本的分布图相比,2020年涵盖的产品数量从400个增加到500多个,增幅超过20% ,达到660个产品。鉴于这种增长,我们不得不做出艰难的决定,从信息图表中删除较小的技术分组,如翻译记忆编辑器和国际化工具。目前的分布图系统包括以下九类主要工具:
1. 翻译业务管理系统(BMS)
2. 翻译管理系统(TMS)
3. 集成器(中间件)
4. 质量管理,包括术语管理系统
5. 机器翻译
6. 虚拟口译技术(VIT)
7. 语音识别解决方案
8. 视听翻译工具
9. 市场和平台
让我们来看看在过去的一年里语言技术发生了什么变化。
主要变化及发展
各大技术产品正积极地向云端迁移。根据 Nimdzi 语言技术调查,大多数工具现在都部署在云端:
语言技术调查结果: 模型部署
(图片来源:Nimdzi)
机器翻译类别出现了一些新的功能,如自动选择机器翻译引擎,以及根据机器输出的翻译来预测质量。与来自买方的行业领导者一起,我们期望会有更多的 MT 质量评估工具出现,这些工具可以是独立存在,也可以是内置于翻译管理系统(TMS)中。
另一个增长的领域是自动语音识别(ASR)。这就是为什么我们在分布图中专门开辟了一个单独的部分来介绍该技术。即使是廉价的语音识别软件也比手工操作提供了更高的生产效率。我们注意到,自动转录和同步服务在字幕出品中越来越多件,这些技术工具包括Happyscribe,Limecraft,Trint 和 Rev。
自动字幕已经取代了人工制作,机器旁白也在上升。尽管它距离所谓的全机配音还有一段距离,但语音合成领域正在取得有意思的进展。目前的自动化技术主要用于配音录制,如纪录片、电子学习、新闻、企业视频和音频描述。
受疫情影响,配音不得不远程进行。远程配音已经存在一段时间,但是出于对质量问题的考虑,业界似乎不愿意使用这项技术。然而,新冠病毒使得行业更早运用这项技术,迫使工作室测试和尝试不同的解决方案。由于隔离封锁,受影响国家的大多数工作室被关闭,导致配音业务严重中断。大多数媒体本地化公司需要非常迅速地调整他们的业务来应对这种情况。为此,他们采用了不同的远程配音解决方案。一些工作室已经开发了自己的平台在疫情之前他们就有类似的想法) ,其他的工作室已经找到了可以适应其当前工作流程的现有解决方案。
另一种远程方案是虚拟口译。我们在视听翻译工具部分详细讨论过,远程口译是2020年语言技术的主要进步之一。有关口译系统的分布图部分提供了一百多种工具。
在互用性领域,除了远程化之外,还出现了一种有趣的趋势。特别是业界当中,不同类型技术提供商之间的集成融合数在不断增长,分布图的中间件部分也在迅速发展。
因此,致力于整合主题的行业标准得到越来越多的关注——特别是《翻译API案例及类别倡议》(TAPICC) ,该倡议旨在推进用于多语言内容交付的 API 标准。Straker、 Lingo24、Lionbridge、 Languagewire 等公司都采用了这项标准。
说到API,不断得到支持的API 数量也从两个(REST、 SOAP)增加到了五个以上。然而,由于缺乏跨系统的通用 API,不同的工具很难彼此连接。
语言技术调查结果: API
(图片来源:Nimdzi)
由于越来越多公司正在研究新的解决方案的,各种技术之间的交流十分必要。例如,去年的分布图中只有20个翻译业务管理系统(BMS) ,而这次有33个。.
这种技术在以下两方面得到持续发展:
这里的新鲜之处在于,一些翻译业务管理系统工具开始免费,例如 Rulingo。除此之外,诸如 Smartcat 和 Wordbee 等许多翻译管理系统提供商都集成了广泛的业务管理功能。
(图片来源:Nimdzi)
分布图中最大的部分——翻译管理系统——也进步明显。持续本地化(CL)仍然是热门词汇。一些公司一直在追随这种趋势,虽然宣传他们的交付方式是连续的,但实际上并没有提供。
对持续本地化的需求将继续增长,但其需要绕过当前文件交换连接器的限制。其中一家持续本地化供应商Transifex,推出了一个开源的开发软件开发工具包(SDK)来通过 API 检测字符串和无文件的字符串传输,作为他们开发路线图中的顶级特性的例子。
具体趋势和挑战
虚拟口译技术
新冠肺炎疫情对远程口译市场产生了无可否认的积极影响。自2020年3月以来,一些视听翻译公司的入境咨询量增长了250%。在医疗保健领域,对电话口译(OPI)和视频远程口译(VRI)的需求增加了50% 以上。这主要得益于远程医疗的迅猛发展。全球医疗服务提供者都在敦促患者在拜访医生办公室、诊所和医院之前进行电话咨询,电话口译正被用作支持来自各种语言背景的人们的一种手段。此外,法律事务所已开始通过视频远程口译的形式使用虚拟口译。
由于世界范围内的旅行禁令,现场活动的口译已经被取消。反过来,相关活动,以及提供支持的翻译服务都转移到了线上。鉴于需求激增,需要更多的资源来满足新客户的额外培训和项目要求,包括招募和培训新的口译员。例如,虚拟口译提供商KUDO的内部员工数量仅在一个月内就增加了一倍。在同一期间,KUDO认证口译员的人数也增加了2000人,达到3500人。因此,尽管全球疫情对现场口译业务造成了沉重打击,但它却加速了虚拟口译的发展。
(图片来源:Nimdzi)
这种新技术进行快速市场渗透还面临许多挑战,虚拟口译提供商指出了下列一些问题:
培训客户使用新技术
未能找到一个愿意在国际上测试该平台的合作伙伴
继续利用来自微软、亚马逊和谷歌等主要科技公司的巨额投资
管理需求的激增需极度小心,掌控关注点聚焦语言技术解决方案和服务领域
由于在新冠疫情的最初高峰过后,向“正常”的过渡仍然进展缓慢,我们预计虚拟翻译将继续增长。一些虚拟口译供应商认为,虚拟口译实际上将成为新的规范,因为人们将对专用远程口译技术和服务的可用性、实用性和价值有新的认识。
远程配音
媒体本地化公司一直在积极主动,迅速地调整和改造自己,以保持在线提供多语言录音,同时遵守质量标准。
虽然对于许多公司来说,这是一个灾后重建的解决方案,并且他们渴望能够重回工作室,但远程配音技术已被证明对类似的情况(新一波的疫情,地震,洪水等)或应用这种技术的其他更有创造性的方式(例如,当声音工作者在度假期间,也能录制一些对白,混音,增加高峰期的配音能力)非常有用。
配音公司在远程道路上面临的主要挑战是:
3. 确保保护客户资产的安全措施
字幕、自动标题和语音识别
鉴于视听翻译技术的需求,翻译管理系统继续在其翻译环境中增加字幕编辑功能和视频预览功能。这就是为什么我们把 Memoq、 SDL、 Smartcat 和 Wordbee 等公司包括在这一部分的原因,尽管这些公司不是字幕编辑器,而是带有插件和字幕本地化环境的工具。
关于自动标题还需要注意的是: 一些应用程序,如 AutoCap,Clips by iPhone,Quicc,以及类似的其他一些应用程序都是为社交媒体内容设计标题的(例如Instagram,Facebook,Snapchat)。
(图片来源:Nimdzi)
语音识别功能正迅速被添加到许多工具中,例如在线会议平台。这个领域最新的发展包括Zoom的 Rev Live和 Google Android的Transcribe,都于2020年春面世。
语境审查
迟迟不能让语言服务需求方满意的一个重要但并不新鲜的利基市场,就是“语境审查”(in-context review)。语境审查工具有助于识别翻译内容中的错误,并在工作环境中对其进行实时修正。这方面最流行的使用案例之一就是能够对基于网络的产品、桌面应用程序和网站进行语境翻译和国内审校的在线工具。
尽管市场上已经有了行之有效的解决方案,比如 Lingoport 的 InContext Translation 和 QA、 translate5的 visualReview或Rigi.io,这些工具有助于一站式审校,但是全球的市场营销和本地化团队仍然认为这些审校活动是一个持续的问题。这可能就是为什么一些语言服务供应商一直在开发他们自己的审校工具,例如 Venga Global 的 InView for Product。
专注翻译管理系统
按照字面意思,TMS指的就是翻译管理系统。然而,本地化行业对于这个名称涵盖哪些特性和功能存在分歧。这是语言技术市场中最新兴的聚焦点。
Nimdzi语言技术图集的TMS部分提供了超过150种技术解决方案。在Nimdzi语言技术图集调查当中,TMS 类占了43.75% 。
这是最早又最常新的语言技术之一,2010年以来一直在蓬勃发展,所以我们决定整理一份历史时间表,说明这一切是如何开始,并在过去35年里发展的。
专题: TMS 的历史,从20世纪80年代到2010年
在 TMS 之前,有 CAT 工具。CAT (计算机辅助翻译)是一种允许用户处理双语文本,即源文本和目标文本的软件。其核心组件包括翻译记忆(TM)、 术语库 (TB)和(某些情况下)机器翻译选项。通常还包括一个内置的质量保证(QA)功能。
随着时间的推移,为了更快地完成翻译工作并增强其可塑性,这些组件已经不再能够满足需求。这就是为什么CAT环境中会出现各种管理功能,这也催生了随后的翻译管理系统。为了能够更简单、更高效,许多云端CAT 工具诞生。这些工具是 TMS 的核心。
让我们快速回顾一下这项技术的历史,以及这项古老的工具从20世纪80年代到2010年的发展情况。
年份 | 技术 |
---|---|
1984 | 英国沃里克郡考文垂兰切斯特理工大学语言研究系开发出了ALPS计算机辅助翻译。 |
1986 | Star Transit: 它的起源可以追溯到1986年。在1991年,Transit 1.0(32位 DOS 版本)是第一个出现的翻译专用工作站之一。其设计理念不同于同时期推出的其他 CAT 工具。Transit是基于用户输入到数据库中的不同语料库,而CAT系统是源文本和目标文本之间的一对一句段式对应。 |
80年代后 | Trados有限公司在80年代末开始开发翻译软件。在90年代早期,他们发布了该套件两个主要组件的第一个 Windows 版本:1992年的MultiTerm和 1994年的Translator’s Workbench。 |
1992 | GlobalWare 发布了 XL8 Code (DOS)——一个用 c 语言源代码翻译和维护用户界面文本字符串的交互式工具。它的优势在于重复使用以前的翻译和自动处理修订; 它的模糊匹配算法能够分析新的源语言文件以获取以前的翻译材料并进行替换。这听起来和翻译记忆很像! |
1993 | Atril的Déjà Vu是在对机器翻译(MT)系统和 TM 工具进行实验的基础上开发的。1993年6月初步版本完成,Windows 3.1的翻译工具诞生。1993年11月,一个集成了Windows 2.0的 Word的界面 问世,Déjà Vu的第一代版本由此产生。 |
1994 | MultiTrans (最初叫做MultiCorpora ) 于加拿大安大略省的渥太华面世。 |
90年代中期 | IBM Translation Manage (通常被称作TM/2)发布 |
1998 | 北京雅信诚软件科技有限公司成立,作为翻译软件的开发商,中国第一款CAT工具问世。 |
1999 | Wordfast Classic的前身Wordfast,由 Yves Champollion 开发,作为 Trados 的一个经济实惠的替代品。 |
2002 | XTM由 Bob Willans 和 Andrzej Zydron开发, “比其他云端TMS要早很多”。 |
2003 | Globalink (1999年最初作为 eTranslate 的一个支持工具开发)在母公司被 TransPerfect 收购之后,收到了大量投资。 |
2004 | MemoQ由Balázs Kis, István Lengyel, and Gábor Ugray三位语言技术专家在匈牙利成立。这家公司的名字Kilgray来源于其创始人的姓氏。第一版MemoQ于2006年发布,它很快就开始与 SDL Trados 争夺市场。 |
2005 | Across System有限公司成立。 |
2006 | Lingotek 由 Jeffrey Labrum在美国犹他州德雷伯开发。 |
2008 | José Vega和 Stephan Bohmig 发布Wordbee。 |
2009 | ONTRAM由Sven C. Andrä 于1999年开发, 2009年作为商业产品上市。 |
| IMB TM2的核心组件于2010开源。(TM2代表TranslationManager2,前身是IBM公司的Translation Manager) |
2010年后,该行业开始突飞猛进地发展,每年有数十个 TMS 推向市场。从那时起,平均每个月都有一个新的TMS进入市场。
展望未来一年
我们预测2020年以下方面会有快速发展:
支持持续本地化的工具
内容管理系统连接工具,中间件和集成工具
对其他领域的现有工具(例如多媒体和设计领域)的嵌入集成
机器翻译质量评估和预测工具
商业智能驱动的运营(如译后编辑)
语境翻译和审校解决方案
市场上有太多工具的主要问题是难以集成,或在一个工具和另一个工具之间切换(资源损失、迁移成本、定制成本)。对于大型组织来说,数十年来积累的工具和内容数量使转换的成本更加高昂。虽然他们可能会密切关注市场,但是他们现有业务体量很难让他们考虑技术转换。行业标准化举措可能有助于这方面的工作,但只能从长期来看,并且随着采用这些标准的人数的增加而出现。我们并不期望这个互用性问题能在2020年内完全解决。
更重要的是,过多的技术解决方案不一定对需求方有很大好处,尤其是当需求方想要的是解决他们独特问题的定制方案时。需求方反复表达的一个观点是,在功能方面要求具有灵活性——他们想要定制的解决方案。这使我们产生了一个想法,本地化技术将继续向价值链上游移动,增加更多用户友好、即开即用的解决方案,对相关领域的常见工具进行更多集成。
本文原文来自Nimdzi,全文为完整版,未有删节,全文译文来自机器翻译观察微信公众号,由周子琦、吴泽闽共同翻译。
注意啦!在公众号对话框回复“号内搜”,获取链接,可以快捷搜索“译·世界”号内任意信息~
推荐阅读