2018机器翻译产品全景图
“不谋全局者,不足谋一域。” ——古语
机器翻译在2018的科技媒体绝对是一个高频词。看过WMT和IWLST等国际大赛中国玩家夺得好名次的消息,也见识过《揭秘进博会同声传译背后:不是人,是机器人》这样的惊悚标题;见过实时字幕投屏的机器同传的惊艳,也经历过“人机耦合”的刷屏;看过一场场翻译机翻译蛋翻译耳机的发布会新闻,也等到了百元级别价格屠夫的出现……但作为一个好奇执着的翻译产品关注者,观察君更关注的是,机器翻译这个近两年日渐成熟的技术,在这一番热闹之下,在产品层面如何的演化?渗透进了哪些场景?呈现出了怎么样的趋势?
先来一张图:
机器翻译+场景是最有意思的部分,观察君把它们分为三大类场景:信息发布、信息获取、信息交换。当然这个分类不是绝对的,比如视频翻译和文档翻译就可以既归于信息发布又可以归于信息获取,并有融合的趋势。
下面就这张图一一细说:
一、开放翻译系统:
最常见的形态就是这种在线翻译:
这类产品,除了语种在默默增加,各家系统暗自较劲,有两个大的变化,一是几乎一夜之间齐刷刷冒出来的文档翻译,就连之前老气横秋的谷歌翻译大叔也改版了;二是中译语通、新译、爱特曼等公司,在通用翻译之外,推出了专业领域翻译。可以预见接下来会更多样化,比如增加用户上传术语之类的功能。
二、私有翻译系统:
出于安全考虑,一些财大气粗的政府机构、情报机构或者企业,会直接采购私有的翻译系统部署在本地,当然具体需求各异,但安全、定制化是大家一致的需求。下面是to B类机器翻译赛道上的一些公司:
以上只列举了部分,提供机器翻译私有部署服务的还有橙译中科、传神、语智云帆、欧米翻译等公司。另外,正如近年一个有趣的现象:友商之间竞争有时非常短暂,大家跑着跑着就不在一个赛道了。比如中译语通转向大数据,爱特曼科技转向医疗(同类公司还有具备人机翻译背景的深度智耀),百度翻译、搜狗翻译也”横插一脚“提供私有化部署服务。
三、机器翻译+具体使用场景:
1、信息发布场景:
CAT(计算机辅助翻译):除了翻译记忆库,这个“古老”工具最大变化之一是机器预翻译以前是免费的,现在开始收费了,毕竟机器翻译越来越靠谱了。还有一个重要变化是从复杂的客户端演变成在基于web端的轻量化工具,无需下载安装,上手容易。CAT工具可以分成三类:
交互式机器翻译方面,创立于2015年的Lilt今年10月刚刚宣布A轮融资;腾讯AI Lab 11月也刚刚发布了交互式机器翻译产品Transmart。超越传统CAT基于翻译记忆和机器翻译译后编辑模式,这个产品实现了人机互动的数据闭环,无疑代表了专业笔译工具的未来。随着工具门槛的降低,来自各行各业的“非专业”译者,凭借自己的专业知识背景,有望快速扩大这个原本不足百万的用户群体。
翻译输入法:代表产品有译云输入法、轻敲输入法、搜狗输入法(翻译只是其中一个功能,海外版名字叫Typany)、新译预测性翻译、轻敲输入法等。
需要改变用户习惯的客户端输入法已经被验证是鸡肋产品,借著名的俞军产品价值公式:产品价值=(新体验-旧体验)-换用成本。输入法高昂的换用成本,导致这个等式右边目前只能为负。
今年出现的Transmart和预测性翻译是一种“轻量级”的输入法,只是在输入时,提供单词补全和短语提示,但是起到了减少键盘敲击次数的作用。
文档翻译/word翻译插件:只是简单的机器翻译+格式处理,文档翻译应该算是2018年最低调但是最流行的机器翻译产品了,而且受众广泛,以至于可以出现一家公司就专注于文档翻译,比如翻译狗。当然,随着百度、搜狗、谷歌翻译相继推出免费版本,这个产品的盈利方式挑战严峻。
视频翻译:根据语音实时生成多语字幕,Youtube很早就有这个功能了,可惜大多数朋友享受不到。不过字幕通和网易见外不仅可以实时自动翻译字幕,还更进一步,可以编辑生成的字幕,加一些简单的特效。把传统字幕翻译的6个步骤变成2个步骤。在视频内容激增、5G风雨欲来的背景下,视频翻译未来几年是否会爆发?
2、信息获取场景
跨语言搜索:用谷歌搜索外文关键词,搜索结果会显示“翻译此页”,部分解决了网页浏览的语言问题。不过,假如观察君想了解糖尿病,打开google却尴尬的是发现不会拼这个词……不过现在有一个替代方案了,搜狗英文也多做了一步——帮你翻译查询词。
电商商品翻译:电商平台本身就涉及多种翻译场景,比如商品描述、买家评论、买家卖家即时跨语言交流。这方面阿里巴巴走在前面。Amazon、Booking、Tripadvisor、Yelp这些网站也有大量商品点评的自动翻译。
网页翻译:除了传统的网页翻译插件,彩云小译推出的外媒内容翻译是一个很有意思的尝试,堪称重度内容患者的福音。
相比于网页插件,这个产品有两个亮点:帮你把海外各大媒体分好类;翻译时是原译对照,给人一种“安全感”。
跨语言大数据:海量信息抓取+机器翻译+文本处理和分析,下图是中译语通的部分产品。当然,在这些产品中,机器翻译作为一种能力隐藏起来了。这种应用方式契合中译语通“机器翻译最大的意义是扩大了人类认知信息的广度与深度”的看法。类似的产品还有今年刚上线的因钽投智,通过医疗健康产业数据抓取+机器翻译+处理分析,为医疗行业投资者提供数据分析服务。
3、信息交换场景
社交翻译:微信的“长按翻译”就是典型应用,除了Facebook、Instagram、Twitter、微博、阿里卖家海外版这些大众社交软件,还有一批主打翻译社交的小众app。不过,随着翻译不再小众,这类翻译社交APP机会渺茫。
语音翻译:除了早年的主打语音翻译的APP,翻译机的爆发让很多人都惊呼意外,目前在京东上架的翻译机已接近200种。当然,直到现在坚持认为“翻译机就是收智商税的产品”的还大有人在。翻译机会怎么样?这是另一个有意思的话题,观察君择日会和你分享一些观察和思考。
AI同传:自腾讯同传在博鳌亚洲论坛“上岗”之后,AI同传算得上最夺人眼球的机器翻译产品,毕竟占据着大会的屏幕,让原本只能听见的声音“看得见”。对这个产品而言,好消息是,人机耦合的风波渐渐退去,相比于人工同传的高成本,这个产品不会有翻译机那种“是否鸡肋”的争议,毕竟人工同传的价格摆在那。坏消息是,我们究竟有多少会议需要现场同传?除了PR效果,这个市场容量到底怎么样?
智能问答:从形式上看,一种作为问答机器人的一项“技能”,和定闹钟,放首歌,查天气一样,通过语音交互,比如小爱同学APP和智能音箱。还有一种集成到微信的形式,比如彩云小译和桔子互动合作的小译问答&翻译机器人——小译9号。
四、最后,除了以上机器翻译上层应用,围绕机器翻译厂商这样的淘金者,有Tmxmall、Flitto这样的数据供应商、也有Intento这样的API集成商——帮你“打包”集成各家的API。近日,Tmxmall也宣布开放文件解析回填API,加上机器翻译和翻译记忆检索API,极大降低了CAT等翻译工具类的成本。
观察君说:机器翻译技术大幅跃迁之后,目前进入技术“调优”阶段,应用爆发,开枝散叶。翻译类工具有成为大众工具之势——使用门槛降低、需求分散、场景增多、知名度提升。可以预见工具属性还将弱化,日渐融合,至终演化为基础设施。另一方面,鉴于语言远超图像和语音的复杂度,加上“人们总是高估新技术短期影响”的魔咒,每一个设计产品的人都应该重点考虑这两个因素,避免过度自嗨。
声明:关于以上产品观察和评价,观察君尽力做到客观、中立、全面。既是追随自己的兴趣,也为关注机器翻译产品的朋友服务,做一些收集整理的工作。限于观察君的有限脑洞和观察力,欢迎各种拍砖讨论。转载请后台留言。