查看原文
其他

搜狗机器同传真的那么神吗?也许未必。

2016-11-19 译匠 译匠


乌镇互联网大会,百度的李彦宏刚当着同传的面吹完牛逼,同是搜索引擎公司的搜狗王小川又来吓唬翻译了。后者虽然实力不及百度,但与百度李彦宏的干说不同,王小川却来了个现场演示。因而在翻译界造成的恐慌也更大一些。


王小川号称此次演示是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示,效果可靠、准确率已接近人类同传翻译结果。基于这项技术,演讲现场屏幕上除了语音识别实时显示的中文内容外,还有机器同步翻译的英文内容,实时生成了演讲内容的双语滚动字幕,如当王小川说到“搜索的未来就是人工智能时代的皇冠”时,屏幕上实时显示出了“In the future, search will be the Crown of the AI Era”,机器还能随着语句的逐渐完整,根据语义自动修改调整之前识别的内容,引起全场嘉宾、媒体的关注,让翻译圈的小伙伴着实恐慌了。据称,搜狗语音识别准确率已超过97%,机器翻译准确率达90%。在近期人工评测中,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用五分制人工评分能达到4.4分,走向实用化。


现场演示效果似乎也很不错,据说现场的同传小伙伴已哭晕,更可怕的场景是外宾们纷纷摘下同传耳机,感受这不同寻常的“同传”。

 https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=d0347i2r088

对此搜狗王小川非常自豪地表示:“这是搜狗自研的机器同声传译,融合了业界领先的端到端神经机器翻译技术以及基于实例的翻译技术,基于大数据和深度学习,涵盖了搜狗自主研发的语音识别、机器翻译两项重要技术。利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,翻译的结果比传统机器翻译更加流畅,效果更好。”


王小川此次演示直指翻译最顶级最巅峰的同传行业。同声传译(Simultaneous interpretation),简称“同传”,又称“同声翻译”、“同步口译”,是指译员在不打断讲话者讲话的情况下,不间断地将内容口译给听众的一种翻译方式,同声传译员通过专用的设备提供即时的翻译。为了保持听众的连贯理解,它要求译员在听辨讲话的同时,以“闪电般的思维”和高超的语言技巧,在极短的时间内迅速完成对源语言信息的预测、理解、记忆和转换,同时要对目标语言进行监听、组织、修正和表达。在工作状态下,同传每隔15-20分钟就要换人,十分“烧脑”。


这种方式适用于大型的研讨会和国际会议,当前世界上95%的国际高端会议都采用同声传译的方式,同声传译除了广泛应用于国际会议之外,也在外交外事、会晤谈判、商务活动、新闻传媒、培训授课、电视广播、国际仲裁等诸多领域被广泛使用。同传通常由两名到三名译员轮换进行。同声传译效率高,能保证演讲或会议的流畅进行。同声传译员一般收入较高,但成为同声传译的门槛也很高。同传被誉为业内“最贵小时工”,平均每小时收入可达7000-10000元。除此之外,同传设备搭建的成本也极高,据不完全统计,一场200人的活动同传设备租赁价格在5W元左右。

 

搜狗在举世瞩目的世界互联网大会上的展示,看上去一下把同传逼到了边缘境地,把同传这项很难的技能变得几乎没有门槛。同时,不知疲倦的机器性价比更高,很可能在近期彻底取代现有的同传甚至是整个翻译行业。王小川在微博上甚至提前告诫以后孩子别再报这专业。

 


于是小编去向一些行业人士问询观点和洞见,得到一些值得一说的观点。首先针对“此次演示是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示”一说,有专业人士称王小川演示的实际上,2010年微软就已经做到了。微软每年投入到多语言语音识别的资金是个巨大数字,都非常谦逊说语音识别和同传很难做到令人满意。微软的 Cortana 背后,是有强大语音语料库和强大算法支持的,他们都这么谦逊。搜狗王小川上来就声称语音识别准确率已超过 97%,机器翻译准确率达90%,为了搞个大新闻,一点都不谦虚。


这些耸人听闻的演讲如果是自然语言处理专家讲出来,那可能是真的研究结果。但是话语权往往在那些吹牛的人身上,很有意思的事情,最近10年的观察和体会,往往是所谓的官职和CEO之类。我出席一些会议,往往需要考量那个人什么背景,做过什么研究,然后看他的项目。最后得出的结论非常明显,很容易判断。


还有专家称,王小川的“黑科技”并不先进,几年前微软在天津计算大会上演示过,而且还可以同步播放中文声音,计算机辅助口译。


小编于是搜索了一下这方面的大新闻,确实看到微软多年前在这方面的诸多建树。微软公司2012年就表示通过对大量数据的深入分析,已经有能力将英文转换成普通话的发音说出来,对微软的翻译系统讲了大约1小时左右的英语以后,系统就可以用他的语音语调说普通话了。用户使用前大概需要1个小时的语音输入时间,以让系统辨别每个人声音中的细微差别,同时建立相应的模型。此外,该项目已经能够支持包括普通话在内的26种语言,当时声称该技术在实时口译工具,语言学习工具等方面会有广阔的应用前景。



之后,但凡有这种产品,每次各大媒体都以“同传要失业”这样的题目,以示机器口译/同传系统对行业的颠覆性。微软近年推出的 Skype Translator 也确实在当时引发了一阵恐慌。


同传失业?新版Skype支持语音聊天实时翻译
同传要失业:Skype实时翻译工具支持汉语了|Skype|机器翻译
同传要失业:Skype实时翻译工具支持汉语了-skype,免费通话


https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=w0151fc875v


所以搜狗的演示并无什么新意,而且搜狗此次演示还未发声,只是实时在荧幕上显示译文,技术上并没有想象的那么神奇。所以,搜狗不要老想着搞个大新闻,把微软做过的事情在以较Low的方式做一遍,还号称首创,甚至王小川还当起了青年导师,劝小伙伴不要报考同传这个专业。


还有行业人士将国内这两家搜索公司相提并论。李彦宏是为了给他的百度翻译这个功能做广告,所以他是越能吸引眼球越好。越是有争议,就越能够达到广告的效果。而王小川的演示里边可能有作弊的成分,但是,他确实是演示了未来的一个方向。搜狗没有能耐做到演示那样的水平。但王小川演示的技术组装是没有问题的。所有有人严重怀疑事先准备好稿子,事先调试好了机器翻译,所以结果才出乎意料,准确率才那么高。言下之意,一个在推销,一个来作弊。


有小伙伴说了这是利用大众的无知,演示简单内容机器同传 ,如果让搜狗实时机器现场随机翻译其他演讲嘉宾的发言,不知是否也能如此准确?更有小伙伴提到,说话像王小川这么清楚的讲者哪里是天天都有,除了口音,讲者各种随意停顿,无意义的重复,各种突然另起一句。这种情况下机器怎么翻怎么补?


鉴于微软推出重磅产品后同传依然活得很好的事实,机器同传/口译技术尚有进步空间,中国诸多土豪和金主Boss多有口音,而全球各地外宾的口音更是不可胜数的情况,外宾们纷纷摘下同传耳机的情况可能不会很快发生。


当然作为翻译,应对此保持谨慎乐观,谨慎在于技术在进步,翻译的核心是质量、价格和速度,显然价格和速度人类已经完败机器,只有质量这块阵地人类尚能守住。人类重复教育一代又一代的学生,而机器翻译,通过数据积累和机器学习,提升速度非常快。在人工智能技术面前,学习能力不足,知识储备不够和综合实力不济的从业者,难免被冲击。业内人士认为,由于语言和环境的复杂性,想要完全依靠人工智能和语义理解还有很长的路要走,但不得不说,语音实时翻译的出现为我们提供了全新的交流想象。


但小编依然保持足够的乐观态度,并表示同传行业肯定会在我们有生之年屹立不倒的,为何?从语言的复杂性来看,人类的语言是非常丰富的,能识别普通话,未必能识别“川普”,识别了川普,未必能hold住“胡建”口音。还有各种引经据典、网络潮词、临场发挥、各种抖机灵的幽默和调侃,机器都能识别并传达吗?;从影响方面讲,与支付给同传的酬劳相比,同传一旦出错的影响无法估量,在下面这则经典视频中,就介绍到曾经有一次同传翻译的错误差点引发了第三次世界大战!有哪家五百强大企业会冒着把会议搞砸的风险,将影响品牌、客户关系和市场地位的会议交到可能无法达到100%的技术手上。


当然你也可能会说,现在的有的同传可能连机器翻译的水平还达不到。比如科比的“那么哥”,神州的蜜汁口音等等,这等事情机器是绝对干不出来的。是的,机器同传冲击的就是这类劣质同传。而成就将是才华横溢、知识面广、善于洞察、机智灵活、准确迅捷的同传。而那些不差钱的高端客户,不会为了区区万把块钱就把重大会议的语言转译工作交到机器手上的。


https://v.qq.com/txp/iframe/player.html?width=500&height=375&auto=0&vid=c03090pc2d3

150年前,当机械大规模代替人工的时候,工人们罢工、捣毁机器,觉得机器抢了自己的工作。后来工人们做的是学会操纵机器,机器应用越来越广,却也需要越来越多操纵机器的工人。


100年前,当福特发明流水线的时候,工厂的生产效率倍数级增长,却未见工人的需求量减少,反之,熟练工人需求量猛增。

50年前,彼得德鲁克发明了管理这个概念。有人认为,管理的应用和流水线的效率越来越高,将导致大量工人失业。其结果,确实有一个群体消失了,那就是低技术含量的工人,但是他们是慢慢转化为了另一个群体:具备管理技能的现代人才,其需求量与日俱增。

50年前,电子计算机发明。随后电子技术日新月异,在摩尔定律的强大威力下,电子计算机革命势不可挡。有人惊呼,电子计算机和自动化将取代人类的工作,以后大家坐到家里不用上班了,科幻电影里的场景即将出现。现实是,电子计算机替换了大量低技能工作,而对掌握电子计算机操作技术的人才需求则是爆发式增长,人们依旧去写字楼打卡上班。

如今,人工智能 AI 技术日益取得突破,但只要电子计算机仍然需要人类来给予指令进行工作,口译同传相关的电子计算机传译技术的进步,带来的是口译同传行业的突破和进步。人们只是工作的侧重点改变一下,本质不会变。如同在笔译行业兴起的 MT+PE 组合一样,机器翻译(MT)打头阵,而后高级翻译或审校开展事后编辑,同传行业也许以后也会出现一个实时质量把控的角色,或许可暂时将其称为同传质检员?一切犹未可知。


未来已来,请翻译小伙伴谨慎乐观,既不要被有作弊嫌疑的搜狗吓坏,也不要盲目自大,应及时洞悉行业风向,让自己的语言技术依附于几个热门有前途的行业,深耕行业知识,才能立于不败之地,在浪潮来临之时,及时切换角色,方不负满腔的翻译才华和志向。


广大翻译小伙伴,你说呢?


关注译匠,回复关键词:

航空资料 | 法律资料 | 航空翻译 | 法律翻译 | 航空笔记  |  医学翻译 | L10N  | MTI   | 梅花剑法  | abbyy |  FQ  | Lingoes | Trados |  memoQ  | 法律翻译笔记连载 | 经济学人 | 译匠 | 墙测试 | B20 | G20 | 经典译著

置顶译匠,每天涨本事:

学习、翻译、观世界

深耕各专业领域的语言翻译

正事请联系:xperception@foxmail.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存