查看原文
其他

昨天机器同传又败给了人工同传,那明天我们应该做什么?

韩林涛 语标 2021-03-18


背景


2018年3月22日-23日,北京语言大学


翻译自动化用户协会亚洲峰会(TAUS Asia Conference)采用了微软公司开发的名为“Presentation Translator”的PowerPoint插件为参会者提供了实时口语翻译服务,技术本身令人称赞,翻译结果却令人唏嘘。


参考:刘和平、韩林涛: 下“机器翻译替代人类”结论为时尚早

http://opinion.huanqiu.com/culture/2018-04/11756638.html


2018年4月09-10日,鳌博亚洲论坛


“为鳌博亚洲论坛提供翻译服务的,正是由Tencent公司推出的人工智能同声传译解决方案'Tencent同传',也是2018鳌博亚洲论坛官方采用的首家AI同传技术展示合作方。'Tencent同传'由Tencent翻译君联合微信智聆共同打造, 将为论坛开幕式及部分论坛提供现场同传服务,包括会议现场投屏、小程序查看、语音收听、会议纪要回放等。这是鳌博亚洲论坛首次尝试使用AI机器同传技术。”


来源:

《未来已来  人工智能翻译首次亮相鳌博亚洲论坛》

http://tech.qq.com/a/20180409/015861.htm


比起3月份的TAUS会议,这次Tencent的技术服务可谓相当到位,从目前看到的新闻可知:


微软还仅限于基于PowerPoint提供同传服务,而Tencent则可以直接为自由发言的多人论坛提供同传服务,可以说Tencent的肌肉秀得更漂亮;


微软基于网页和“微软翻译APP”提供同传服务,而Tencent则通过微信小程序就能快速提供,的确是更懂中国人;


微软的“Presentation Translator”是任何一个人都可以下载使用的,而Tencent应该是专为鳌博论坛定制了一套机器同传系统。


相比之下,Tencent同传的技术服务更到位,技术同样令人称赞,但翻译结果依然令人唏嘘。


正文


我和刘和平老师之所以选择在“环球网”发那篇署名的文章,并不是在冷嘲热讽机器翻译,更不是站在AI的对立面,代表人类向机器宣战。我本人是研究计算机辅助翻译的,刘和平老师是口译界最早(而且始终、一直、不断、持续)呼吁“拥抱技术”的资深口译专业教授,我们都看好技术的发展。


但是,我们最担心的是机器翻译的开发者、机器翻译研发团队的写手、互联网媒体记者、自媒体小编一次又一次突破底线得宣称自己的机器翻译技术水平已经超越人类。这对整个翻译行业(语言服务行业)而言是致命的打击!!有潜力的优秀学子将不再考虑报考翻译专业!!


具体可参见我写的:人工智能时代传统翻译教育的危机


2018年3月和4月分别出现的两起“机器翻译翻车事故”给搞机器翻译技术落地的团队泼了两瓢冷水,同时也让不少学生译员和职业译员感受到了真正的冲击。


但昨天的事儿已经成为历史,今天我们要思考的是明天我们要做什么。这里的“我们”是指“搞机器翻译技术落地的团队”、“学生译员和职业译员”以及“从事翻译教育的高校教师和教学指导委员会”。


诸位,如今我们不需要写公关稿去洗地,也不需要再发什么截图去冷嘲热讽,这一页得翻过去了,嘴炮打完后就得继续撸起袖子加油干了。


建议“搞机器翻译技术落地的团队”做的事


我是研究计算机辅助翻译的,说白了就是研究怎么使用各种各样的计算机技术和工具来帮助学翻译做翻译的人提高翻译效率和质量,这与“机器翻译”是两码事儿。我会教学生怎么在做笔译的专业软件中嵌入不同的机器翻译引擎,但不会详细讲解机器翻译的原理,学翻译的同学和做翻译的职业译者不需要自己去搭建神经机器翻译系统。对我而言,“翻译”是一种“服务”,而“服务”是全过程的,不仅仅只关注结果。


从这个角度来说,“搞机器翻译技术落地的团队”也不应该只关注机器翻译的质量,既然是搞技术落地,就需要根据场景进行适应性的技术调整,把软件技术和硬件技术结合在一起去做落地。


比如说,无论是3月份的TAUS还是4月份的鳌博,影响机器翻译结果的很大一部分原因是源语言的语音识别效果。TAUS的会议是个人发言式的,鳌博的会是多人论坛式的,后者的场景更为复杂;TAUS的会议是提前训练过发言人的发言内容的,但没有提前训练发言人的语音,而鳌博的会似乎也没有提前训练发言人的语音,也没有拿到发言稿。所以鳌博的会对语音识别的挑战更大。可是,站得多高,跌下来就有多疼。越是复杂的场景,越应该准备好备用方案(Tencent同传的备用方案应该是“人”......而不是其他的技术方案)。


也许下一步,为了提高语音识别的效果,Tencent会在硬件上下些功夫,为大会提供他们自己研发的“Tencent话筒”、“Tencent耳麦”、“Tencent同传接收机”、“Tencent红外发射机”......,提前设置好哪位演讲人说什么样的语言,或者通过统一的软件平台预设每个话筒的发言语言,外加现在已有的语言识别技术,这样就不会出现因为语言识别错误而导致翻译错误了。


也许下一步,Tencent可以选择收购“博世”(BOSCH)、“泰利维克”(Televic)这样的同传设备供应商,直接基于他们现有的同传设备硬件技术来嵌入他们的同传技术。虽然微软推出“Presentation Translator”已经很久了,但是职业译员在做会时之所以一直没有用上,根本原因是这玩意必须主办方来安装,译员唯一接收声音的地方是自己的耳机,而耳机的声音很难再转到另一个做语音识别的设备或软件中。如果在硬件上下些功夫......


也许下一步,Tencent可以和国内的几大高翻学院合作培养口译背景的学生来做产品经理,或者和研究(且真懂)计算机辅助口译的口译专业(做得好且教得好的)教师一起推动Tencent同传在真实同传场景下的应用,推出一些实用的“计算机辅助口译”系统。


也许下一步,Tencent只需要多拿出几千万、多招几位工程师和产品经理就能在现有的技术基础上实现进一步的飞跃。


我个人觉得,Tencent同传现在什么都不缺,迈向下一个高峰前只需要更多的钱、更多的人和更多的实战经验。如果说现在真缺什么,那缺的应该是“SDL Trados”这类计算机辅助翻译工具的“曲径通幽”的态度,他们从不说自己要“替代”什么,只说自己怎么“辅助”。


用温水才能煮得了青蛙。


建议“学生译员和职业译员”现在应该做的事


在“计算机辅助口译”这个话题上,我听到很多学生译员和职业译员都说,译员的精力是有限的,像记数字、记专业术语这种事儿译员更希望机器辅助做完。


另外,一个在译员圈公认的事实是:绝大多数译员在做同传时并不能将发言人的全部信息传递出来。而这个事实却很难被公众接受,你既然不能把全部信息传达出来,信息还原度低于100%,那么为什么我还要付给你那么多钱?如果说“笔译”是一项充满遗憾的艺术,那“口译”是怎样的艺术呢?


还有,很多人会误以为坐在谈判桌上提供翻译服务的“交替传译员”也是“同传”,我听很多译员讲,做交替传译比做同声传译要更紧张,交替传译反而更难做。


除了上面这些,还有很多很多各种关于人类翻译水平天花板的现实。只要人类还需要跨语言沟通,就会需要翻译服务,只要有人需要翻译服务就会存在提供翻译服务的人员之间的竞争。我们如何能够在更短的时间内突破人类生理的局限更快速学习翻译、提供更好的翻译服务,这应该是每一个人类译员都应该思考并去践行的问题。


在我看来,“拥抱技术、探索技术、应用技术”是一个必然的过程。我相信会有越来越多的人开始探索现有技术应用的最佳实践,并广而告之。微信当年是如何普及到我们生活的每一个缝隙的,人工智能接下来就会如何融入到同传服务的每一个流程。


建议“从事翻译教育的高校教师和教学指导委员会”应该做的事


“跨学科”、“跨学科”、“跨学科”!


在大学工作了将近四年后,我算是非常清楚得知道了大学老师的工作状态,所以我不建议也不愿意看到如今33岁以上的从事翻译教育的高校教师还去学什么机器翻译技术,所谓“术语也专攻”,目前这个群体的老师是难以在没有任何数学基础、计算机基础的情况下去接触一个新的学科,但这个群体的老师是完全可以与其他学科(尤其是计算语言学、机器翻译、自然语言处理、人工智能等背景的22岁以上)的学生、工程师或学者一起开展项目合作,联合推动“翻译教育技术”的研究(关于翻译教育技术:论“翻译教育技术”)。


尤其要注意的是,“学习如何使用计算机辅助翻译软件”和“跨学科”是两码事儿。


至于33岁以下的老师嘛,能多学一点技术就多学一点技术,此时还不晚。


唯有如此,从事翻译教育的高校教师才能有更广阔的视野,给学生指引更正确的方向。


对于教学指导委员会的专家们,哎,不知道该建议啥。反正你们也不会看我这篇文章。


结语


空谈误国,实干兴邦。

实践是检验真理的唯一标准。

撸起袖子加油干。


修改于2018-04-10


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存