3分钟科普:机器翻译到底是个啥?
近年来随着机器翻译技术的快速发展,出现了越来越多关于机器翻译技术及应用的讨论,我们经常收到粉丝私信表示,希望我们能够继续对机器翻译原理及应用进行科普、对机器翻译与人类翻译关系进行阐述。作为行动力超强的小牛翻译,我们现在就来为大家解答疑惑!
机器翻译学习语言跟人一样吗?
A1和我们小时候学习英语不同,机器并不会学习明确的语言规则,例如什么是现在进行时,什么是状语从句。相反,它更像你小时候看图识字,学的是个对应关系,还要学一些推导思维,比如相似的字,声旁相同音相近,多看多记,它自然就学会了。例如,机器总是看到“Good luck ”被翻译为“祝你好运”,慢慢地,它就学会了把“Good luck ”翻译成“祝你好运 ”。正所谓:“操千曲而后晓声,观千剑而后识器”。当然,我们这里说的“多”,可不止“千曲”“千剑”这么简单,一般需要千万级甚至上亿级的句子,数据是机器翻译“智能”的关键。
机器翻译就是指计算机自动翻译吗?
A2自行车就是自己会走路的车吗?从实现形式上来看,“全自动机器翻译”确实是计算机在没有人工干预的情况下自动将源语言输入转换成为目标语言输出,但实际上这种“全自动”的机器翻译系统还是依赖于开发者在语言建模、算法优化和语料训练等方面的工作的。
计算机辅助翻译和机器翻译到底区别在哪里?
A3计算机辅助翻译(computer-aided translation, CAT)≠机器翻译(machine translation, MT),两者是有本质区别的。首先,计算机辅助谁做翻译呢?答案是计算机辅助人工译员来做翻译。也就是说,设计一套计算机软件系统,在这个软件里尽可能集成人工译员在翻译过程中所需要的各种资源(比如,术语词典、翻译记忆库等)和辅助工具(比如,双语句对齐工具、译文质量检查工具等),人工译员在这套软件的辅助下进行翻译,翻译这个活儿还是人来做。而机器翻译则完全不同。机器翻译追求的就是不用人参与、而是尽可能由机器来完成整个翻译过程。大家通过访谷歌翻译、小牛翻译等机器翻译平台,看到网页上有两个文本框,左边输入原文后,不需要你做任何其它事情,右边就可以立即输出译文,这就是机器在工作。
实验室里开发的机器翻译系统和实用的机器翻译系统有何区别?
A4实验室里开发的系统专注模型能力、理论数据支撑方面,而实用的系统要考虑到翻译的真实场景,更关注计算效率、模型大小这些问题。一般情况下,实验室更多的是从理论上思考当前系统的不足进行优化,或者进行一些探索性的研究,这些研究可能短时间内无法应用到实际场景,但是拥有巨大的潜力。但是工业界不是这样,工业界要保证用户的使用体验。举个栗子,通用系统本身并不算是一个产品,必须要通过与用户的业务和场景相结合,才能发挥它的价值。而翻译系统也并不是静态的,比如说训练出来的模型,要用到某个业务场景里面,业务场景里产生新的数据,这些数据进一步提升翻译模型的能力,再用到场景里面,这是一个闭环和不断迭代的过程。一个成功的产品,还需要算法、数据、产品等非常多的人的参与,大家一起才能做出一个用户体验完美的机器翻译产品出来。
能通俗的聊聊著名的BLEU算法吗?
A5没有规则,游戏就没得玩。那么如何评判出系统产生的译文质量优劣呢?有那么一帮人揣摩出一种自动的译文评价方法,大致就是看机器翻译译文里有多少个词能在参考译文里找到,找到的越多那译文质量就越好。很明显,这种方法很容易自动实现但又很不“科学”,后续研究者们不断优化和改进这条游戏规则,但基本思路基本没有变,这就是著名的BLEU算法。那么刚才所说的译文最优就是BLEU得分最高的译文。但实用的机器翻译的译文优劣不能完全用BLEU来评判(当然也不能用信达雅来评判),可以理解为实用的机器翻译系统都是服务于特定用户的,那么用综合人工评价和自动评价方法是较为客观和科学的。
目前机器翻译已经达到了什么程度?
A6对于比较大的语种,比如中英互译,目前成熟的商业机器翻译系统在通用领域已经不会输给普通的译员了。虽然机器翻译技术现在已经非常成熟了,但是和翻译专家相比,翻译质量还是差了很多。用“信、达、雅”的标准来讲,机器翻译技术已经达到了“信”和“达”的标准。但是在一些专业的领域,或者面对需要意译的句子,比起专业译员,机器翻译还有很长的路要走。欢迎感兴趣的同学们投身自然语言处理和机器翻译,继续推动这个领域向前发展。加入小牛翻译团队,一起做伟大的事情。
都有机器翻译了,我们还有必要学习语言吗?
A7举个栗子:夏目漱石曾经把【I love you】翻成【月が綺麗ですね】(月色真美),很显然机器翻译是达不到这个水平的。机器翻译可以把海量的数据翻译工作变得更加快捷高效,但因为机器最缺少的是人的感情、情绪、语言背后要表达的深层次含义,所以现阶段还是无法代替人工。学习语言与其担心,不如学其所爱,方能潜心求索,不负韶华。
关于我们
专注于机器翻译技术基础研究49年,拥有百余人的机器翻译产学研团队,自主研发以中文为核心的NiuTrans机器翻译系统,支持300+种语言随心互译。通过丰富的应用与功能,为用户提供机器翻译服务全栈式解决方案,致力于为机器翻译产业化应用提供基础平台,帮助企业级用户在国际业务中消除语言障碍。
What? Niu厂竟然开始养牛?
远程办公大数据:这些地方的人最努力
文档翻译插件新增术语词典和翻译记忆功能