知识就是力量:Google 神经机器翻译系统面世
Google 日前正式上线了神经机器翻译系统(Google Neural Machine Translation,GNMT),该系统的翻译质量已经接近普通的人类译员。
Google 在十年前推出了基于短语翻译的机器翻译产品,机器智能的快速发展也提高了 Google 的语音识别和图像识别能力,但机器翻译仍然是个具有挑战性的目标。
而新的神经机器翻译系统则利用最先进的训练技术实现机器翻译质量的最大改进,GNMT 系统则可以用来弥补人类与机器翻译之间的差距。
神经机器翻译系统最大的特点在于不再像以前一样对关键字、关键词进行单个翻译再组成句子,而是突破性的根据整个内容的大意来对句子进行分析。
下图:GNMT 对首先对所有内容进行编码,一旦编码完成就可以进行解码,动图中蓝色线条深浅程度代表翻译权重。
听起来是不是很像中学时代语文考试中的文言文翻译呢?根据上下文语境对文言文内容进行翻译。
神经机器翻译系统对比之前的机器翻译系统翻译错误可以减少 60%以上,其翻译质量已经接近了普通的人类翻译员。
下图:GNMT 系统对几种语言之间的互译准确性,可以看到对于英语与汉语之间(不同语系)的互译 的准确率要比其他的低。
Google 大脑团队的成员表示在双语评委的帮助下神经机器翻译系统从 Wikipedia 和新闻网站选取的几种语言进行翻译,其翻译的错误率较此前的机器翻译下降了 55%~85%。
但是神经机器翻译系统也并非是完美的,在同一种语系中翻译不同的语言准确率会非常高。但对于不同的语系例如将中文翻译成英语准确率则会有较大的下降。
下图:依次是输入的内容、PBMT(基于短语的机器翻译)、GNMT(神经网络翻译)和人类翻译员
另外一点就是专有名词或者是非常用的专业术语准确率也会下降,同时部分内容仍然脱离了上下文语义。
Google 大脑团队的成员在论文中称尽管 GNMT 比以前的机器翻译系统要好得多,但是他们仍然有大量的工作要做,GNMT 代表了一个重要的里程碑。
神经机器翻译系统目前已经 率先应用到了网页和移动端的 Google Translate 的中文翻译英语上,准确率比以前已经提高了许多。
附注:
对此方面有兴趣的网友可以前往 Google Research 查看原文以及 Google 团队发布的论文。
你也可以直接通过 Google 学术搜索来查看 Google 团队已经发布的有关 GNMT 的论文。
Google 学术搜索:
近期热点推荐:
PS:求各位帅哥美女看完顺手戳戳那啥哈~