查看原文
其他

机器翻译思想提出71周年 |破土而出的机器翻译

NiuTrans 小牛翻译 2021-09-27


1949年7月15日,利用计算机进行语言自动翻译的想法被提出,机器翻译的种子从那时起生根发芽,逐渐枝繁叶茂。如今,我们更是常常躲在它的树荫下,享受着技术带来的便利。今天就跟着小编一起了解一下,这项技术是如何起步的,在初期又是如何挣扎前进的。


自然语言处理是人工智能皇冠上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理最典型的应用技术之一。

20世纪30年代初,亚美尼亚法国工程师阿尔楚尼(G. B. Artsouni)提出用机器进行语言翻译的想法,并在1933年7月22日获得了一项“机械脑”的专利。1933年,苏联发明家特洛扬斯基设计了用机械方法,把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。
 
机器翻译思想出现在二战之后。信息论的先驱、美国科学家瓦伦·韦弗(Warren Weaver)等人受到在战争期间采用图灵机破译德军密码的启发,认为语言翻译与破译密码本质都是符号转换,并正式提出了机器翻译的思想。

Warren Weaver


1949年7月15日,瓦伦·韦弗(Warren Weaver)于《翻译备忘录》中提出了四条机器翻译思想:


意义和上下文:需要在上下文中解决语言的歧义。
语言和逻辑:需要对语言做出基于逻辑的句法或者语义分析。
基于香农(Claude Shannon)的信息论(information theory),从密码学的角度提出了语言统计语义的性质。
普遍语言:语言之间需要有通用性的表达。


这四条思想为后来的机器翻译研究提供了思想框架,韦弗也因此被称为“机器翻译之父”。


在1954年,出版了第一本机器翻译的杂志,这本杂志的名称就叫做Machine Translation(《机器翻译》)。同年1月7日,IBM 在纽约的总部启动了 Georgetown-IBM实验,IBM 701计算机有史以来第一次自动将60个俄语句子翻译成英语,被视为机器翻译可行的开端。

IBM 701


随后,美苏两个超级大国均投入巨资来进行机器翻译研究——为此来获取更多敌方的情报。同时,欧洲国家由于地缘政治和经济的需要,也对机器翻译研究给予了相当大的重视。我国则是继美国、苏联、英国三个国家之后,世界上第四个开展机器翻译研究工作的国家(1956年,中国把机器翻译研究列入全国科学工作发展规划)。

虽然,在那个时期机器翻译的译文多数情况下不尽人意。但是,无论如何,这项新兴的技术终于萌芽了,他毅然地破土而出,悄悄地登上了学术的殿堂,并且迅速地发展和壮大起来。

那么,机器翻译这项技术又是如何从一个从牙牙学语的孩童成长为一个对社会有用的优秀青年的您接着往下看




小“艾姆涕”成长记

——从基于规则,到基于统计模型,再到基于神经网络 


机器翻译技术的迅速发展始于70 年代,我们可以把它的发展看成是一个孩子的成长故事,就暂时给他起名叫做“艾姆涕”吧(源于machine translation MT)。 


最一开始的时候,艾姆涕有些笨拙,是个只会翻字典找对应的孩子。可以想象这个孩子翻译出的内容一定是粗糙的:用词不精准,句法不连贯,内容表达不清晰。


随着艾姆涕渐渐长大,他发现了词与词之间的规律,能够将词语组合成词组和短语进行翻译,翻译的句子有很大进步。但很快,这种方法遇到了瓶颈。规则多到难以记住,而且这些规律很难全面覆盖不断演化的语言。这种方法准确率虽然有进步,但是依然达不到可用的预期。


后来,他学会了数学和统计,于是他开始一点点构建统计模型,希望以此提高翻译的准确度。他最先尝试逐词翻译,可是翻译出的内容经常驴唇不对马嘴,让人啼笑皆非。于是,他开始以短语为单位重新建模,这一次的效果好多了。 


然而,随着年龄的增长,世界对他的要求也越来越高,给他的句子也越来越长。为了确保句子的连贯性,艾姆涕开始逐渐尝试以句子做单位,并能翻译出句中各短语之间的逻辑关系。听人说,他这方法这就像人类的神经网络一样,非常的厉害。 


尽管如此,还是有人会问:“艾姆涕啊,你不熟悉的、从来没学过的语言,你能不能翻呢?” 艾姆涕先是愣了一下,然后从容且迅速地给出了答案:“能”。艾姆涕说,他掌握的是学习的方法,能够快速阅读新知识,学习新的翻译技能,并且在习得的语言中,已经积累了很多翻译技巧,能够运用到新语言翻译中去。


随着,技术理论不断革新、国内外众多相关学术专家持续实践,艾姆涕已不再仅仅局限于科学研究,更是趋于大众化、平民化、市场化。如今的艾姆涕已成长为一位才华出众的青年,成为大家寻求翻译帮助的第一对象。


机器翻译思想
在1949年7月15日被提出
我们就把每年的7月15日定为
机器翻译诞生纪念日(简称“机诞日”)
7月15日-8月15日定为”机诞节”
用于纪念这项伟大技术的诞生

机器翻译的诞生
给人类带来打破语言高墙的希望
在机器翻译思想提出71周年之际
小牛翻译决定推出一波宠粉福利
回馈粉丝们长久以来的信任和热爱
 


"机诞节"宠粉计划
将于7月15日当天开放
虽然很想一次性把
全部活动内容告诉大家
但是真的只能卖关子卖到这了
……
 
宣传包装不行
发福利咱第一名
7月15日
“小牛翻译开放平台”不见不散
拜了个拜
 

💗

💗

💗


往期精彩

再添新福利 | 机器翻译系统可以申请本地部署免费试用啦!

开门见山 |小牛翻译四大免费权益招募合作伙伴

304!小牛翻译引擎又新添语种啦?

2020年首届线上中日机器翻译论坛圆满落幕

漫谈小牛翻译|在线机器翻译能力免费开放,良心“福利”在哪里?

不只是免费!小牛翻译开放平台V6.1今日上线!

首届线上中日机器翻译论坛即将开启:让机器翻译为中日经济交流赋能

文档翻译“神器”上线!带你快速GET如何高效翻译多格式文件

七种语言表白,小牛翻译收到暖心“三行情书”

心有坚守,仰望星空——写在小牛翻译13周年之际

与开发者共成长!小牛翻译开发者社区上线

技术讨论 | 机器翻译问题浅析

赋予机器自主设计模型“能力”,一文概览结构搜索的起源

NLP领域预训练模型的发展及变种

源和目标语句不再独立,联合表示更能提升机器翻译性能

浅析大规模多语种通用神经机器翻译方法

浅析基于隐变量的非自回归神经机器翻译方法

如何利用篇章级单语数据来提升机器翻译性能?

神经结构搜索在机器翻译中的应用

基于序列模型的随机采样

低精度神经网络:从数值计算角度优化模型效率

一文详解神经网络结构搜索(NAS)

知识科普 | 机器翻译三代技术(规则、统计和神经)通俗分析


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存