新书推荐 | 一部有情怀的机器翻译教材:肖桐、朱靖波著《机器翻译:基础与模型》
欢迎关注我们,一站式分享海量语言学术资源
来源编辑:比特人文公众号
敬请星标应用语言学研习,喜欢请点赞,分享请转发⭐
一部理论与技术的集大成之作
机器翻译是自然语言处理技术的集合体,既包括了对一种语言的深度分析,又要生成另一种语言。所以,它包含着对语言从字词到短语、句子乃至篇章的细致分析与生成,技术细节繁多。可以说,上一门机器翻译的课程,几乎囊括了NLP的全部。
早在图灵的那篇划时代的论文《计算机器与智能》中,就提出机器翻译是机器智能的重要应用。然而机器翻译从梦想变为基本可用的产品,经历了70多年的发展历程,技术方案与细节可以说是十分庞杂。
东北大学肖桐与朱靖波教授合著的这本《机器翻译:基础与模型》全面地介绍了机器翻译的历史与现状,特别是技术发展史。洋洋600多页,从传统的基于规则的方法,到基于统计的方法和近年来的神经机器翻译方法,重要的理论、最新的技术,几乎全部涵盖,可以说是“一本在手,翻译技术全有”。
一部追求完美与生命意义的情怀之作
有人说,“技术类的书最容易过时,因为技术总是在向前发展。” “技术类的图书出来就过时了,从写到出版,怎么也得花费一两年” “在高校写书不划算,因为很多学校不算工分”。发一篇顶刊、顶会得到的奖励远大于一本书,而况写一本书要耗费巨大的时间和精力。
但容易“过时”就不写书了吗?
书籍是人类进步的阶梯。论文虽好,能够体现学术的最前沿,但失在散,对学生来说,无法形成系统的知识体系。对于机器翻译这种历经数十万学者殚思竭虑开发与推进的综合题来说,能够系统地把握历史,介绍清楚技术演进的来龙去脉,近年来的最新技术与应用现状,需要深厚的功力。东北大学自然语言处理实验室从1973年创立至今,近50年的研究积累,几代人的不懈努力,构建出能够翻译300多种语言的学商两用机器翻译平台——小牛。这本书也是东北大学机器翻译团队几十年教学经验与科研成果的集大成之作,是内部讲义不断更新,人才培养过程中不断完善,机器翻译系统开发中不断探索的硬核作品,是产学研结合的结晶。
技术类教材,往往没有情感的流露,但正如作者在前言和后记中的诸多肺腑之言,也可以看出作者对机器翻译事业的热爱,对生命与生活的感悟。借用作者的话“机器翻译的发展沐浴着阳光,不断生长,希望本书也能陪伴各位读者成长”。
PS:写给新时代的语言学爱好者
在与肖桐教授的交流中,我们都深感科研中的窘境。在这个“数据为王,算力至上”的时代,缺钱少设备的中小团队该如何发展。数学模型靠机器学习、计算数学的发展,数学的硬杠杠谁来扛?仅靠追随欧美的新模型显然不是长久之计。而新模型靠数学,模型优化靠调参,语言学也进一步被边缘化。基于复杂语言学知识的句法分析被逐渐抛弃,句子的直接线性建模方法简单粗暴、效果已经不错。那么语言学还有用吗?当NLP技术越来越以人工智能的机器学习为理论与技术支撑,语言学是乘技术而上,还是避技术而独立发展?
科学靠数学的眼光与实验的检验,实践出真知。正如天文学的发展并不依赖于卜天术的高明,它来自不断更新的观测技术与观测数据。从宏观上看,语言学的发展已经呈现出向内、向外两个方向的大拓展。向内,是指神经科学对人脑内部构造的实验、观测和建模。向外,是指自然语言处理技术对人类的语言成果,也就是海量语言数据的存储、观测与建模。读这本书,便是了解自然语言处理技术的绝佳选择。
期待
对于东北大学的小牛翻译团队充满信心,希望在将来的修订本中,不止能看到小牛翻译系统中的诸多创新,还可以看到他们如何实现新的突破。例如,如何应对很多资源稀缺的语种,如何将机器翻译应用到新的领域,如何引领下一代的机器翻译技术。
>>> 附录:全书目录
比特人文
投稿邮箱:dhbase@126.com
综合编辑:应用语言学研习
微信公众平台审核:研习君
技能提升
专题推荐
基础文献荐读
科研方法
扫码关注↑↑↑ 即可获取最新入群二维码!
目前已有 7.39 万语言文学、区域国别与
跨文化传播学研习者关注本公号
欢迎加入交流群,分享学习,共同进步!
欢迎点赞、在看、分享三连!