不止于技术——探索神经机器翻译的“百科全书”
👆点击“博文视点Broadview”,获取更多书讯
2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。
该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。
历经70载,机器翻译进入深度学习驱动时代
机器翻译诞生于二十世纪四五十年代,纵观机器翻译70多年的发展历程,从最初的朴素统计模式,发展到基于规则的机器翻译、统计机器翻译,再到目前的深度学习驱动的神经机器翻译,不同技术范式在不同历史时期各领风骚。
(图源:https://acutrans.com/top-10-most-commonly-spoken-languages-in-the-world/)
目前机器翻译的主流技术范式——神经机器翻译——是一种基于神经网络的端到端机器翻译模式。区别于前代的统计机器翻译采用的多步骤级联方式,神经机器翻译只需要输入源语言句子,就能直接输出目标语言序列。
如下图所示,其基本思想是利用神经网络对源语言进行编码得到源语言的语义表示,然后根据该语义表示解码生成目标语言。这种端到端模式使模型可以一次性整体训练,既避免了传统级联方式的错误传递,也大大降低了模型训练和部署的烦琐程度。
(来自书中图4.1:神经机器翻译结构示例)
时至今日,神经机器翻译已成为在线机器翻译的主要引擎,每天以数千亿单词量的翻译规模服务全世界各地用户。
但即便如此,机器翻译仍然存在诸多挑战和难题。
一方面,全世界在使用的语言有几千种,即使像NLLB这样的大规模模型,目前也只能覆盖200余种语言,占比不到已有语言的1/30,大量语言在机器翻译版图里仍然被“Left Behind”。
另一方面,神经机器翻译虽然显著提升了译文质量,但仍然面临鲁棒性、可解释性、广域语境依赖性、多模态、资源稀缺等多种挑战和开放问题。
《神经机器翻译:基础、原理、实践与进阶》正是在这样的背景中写就的。
“百科全书”式内容,展现神经机器翻译全景视图
该书为实践者总结已有技术,为研究者梳理前沿进展,并站在机器翻译历史发展的角度,对比不同机器翻译范式,希望读者能从对比中窥见技术发展的内在原因和规律,以此吸引更多机器翻译爱好者为实现所有语言互译的美好愿景添砖加瓦。
全书分为基础篇、原理篇、实践篇和进阶篇,覆盖神经机器翻译的基础知识、经典框架、原理技术、实践方法与技巧,以及无监督神经机器翻译、多语言神经机器翻译、语音与视觉多模态机器翻译等前沿研究方向。
全书理论与实践相结合,基础与前沿相交映。
技术与短评双主线叙事,不止于技术
除此之外,本书的一个特色是在每一章均附有一篇短评,针对相应章节的主题,介绍和评论神经机器翻译技术背后的历史、故事、思想、哲学、争议和规范等。短评与全书内容相交错,使读者对神经机器翻译技术不仅知其然,而且知其所以然。
本书适合高等院校计算机专业高年级本科生,以及人工智能、自然语言处理方向的研究生阅读,也可供机器翻译研究者、实践者、使用者,以及机器翻译行业的管理者、人工翻译研究人员等对机器翻译技术感兴趣的读者参考。
熊德意
天津大学智能与计算学部教授、博士生导师、自然语言处理实验室负责人,天津大学“语言智能与技术”中外联合研究中心主任,中译语通-天津大学自然语言处理联合实验室主任、中译语通人工智能首席科学家。
主要研究方向为自然语言处理,特别专注于机器翻译、对话、问答、自然语言生成、常识推理、认知计算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文100余篇,在Springer出版英文专著一部。
获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金等资助。
获得新加坡资讯通信研究院2008年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等奖项。
曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员,目前是中国中文信息学会理事。担任IALP 2012&2021程序委员会共同主席,CWMT 2017程序委员会共同主席,欧盟多国联合项目QTLeap咨询专家,ACL、EMNLP、NAACL、COLING等多个知名国际会议领域主席,以及TACL和ARR的Action Editor等。
李良友
华为诺亚方舟实验室研究员、机器翻译团队负责人。在欧盟玛丽居里项目资助下,于2017年获得都柏林城市大学计算机博士学位。
主要研究方向为自然语言处理,特别专注于机器翻译相关技术领域的研发。在ACL、EMNLP等多个国际著名会议和期刊上发表论文10余篇,并担任ACL、EMNLP等国际会议领域主席和会议审稿人。
张檬
华为诺亚方舟实验室研究员。于2018年获得清华大学计算机科学与技术系博士学位。
主要研究方向为机器翻译和跨语言自然语言处理。在ACL、EMNLP、AAAI、TASLP等国际著名会议和期刊上发表论文10余篇。
曾获中国中文信息学会优秀博士学位论文提名奖。担任ACL、EMNLP、AAAI、IJCAI等多个知名国际会议审稿人。
本书介绍的是当前的主流——神经机器翻译技术。全书按两条主线组织,内容主线分四篇,覆盖神经机器翻译的基础知识、神经网络模型原理、引擎实现和部署以及若干前沿研究主题,理论和实践相结合;短评主线交织穿插于内容主线网络中,将相关内容与更广泛的主题关联,如机器翻译的发展历史、自然语言处理研究范式、软件开源、数据驱动、技术创新、实验可复现性、人工智能伦理等。
可贵的是,书中的某些短评探讨了被机器翻译技术快速发展掩盖的机器翻译背后的科学问题,并呼吁机器翻译研究需在科学与技术间再平衡;在技术创新发展的同时,机器翻译研究需与其他学科交叉融合,使得相关科学理论可以支撑机器翻译未来更大的发展和突破。同时,作者也从科学研究范式的本源上深入思考了机器翻译的未来。
——梅宏 中国计算机学会理事长
机器翻译是人工智能的一个缩影,神经机器翻译的诞生是人工智能的一个飞跃。本书深入浅出,系统地介绍了神经机器翻译的理论与实践,每一章节都有作者对问题的精辟见解和深入思考。本书是了解机器翻译和自然语言处理的一本难得佳作。
——李海洲 IEEE Fellow,新加坡工程院院士,新加坡国立大学终身教授
熊德意教授是机器翻译领域业界的知名专家,他和李良友、张檬两位博士一起撰写的《神经机器翻译》一书,是想学习和了解机器翻译技术进展的读者都应该阅读的好书。本书的基础、原理、实践、进阶四个篇章,为不同背景和不同需求的读者提供了完整的学习材料。书中不仅详述了神经机器翻译的模型、算法等技术,还介绍了背后的思想和历史的演进。这是只有一直走在领域前沿并不断进行理论和实践探索的人才能写出的佳作。
——李 航 ACL Fellow、IEEE Fellow、字节跳动AI Lab Director
语言数据是数字科技的关键要素,是数字经济时代的生产力。阅读本书,对此会有更为理性的认识。
——李宇明 中文信息学会原副理事长
神经机器翻译虽然出现时间不长,但以其优异的性能迅速改变了机器翻译的面貌,成为机器翻译的主流技术,并大大拓宽了机器翻译技术的应用边界。本书是一部专门介绍神经机器翻译技术的著作,由浅入深地介绍了机器翻译的方方面面,非常适合各个层次的机器翻译研究者阅读。本书的作者熊德意是天津大学教授,是机器翻译领域的知名学者,其研究工作在国际学术界非常有影响力,李良友和张檬都是华为诺亚方舟实验室的研究员,多年在机器翻译领域一线工作,不仅研究做得非常出色,而且有着开发企业级大型机器翻译系统的丰富的经验。他们对于机器翻译的深刻理解和实战经验,可以确保这本书的质量和水准。本书非常有特色的一点是每一章后面都附有一个小节的“短评”,将机器翻译各项技术背后的思想、争议、发展演变过程娓娓道来,让读者不仅可以了解这些技术本身,也可以更好地了解这些技术背后的故事,非常精彩。强烈建议阅读此书,相信读者们一定会受益匪浅!
——刘 群 华为诺亚方舟实验室语音语义首席科学家
现代意义的人工智能研究20世纪50年代初发端于机器翻译。当前这一次席卷全球的人工智能大潮在机器认知任务上取得突破也肇始于神经机器翻译。本书洋洋洒洒计二十章,俨然一部神经机器翻译的百科全书,同时还是一本技术深度指南。一卷在手,可起到机器翻译“传道、授业、解惑”之效,以其昭昭,使人昭昭。此外,我非常喜欢每章后的短评,海阔天空,信手拈来,很有启发性。
——孙茂松 清华大学人工智能研究院常务副院长、欧洲科学院外籍院士
本书是了解机器翻译技术的一本全新专著。自然语言处理是人工智能皇冠上的一颗明珠,而机器翻译则是自然语言处理技术的演兵场。过去六十年,机器翻译催生并应用了几乎所有重要的自然语言处理技术。无论是从早期的基于规则的机器翻译系统,到中期的统计机器翻译,再到最近几年的神经网络机器翻译,几乎无一例外。了解机器翻译的历史沿革、技术趋势,就等于把握住了自然语言处理的发展脉搏。本书循着机器翻译技术发展的脉络,深入浅出地介绍了神经机器翻译的理论基础、技术体系和实践方法。同时,本书深刻揭示和探讨了机器翻译技术发展的推动力和未来发展方向。
——周 明 创新工场首席科学家,澜舟科技创始人,中国计算机学会副理事长,ACL主席(2019)
限时下单立减100,快快扫码抢购吧!
抽奖赠书
按以下方式与博文菌互动,即有机会获赠本书!
活动方式:关注下方“博文视点Broadview”公众号,在后台回复“机器翻译”参与活动,届时会在参与的小伙伴中抽取3名幸运鹅!
活动时间:截至8月15日开奖。
快快拉上你的小伙伴参与进来吧~~
审核:陈歆懿
热文推荐
▼点击阅读原文,查看本书详情~