赠书 | 重量级神经机器翻译“百科全书”来了!
元宇宙到底有多火?据统计,截至2022年7月,国内至少7省17市政府部门已经发布元宇宙产业相关建设规划,包括北京、上海、南京、无锡等。火爆的元宇宙背后少不了人工智能的身影,而神经网络机器翻译将在其中大显身手。
目前机器翻译的主流技术范式——神经机器翻译——是一种基于神经网络的端到端机器翻译模式。区别于前代的统计机器翻译采用的多步骤级联方式,神经机器翻译只需要输入源语言句子,就能直接输出目标语言序列。
如下图所示,其基本思想是利用神经网络对源语言进行编码得到源语言的语义表示,然后根据该语义表示解码生成目标语言。这种端到端模式使模型可以一次性整体训练,既避免了传统级联方式的错误传递,也大大降低了模型训练和部署的繁琐程度。
(来自书中图4.1:神经机器翻译结构示例)
时至今日,神经机器翻译已成为在线机器翻译的主要引擎,每天以数千亿单词量的翻译规模服务全世界各地用户。
即便如此,机器翻译仍然存在诸多挑战和难题。
一方面,全世界在使用的语言有几千种,即使像Meta(原Facebook)AI 7月最新发布的NLLB-200这样的大规模模型(540亿参数,NLLB是“No Language Left Behind”的缩写),目前也只能覆盖200余种语言,占比不到已有语言的1/30,大量语言在机器翻译版图里仍然被“Left Behind”。
另一方面,神经机器翻译虽然显著提升了译文质量,但仍然面临鲁棒性、可解释性、广域语境依赖性、多模态、资源稀缺等多种挑战和开放问题。
《神经机器翻译:基础、原理、实践与进阶》正是在这样的背景中写就的。
该书为实践者总结已有技术,为研究者梳理前沿进展,并站在机器翻译历史发展的角度,对比不同机器翻译范式,希望读者能从对比中窥见技术发展的内在原因和规律,以此吸引更多机器翻译爱好者为实现所有语言互译的美好愿景添砖加瓦。
全书分为基础篇、原理篇、实践篇和进阶篇,覆盖神经机器翻译的基础知识、经典框架、原理技术、实践方法与技巧,以及无监督神经机器翻译、多语言神经机器翻译、语音与视觉多模态机器翻译等前沿研究方向。
全书理论与实践相结合,基础与前沿相交映。
除此之外,本书的一个特色是在每一章均附有一篇短评,针对相应章节的主题,介绍和评论神经机器翻译技术背后的历史、故事、思想、哲学、争议和规范等。短评与全书内容相交错,使读者对神经机器翻译技术不仅知其然,而且知其所以然。
本书适合高等院校计算机专业高年级本科生,以及人工智能、自然语言处理方向的研究生阅读,也可供机器翻译研究者、实践者、使用者,以及机器翻译行业的管理者、人工翻译研究人员等对机器翻译技术感兴趣的读者参考。
熊德意
天津大学智能与计算学部教授、博士生导师、自然语言处理实验室负责人,天津大学“语言智能与技术”中外联合研究中心主任,中译语通-天津大学自然语言处理联合实验室主任、中译语通人工智能首席科学家。
主要研究方向为自然语言处理,特别专注于机器翻译、对话、问答、自然语言生成、常识推理、认知计算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文100余篇,在Springer出版英文专著一部。
获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金等资助。
获得新加坡资讯通信研究院2008年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等奖项。
曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员,目前是中国中文信息学会理事。担任IALP 2012&2021程序委员会共同主席,CWMT 2017程序委员会共同主席,欧盟多国联合项目QTLeap咨询专家,ACL、EMNLP、NAACL、COLING等多个知名国际会议领域主席,以及TACL和ARR的Action Editor等。
李良友
华为诺亚方舟实验室研究员、机器翻译团队负责人。在欧盟玛丽居里项目资助下,于2017年获得都柏林城市大学计算机博士学位。
主要研究方向为自然语言处理,特别专注于机器翻译相关技术领域的研发。在ACL、EMNLP等多个国际著名会议和期刊上发表论文10余篇,并担任ACL、EMNLP等国际会议领域主席和会议审稿人。
张檬
华为诺亚方舟实验室研究员。于2018年获得清华大学计算机科学与技术系博士学位。
主要研究方向为机器翻译和跨语言自然语言处理。在ACL、EMNLP、AAAI、TASLP等国际著名会议和期刊上发表论文10余篇。
曾获中国中文信息学会优秀博士学位论文提名奖。担任ACL、EMNLP、AAAI、IJCAI等多个知名国际会议审稿人。
本书介绍的是当前的主流——神经机器翻译技术。全书按两条主线组织,内容主线分四篇,覆盖神经机器翻译的基础知识、神经网络模型原理、引擎实现和部署以及若干前沿研究主题,理论和实践相结合;短评主线交织穿插于内容主线网络中,将相关内容与更广泛的主题关联,如机器翻译的发展历史、自然语言处理研究范式、软件开源、数据驱动、技术创新、实验可复现性、人工智能伦理等。
可贵的是,书中的某些短评探讨了被机器翻译技术快速发展掩盖的机器翻译背后的科学问题,并呼吁机器翻译研究需在科学与技术间再平衡;在技术创新发展的同时,机器翻译研究需与其他学科交叉融合,使得相关科学理论可以支撑机器翻译未来更大的发展和突破。同时,作者也从科学研究范式的本源上深入思考了机器翻译的未来。
——梅宏 中国计算机学会理事长
机器翻译是人工智能的一个缩影,神经机器翻译的诞生是人工智能的一个飞跃。本书深入浅出,系统地介绍了神经机器翻译的理论与实践,每一章节都有作者对问题的精辟见解和深入思考。本书是了解机器翻译和自然语言处理的一本难得佳作。
——李海洲 IEEE Fellow,新加坡工程院院士,新加坡国立大学终身教授
熊德意教授是机器翻译领域业界的知名专家,他和李良友、张檬两位博士一起撰写的《神经机器翻译》一书,是想学习和了解机器翻译技术进展的读者都应该阅读的好书。本书的基础、原理、实践、进阶四个篇章,为不同背景和不同需求的读者提供了完整的学习材料。书中不仅详述了神经机器翻译的模型、算法等技术,还介绍了背后的思想和历史的演进。这是只有一直走在领域前沿并不断进行理论和实践探索的人才能写出的佳作。
——李 航 ACL Fellow、IEEE Fellow、字节跳动AI Lab Director
语言数据是数字科技的关键要素,是数字经济时代的生产力。阅读本书,对此会有更为理性的认识。
——李宇明 中文信息学会原副理事长
神经机器翻译虽然出现时间不长,但以其优异的性能迅速改变了机器翻译的面貌,成为机器翻译的主流技术,并大大拓宽了机器翻译技术的应用边界。本书是一部专门介绍神经机器翻译技术的著作,由浅入深地介绍了机器翻译的方方面面,非常适合各个层次的机器翻译研究者阅读。本书的作者熊德意是天津大学教授,是机器翻译领域的知名学者,其研究工作在国际学术界非常有影响力,李良友和张檬都是华为诺亚方舟实验室的研究员,多年在机器翻译领域一线工作,不仅研究做得非常出色,而且有着开发企业级大型机器翻译系统的丰富的经验。他们对于机器翻译的深刻理解和实战经验,可以确保这本书的质量和水准。本书非常有特色的一点是每一章后面都附有一个小节的“短评”,将机器翻译各项技术背后的思想、争议、发展演变过程娓娓道来,让读者不仅可以了解这些技术本身,也可以更好地了解这些技术背后的故事,非常精彩。强烈建议阅读此书,相信读者们一定会受益匪浅!
——刘 群 华为诺亚方舟实验室语音语义首席科学家
现代意义的人工智能研究20世纪50年代初发端于机器翻译。当前这一次席卷全球的人工智能大潮在机器认知任务上取得突破也肇始于神经机器翻译。本书洋洋洒洒计二十章,俨然一部神经机器翻译的百科全书,同时还是一本技术深度指南。一卷在手,可起到机器翻译“传道、授业、解惑”之效,以其昭昭,使人昭昭。此外,我非常喜欢每章后的短评,海阔天空,信手拈来,很有启发性。
——孙茂松 清华大学人工智能研究院常务副院长、欧洲科学院外籍院士
本书是了解机器翻译技术的一本全新专著。自然语言处理是人工智能皇冠上的一颗明珠,而机器翻译则是自然语言处理技术的演兵场。过去六十年,机器翻译催生并应用了几乎所有重要的自然语言处理技术。无论是从早期的基于规则的机器翻译系统,到中期的统计机器翻译,再到最近几年的神经网络机器翻译,几乎无一例外。了解机器翻译的历史沿革、技术趋势,就等于把握住了自然语言处理的发展脉搏。本书循着机器翻译技术发展的脉络,深入浅出地介绍了神经机器翻译的理论基础、技术体系和实践方法。同时,本书深刻揭示和探讨了机器翻译技术发展的推动力和未来发展方向。
——周 明 创新工场首席科学家,澜舟科技创始人,中国计算机学会副理事长,ACL主席(2019)
全彩印刷,精致排版,提供绝佳阅读体验
看到这里,你是否已经迫不及待想把这本书收入囊中了呢?别着急,我们为你准备了多重惊喜福利!
福利一:文末留言获赞数量前10名免费获得《神经机器翻译——基础、原理、实践与进阶》一本
1. 关注译·世界微信公众号;
2. 给本文留言,写下你想得到《神经机器翻译——基础、原理、实践与进阶》一书的原因;
3. 我们将把符合留言主题的留言扶上墙,截止到8月15日15:00,赞数排名前10名的粉丝,将免费获赠价值208元的《神经机器翻译——基础、原理、实践与进阶》一本;
4. 获奖结果将于8月15日公布,获奖的小伙伴请留言附上邮寄信息,我们将包邮寄出哦~
没有中奖的小伙伴也不要灰心,现在购买可享受超低优惠价哦↓
福利二:《神经机器翻译——基础、原理、实践与进阶》超低优惠价
现在购买《神经机器翻译——基础、原理、实践与进阶》一书,可享满100元减50元优惠,原价208元,现价108元一本!多买优惠更多哦~ 购买三本,单价低至92元!活动截至8月14日晚23:59,先到先得~
扫描以下二维码,即可购买↓
附全书目录:
小伙伴们,快快行动起来吧!
图片来源 | 博文视点Broadview
制作|绢生
审核|肖英 / 蓝莓
终审|清欢
注意啦,好消息!在公众号对话框回复“号内搜”,获取链接,可以快捷搜索“译·世界”号内任意信息~
推荐阅读
译词 | 老外说的“She is your double”是什么意思?可不是“她是你的两倍”!