查看原文
其他

宗成庆:机器翻译的梦想与现实

宗成庆 应用语言学研习 2022-06-09
感谢关注我们!加油,研习人!

欢迎关注我们,一站式分享海量语言学术资源

来源编辑:语言科学公众号

转载编辑:研习君



敬请星标应用语言学研习,喜欢请点赞,分享请转发




本文来源:光明日报



     如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现任意时间、任意地点、任意语言之间的无障碍自由通信,是人类长期以来的梦想。

    近年来,随着计算机性能的提高,云计算、大数据和机器学习等相关技术迅速发展,人工智能再度崛起,机器翻译重新成为人们关注的焦点。一时间,机器翻译系统如雨后春笋般涌现,各种报道随之呈井喷式爆发,“机器翻译将取代人类”的说法也时有耳闻。然而,机器翻译的真实水平如何,梦想与现实的距离到底有多远?

从低迷到兴盛



       机器翻译概念于1947年被提出,随后成为人工智能研究的核心问题。在70多年的发展历程中,机器翻译研究经历了几个不同的历史阶段:
从概念提出到1954年美国乔治敦大学(Georgetown University)在IBM公司的帮助下实现第一个机器翻译演示系统,可以认为是机器翻译的初创时期。1966年,美国国家科学院语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,ALPAC)发布题为《语言与机器》的报告,宣称“目前给机器翻译研究以大力支持没有太多的理由”,“机器翻译遇到了难以克服的语义障碍”,从而导致机器翻译研究在世界范围内走向低迷。  20世纪70年代中后期至80年代前期,部分机器翻译系统在特定领域得到初步应用(如加拿大蒙特利尔大学研制的天气预报翻译系统TAUM-METEO)。欧洲共同体实施的欧洲翻译体系(European Translation System,EUROTRA)计划和日本对第五代计算机的研究都对机器翻译研究给予了支持,机器翻译研究开始复苏。  20世纪80年代末期,IBM公司实现了基于噪声信道模型的统计机器翻译系统,并在美国国防部高级研究计划署(ARPA)组织的评测中取得了较好成绩,推动了机器翻译技术的快速发展。尤其进入2000年之后,GIZA++、Pharaoh、Moses等一批开源工具相继发布,2006年谷歌翻译正式上线运行,2011年百度翻译上线,各大公司陆续推出了自己的翻译系统,整个机器翻译领域呈现出蓬勃发展、遍地开花的大好局面。  2013年基于神经网络模型的机器翻译(简称“神经机器翻译”)方法被提出,机器译文的质量得到大幅提升,并且很多开源工具被相继公布,机器翻译技术研究和系统推广应用均出现前所未有的盛况。统计机器翻译和神经机器翻译的基本原理都是基于已有的大规模句子级双语对照语料进行模型训练,建立最优的翻译模型,最终实现从一种语言到另一种语言的翻译。通常情况下,用于训练模型的语料规模越大,模型性能表现就越好。

被夸大的技术



       机器翻译技术的进步和系统性能的提升在为人们日常生活和工作带来更多便利的同时,也为该技术的产业化发展带来了更多商机。这种空前局面不仅让人们看到了梦想成真的希望,也点燃了部分人心中按捺不住的欲望。从传统媒体到新媒体,对机器翻译技术夸大宣传的声音不绝于耳,但一个不可否认的事实却是,目前的机器翻译技术尚不成熟,无论是文本翻译,还是口语翻译,机器翻译的质量远没有达到令人满意的水平。
  当前所有的商用文本机器翻译系统普遍存在的问题:  一是错翻、漏翻和重复翻译比比皆是,尤其对成语、缩略语、专业术语和人名、地名、组织机构名称等的翻译更是招数无几。  二是难以实现篇章范围内的指代消解,常常张冠李戴,例如,前面说的是美国与伊朗之间的事情,后面翻译“美伊两国”时却译成了美国与伊拉克。  三是缺乏足够的在线优化能力,无法从译员修改译文的过程中自动学习和更新翻译知识,即使译员对系统给出的某个错误译文反复修改,系统依然照错不误。  四是对口语而言,说话人的语气、重音、语调,甚至肢体语言无法得到充分利用,尤其当说话人的口音较重、用词过于生僻、话语主题超出先验知识范围时,译文的质量无法保障。

高端翻译不可取代



       我们并不否认机器翻译技术的进步,正如前文所述,机器译文的质量已有显著改善。在日常口语对话中,对于资源较为充分的语言(如英汉、日汉等),在说话场景不是非常复杂、口音基本标准、语速基本正常、使用词汇和句型不是非常生僻的情况下,口语翻译的性能基本可满足正常交流的需要。专业领域的文本机器翻译在训练语料较为充分时,译文准确率可达到80%以上。而对于资源匮乏的语言之间的翻译(如波斯语或达利语等与汉语之间的翻译),译文质量还十分有限。
  毋庸置疑,机器翻译可能替代那些任务重复性较大、翻译难度较低的低端翻译人员,如天气预报查询、旅馆预订服务、交通信息咨询等翻译,但不可能取代高端翻译(如重要文献、伟人著作、文学名著等翻译)人员,更不可能消除翻译职业。“信、达、雅”是翻译的终极目标,我们可以预期,未来的机器翻译系统能够辅助高端翻译人员提高翻译效率,但要实现无须人工干预的高质量全自动翻译恐怕还是一个愿望。  不得不说的是,任何负责任的科学家和企业界都有责任和义务把技术或产品的真实水平和性能告知公众,而不是一味地宣扬,甚至为了利益而故弄玄虚。实事求是是一种态度,也是一种品格。

宗成庆:中国科学院自动化研究所研究员

2022年度教育部人文社科项目申报线上培训——语言学专场
推荐 | 一文讲清国家社科基金和教育部人文社科项目
立项率3连降!2021年度教育部人文社科项目立项分析
慕课资源 | 兰卡斯特大学:语料库语言学方法、分析与阐释
(1)教育部人文社科项目申报书填写+立项案例
(2)讲座回看| 2021年度国社科活页新变化专项解读
(3)国家级教学成果特等奖申请书分享

综合编辑:应用语言学研习

微信公众平台审核:梁国杰

科研助力

文献综述的目的及写作方法指南

2022年度教育部人文社科项目申报线上培训——语言学专场

线上课程 | 人文社科研究方法——质化、量化、混合研究方法


文献延伸阅读(研习人指引)

本平台友情整理相关文献索引链接

欢迎感兴趣的朋友按需选购





科研助力

扫码享限时特惠!



扫码享限时特惠!

2022年度教育部人文社科项目申报线上培训——语言学专场
教育部人文社科项目申报书填写+立项案例
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点

友情推荐

点击左下方阅读原文,发现更多语言学好书!

出版社官方直销包邮!扫码查看详情

推荐阅读:
推荐 | 文献综述高分模版
Noam Chomsky | Mind Your Language
会议通知 | 第五届大夏跨学派语言学论坛
北外二语习得现状研究系列讲座(10.20-26)
224本CSSCI期刊最新便捷投稿方式汇总(综合社科、高校学报类)
预告 | “北外英语讲堂”系列活动
2022年度教育部人文社科项目申报线上培训——语言学专场
文献综述 | 选文献、读文献、写综述的原则与方法
会议通知 | 第三届话语、认知和社会高层论坛
"我因多年的冷漠而无法入睡,都是因为我读了一点诺姆·乔姆斯基"
王定华:关于开展国别区域研究的若干思考
讲座专栏 | 教育部人文社科项目申报书填写+立项案例
直播预告 | 教育部高校大学外语教指委专题培训 “大学外语教育教学的改革与创新”
国别区域相关×2021年度国家社科基金后期资助项目立项公示名单
专栏讲座 | 定性研究方法及论文写作(清华大学教授、博导主讲)
资源|网络上那些轻松愉快的语言学课程(值得收藏)
收藏 | 37个国家级、省级报纸理论版投稿邮箱
听说你还没用过这些论文写作神器?
语言人工智能正在升温
推荐 | 一文讲清国家社科基金和教育部人文社科项目
最新 | 北京大学出版社语言学书单(附:即出新书预告)
近五年国家社科中华学术外译项目立项名单及2021年推荐选题目录
当谈论颜色时,我们在谈些什么?
刊讯 |《现代外语》2022年第1期目录、摘要及稿约
乔姆斯基 | Simplicity and the form of grammars
课题研究方案、立项申报书、开题报告的联系和区别
两岸三地翻译学博导知多少?最全名单来了(2021年版)
讲座视频 | 认知语言学导论(9):认知语法
课程视频 | 认知语言学导论(6):概念整合
聚焦 | 国家社科基金:盲评、会评大揭秘
孔子语录英文版(理雅各 译),值得珍藏!
Google学术搜索使用方法及技巧Google学术来啦——最新免费镜像
2021年度国家社科基金项目公示(外国文学、语言学、翻译学)
我国区域与国别研究的现状和愿景(钱乘旦 汪诗明 张倩红)
《外语教学与研究》2021年第5期目录
“新文科”怎么搞?12所大学新文科建设典型案例汇总!
2022年度泰晤士世界大学排名发布:清北并列,中国大陆10所高校跻身200强
名单:C刊来源期刊目录(2021-2022),附快速查询通道!
于洋 姜飞:国际跨文化传播研究新特征和新趋势
最全3000个常见公共场所英语标示!(国家英文译写规范/收藏版)
学科分类版 | CSSCI扩展版来源期刊目录(2021-2022)
Michael Farrelly | 再论批评话语分析中的「互文性」
推荐 | 160个学术电子书下载数据库网站(部分网址已更新)
CSSCI南大核心来源期刊目录(2021-2022) 学科分类版
重磅 | 外语类新学科出现了!如何看待“国际语言服务”?
语言学再添新分支:北语创立国内首个“语言资源学”学科
推荐 | 在家也能免费下载知网等文献的10种方法
莫言:翻译家功德无量
赵新利:八路军的日语学习培训
高教司司长吴岩:新文科建设中外语教育教学不能缺位!
蔡基刚:英语在中小学的主课地位与公民素质和能力的培养 | 光明日报
翻译要忠实于原文吗?这是个问题
冯全功 | 翻译忠实观:争议与反思
《外国语》2021年第4期目录、摘要
收藏 | 公文写作常见错误更正对照表!
郑永年:一个国家有没有前途, 就看有没有给年轻人前途
复旦教授:人文社科类学生还是要老老实实读经典(外一篇)
学术争鸣|蔡基刚:课程思政与立德树人内涵探索——以大学英语课程为例
六位核心期刊主编眼中的“好论文”
特别推荐 | 语料库方法技术
PPT收藏丨2021-2018年教育部高教司吴岩司长报告汇总(附下载链接)
2021第九版北大核心期刊目录(语言学、文学、综合性学报)
陆俭明:语言研究要与未来接轨
我国二语写作研究的若干重点问题 |《外语教学与研究》2021(4)
收藏 | 国内外好用的语料库资源汇总
C 刊中常用的 107种人文社科研究方法
推荐 | 兰卡斯特大学免费慕课:语料库语言学方法、分析与阐释
胡壮麟:“语言学及应用语言学名著译丛”总序(首批30余种陆续出版)
王学典:何谓“新文科”?
郭英剑 | 新文科与外语专业建设
期刊《认知语言学》近20年数据简析(2000-2021)
王俊菊:新文科建设对外语专业意味着什么?
《现代外语》2021年第4-5期目录
刊讯 |《外语教学与研究》2021年第4期目录、摘要
胡钦谙 顾曰国 | 计算语言学研究70年
视频 | Tony McEnery:语料库与批评话语分析 前沿讲座
视频 | Paul Baker: 语料库与话语研究 前沿学术讲座
刘海涛:关于自然语言计算机处理的几点思考
人工智能的诗与远方,一文读懂NLP起源、流派和技术(外一篇)
关注人工智能时代的语言学研究(外一篇)| 中国社会科学网
重磅上市 |《国际中文教育中文水平等级标准》及解读本正式出版!
重磅 | 最新版北大核心期刊目录及投稿方式大全(语言学)
访谈视频 | Rod Ellis, D. Nunan & K. Bailey谈线上TESOL项目的发展
《外语教学》2021年第4期目录
刘海涛 林燕妮:大数据时代语言研究的方法与趋向
荐读 | 张辉教授团队“批评认知语言学”系列研究成果
张辉 张艳敏 | 批评认知语言学:理论源流、认知基础与研究方法
热点聚焦 | 本土语用研究—《外语与外语教学》专栏“人际语用研究的本土视角”)
讲座视频 | Martin Hilpert:语言与大脑的关系——从三个语言学实验谈起
讲座回放 | 宗成庆:机器翻译现状与语料资源建设
文秋芳《产出导向法:中国外语教育理论创新探索》评介
国内高校外语专业哪家强?教育部第四次学科评估 外语专业排名
讲座回放 | 李嵬教授:多元能力、超语行为及自主移动学习
王立非:加快建设“新文科语言学”!增设五个方向
新文科背景下外国语言文学学科发展与学术创新高层论坛(1号通知)
原版引进 | 德古意特认知语言学研究丛书+应用丛书(13种)
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点
热文 | C刊的“秘密”
中英全文 | 习近平:在庆祝中国共产党成立100周年大会上的讲话(中英双语+外媒报道)
文秋芳 常小玲 | 中国共产党百年外语教育与中华民族伟大复兴
重磅 | 2021软科中国大学专业排名出炉(中国语言文学 & 外国语言文学)
李战子教授原创随笔 | 人文学者与国际传播素养——话语研究者的观察与思考
施旭 | 文化视野下的话语研究 (浙外学报文化话语研究专题)
Rod Ellis教授关于二语习得的两个视频讲座
分享 | Rod Ellis教授讲座课件PPT
吴岩:教学改革改到深处是课程,改到痛处是教师,改到实处是教材
吴岩:抓好教学“新基建”  培养高质量外语人才
重磅丨2021软科中国语言类大学排名出炉(附中国大学完整排名)
重磅 | 语言学CSSCI(2021-2022)来源期刊投稿方式大全
收藏 | 史上最伟大的100部戏剧(附观看链接)
CSSCI南大核心来源期刊投稿方式大全(五)——综合社科和高校学报
讲座PPT:BCC语料库的理论和应用(荀恩东 邵田)
世纪对话 | Krashen教授与 Chomsky教授 谈现代语言学的发展
圆桌谈| Halliday, Labov, Mey, Embleton谈功能、语用与社会语言学的融合发展
「关联理论」超大份文献资源!
访谈视频 | Larsen-Freeman教授谈应用语言学中的复杂理论
冯志伟:大哉,计算语言学之为用!| 中国社会科学报
刘建军:思维方式差异与中西文化的不同特性 | 上海交通大学学报哲社版
CSSCI来源期刊最新总目录(含扩展版,2021-2022),建议收藏!
陈平:语言学的一个核心概念“指称”问题研究
语言与心智:普遍语法是否存在?
国别和区域研究体系机制探讨专栏 (主持人: 罗林)
刊讯 | 《现代外语》2021年第5期目录、摘要及稿约
黄国文 李文蓓:作为应用语言学的生态语言学
视频 | 李嵬教授谈超语实践研究(附Applied Linguistics 高被引论文)
收藏 | 2020版《中文核心期刊要目总览》完整目录表格版(附增减变化明细)
孙茂松 | 人工智能与未来语言教育
蔡基刚:课程思政与立德树人内涵探索——以大学英语课程为例
新书预告 | 乔姆斯基《句法结构》第二版中译本(冯志伟审校)
“躺平”一词火到外网,这个翻译有意思!
外语教师面临的新形势 新问题 |《外语教学与研究》
【讲座回顾】多模态人类学的思考
黄国文 | 新文科与外语教育——从“术”与“道”的 关系谈起
蔡基刚 | 学科交叉:新文科背景下的新外语构建和学科体系探索
陈平 | 话语的结构与意义及话语分析的应用
书讯 | Routledge Handbook of Cognitive Linguistics 文旭&Taylor主编
话语研究四十年 | 热点话题·发展趋势·研究路径
图解 | 语言研究的哲学基础与理论渊源
新文科建设的理路与设计
访谈视频 | Dan Jurafsky:AI 如何改变我们对语言的理解
徐赳赳 | 篇章语用研究70年
刘海涛 | 数据驱动的应用语言学研究
黄国文:思政视角下的英语教材分析
北大中文核心期刊投稿方式大汇总(最全版)
王宁:新文科视域下的翻译研究 |《外国语》2021(2)
徐锦芬 | 应用语言学研究的国际动态与前沿分析
王克非 | 翻译研究拓展的基本取向
语言学家伤口撒盐:王冕死了父亲
语言学、外国文学、中国文学CSSCI (2021-2022) 源刊目录及官微汇总
胡键丨语言、话语与中国的对外传播
王文斌 柳鑫淼:关于我国外语教育研究与实践的若干问题
新书推荐 | 穆雷 等著《翻译学研究的方法与途径》
何宁 王守仁 | 高校外语专业学生外语运用能力的培养
中国国家治理话语体系的构成与演化:基于语词、概念与主题的分析
戴炜栋 胡壮麟 王初明等:新文科背景下的语言学跨学科发展
国外语言学学科眼动研究: 现状与前瞻( 1934-2020)
神经语言学国际热点与趋势的科学知识图谱分析

扫码关注↑↑↑ 即可获取最新入群二维码!

目前已有 4.5 万语言文学、区域国别与

跨文化传播学研习者关注本公号

欢迎加入交流群,分享学习,共同进步!

亲爱的研习人,

一起来点赞、在看、分享三连吧!

一个,点亮在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存