查看原文
其他

声音 | 袁毓林:ChatGPT语境下语言学的挑战和出路

袁毓林 语言服务
2024-09-04
点击上方“语言服务” 可以订阅


本文刊于

《现代外语》2024年第4期



ChatGPT语境下语言学的挑战和出路


袁毓林



作者简介


      袁毓林,男,1962年生,江苏省昆山市人。1990年毕业于北京大学,获博士学位。现为澳门大学人文学院中国语言文学系讲席教授。主要研究理论语言学和汉语语言学,特别是语法学、语义学、语用学、计算语言学和中文信息处理。在《中国社会科学》《中国语文》《当代语言学》和《中文信息学报》等刊物发表论文100余篇,出版著作10多部。2015年被聘为教育部长江学者特聘教授,2017年入选第三批国家“万人计划”哲学社会科学领军人才。















提要:ChatGPT在语言理解和生成方面的成功,对语言学有关传统观念提出了挑战。本文据此重点讨论了人工智能时代语言学家不可回避的三个问题:1)怎样看待ChatGPT等语言大模型生成的语言?2)怎样为语言模型等人工智能系统提供语义学支持?3)怎样跟语言大模型等人工智能系统形成人机协同?对此,我们尝试性的回答是:1)“机造语言”是一种“中介语”;2)应该把指称论语义学和分布式语义学结合起来;3)人机协同有嵌入、副驾驶和智能体三种模式。


关键词:ChatGPT;语言大模型;人工智能;语义学;人机协同



1 ChatGPT等大模型

对语言学的挑战



长久以来,从事语言学(包括语言教学与研究)的人有一种笃定的信心:只要人类不灭,语言就不会消亡;只要语言不亡,语言学职业就铁定存在。更何况,几千年来,语言学从业者对于语言的结构、功能及其历史演变,对于语言及外语教学的策略与方法,已经积累了丰富的经验,建构了系统的知识,并且形成了专门化的学科建制(disciplinary institution)和学科规训(disciplinarity)。虽然语言学内部多少还有点卷,在语言教学与研究的理念与方法上争议不断、流派纷呈,竞争的压力也不容小觑,但从外观上看还算是岁月静好,总体上说景气指数也应该不低。


谁能想到,2022年底人工智能聊天机器人ChatGPT横空出世,以其超强的、接近人类水平的语言理解与生成能力,外加知识学习与常识推理能力,一下子火爆全网;同时也无意中把语言学推到了历史的十字路口,挑战了语言学既有的一系列传统观念。比如:


1)语言是人类独有的现象,只有人类大脑才能产出自然语言;


2)人类语言具有递归性(recursion),所以无法用基于统计的概率模型来刻画;


还向语言学人提出了一系列棘手的问题,比如:


1)ChatGPT等大模型生成的语言是不是人类自然语言?为什么?


2)语言符号具有任意性(arbitrary,即形式和意义没有必然的关系),那么语言模型是怎样跨越这种语义鸿沟的?


3)目前的语言学理论在多大程度上揭示了人脑中实际的语言机制?


4)现代大型语言模型的成功有没有影响到语言学作为一门学科的存在?语言大模型在自动翻译方面的成功会不会影响到外语专业的存在?


显然,在ChatGPT等大模型的背景下思考这些问题,可以拓宽语言学的学术视野。本文集中讨论三个问题:1)语言学家应该怎样看待ChatGPT等大模型生成的语言?2)语言学家怎样为语言模型等人工智能系统提供语义学支持?3)语言学家怎样跟语言大模型等人工智能系统相处(互相协作)?



2 怎样看待ChatGPT等

大模型生成的语言?



下面,我们先来讨论第一个问题:ChatGPT等大模型生成的语言是不是人类自然语言?这个问题的回答,取决于怎样来定义“人类自然语言”。如果规定只有人类(大脑)产出的语言才能叫“人类自然语言”,那么ChatGPT等大模型生成的语言就不能算作人类自然语言。但是,这可能会有问题,因为语言大模型通过海量文本的训练,已经基本学会了人类自然语言的句法、语义和语用模式,在人类用户合适的提示(prompt,包括问题或命令)的指引下,能够生成类似于人类自然语言的文本。比如,下面是笔者和ChatGPT的问答:


笔者:


请向语言学家通俗地介绍ChatGPT的工作原理是怎么样的?


ChatGPT:


当然,我很乐意向你解释一下。ChatGPT的工作原理基于人工智能技术中的一种称为“深度学习”的方法。具体来说,它是基于一种称为“神经网络”的模型。(以下删去一小节)


在训练过程中,ChatGPT通过大量的文本数据进行学习,这些文本数据包含了各种各样的语言信息。通过观察输入文本的上下文以及与之相关的输出(回答、建议等),模型试图学习语言的模式、结构和语义。在这个过程中,ChatGPT逐渐建立了对语言的理解能力,并学会了生成自然流畅的文本。(以下删去一小节)


总的来说,ChatGPT的工作原理就是通过大规模的数据训练深度神经网络,使其能够理解和生成自然语言文本。这种模型可以用于各种任务,包括对话、文本生成、问题回答等。


机器的这个回答不仅语句通顺,结构完整,而且内容正确,逻辑自洽,比我心目中的答案还要全面一点。不足之处是篇章布局上略嫌松散,可能是受提示中“通俗地介绍”的影响。如果把这种机器从人类文本中学来的、并且人们可能也会这么说/写的文本,排斥在“人类自然语言”之外,可能是一种短视和狭隘的做法。这有点儿像不承认医院的辅助生殖科在实验室里培育出来的试管婴儿是“人类婴儿”一样,不近情理。其实,务实的人工智能社区已经把机器生成的语言当作“人类自然语言”,来快速有效地扩大训练语料的规模,并且有效地规避使用真正的“人类自然语言”文本可能带来的版权风险。


不过,话要说回来。如果承认机器生成的语言(简称“机造语言”)是“人类自然语言”,那么语言学家在收集语料、提取语法规则时,能不能使用这种“机造语言”来归纳“人类自然语言”的语法规律?更何况,这种“机造语言”可能良莠不齐,有时可能存在语法错误。比如,上例中介词“基于”前面缺核心动词“是”、“建立……能力”这种动宾搭配不同寻常、介词“通过”后面缺核心动词“采用”,等等。就像二语习得者产出的“中介语”(interlanguage)是语言学的一个重要的研究对象一样,“机造语言”(machine language)可能会成为未来语言学研究和工程应用的一个重要的研究领域。



3 语言学家怎样为人工智能

提供语义学支持?



接着,我们来讨论第二个问题:ChatGPT等大模型是怎样跨越语言符号的音义任意性这种语义鸿沟的?大家知道,人类自然语言是一种象征性的符号系统,语言符号音义之间的联系是由社会成员在历史的长河中约定俗成的。对于语言学习者来说,这种没有逻辑必然性的音义关系,是他们在一定的文化和语言环境下,通过具身认知,把某种语言符号跟有关的外部世界和内心体验结合起来,日积月累而逐步习得的。对于机器而言,上述这种指称论语义学(Denotational Semantics)不好使了,因为机器没法理解词典释义式的离散性语义表达。于是,怎样对语言符号的意义进行可计算的连续性的数值表达,就成为自然语言处理(natural language processing, NLP)的难题。好在人工智能专家在“意义即用法”、“意义相近的词语有着相近的分布”等语言学思想的指导下,根据词语出现的各种上下文,把词语的意义表示成高维向量(vector)。粗略地说,这是用某个词的各种上下文来表示这个词的意义和用法。现代大型语言模型的词向量动辄成千上万个维度,相当于在用每一个词的成千上万种语境信息来表示这个词的意义和用法。因为意义相近的词语往往出现在相似的上下文中,所以它们的向量值也相近;或者说,它们在高维的语义空间中挨得很近,并且相关词语的向量之间有一种平行的推导关系。一个著名的例子是“国王”的向量减去“男人”的向量(约等于“royal,王室”的向量)再加上“妇女”的向量约等于“女王”的向量。正是这种基于分布式语义学(distributional semantics)的词语意义的向量化嵌入表达(embeddings),为大模型注入了语义;并且,在大规模训练数据、转换器(transformer)的注意力机制、把在少量样本上学习到的知识迁移到其他领域的能力、在上下文中学习等各种预训练技术的加持下,使得语言模型能够跨越语言符号的语义鸿沟。


分布式语义学虽然在人工智能语言模型上取得了巨大成功,但是语言学界对于它及其前身潜在语义学(Latent Semantics)的关注是严重不够的。我们希望有志于面向人工智能语义学研究的年轻学者,能够从语言学角度去关心和研究分布式语义学。事实上,对于人工智能应用来说,以词向量为核心的分布语义学只是在数字世界(digital world)中解决了意义的表达和计算问题;但是,语言符号没有跟物理世界建立联系,即跟外部环境是脱节的。而语言是交际工具,语言符号最终要在人类生活的物理世界(physical world)中跟有关事物发生指涉和绑定关系。这就是所谓的“符号接地问题”(the symbol grounding problem),即让语言符号的语义解释从人脑或机器中投射到物理世界中,跟语境中有关的事物、事件或状态建立指称关系。比如,一台加载了语言大模型的家用机器人,虽然能够听懂主人的指令“把桌子上的大苹果装进礼品袋里!”的意义,但是实际操作起来必须把“桌子”、“大苹果”和“礼品袋”等符号跟当下环境中的有关物体建立一一对应关系。这里面,涉及到机器人对物品的识别和对语言符号的指称歧义的消解等,是一系列复杂的多模态感知和语义理解问题。这种符号接地问题不解决,人工智能就不能实现“具身智能”(embodied AI),最终无法进入人们的日常生活。而恰恰是在指称消歧和语义理解这一方面,语言学家的语义学知识和智慧是不可缺少的。可见,在人工智能时代,怎样把指称论语义学和分布式语义学有机地结合起来,解决机器人的语言符号的意义和指涉问题,是语言学家和人工智能专家共同的课题。



4 语言学家跟ChatGPT等

大模型协作的三种模式



2024年初,人工智能芯片公司英伟达的总裁黄仁勋说:“这是一个令人惊叹的时代,因为我们正处于一场新的工业革命的开始,过去蒸汽机、电力、PC和互联网带来了信息革命,现在是人工智能。OpenAI首席执行官Sam Altman称人工智能将“像手机一样”改变世界,彻底颠覆教育、医疗和科学研究等领域;将成为人类建设未来的强大工具,赋予我们表达创造性想象力和意志的能力。他鼓励年轻一代积极利用人工智能工具,实现个人的愿景,创造前所未有的价值。是的,本轮人工智能也开启了一个学术创新、研究范式转变的伟大时代。


站在这个新时代的门口,我们语言学人也应该积极拥抱人工智能。一方面要思考怎样更深刻地揭示人类自然语言的结构和功能,为人工智能的自然语言处理提供知识资源。另一方面要考虑怎样更好地利用ChatGPT等现代大型语言模型,来辅助我们的语言教学和语言学研究。在这里,我们首先要了解和考虑人机协同的三种可能的模式:


1)嵌入(embedding)模式,即语言学家通过跟ChatGPT等大模型交谈,使用提示词语来设定具体目标,让人工智能系统协助我们完成研究或教学工作中的某一项或几项任务;然后,语言学家自主地结束工作。比如,分别提示ChatGPT:


找出现代汉语中像“获得、落得”那样以“得”结尾的二字词,越多越好;


造出10个像“难道要我下跪不成?→难不成要我下跪?”一样的句子配对;


仿照“Colorless green ideas sleep furiously.”,造10个语义违反的英语句子,并译成汉语;


把下面的段落缩写成30字以内的一句话,给下面的文章摘要进行润色和修辞加工;


结果返回以后,语言学家进行检查,看是否符合要求;也可以指出不足,提出更加明确的提示,要求机器重写。在这种模式下,ChatGPT等大模型充当执行指令和完成特定任务的工具,语言学家则充当任务设计者和指挥者的角色。


2)副驾驶(copilot)模式,即语言学家跟ChatGPT等大模型形成伙伴关系,共同参与到研究工作的流程中,从提出研究计划、收集相关例句、总结有关规律,到编撰论文提纲、写作论文的有关段落,都是人机协同,并且让人机各自发挥自己的作用。比如,分阶段和分批次地提示ChatGPT:


什么是否定极项(negative polarity items)?举例说明英语中有哪些典型的否定极项词语?它们有什么样的句法语义特点?这方面有哪些参考文献和研究结论?


举例说明否定极项这个概念对于描写和解释语法现象有什么作用?


请举例说明现代汉语中有没有否定极项?如果有,那么以“现代汉语否定极项的句法语义研究”为主题,进行专题研究和论文写作合适吗


这个主题有哪些重要的参考文献和研究结论?还可以进行哪些方面的拓展和挖掘?


我从哪几个方面着手现代汉语否定极项的语料调查和例证分析比较合适?


同时,语言学家自己检索真实文本语料库,一方面自己分析语料,总结规律;另一方面把语料给机器,让它也分析语料,总结规律;再对它的分析进行检查,看看是不是能够补充或者修正自己的结论,或者从中获得新的观察角度;再把有关发现告诉机器,咨询它怎样列出论文提纲,乃至请它帮助写作有关部分,再自己亲手修改,等等。在这种模式下,ChatGPT等大模型和语言学家优势互补,相互配合,并且语言学家是主导者,机器是合作者。


3)智能体(agent)模式,即语言学家提供目标和必要的资源(比如,特定的文献和语料、比较明确的观点、结论或立场评价上倾向性),让ChatGPT等大模型独立完成某项任务(比如,写作某种科普性的通俗文章),由语言学家监督进程和评估最终结果。比如,根据文章性质或者现实需要,一次性或者分阶段和分批次地提示ChatGPT:


请以语言学教师的身份,写一篇面向大众的、关于汉语字母词(如“X光片、CT扫描”,等等)对于语言交际的重要性(不能废除、无可取代)的文章,限800字以内;


请以专业语言学家的身份,从下面三对例句(前面打星号“*”表示该句子不合语法)上,概括出一条语法规律,并作出一定的说明、解释和论证,写一篇3000字以内的文章:


1)买这种汽车的人不太多~这种汽车买的人不太多


2)看见那个学生的人来了~*那个学生看见的人来了


3)我见过买这种汽车的人~*这种汽车我见过买的人


像后面这个高度专业性的论题,可能需要多个回合的人机问答互动,并且需要语言学家给出更多的正面(支持自己的论点)的例句和反面(反驳对方的论点)的例句,最后,语言学家要细致核查和严格把关。在这种模式下,ChatGPT等大模型充分体现出智能体的互动性、自主性和适应性的特点,接近于独立的行动者和代理人;而语言学家则充当执行任务的监督者和验收结果的评估者。也许,目前ChatGPT等大模型还没有达到这种自主的水平。








相关链接


学人 | 袁毓林:人工智能大飞跃背景下的语言学理论思考

干货 | 长江学者袁毓林:如何形成开拓性的论文选题



声音


声音 | 清华大学李学勤教授:现在大学生的空闲时间太少了

声音 | 清华教授:创新很难,制造“学术垃圾”则很容易

声音 | 北大钱理群教授:中国教育的最大问题,就是连老师也不看书了

声音 | 台湾学者王汎森:人文学科做学问的关键是多写文章少参会

声音 | 为什么中国人要讲方言?这是我听过最好的答案

声音 | 做学问要会“搭架子”:王力先生对建构中国语言学系统的不懈追求声音 | 乔姆斯基:语言最大的用途并不是交流
声音 | 中国语言学的体系建设和时代使命访谈 | 中国语用学拓荒人何自然:期待海外学者目光投向内地
访谈 | 中国语用学的拓荒者和坚守者——何自然教授访谈录
访谈 | 语言学的责任与情怀:著名学者李宇明教授访谈录声音 | 陆俭明:当代中文走向世界必须做好这四件事声音 | 陆俭明:学好语文是学好一切的根本——个人语文素养关系国家语言能力建设
声音 | 陆俭明:为何“人工智能对语言学的研究成果不是不需要,而是用不上”?声音 | 陆俭明:语言研究要与未来接轨声音 | 陆俭明:科学研究的第一要素是兴趣声音 | 李宇明:中文怎样才能成为世界通用第二语言声音 | 屈哨兵:新文科背景下的语言学科建设
声音 | 胡壮麟:我所经历的新中国外语教育 & 新时代中国外语教育再出发声音 | 王宁先生:中国语言文字学面临的抉择访谈 | 华文教育需要顶层设计——郭熙教授访谈录声音 | 屈哨兵、徐杰、邓思颖、林华勇:语言学与新文科建设四人谈
声音 | 李宇明,屈哨兵:大湾区语言的时代机遇和未来选择
声音 | 李宇明:人类进入超语时代
声音 | 庄初升:当前我国的语言生态与中国语言学的使命声音 | 汪磊:互联网催生超媒体语言
声音 | 汪磊:走进现实的网络语言
声音 | 李朝:对英语专业办学和大学英语教师转型之管见声音 | 李斌,张松松:语言智能时代呼唤语言学理论创新
两会声音 | 王灿龙、张博委员:建议将语言学设置为一级学科及独立学科门类声音 | 众学者谈:语言学应该成为一级学科声音 | 外语界部分知名专家谈“取消英语在中小学主课地位”声音 | 北大教授:为什么中国没有文科院士?声音 | 北大陈平原教授:在大学,最伤害青年教师的是职称
声音 | 北大陈平原教授:人文学科的转引率价值不大
声音 | 985高校教授:建议取消“博导”这个荒谬可笑的称谓
声音 | 真正的大学老师需要具备哪些特质?
声音 | 中文成为世界语言的六大转向
声音 | 任正非:不学英文,农村的孩子永远都是农民

声音 | 黄友义:如何突破中外文化差异,让世界更了解中国?

声音 | 众学者谈ChatGPT与社会科学:应用、监督与展望

声音 | 胡建刚:华文教育如何更好地服务“一带一路”建设?

声音 | 朱国华:人文学科是未来王国投向现实世界的一道救赎之光

声音 | 当甲骨文遇见当代知音

声音 | 人文学科的危机是自然科学化
声音 | 中华文明第一次被清华大学教授整理得如此清晰声音 | 网络流行语会“杀死”中文吗?
声音 | “最美翻译官”张京英语发音惹群嘲:永远不要用自己的业余,去挑战别人的专业
声音 | 外交部姚梦瑶:口译会不会被AI取代,要看我们声音的温度和力量
声音 | 说话时中文夹英文会不会很low?
声音 | 什么是语言退化?语言退化群体最需要什么?
声音 | 人工智能将如何影响翻译行业的未来?

声音 | B站发布五四青年节短片:不被大风吹倒(视频+全文)

声音 |《我不想做这样的人》:B站献给明日青年的演讲(附演讲全文)

后浪 | B站献给新一代的演讲:年轻人是一个国家最好看的风景(附演讲全文)


语言服务资源共享



学术资讯分享

学术资源共享

学术交流共进

还有实用干货和更多福利

尽在语言服务资源共享群

欢迎加入


在【语言服务】公众号对话框

回复“资源共享

获取进群方式


语言服务

20万+语言学人已关注

ID:Language-service

投稿邮箱:yuyanfuwu@yeah.net

投稿交流、商务合作、著作出版

请联系语服君

微信号:yuyanfuwu2023

点击阅读原文

聆听更多声音


今天有“在看”我吗?
继续滑动看下一个
语言服务
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存