专 访|圣杯就在眼前:“现代语言学之父”乔姆斯基的批判与期望
图片出处:Wiki
现已 91 岁的诺姆・乔姆斯基(Noam Chomsky),是麻省理工学院的荣誉退休教授,其所著的《句法结构》(Syntactic Structures),被认为是 20 世纪理论语言学研究上最伟大的贡献。
乔姆斯基通过该书传达着这样一种理论,即人类说话的方式遵循一定的句法,这种句法是以形式的语法为特征的,是一种不受语境影响并带有转换生成规则的语法。儿童被假定为天生具有适用于所有人类语言的基本语法结构的知识。这种与生俱来的知识通常被称作普遍语法理论。
因此,乔姆斯基认为,所有人类语言都具有共同的基本语言结构,无论其社会文化差异如何。从这个意义上讲,这是其他伟大的哲学家(例如约翰・洛克)等人拒绝人类的思想在出生时就是 “空白” 的观点。
尽管乔姆斯基本人在其学术生涯中并未真正涉猎过计算机和 AI (甚至近年还常常表达还对 AI 领域的某些作法颇有微词),但并不阻碍其思想对这两个领域带来冲击和重建。乔姆斯基的理论也被视作其它一些领域的理论基础:计算机科学的基础课程中会涉及乔姆斯基体系,因为它传达了对语言的深刻洞见。这一体系也可以从数学的角度来讨论,并引起了数学家,尤其是组合数学家的兴趣。很多重要的进化心理学、认知科学的论点也都基于乔姆斯基的理论体系。
在麻省理工学院出版社负责人 Amy Brand 与这位 “现代语言学之父” 于 2019 年的一次访谈中,乔姆斯基仍然在为该领域提出新的问题。
以下为双方 QA 内容(为保证中文阅读体验,内容经过基于原意的删改)。
Robert Berwick 和乔姆斯基在 2015 年出版的《为什么只有我们》一书中讨论了语言的进化论,即人类如何获得这种非凡的、超物种的能力
谈今昔的语言学研究变化
问 :20 世纪 50 年代,您在还是一名研究生的时候就发现了转换语法理论 —— 即人类语言背后有一种深层的、基于规则的结构,并在 1957 年出版了该方向的第一本书籍 “Syntactic Structures”。今天的理论语言学领域与 60 年前您想象的未来相比有什么不同?
Noam Chomsky :今非昔比。60 年前,语言学是一个相当小的研究领域,工作中有趣的事情几乎仅限于在 RLE (电子研究实验室)。相关的期刊、论文都很少,并且也不对这类研究开放。在 1955 年 Roman Jakobson 的建议下,我才将我的第一本书 ——“The Logical Structure of Linguistic Theory”(LSLT)—— 提交给麻省理工学院出版社。但审评人给出的评论认为它似乎不适合任何已知领域( 1956 年版本的书发表于 1975 年,当时该领域已经确立),所以拒绝出版。
实际上这部作品有相当丰富的价值,在某种程度上对该领域进行了综合和扩展,但当时完全不为人知(现在可能仍然是这样)。
在 50 年代末,我和 Morris Halle 很快申请并建立了语言学系,这是一个相当疯狂的想法,特别在当时语言学系很少的情况下。为什么要在麻省理工学院会设立这个系?为什么要研究几乎没人听说过的语言学呢?为什么学生会申请这样的院系呢?我们决定无论如何都要试一试,最后竟成功了。第一届学生是非常杰出、优秀的,他们都以所学的专业进入工作并走上了完美的职业生涯。直到现在,还有许多人的工作与语言学相关。奇怪的是,其他国家也遵循着相同的模式:“生成语法”(generative enterprise)研究在重点大学之外发展较快。
事实上,第一个博士生出现在该系之前:Robert Lees ,他写了一篇非常有影响力的关于土耳其名词化的研究。由于当时还没有成立该系,所以我们通过麻省理工学院电气工程系的系主任 Peter Elias ,在他那里申请了博士学位。这是麻省理工学院一种非常典型高效、但又非正式的方式。
但现在,这种情况早已发生了改变,来自欧洲、日本和其他许多国家的大学的语言研究院系都得到蓬勃发展,并对该领域作出重大贡献。
包括麻省理工学院出版社的《Linguistic Inquiry》和其他很多期刊在内,都在庆祝 MIT 语言学系成立 50 周年。各种各样对语言生成语法的研究,为该领域拓展了深度和广度。许多 50 年前几乎不存在的领域被开辟。学生们正在探索几年前还不可能提出的问题。语言学的理论工作已经达到了全新的深度和实证水平,并不断探索更有前途的新方法。
这几年来, Morris 和我经常回忆 50 年代初开始一起工作的日子,我们当时无法预见甚至想象的事情,却在未来的日子里神奇地发生了。
问 :在 1957 年出版的那本书中,有您的这样一句名言:“Colorless green ideas sleep furiously”。这句话虽然在语法上是正确的,但在语义上却可能没有任何意义,证明了结构和句法是一种原始的、独立于意义的东西。某些诗人可能会认为这个句是有意义的,而且可能会用它证明语言学家和文学理论家 Roman Jakobson 所说的语言有 “诗意功能” 的观点。一些人已经开始给句子 “注入” 某种意义,您怎么认为这件事呢?
Noam Chomsky :这是因为没人能理解这一句或者其他类似的句子,所以关键是要推翻人们对语法地位的主流看法:语法是由对多个语料的统计近似、形式框架以及独立于结构的意义等因素决定的。把您刚引用的句子称之为(1),虽然语法简单,但违反以上所有的标准。这就是为什么用它来举例的原因。与(1)结构相似的句子(2)“revolutionary new ideas appear infrequently”,但它有直接明显的字面意义。再比如将(1)倒过来的句子(3)“furiously sleep ideas green colorless”,甚至很难用正常的韵律发音。第(1)句话的特殊地位源于它违反了所有当时的语法标准,但与它具有相同的语法形式的(2)句却有清晰明了的字面意义。因此,对(1)构造没有意义的解释并不难,但对(3)句构造无意义的解释则要困难得多,因为它缺乏像(2)这样完全符合语法表达的结构。
这些对 “语法结构” 的讨论大多在我的书 LSLT 中都有涉及,包括我和 Pete Elias 的联合研究,我们开发了一种基于信息理论的分类描述,它在小样本和手工计算方面效果相当好,因为上世纪 50 年代早期,我们在哈佛大学读研究生时能选择的工作方式只有这一种。
由于很多人没能理解这一点,对(1)提出了隐喻(诗意)的解释,这与 “语法结构” 讨论的思路完全一致。但对于句子(3)来说情况则不太一样,尽管可以对任何单词序列编造出某种解释。我们对语言的研究,都是关于规则如何产生可解释、有意义含义的问题。其次,是在依赖语言结构(如句子(1)、(3))的情况下,如何提供其他丰富的解释。
谈 AI 与认知科学的结合
问 :今年 5 月,在采访 Steven Pinker(著名思想家、心理语言学家) 时,我们询问了他关于外界对人工智能和机器学习领域兴趣激增可能带来对认知科学领域的影响。Pinker 认为这些领域存在 “理论荒芜”,除非与认知研究更紧密地结合在一起,否则会走入死胡同。你帮助开创的认知科学方向,是对行为主义(强调环境因素对行为的影响,而非先天)、B.F. Skinner 研究工作的明确对立(一般认为,乔姆斯基 1959 年针对斯金纳《言语行为》一书发表的书评打响了认知革命的 “第一枪”)。
你是否认为机器学习的发展会倾向行为主义的回归?您觉得哪些计算领域的发展方向是值得关注的,可能为认知研究注入新的生命?
Noam Chomsky :有的时候会有对 Skinner 理论非常明确的支持,甚至是奔走相告的。例如, Terrence Sejnowski (著名 AI 学者)最近的《深度学习革命》一书中,他宣称 Skinner 是正确的。我认为这是对 Skinner 的严重误解,也是对 “革命” 的误解。
机器学习有一些显而易见的问题,例如以 Google Parser 为例,要问的第一个问题是:它是干什么用的?如果它的目标是创造一种狭义的工程形式的设备,那就没有什么好说的了。
但如果目标是科学,也就是了解世界,例如人类是如何处理句子的这种认知。就会出现其他问题,其中一个最无趣的问题是 Google Parser 在分析《华尔街日报》语料库时做得如何。
假设像谷歌 PR 声明的那样有 95% 的成功率,解析问题可以基本解决,科学家就可以转而研究其他东西。事实上这意味着什么呢?我们现在认为这是科学的一部分,语料库的每一个句子都可以看作是对实验问题的回答:语法上有这样或那样结构的英语句子吗?答案是:是的。然后我们提出了一个任何科学领域都会被提出的问题,一个没有目的的理论或方法,即使在随机实验中都能得到 95% 的正确答案又有什么意义呢?答案是:几乎没有意义。我们感兴趣的是理论驱动的实验答案,旨在回答一些重要的问题。
而如果这也算 “科学”,它就是未知的那种类型。
下一个问题是,它所使用的方法是否与人类使用的相似。答案是:根本不是。这又是一种未知类型的科学。
还有一个从未被提过的问题, Google Parser 在处理不可能出现(违反通用语言规则)的语言时表现如何?当目标是科学,那么成功解析就会被认为失败。尽管据我所知还没有人尝试过,但成功率几乎可以肯定会很高。甚至在许多训练试验较少的情况下,会比人类语言成功率更高,特别是用来使用基本计算特性的系统,而这些特性在原则上是违背人类语言规则的 (例如线性顺序)。到目前为止,我们已经对很多 “不可能” 语言(impossible language)有了解,包括关于人类如何处理心理语言学和神经语言学。如果有这类证据的话,它更像谜题,而不是语言。
简而言之,我们很难看到这项工作对科学,尤其是认知科学有任何方面的贡献,无论它在构建有用的设备或探索计算过程特性方面的价值。
有人可能会说,不会有最后这种问题出现的,因为不存在 “不可能” 语言:任何任意选择的单词序列集合都是一种语言。即使除了充足的反例,这种说法也可以根据基本的逻辑理由进行反驳:如果这种说法是正确的,那么我们不可能学会任何语言。
这样的信念在行为主义和结构主义鼎盛的时期是普遍存在的,有时很明确的叫做 “the Boasian thesis”。但语言之间可以有任意方式的差异,对每一种语言的研究必须不带有任何偏见(关于生物的多样性,生物学家也表达了类似的观点)。而且在一些机器学习文献中也隐含着类似的想法,但很清楚的是,这疑虑不能得到认真的思考,而且现在已知是不正确的(关于有机体的解释也是错误的)。
关于旨在回答语言学问题的理论驱动型实验,- 我再多说几句可能有用的话。计算认知科学家 Sandiway Fong 已经证明,备受推崇的机械解析系统表现效果相当糟糕。而这至少对科学来说是重要的,它不仅仅是那些没有目的的任意实验(比如模拟,或者解析一些语料)的结果。
最有趣的实验与 “异域 “(exotic)的语言结构有关,这些结构在正常的语音中很少见,但人们却能立刻理解,以及它们满足的所有奇特条件。多年来,已经发现了不少这样的存在。它们的特性特别具有启发性,因为它们使人们看到了使语言习得成为可能的原则。虽然我在这里不细究这个问题,但对婴儿语言习得的调查和对儿童获得语言素材的严谨统计研究,揭示了 “异域” 概念对婴儿的经验具有非常广泛可扩展性。
关于语言学未来的 “圣杯”
问 :我发现您和以前一样,在不止一个领域中活跃。比如近年来,您和计算机科学和神经科学等其他领域的同事合作撰写了一系列论文。那您现在在研究什么?
Noam Chomsky :有必要简单从头回顾一下,我在上世纪 40 年代末开始将生成语法作为个人爱好进行研究。我的一部分兴趣是从明确的基于规则的生成语法中解释数据,但更主要的研究是探索语法简单性。由于深度有序规则系统的复杂性,只能通过手工计算解决,因此 “最短程序”(shortest program)是一个有意义的问题。不久之后,我在哈佛遇到了 Morris Halle 和 Eric Lenneber 。由于我们都对当时流行的行为科学学说 —— 虚拟学说 —— 持怀疑态度,所以我们很快成为了好朋友。这些共同的兴趣导致我后来对 “生物语言学计划” 的研究,将生成语法作为有机体的生物特征(Eric 通过不断的研究建立了当代语言生物学领域)。
很明显在生物语言学的框架内,“圣杯” 是在生成语法的基础上解释语言的基本属性,满足可学习性和可进化性这两种条件。这是真正解释的标准,但却遥不可及。
很多数据和问题在最初努力构建生成语法时迅速积累,而当前的任务是设法弄清楚大量的新数据和这些令人困惑的问题,但这一过程相当复杂。之后,我就不再回顾生物语言学的历史了,但它的基本主旨仍是努力表明更简单、更有原则的假设,并可以在更大范围内产生相同或更好的实证结果。
在有些人看来, 90 年代初期可能是一段艰苦的岁月。为了得出语言的基本属性必须采用最简单的计算机制,还要试图证明这些特性可以用术语来解释,被称为 “强式最简思想(SMT,the strong minimalist thesis)”。到目前为止,我认为这方面的努力已经有了相当大的进展,包括首次解释了语言真正需要满足的两个条件的通用属性。
在过去的几年中的首要任务是确定 SMT 在多大程度上可以包括语言的基本原则,并且进行一些对语言能力的使用和解释语言习得原则特别有启示性的实验。
第二个任务是,区分特定语言能力的内在结构外的,和其他语言相比更为普遍的语言原则。比如在这方面非常有启发性的语言的计算系统,其中就包含了计算效率原则。最令人感兴趣的是专用于短期资源能力有限系统的计算原则,这类系统已被证明具有重要的经验成果。最后一个任务是使上述这些原则更加清晰,以便包括在真正解释中起作用的原则同时,排除那些表面看起来相似,但在经验和概念上都是不合理的原则。
这些有趣的工作在各个领域中进行,我认为对语言学发展进行全面审查的时机似乎已经成熟,在这个古老的研究领域中提供了一个相当令人兴奋的新阶段。
简而言之,我第一次认为在某些核心领域的 “圣杯” 已经可以窥见,甚至可以触手可及。这就是我最近一直在做的主要工作,希望能够很快将其整合。
问 :您最近和麻省理工学院的朋友和同事一起庆祝了您 90 岁的生日。在这样的里程碑日子或者展望未来的时候,就会忍不住回顾过去。所以您认为在这些年的工作中,您对语言学领域最重要的理论贡献是什么?
Noam Chomsky :开辟新的可供探究的问题和主题。
Refrence:
[1]https://thereader.mitpress.mit.edu/noam-chomsky-interview/
往期回顾
2020-11-01
2020-11-04
2020-11-04
2020-10-27
欢迎加入
“语言学心得交流分享群”“语言学考博交流群”
请添加“心得小助手”
今日小编:心得君
审 核:心得君
"心得君"
微信:xindejun_yyxxd