查看原文
其他

人物专栏 | Alec Marantz: What do linguists do?(下)

人物专栏 理论语言学五道口站 2021-03-16

点击上方蓝字关注我们

编者按

《理论语言学五道口站》(2020年第63期,总第127期)“人物专栏”继续与大家分享Alec Marantz教授的自述——What do linguists do? Alec Marantz教授现任职于纽约大学,语言学及心理学教授,纽约大学阿布扎比校区语言神经科学实验室共同首席调查员。曾任职于麻省理工学院,担任杰出语言学教授,兼任KIT/MIT MEG联合研究实验室研究主任,主要研究方向包括形态学、句法学以及神经语言学。此篇自述为Alec Marantz教授在2019年2月所做。


在本篇自述中,Alec Marantz教授以计算机工程师、人类语言学家对语言学的批评以及一些具体的语言现象为出发点就语言学家主要是做什么的这一问题给出了自己的看法,为当今语言学研究人员带来了许多的启发。


Alec Marantz教授简介可参考《理论语言学五道口站》“人物专栏”2020年第58期,总第122期。


自述内容(续)

通过解谜对语言进行分析的观点导致了大家对语言学的批评,该观点认为这些调查充其量是一种高级数独游戏,在最坏的情况下是一种神秘的卡巴拉教(犹太神密哲学教)——句法学家们正在无休止地寻找与说话者获得语言、使用语言和理解语言等方面的知识脱节的语言模式。即使是对技术文献的粗略检验,也能反驳上述批评,因为语言学具有预测性、创造性和竞争力。语言学家预测未知的数据,根据方法论所获得的经验逐年增加,而对现象的替代性描述实际上是相互对等的,但失败的观点不再可行。在我们的主要期刊上,语言学的进步显而易见。然而,一些处理语言问题的科学家和工程师仍然质疑生成语法理论的合理性。

 

计算机工程师对生成语法的批评尤为显著。例如,如果一个人有兴趣处理来自网页的数百万个句子,以便于预测浏览器问题查询的最有用答案,那么他可能会发现,英语的(简洁,有用)有限状态语法涵盖了此类句子随机抽样的大部分内容。在某些任务中,对于更复杂的短语结构描述,移动并不会带来明显的结果,甚至人类阅读行为模式也可能不会因为使用短语结构语法而非有限状态语法而得到统计学意义上的改进,至少在随机测试的句子中如此。如果你也对这种现象密切关注,你应该思考如“If, either the guy who said he’ll complete the job is arriving today, or he’s sending someone else, then we’ll be finished by the end of the week”?这样的句子,难道英语不涉及需要短语结构语法的嵌套长距离依存吗?

 

答案是肯定的。与生成语法学家争论的计算机学家们采取各种办法来反对Chomsky的理论,即关于英语和一般语言的基本事实。但是任何阅读这些攻击语言学家文章的人都应该清楚,计算机学家和语言学家并不从事同样的科学研究。在语言学领域,研究的是说话者使用语言时的内在知识基础,不仅包括编写用于计算语言学数据网页时的语言,还包括理解判别由语言学家精心构建以作为测试用例的句子,以在相互竞争的理论之间做出判断。例如,假设我们对嵌套长距离依存的判断停留在嵌入级别上,如果判断直接关系到我们的语言知识,而不是处理过程的结果,这可能是短语结构描述的证据。将我们的分析限制在可能数据的狭窄子集里,比如通过随机文本读取时间数据,或对大量随机选择的英语文本通过计算分析程序执行“正确”分析,都不符合通常的科学实践。一个人可能事先不知道关键数据来自哪里,因此有必要在探究领域发展有趣的竞争理论,设计适当的实验,在相互冲突的理论预测之间做出决定。在英语的有限状态语法和短语结构语法对立的情况下,Chomsky在《句法结构》一书中提供了关键的实验和数据-在任何英语语料库中嵌套长距离依存[a [b [c c] b] a]相对贫乏,很难说明问题。

 

对生成语法的另一种批评是来自人类学角度的批评,在20世纪上半叶,该批评在美国促进了语言学的发展。假设语言结构在人类物种中并不普遍,也不是由我们的DNA决定的。相反,假设在经过充分研究的语言中,语言结构明显一致,这反映了一种事实,即此种语言被高学历的工业社会所使用。这些语言的短语结构对于此类社会使用语言的功能类型是必要的。假设我们找到了一类人和文化,他们的社会要求使用一种更简单的语言,不仅仅是有限状态,句子的数量也是可数的。Dan Everett就提出过这样一种语言,并受到了Tom Wolfe的公开支持。

 

简而言之,Dan Everett认为,巴西的皮拉罕人所说的语言缺乏“递归性”。“递归”的含义及其对语言学各种结构和拟议规则的适用性一直有争议,但就本文讨论的句法结构而言,所有人都同意,在任意形式的句子中(比如,《句法结构》中的S1)嵌入任意形式的句子将构成一种递归。Dan Everett否认皮拉罕语法存在这种结构,皮拉罕语中的句子既不包含嵌入名词短语中(任意结构)的名词短语,也没有嵌入形容词的形容词短语。事实上,鉴于Dan Everett对皮拉罕语提出的限制,该语言本质上是有限的,我们可以列出该语言中的所有句子。

 

虽然是生成语言学家,并对Chomsky的生成语法中皮拉罕语进行了出色的描写(生成语法提出皮拉罕语显示了通常排序的递归语法),Dan Everett最近从人类学家的角描述了皮拉罕语。他试图通过皮拉罕语的文化方面来解释观察到的皮拉罕语的特点。特别是,他把皮拉罕语归于此时此地的承诺,这构成了一种普遍的文化限制,反对谈论或思考遥远的,特别是那些超出自己和部落成员经历的时间或地点。在他的写作中,Dan Everett试图将这一原则与皮拉罕语和文化的其它各个方面联系起来,比如缺少颜色术语,缺少数字表达等。

 

虽然Marantz不是人类学,但他认为Dan Everett写的平庸的文章对人类学来说很糟糕。他可以这样说:因为文化人类学家的工作是让读者了解所描述的文化,即讲述一个引人入胜的故事,让我们了解另一种文化与我们自己文化的区别,然而通过阅读Dan Everett的文章,Marantz对皮拉罕语言和文化没有任何感觉与理解。就目前的讨论来说,Dan Everett语言学解释的最失败之处是他的观点,即当违反约束的可能性明显时,文化约束可以解释严格遵守约束的行为。如果Dan Everett的故事包括关于部落如何处理入侵和背叛,那会更好理解他对文化约束的解释。例如,该组织如何处理一个可以在皮拉罕语和葡萄牙语之间语码转换的叛逆青少年的故事(或者用皮拉罕语的递归名词短语结构大喊出“large happy fish”,(见下文)),这些将会有力的说服Marantz,并证明Dan Everett描述了一种做人的替代方式,而不是一个让人难以理解的异域之人。

 

Marantz说道:“就像我之前所说的那样,虽然Dan Everett作为一名人类学家在某种程度上并不成功,但他的确是一位优秀的语言学家。当他研究皮拉罕语法时,他清楚地知道必须提供皮拉罕语法的(半)正式说明,即如何描述皮拉罕的结构及其语法的有限性质。他在对皮拉罕语进行研究的过程中发现,皮拉罕语除了在一个语言机制上与其他语言有些许不同外,其他方面与别的语言几乎一样。”重要的是,Dan Everett还发现,皮拉罕中的所有名词、动词或形容词都需要在进行某种特殊标记后,才能在其句法位置上“获得许可”。这种标记是一种特殊的语素,它可以将句子信息中的命题内容与说话者或其他话语参与者联系起来。而从句子的层面上看,几乎每个句子都有一个这样的标记。 

 

名词“限制性”修饰的含义涉及语义递归的计算,Marantz为了方便我们的理解举了这样一个例子,在他看来最基本的修饰其实可以理解为“交叉”,比如“绿色的树”其实就是“绿色事物”与“树这种植物”的一个交集。一般情况下,如果一种语言中的名词可以被其他成分修饰,那么除了在语义内容方面有所补充外,修饰成分加名词整体的“语义类型”其实还与原名词相同。然而,在皮拉罕中,如果句子中的那个唯一的动词上只有一个单一的证据标记,则递归修饰会使得包含修饰名词的短语中的元素处于该短语结构的更深处,同时离证据标记也会越来越远。比如,在[large [happy [fish] ] ]这种由动词+证据标记和名词短语的结构中,至少有一个名词或形容词会离这个结构中的证据标记非常远,但即使这样,在皮拉罕中名词的修饰仍可以做递归计算。因此,“证据标记许可”将修饰的程度限制为一个,即不允许递归。

 

简而言之,Dan Everett对皮拉罕中句法的解释,使得皮拉罕符合普遍语法中的“生成”主张。 说皮拉罕的人在说一个新句子时受到的递归限制和“创造力”的限制,并非源于对语法的直接约束(该约束使皮拉罕本质上成为有限状态),而是源于一种用来限制递归结构构建的特殊形式的许可约束。然而,有很多语言学家对Dan Everett的说法表示质疑。Dan Everett除了在研究过程中采取了人类学的视角,还否认了标准语言方法在皮拉罕研究中的适用性。语言标准信息提供者的工作要求对可接受性做出判断,例如,对语言学家构建的新颖示例进行判断。但Dan Everett认为这种方法论对皮拉罕的研究来说并不适用。相反,在某种程度上,他甚至建议研究者重新采用结构主义的方法来对说话人的语料进行处理。比如表示“等待”含义的句子,如“If, either the guy who said he’ll complete the job is arriving today, or he’s sending someone else, then we’ll be finished by the end of the week.”就是说,Dan Everett拒绝使用语言学的标准科学方法来检验皮拉罕中的结构竞争理论。

 

《句法结构》中设想的项目——即通过探索人类语言的数学特性来表征人类认知的项目,时至今日仍只存在于计算语言学家的研究中。尽管Chomsky令人信服地证明了同“上下文无关的短语结构语法”相比,自然语言需要更多的计算“能力”。但是在上下文无关的语法和图灵机的计算能力之间,其复杂程度显然存在有趣的差异。而且我们的语言能力在层次结构中的确切位置仍然未知或未经证实。但是,这个问题并不能推动我们在“普遍语法”的框架下工作,它更关注的是构成单词和短语的元素的本体,以及这些元素之间相互作用的细节,而不是一般的数学特征。Marantz说,当他还是Chomsky的学生时,Chomsky曾对他说“有关这点,无论是中性的还是评价性的,时至今日我们仍不确定。”

 

目前(2019年春季学期),Marantz正在研究“局部性”约束对语言组合元素(“语素”)的交互作用的影响。这项研究与上文提到过的Chomsky《句法结构》中得出的观察结果直接相关,一旦语言的层次结构被承认,条件句中“if”和“then”之间明显的长距离关系实际上是“if”子句和“then”之间的非常局部的关系。语素之间的某些类型的交互需要非常局部的关系,类似于“if”和“then”之间的连接。例如,某些后缀限制了它们所附着的词干的含义。尽管“novel”这个单词有两个含义,既可以指书的内容新颖,也可以指“书”这个实体,但当添加后缀-ize之后,该单词的意义就被限定为第一种。一个人可以“革新”某人的生活,但不能“革新”这几张纸成为一本物理书。如果我们添加另一个后缀来使动词名词化,以创建“novelization”,则最后的后缀不足以定位到词干。因此在后缀之后不再可进一步添加其他后缀。就像我们不能谈论成堆纸张的“novelization”。

 

Marantz认为,这些观察对各种令人费解的现象提出了颇为有趣的见解。例如,前缀re-与“again”似乎具有相同的含义:“I re-opened the door.”(“我重新打开了门。”)似乎等同于“I opened the door again.”(“我再次打开了门。”)但是,re-仅表示“再次”的可能含义之一,即恢复对象的先前状态,而不是重复动作的含义。因此,“我重新打开了门”的意思是“我打开了门,之前它是打开的。”因此,re-不附加于表达动作活动的动词,而附加于改变状态的动词。尽管我们可以说:“昨晚我又跳舞了”,但不能说“昨晚我重新跳舞了。”

 

Marantz说,这时细心的读者可能会思考,“re-dance”中的“dance”是否与前缀re-的关系足够密切以至于它可以为re-选择一种特殊的“重做”含义呢?毕竟,re-和dance紧紧地挨在一起。也就是说,如果说话人愿意,是否可以让“re-dance”表达“再次跳舞”的含义,并征得其他人的同意?答案当然是否定的。语素在语言中的分层排列被称为语言的“句法”。正如乔姆斯基所说的“外在化”,同样的层次句法结构,一方面被解释为声音/写法/符号,另一方面被解释为意义。因此,我们可以找到与词素的发音方式有关的线索,这些词素的发音方式-含义和发音都是从同一结构中以高度受限的方式计算出来的。英语中表示“恢复某种状态”的re-需要重读(试比较“I returned the bottle”中的re- 和“I re-turned the knob to the open position”中的re-)。在英语中,前缀上的重音表示它与它所附着的词干各属一个单独的语法域;对re-的完整分析将表明它属于独立于动词的直接宾语的句法域。如其发音所示,re-和“dance”属于不同的句法领域,如果它们属于同一个领域,它们就无法在语义上相互影响。例如,即使re- 和“dance”看起来像是彼此相邻,但在语义解释的相关意义上,如果“dance”想要选择重复的而不是重读,那么二者其实并不属于一个句法域。

 

Marantz还提到英语单词性质的研究对语法结构和语言的性质具有很强的启示作用。然而,与Chomsky关于人类语言比上下文无关语法需要更多计算能力的结论不同,此处有关语素相互作用的局部性约束并没有对人类认知的本质直接产生明显的影响。Marantz说他自己的研究类型才是标准的认知科学或者说是标准的认知神经科学,因为他的研究类型只是研究语言的表征和使用而没有明确声称语言表征和计算的本质是人类独有的或语言独有的,来检验假设。Marantz又以“novel”和“re-dance”为基础进行了进一步说明,对语素理论及其组合进行的一个研究就是——说英语的人必须将词“excursion”分析成词干“excurse”和后缀语素“ion”(即使假定词干“excurse”仅出现在“excursion”一词中)。Marantz的实验室已经使用一种叫“磁脑图”的大脑监测技术,证实了这一点,并且证实了其他有关形态复杂单词的神经处理的预测。在语言学中,从来没有要求大脑信号中的一种证据只能够支持一种假设,而不能支持其他的假设。但在Marantz看来更重要的是,即使我们知道有关语言学的所有知识,我们也很可能还是找不到大脑反应理论的关键证据。

 

面对“语言学家做什么?”这个问题,Marantz说他们既不是工程师,也不是人类学家,因此,一些人基于这些学科的目标对语言学所作出的批判让他感到困惑和不解。在Marantz看来,他们是认知神经科学家,是视觉科学家,也是语言学的开拓者。他们的研究在许多抽象层次上进行,从基于对人类语法数学的计算语言分析的关于人类认知的一般性主张,到有关“excursion”的神经反应的特定假设。他认为同其他科学发现一样,语言学家对“if…then”句子行为及“re-dance”的不合语法性的观察都应激发我们作为人类天生就有好奇心,以及进一步了解周围世界的渴望。Chomsky建议,追随笛卡尔的理性主义传统,语言学在语言代表某种物种特定的、遗传编码能力的范围内可能具有特殊的吸引力,理解语言的本质使我们成为人类的重要部分。Marantz认为无论是Chomsky对英语语法中嵌套依存关系的讨论,还是Marantz本人对“novel”和“re-dance”的(不)可能含义的描述,都足以促进一个引人入胜且富有成效的领域的基础研究。


(上文为本站成员转述,自述原文如下)


English Version



往期推荐


"句法制图丝路之约"之Linda Badan篇
“现代语言学之父”乔姆斯基的批判与期望合并 —(多主)句法中的二元性
Viviane Déprez & Hedde Zeijlstra | 否定
Alec Marantz: What do linguists do?(上)
 

本文版权归“理论语言学五道口站”所有,转载请联系本平台。


编辑:马晓彤 闫玉萌 陈金玉 王平

排版:马晓彤 闫玉萌 高洁

审校:王丽媛 李芳芳


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存