微沙龙｜乔姆斯基的语言观复盘

THU语协应用语言学研习 2022-06-09

分享，互联时代的生活方式。快乐学习，渡人渡己。加油，研习人！

欢迎关注我们，一站式分享海量语言学术资源

来源编辑：THU语协公众号

转载编辑：研习君

敬请星标应用语言学研习，喜欢请点赞，分享请转发⭐

敬请关注并星标，欢迎点赞、在看、转发！

活动回顾

2021年12月9日，语言学协会邀请到胡笑适老师在邺架轩开展题为“乔姆斯基的语言观”微沙龙。同学们和老师就何为语言、人类如何学习语言、人类如何产出语言等问题进行了交流和探讨。

什么是语言？

什么是语言？从古至今，不同的思想家都对语言提出了自己的定义。早在古希腊时期，亚里士多德就对语言给出了自己的定义，即语言是声音与意义的结合体。而对于索绪尔来说，语言是说话者说出的词语与人脑中概念图像的对应。再之后的美国结构主义语言学家布隆菲尔德认为，语言应该是一套句子构成的系统。

“

然而，乔姆斯基对这些观点提出异议

对于乔姆斯基来说，前人对语言的关注无论是从语言本体出发还是从语言交际出发都没有触及语言对于人的特殊性，因此他认为语言学的研究应该从人的认知能力出发，探究究竟为何人，也只有人得以使用语言。

乔姆斯基的语言观按形成时间可以分为以下几个时期

1957-1965

乔姆斯基构建了一套语言的数学模型，认为语言可以通过由词构成的结构搭建出来。

1965-1970

乔姆斯基从数学模型转向了语言的认知机制（拓展标准理论）。

1973-1980

提出了条件理论，认为语言拥有一套自由产出句子的生成机器，再通过一系列条件过滤器筛选出合语法的句子。

1981-1992

乔姆斯基提出了原则与参数理论，认为不同语言之间不存在彼此独立的结构规则系统，而是都遵循一套普遍的原则 (principle) 系统。这套系统拥有不同参数，而语言之间的差异则通过参数值的差别体现。在这个时期，乔姆斯基也将儿童语言习得机制纳入了语言研究的范围，试图通过对儿童的研究揭示人类语言官能的初始状态属性。

1992-今

乔姆斯基对前四十年理论进行了反思与革新，开创了最简方案，从语言最底层机制：递归与合并出发，重塑句法系统。

乔姆斯基对语言认识转向的根本原因在于对儿童习得语言机制的思考。他用著名的柏拉图问题作为类比，认为人类作为唯一一个能够使用语言的物种，应该先天拥有关于语言的知识。面对来自经验主义认为语言是纯粹后天交流产物的挑战，乔姆斯基为语言先天论提出了以下三个论点：

语言学习不同于其他一般的学习模式，只有在关键期 (critical period) 内的儿童才能完全掌握一门语言至母语水平，而拥有更高心智成熟度的成人则无法完全习得。

不同语言在方方面面都有极大差异，而所有儿童都会在相同时间段习得自己的母语，这是经验主义路径无法解释的现象。

儿童的语言环境中缺少负面刺激，母语者不会产出不符合语法的句子，但儿童依然会产出不合语法的句子，并且会将成年人的纠正置若罔闻。这些现象说明人的语言能力是有其普遍的、作为族群的生物性基础的。

语言作为一种声音和意义的结合体，自然需要与其他认知系统互动。语言信息需要被处理为完全可以解读的信息传输至感觉运动系统（发出声音）与概念意向系统（解释意义）完成其作用。

因此，乔姆斯基认为人类之所以是拥有语言的独特物种，正是因为其不仅拥有独特的语言官能，更拥有高级的认知系统以支持语言的形成。例如人类拥有递归性思维，可以思考对方可能在思考什么，而即便是如大猩猩这样的灵长类动物也没有这种认知能力。

在语言的产生上，乔姆斯基认为这样的一个语言官能是基因突变的产物。在2001年，生物学家在对一个遗传性失语症家族的研究中发现这个家族中的成员都缺少FOXP2基因位点，一时间FOXP2成为了语言官能最可能存在的物质基础。然而之后的研究发现FOXP2在动物身上依然存在，说明语言的生物性基础还需要生命科学、脑科学等等学科进一步的发展与探索。

《王立铭.生命科学50讲》，《得到》，2018.5.20/21

倒Y型的模型

在语言的具体表现上，乔姆斯基认为人产出句子的过程可以构成一个倒Y型的模型：根据想要表达的信息从词库中提取词汇；将词汇传送至句法系统进行组合，组合后形成的可解读单位将被传输至语音和语义部分进行分别阐释，完成一个句子的产出。

在最简方案之前，乔姆斯基认为人类的语言能力可以被抽象为X-杠（二分三级多层跨类向心）结构，这个结构为句子提供了可以插入词项的位置，插入完成的结构再经过不同语言不同参数而形成的规则系统进行核查筛除错误句子，从而保证句子的正确性。然而在最简方案时代，乔姆斯基认为人的大脑不应该存储这么多核查的规则，而应该只通过简单的语法能力（句法单位的组合）生成无穷的句子，再在语音语义层面通过特征匹配来确定组合是否合法。

关于X-杠结构，详情请戳系列推文：

Digest｜短语结构（上）

Digest｜短语结构（上）

原创潘浩 THU语协 2022-03-17

什么是短语？什么是句子？

Fukui, N. (2001). Phrase Structure. In The Handbook of Contemporary Syntactic Theory (pp. 374-406).

从零开始拆解句子

许多语言现象已证明人类语言的会话片段——句子——是可分的。基于此我们理应可以将一个话语片段分割成更小的语言单位。

我们假设α是一个单独的符号是一系列符号，Φ、χ、ψ（其中Χ不能为空），那么我们可以为这种分割提供一个形式化表达： Φαψ→Φχψ。我们称这种分割规则为：词组结构规则 (phrase structure rule, or PSR)。假设我们现在有这样一系列规则：

S → NP VP（P代表phrase，短语）

VP → V NP

NP → D N

D → the（限定词）

N → boy（名词）

N → problem

V → solved（动词）

那么显然我们可以生成一个句子：The boy solved the problem，并描写出内部结构：

我们发现，并非是简单的线性结构，而应该拥有内部的层级 (Chomsky, 1957)。在这个结构中，我们可以看到三种句法特征：句法成分之间层级关系（居高，dominance），句法成分的类别（标签，label），句法成分的线性关系 （领先，precedence）。

在我们目前的假设中，词项的插入依然是属于PSR的一部分，这也使得这些规则的应用会受到上下文 (context) 的影响。很自然地，我们可以将词项插入与PSR分离开来，使得PSR与上下文无关（context-free）。我们假设人脑中存储有一个词库（lexicon），词库中的每一个词项都拥有其次范畴特征（subcategorization feature），规定了其后可以出现哪种类别的词语。因而，现在词项的选择被排除在PSR之外，PSR便可简单地表示为。至此，我们通过简单的直觉和对理论简化的追求得到了标准理论（standard theory）：句子的结构依靠词组结构规则以及插入包含句法信息（次范畴特征）的词项组合实现 (Chomsky, 1965)。

从PSR到X-bar理论

词组结构规则并非Chomsky的初创，而是他从美国描写主义手中继承来的分析工具。描写主义致力于全面地对句子结构进行拆解，以下是英语中的一些短语结构：（括号代表其中成分非必须。）

VP → V (NP) (PP)

NP → (D) N (PP)

PP → P (NP)

然而，这套基于事实归纳的规则并不能完整刻画我们对语言的朴素理解。由标签我们可以很自然地承认这样一条规则：左边出现XP，右边就必须出现X，然而我们已有的表达式α→χ并没有做此限制。我们发现这套计算系统过度生成了不符合自然语言的句子。同时，我们的语感会感到一些短语之间似乎存在一些联系，PSR无法捕捉：

The enemy destroy the city. （句子）

the enemy's destroying the city （动名词）

the enemy's destruction of the city （派生名词）

如何刻画这种联系？最简单的做法是假设存在名物化转换(nominalization transformation）：这两个名词均由句子"the enemy destroyed the city"由句法操作转换而来。然而这种直观的想法遭到Chomsky的反驳。

Chomsky的驳斥 (1970)

Chomsky指出，无论是名物化的操作还是性质，转换假设站不住脚：

名物化中许多操作不具有普适性（将动词变为派生名词，插入介词of等），在其他的变换中也不曾出现。
名词化后的片段与名词高度相似，而与句子不同。
并不是所有句子都可以用相同的方式名物化。

因此他提出了词汇假设（lexicalist hypothesis）：名词的派生应该在词库中的词项上完成，之后以名词的身份进入PSR进行计算操作。

但若派生名词短语与句子不存在变换关系，我们依然无法解释其相似性。显然我们此时需要一个对所有语类 (category, N, V, P, etc.) 都适用的一般规则。Chomsky给出的规则便是X'，二分三级多层跨类向心模型。

目前的X包含如下两个部分：【二分】

X' → X ...

X'' → [Spec, X']

其中每个符号意义如下：

X：跨语类的核心（head），可以是N，V，P等。【跨类】

...：补足语（complement）。

X'：一个包含核心与其补足语的投射projection。

[Spec, X']：标志语（specifier），例如动词投射中的标志语可以是助动词，形容词投射中的标志语可以是very这样的形容词。

X''：一个包含X与其标志语的投射【三级】，X与X'都与X''有相同的基础性质，因而被称作X的投射（projection），同时后者被称为最大投射（maximal projection）。

X'理论刻画了人类语言的普遍特征：向心性 (endocentricity)，所有短语都由其核心投射而来。

因此所有短语都获得相同的内部结构，核心的次范畴特征也决定了投射结果：例如X拥有特征+[_PP]，则PP将成为X的补足语参与投射。

除次范畴特征，核心本身也有体用 (substantive & predicative) 两重特征：[±N]，[±V]，据此我们可以描写一些主要词类的性质。

N=[+N, -V]
A=[+N, +V]
P=[-N,-V]
V=[-N, +V]

因此，核心并不是独立的存在的个体，而是特征的集合，也因此我们可以规定不同变换作用的特征要求，以区别不同变换的适用范围。

至此，我们初步得到了刻画语类之间相似性的工具，但这个工具却没有回答一个最基础的问题：什么是句子？

什么是句子？

根据X'理论，句子也应该是某种成分的投射。据此，不同句法学家提出了不同的观点：

Jackendoff (1977)：

句子是动词的最大投射

1. 定式句（I有时态标记）中I向主语派主格。

2. 印欧语中I与主语存在性数等的一致关系。

3. 理由：因为表现了句子与名词在内在结构上完全的平行性（parallelism）。

形式化表达²：S (V''') → N''' V''

但这种分析忽略了句子的屈折元素（inflectional element, or I，包括时态、助动词等），而众多语言事实表明主语与I有紧密的关系，将主语生成在动词投射内部则无法刻画这种联系。因此，到Chomsky (1981)，句子依然使用PSR而非X'刻画。

形式化表达（违反了二分的原则）：

S → N'' I V''

Huang (1982)：句子是I的最大投射

1. 由X-bar向心性原则推导的必然结果。

2. I可以管辖（govern）主语，因而其应该为核心，形式化表达：

S (I'') → N'' I', I' → I V''

Bresnan (1972) ：句子之上还有成分

在对英语做更为仔细的考察后，我们会发现有些话语片段无法容纳在现有的句子中。Bresnan通过对wh-移位研究，提出句子之上还有其介绍性成分，称作标句词 (complementizer, or C)，包括that, for, whether等。

形式化表达：C' → C S

据此，我们大致可以认为句子是由I投射而来，并可能拥有其之上的成分。

对句子的描写有大致了解后，我们回过头重新审视标志语成分。直观上看，标志语经常是名词短语，且与核心存在一定关系。那如何区分标志语和补足语呢？目前我们只能做出一定归纳：

标志语位置上可以出现主语：例如句子的主语在[Spec, I']，名词的主语在[Spec, N']。
wh-短语也应该在[Spec, C']上 (Chomsky, 1986)，因为我们发现其经常是NP，且与核心C存在特定关系，是C的[+wh]特征触发了wh-移位。

到目前为止，我们已经拥有一套能够描写任意语言事实的X'工具了。

X-bar完全体

不同于复杂的PSR，我们现在可以用两条规则刻画所有的句子：

X' = X/X' Y''

X'' = Z'' X'/X''

补足语、标志语、修饰语只是关系性的表示，用于描写它们在句法结构中的位置而非实际的语类。下面我们总结X'的性质。

X 并非是一套规则（rules），

而是普遍语法里的原则。

X'理论的提出最终彻底废除了PSR，因为PSR与词库中词项的次范畴特征重复，仅用词库与X'框架足矣。同时X'中区分了词汇范畴（如N, V）与非词汇范畴（如I，D）。而PSR中蕴含的其他性质可以用其他句法模块（比如格理论）应用在X'上实现（Stowell, 1981）。

X'仅规定成分之间的居高关系，

而并未对成分之间的线性顺序提出规定。

根据原则与参数理论（Principle & Parameter），线性顺序是由不同语言的参数决定的，核心在前（head initial）或核心在后（head final）决定了不同语言中的不同语序。

普遍语法是根据X'形成的

一系列有限数量的原则。

与这套原则相关的参数不同，便形成不同语言的具体语法。

我们可以给标志语一个统一的定义。首先我们定义两种移位：中心语移位（Xº-movement）与短语移位（X''-movement）。

依据此定义，结合大量的语言事实，我们可以认为：

普遍语法规定替代性移位（将最大投射移位到句法树上本已存在的位置）总是将最大投射移至标志语位置：wh-移位移至[Spec, C']；NP 移位移至[Spec, I']；名词内部被动化移位移至[Spec, N']。因而标志语可以看作是替代性移位的终点。

由是观之，X'似乎已经可以成为一套普遍语法应用的理论，但发展到此时，Chomsky本人已经感受到X'逐渐变得臃肿。毕竟，普遍语法是让婴儿学会语言的机制，怎么会需要如此繁复的限制呢？我们需要更为简单的理论框架......

|未完待续 |

Notes

1：相关内容可以选修邓盾老师的句法基础。

2：在Jackendoff的分析中一个核心最大投射为X'''。

Digest｜短语结构（下）

Digest｜短语结构（下）

原创潘浩 THU语协 2022-03-18

什么是短语？什么是句子？

Fukui, N. (2001). Phrase Structure. In The Handbook of Contemporary Syntactic Theory (pp. 374-406).

迈向最简方案

再论名物化

让我们回到1970，重新审视句子和名词短语：

现在的X'似乎刻画出了这两个话语片段的一致性，但依然存在以下两个问题：

为何在句子中主语（the enemy）处于一个虚词类（non-lexical category）位置[Spec, I'']，而名词短语中的主语（the enemy's）位于一个实词类位置[Spec, N'']？

2. 为何动词V的投射没有出现标志语？

为了进一步统一名物化的名词短语与句子，我们需要为X'提供一些修正 (Fukui & Speas, 1986)：DP分析（DP analysis）与谓词内部主语假设（Predicate-Internal Subject Hypothesis）。

DP分析

现在我们把限定语作为核心，NP作为其补足语。

1. 这种分析在句法事实和语义分析上都能得到支持，在DP分析前的蒙塔古（Montague）语义分析中已经采取了类似的分析方式。

2. DP分析为名词短语提供了双层结构，因而现在主语都位于了虚词类位置。

谓词主语内部假设

我们假设句子的主语生成在动词投射的内部：[Spec, V'']，理由如下：

自然语言提供了两方面的事实：
题元角色指派（theta role assignment）要求主语生成在动词投射内。
格指派（case assignment）同时要求主语最终占据[Spec, I'']位置。
为解释这种现象，我们只有一种操作：
主语在底层结构中基础生成在[Spec, V'']位置，在表层结构移位至[Spec, I'']位置。

经过这样一番修正，我们的X''能更好地刻画名词短语与句子的一致性了。

一个分析句子的新视角

至此，我们在修正理论的时候自觉地做出了实词（lexical item）与虚词（functional item）的划分。实词构成了我们对句子的理解（例如名词、动词），虚词参与了我们对句子合法性的计算（限定词、屈折成分等）。

这样看来，我们似乎可以换一个角度理解投射：实词指派其上的题元特征，与符合特征的词构成更大结构；虚词指派其上的一致性特征，为一个最大投射引入另一个一致的最大投射作为其主语，完成投射。

从这个角度看，虚词上携带的一致性特征会触发移位，而缺少一致性特征的实词则无法触发。通过以上分析，传统的X'理论发展成为了更为精简的相对化X'理论（relativized X' theory）：短语组合通过特征指派驱动。

相对化X'理论

在相对化理论中，实词和虚词最大的区别就在于实词拥有题元特征，而虚词拥有一致性特征。实词可以递归投射，直到其上所有特征全部指派完毕形成最大投射：一个语类X的最大投射是一个其无法继续投射的结构。

在现在的定义中，最大投射不再是与X'相关的具体结构层级，而是相对于核心和结构而言的最大投射。虚词的投射方式与实词不同，虚词上的一致特征一一对应。因此虚词的最大投射是关闭的，即虚词的投射方式是无法递归的。

再看移位

现在我们再考察移位，注意到移位是通过一致特征触发的，因此只有虚词可以触发移位。事实上，我们先前考察的所有替代性移位都符合这一个性质：

名词短语的移位都会移到虚词类I的标志语位置。
名词短语内部的移位都会移到虚词类D的标志语位置。
wh-疑问词移位都会移到虚词类C的标志语位置。

在相对化理论中标志语（spec）位置同样不再是结构中的既有位置，而同样获得相对化定义：X的标志语是与X有一致关系的最大投射。

在这样的定义下，标志语的性质更为突出：标志语位置是移位的终点。

注意到在标准X理论中，深层结构中标志语位置会基础生成空语类Δ以作为替代的目标，然而，在相对化理论中，Δ既无法通过题元角色指派允准，也无法通过一致关系允准，同时这个空语类总会在表层结构被替代。因此，在相对化理论中空语类Δ不需要存在，而替代性移位也不再是对一个已有元素的替代。那么，通过特征指派，我们可以把所有移位统一为句法对象的附加（在这时期被称为Adjunction）。

相对化X'理论通过投射与特征指派，取消了先验的X'结构的必要性。现在的分析预测在一种缺少虚词语类的语言中，投射将不会关闭，也不会触发任何句法移位。Fukui (1986, 1988) 认为日语就具有这样的特征。

最简方案：光杆短语结构

Chomsky (1994) 中提出了光杆短语结构（bare phrase structure）理论，彻底取消了X'的理论假设。

从经济性原则出发，语法的所有原则实体都应该只通过语音和语义界面的性质进行核查。在句法层面上唯一需要的信息只有核心与非核心的组合以形成一个句法单元，因此Chomsky认为短语结构只通过自底而上的合并（Merge）就可以实现。

由于合并不考虑词与词之间的线性关系，因而合并过程的形式化表达如下：

K = {γ, {α, β}}，其中K是由α与β合并而来的新元素。

K的核心将会实现为α与β中其一，这个过程同时也是递归的。

Chomsky进一步认为短语结构生成与移位都是通过合并实现的。

其二的唯一区别在于参与合并的元素α是直接从词库中提取出来的（Numeration）还是从中K复制出来的（Copy），前者是短语结构生成的逻辑，后者是移位的逻辑。

光杆理论对最大投射的定义于相对化理论并无二致，但其对标志语的定义不再以一致关系为标准，而是回到了传统定义，即标志语是被最大投射直接居高（dominance）的短语成分。

光杆理论彻底革除了X'理论假设，将人类的语言能力直接体现为递归合并能力。然而光杆理论产生了原则参数时期不存在的三个问题：

何为居高。
如何给句法对象标签赋值³。
如何确定词与词之间的线性关系。

短语结构中的线性关系

在生成句法框架中，线性关系很长时间内都不是重要的考察对象，与之相关的理论似乎只有核心参数（head parameter），即一个语言的短语结构中核心在前还是在后。然而，Kayne (1994) 重新指出了线性关系的结构依赖性，用结构上的非对称性平瞰（asymmetric c-command）关系定义线性关系。

线性一致公理

Kayne认为在短语P中，如果一个非叶节点（non-terminal node）X非对称平瞰另一个非叶节点Y，那么X居高的所有叶节点将位于Y居高的所有叶节点之前。因此，由于所有语言结构上标志语-核心-补足语顺序的一致性，主语-谓语-宾语的线性顺序应该同样是语言的普遍原则，而其他语序则通过移位得到。因此，线性顺序并非是由核心参数设定而来，而是普遍原则的一部分。

Chomsky (1994, 1995) 将LCA吸纳进光杆理论之中，认为递归合并操作不会编码任何与线性关系相关的信息。Chomsky假设线性顺序不参与语义阐释，而只是语音成分的子系统。

然而线性关系是否参与语义阐释仍然是争论的话题，则需要进一步研究 (Saito and Fukui, 1998)。

到目前为止，我们已经拥有一套能够描写任意语言事实的X'工具了。

|完 |

Notes

3：即对于由α与β合并而来的元素，K应该属于谁的投射的问题。

参考文献

Bresnan, J. (1972). Theory of Complementation in English Syntax. PhD dissertation, MIT.

Chomsky, N. (1957). Syntactic Structures. The Hague: Mouton.

Chomsky, N. (1965). Aspects of the Theory of Syntax. Cambridge MA: MIT Press.

Chomsky, N. (1970). Remarks on nominalization. In R. Jacobs and P. Rosenbaum (eds), Readings in English Transformational Grammar (pp. 184–221). Waltham MA: Ginn.

Chomsky, N. (1986). Barriers. Cambridge MA: MIT Press.

Chomsky, N. (1993). A Minimalist Program for linguistic theory. In K. Hale and S. J. Keyser (eds), The View from Building 20: Essays in Linguistics in Honor of Sylvain Bromberger (pp. 1–52). Cambridge MA: MIT Press.

Chomsky, N. (1994). Bare phrase structure. MIT Occasional Papers in Linguistics, 5. Also in G. Webelhuth (ed.), (1995). Government and Binding Theory and the Minimalist Program. Oxford: Blackwell.

Chomsky, N. (1995a). Categories and transformations. In The Minimalist Program (pp. 219–394). Cambridge MA: MIT Press.

Fukui, N. (1986). A Theory of Category Projection and its Applications. PhD dissertation, MIT. Revised version (1995) as Theory of Projection in Syntax. Stanford: CSLI Publications and Cambridge University Press.

Fukui, N. (1988). Deriving the differences between English and Japanese: a case study in parametric syntax. English Linguistics, 5, 249–70.

Fukui, N., & Speas, M. (1986). Specifiers and projection. MIT Working Papers in Linguistics, 8, 128-172.

Huang, C.-T. J. (1982). Logical Relations in Chinese and the Theory of Grammar. PhD dissertation, MIT.

Jackendoff, R. (1977). X' Syntax: A Study of Phrase Structure. Cambridge Mass: MIT Press.

Kayne, R. (1994). The Antisymmetry of Syntax. Cambridge MA: MIT Press.

Saito, M. and Fukui, N. (1998). Order in phrase structure and movement. Linguistic Inquiry, 29.3.

Stowell, T. (1981). Origins of Phrase Structure. PhD dissertation, MIT.

文案：潘浩

排版：刘秋果

审核：THU语协

欢迎点击下方关注公众号，获取最新交流群二维码

综合编辑：应用语言学研习