好文荐读|杨彩梅、董 昕:唯递归假说中 “递归”的界定
好文荐读(第五十期)唯递归假说中 “递归”的界定。
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
苏州大学外国语学院,江苏 苏州 215006
文章简介
文章来源:杨彩梅,董昕.唯递归假说中“递归”的界定[J].解放军外国语学院学报,2022,45(01):1-10+160.
摘要:唯递归假说认为人类自然语言所共有的狭义句法只包括递归计算,它是人脑的先 天特有属性。研究者纷纷从不同视角支持或反对该假说,但由于他们对 “递归”的界定不明确、 不统一,因而结论之间缺乏可比性和连贯性。本文较全面地概括了生成语法文献中对递归界定 3 个方面的争议,尤其是明确了一些反复使用却又纠缠不清的术语,如 “递归”“合并”“嵌套” “标注”“迭代/重复”“并列”等之间的联系和区别,并结合文献中一语习得和神经语言学研究 结论提出更合理的界定思路。
关键词:唯递归假说; 递归; 生成语法
感谢《解放军外国语学院学报》授权推广,全文下载请点击文末“阅读原文”。
1. 引言
递归是指函数/过程在运行过程中直接或间接地调用自身而产生的重入现象。Chomsky (1951) 认为人类自然语言中的语法是一套有限的递归规则,借此能生成无限多的语言表达。Hauser et al. (2002) 进一步提出,人类的狭义句法只包括递归,递归是基因突变的产物,是 人脑的先天特有属性。Jackendoff & Pinker (2005: 212) 将该观点称为 “唯递归假说”( the Recursion-Only Hypothesis) 。虽然 Chomsky (1957,1959) 讨论过人工语法和人类自然语言中 不同类型的递归,但 Hauser et al. (2002) 没有明确说出唯递归假说中的 “递归”是否涵盖递 归的所有类型,因而学者们对唯递归假说中 “递归”的界定争议不断。Lowenthal ( 2014: V) 总结道: “很多研究者 (Fitch & Hauser 2004; Premack 2004; Gentner et al. 2006; Corballis 2007) 从不 同视角支持或反对唯递归假说,但都没对递归进行明确界定。”Martins & Fitch (2014: 16- 17) 也指出,以往研究 “对递归的界定各不相同,导致研究结论缺乏可比性和连贯性”。国 内的相关研究,如陆丙甫 (1983) 、黄国文 (1998) 、钱冠连 (2001) 和杨烈祥 (2012) 都没有 详细阐述 “递归”的界定问题。杨彩梅 (2020) 较详细地评述了不同领域之间关于递归界定 的种种争议以及证实/证伪唯递归假说的实验研究中的问题,但该文对生成语法领域内部关 于递归界定的争议的阐述还不够清晰。本文旨在更清晰地阐明生成语法领域对递归界定的 3 个方面的争议,并结合文献中的一语习得和神经语言学实验结果提出更合理的界定思路。
2.争议一: 唯递归假说中的 “递归”是指内递归还是尾递归?
2.1 人工语法研究
多数关于人工语法递归规则的研究 (Fitch & Hauser 2004; Bahlmann et al. 2008; Friederici 2014; Rohrmeier et al.2014) 都认为唯递归假说中的递归只包括内递归,不包括尾递归。人工语法中
的尾递归规则 “[1]→AB [1]”或 “[1]→[1] AB”不断调用规则自身,并在一定阶段结
合 (combine) 一个终止推导的规则 “[1]→AB”,从而得到相应阶段的尾递归序列 ABAB、
ABABAB 等,它们是简单、平板的连续并置/并列; 而人工语法中的内递归规则 “[1]→A
[1] B”不断调用该规则自身,并在一定阶段结合一个终止推导的规则 “[1]→AB”,从而
得到相应阶段的内递归序列 AABB、AAABBB 等,它们是多层级的内嵌套; 两者区别可用
(1a) 和 (1b) 来形象地表示 (Fitch & Hauser 2004: 377) 。以上研究的实验材料都是围绕
(1a) 和 (1b) 人工语法递归规则及序列来设计的。
以上文献中的人工语法实验材料可分为 3 类: 第一,Fitch & Hauser (2004) 、Gentner et al. (2006) 等的实验材料和人类自然语言不相关,比如由各种鸟叫声组合而成的 ABAB 和 AABB 等序列。Bahlmann et al. (2008) 、Friederici (2014) 、Martins & Fitch (2014) 和丁彧藻、 陈保亚 ( 2018) 认为这样的人工语法实验材料无法明确 A、B 之间的关系,因为简单的重复 操作也可以得到 ABAB、AABB 等序列,所以 Fitch & Hauser (2004) 、Gentner et al. (2006) 等 的实验结果分析和结论并不可靠。第二,意识到以上问题后,Friederici (2014) 的人工语法实验材料开始联系人类自然语言的音系内容,基于人类自然语言中清、浊辅音对比的ABAB、AABB 等序列 (A 代表清辅音,B 代表浊辅音) 进行设计。第三,为了进一步加强 与人类自然语言的联系,Fukui (2017) 中的人工语法实验材料开始涉及人类自然语言的音系 和句法内容,比如 A 是带有主语后缀-ga 的假词,B 是带有动词后缀-no 的假词,且 A、B 之 间既有句法上的主谓一致依存关系,也有音系上的元音和谐关系。可见,研究者对相关人工 语法实验设计越来越合理,在很大程度上可以规避无法确定 A、B 关系的问题。大多数研究 者 (Fitch & Hauser 2004) 认为其实验结果能证明人和其他动物都能习得 (1a) 中的尾递归序 列,但只有人能习得 (1b) 中的内递归序列。
2.2 一语习得研究
绝大多数的一语习得文献只对人类自然语言中的尾递归进行实验研究。他们认为人类自
然语言中的尾递归有两种: 一是被 Roeper (2011) 称为 “直接递归”(Direct Recursion) 的
尾递归,所生成的序列是简单、平板的并列结构,对应于上文中人工语法的尾递归序列
ABAB 等,人类自然语言例子有 Chomsky (1957) 提到的规则 (2) 、Rohrmeier et al. (2014)
提到的序列 (3) 以及 Pérez-Leroux et al. (2012) 提到的序列 (4) 。二是 Petersson et al.
(2012) 、Pérez-Leroux et al. (2012,2018) 、Roeper (2011) 等研究的 (尾) 递归,被 Roeper
( 2011) 称为 “间接递归”( Indirect Recursion) ,所生成的嵌套性尾递归序列包括所有格递归
序列 (5) 、介词短语递归序列 (6) 、形容词递归序列 (7) 等等。(5) —(7) 背后的尾递归
规则分别为 “NP→PossP NP”“NP→NP PP”和 “NP→Adj NP”,相应尾递归规则两次调
用自身,生成二级尾递归序列。研究儿童对 (5) —(7) 等尾递归序列习得情况的文献
(Roeper 2011; Pérez-Leroux et al.2012,2018) 都默认直接递归是人和其他动物的共有属性,而间
接递归是人类自然语言的独特属性。
(2) Sentence =Elementary sentence<Connective+ Sentence>( Chomsky 1957: 36)
(3) ( This sentence) continues and continues and continues. ( Rohrmeier et al. 2014: 73)
(4) ( he is pulling) an Elmo,a bicycle and a doll ( Pérez-Leroux et al. 2012: 306)
(5) Elmo’s sister’s ball ( Pérez-Leroux et al. 2012: 302)
(6) the baby with the woman with the flowers ( Pérez-Leroux et al. 2012: 302)
(7) big black balls ( Hollebrandse & Roeper 2014: 181)
2.3 生成语法研究
Chomsky(1957:22) 指出“英语中很明显存在 ‘S→a+S1+b’‘S1→c+S2+d’,等内递归规则,其中 a 和 b 之间、c 和 d 之间都存在长距离依存关系”,并给出英语中的典型内递归 (8) 来进行说明,the man 和 is arriving 之间就存在长距离依存关系; 后来 Chomsky & Miller ( 1963) 又给出内递归序列 (9) 来进行说明,the cat 和 killed 之间以及 the rat 和 ate 之间都存 在长距离依存关系。效仿他们,Rohrmeier et al. ( 2014) 给出了内递归序列 (10) 。Chomsky (1957: 20) 还采用 aabb、aaabbb 等抽象序列 (相当于 2. 1 节中的 AABB、AAABBB 等) 来对人 类自然语言中的内递归序列进行描述,并指出它们是由 (11) 中的内递归规则推导生成。可见,在 Chomsky 看来,人类自然语言语法和人工语法都属于形式语法。此外,由于 Chomsky 多 次强调内递归是人类自然语言语法的重要特征,因而很多研究者认为 “唯递归假说中递归的 核心内容就是内递归”(Levinson 2014: 3) 。
(8) The man who said that S,is arriving today. ( Chomsky 1957: 22)
(9) The rat the cat the dog chased killed ate the malt. ( Chomsky & Miller 1963: 286)
(10) Peter who gave Anne who helped Frank (...) paint the fence the ball laughed. ( Rohrmeier et al. 2014: 73)
(11) Σ: Z; F: Z→ab; Z→aZb ( Chomsky 1957: 30)
研究者 (Gibson 2000: 96) 还谈到,内递归加工难度大,且内递归序列的级别越高,难度
越大,像 (9) —(10) 这样的多级内递归序列 “对大多数人来说是无法加工的”。陆丙甫
(1983: 25) 也提到,虽然多级尾递归序列,比如 “他昨天雇佣的那个花匠看到的那个人留下
的那本书在桌子上”是可以接受的,但是多级内递归序列,比如 “这是[赶走了[吃了[放在
房子里]的麦芽]的耗子]的猫]”是 “完全不合格的……,实在不堪记忆,所以在口语中是
绝对通不过的”。不过,Chomsky & Miller ( 1963) 虽然承认内递归比尾递归加工难度大,但
坚信像 (9) —(10) 这样的多级内递归序列是 “完全合乎语法且意义明确的”,是人类自然
语言语法的重要特征。后来 Chomsky (2005: 6) 还给出了一个较好的解释: 像 (9) —(10)
这样的 “合乎语法且意义明确”的表达在书面语和口语中 “不被使用”(unattainable) ,其
实是受 “非语言特有的第三要素”( the third factor not specific to language) 中的某些原则
(比如结构构建原则) 和某些限制 (比如发展限制和记忆限制) 的影响所致。此外,杨彩梅
(2014) 还指出该类表达在书面语和口语中都不被使用的另一个非语言因素,那就是日常生
活中很难出现支持这类多级内递归序列的复杂语境。她的实验研究结果表明只要在实验中设
计出支持这类复杂序列的复杂语境,这类复杂序列就能被理解和使用,在一定情景下甚至非
用不可,比如图 1 中含有 6 只动物的复杂语境就很能支持二级内递归序列 “(张三喜欢哪只
猴?) ( 张三喜欢那只) 打咬猪的狗的猴”甚至三级递归序列 “(谁是张三?) ( 张三就是)
喜欢那只打咬猪的狗的猴的那个人”的产出和理解。以上两个汉语表达之所以在日常语言
使用中罕见,是因为图 1 中的复杂语境在日常生活中罕见。总之,二级及二级以上内递归序
列之所以在书面语和口语中很少被使用,并不表示人类句法能力中缺失内递归,而是 “第
三要素”中的某些规则或限制所引起的。一旦解决 “第三要素”相关问题,比如有足够的语境,这些表达便能被使用,甚至非用不可。所以唯递归假说中的递归应该包含内递归。
图 1. “( 你讨厌哪只猴?) [我讨厌[想打[咬猪]的狗]的那只猴]”的复杂语境 ( 杨彩梅 2014: 822)
3. 争议二: 递归和嵌套、合并等句法操作有区别吗?
3.1 1 最严格的递归界定
Martins & Fitch (2014: 17-18) 认为,如下页图 2 所示,3 个圆分别代表迭代、嵌套和递归,“迭代是指对某一操作进行一定次数的重复,嵌套是指成分之间的句法控制-从属关系(dominance-subordination) ,递归是一种特殊的嵌套,即同一句法范畴(syntactic category)之间的嵌套”,而 “典型的/真正的”递归只能是 3 个圆的交集部分。图 2. 递归、迭代和嵌套三者的关系 (Martins & Fitch 2014: 18)。
按照 Martins & Fitch (2014) 的界定,就语言而言,1) 上文中的 (3) —(4) 是非嵌套性 迭代序列,其形式表征 “ABC...”表示相同句法范畴成分之间的并列,两个成分需进行一次 并列操作,而 3 个及 3 个以上成分就会涉及并列操作的重复/迭代; 2) 序列 [V like [N apples]] 是非迭代性嵌套序列,其形式表征 “[B[A]]”表示不同句法范畴成分之间的嵌 套,嵌套操作只发生一次,为一级嵌套序列,而序列 [I will[V eat [N apples]]] 涉及了嵌 套操作的重复,故而是迭代性嵌套序列,其形式表征为 “[A[B[C]]]”,为二级嵌套序列; 3) 还有一种特殊的嵌套,即递归,它必须是相同句法范畴成分之间的嵌套,其形式表征为 “[ALPHA[ALPHA[ALPHA]]]...”,非迭代递归序列比如 [N[N student]committee]涉及一次 递归操作,为一级递归序列; 迭代性递归序列比如 [N[N[N college]student]committee]涉及 递归操作的重复,为二级递归序列; 4) 典型的递归必须是相同句法范畴成分的迭代性嵌 套,因此至少 3 个相同句法范畴成分之间的嵌套才是典型的递归,也就是说,至少二级递归 序列才是典型的递归。因此,按照 Martins & Fitch 的界定,上文中的 (2) —(4) 是非嵌套 性迭代,不是递归; 经典递归例 (7) 也不再是递归,因为其形式表征是 “[A[A[B]]]”, 不是 “相同句法范畴成分”之间的嵌套; 经典递归例子 (6) 的形式表征也更像是 “[A[B [B]]]”,故也不是递归。同理,(5) 也不大符合 “[ALPHA[ALPHA[ALPHA]]]”的表 征。总之,Martins & Fitch 对于递归的界定太过严格,在语言中真正能满足这一界定的例子 很少,故很难说只有这种递归才是唯递归假说中的递归。
3. 2 最简单的递归界定: 合并即递归
光杆短语结构理论 ( Chomsky 1995,2005,2014) 是最简方案的重要内容,其中的合并计算 操作可用 ( 12) 来描述,即 K 由 A 和 B 合并而成,A 或 B ( 即 C) 是 K 的标注 ( label) 或 者说中心语 ( Head /H) 。
(12) K= { C,{ A,B} } ,其中 Cε{ A,B} ( Fukui 2017: 15)
在这一合并操作过程中,只有中心语 A 或 B 能进入下一步计算。A 或 B 成为标注的过 程以及因标注而产生的短语向心性 ( headedness) 是合并操作过 程 的 “附 带 现 象” ( epiphenomenon) ( Fukui 2017: 15) 。因此,Chomsky 认为合并 ( 不包括标注) 是人类自然语 言所共有的唯一基本属性,而标注借助 “非语言所特有的第三要素”中的 “最小搜索规则” 就能完成 ( Freidin 2014: 144) ,比如,就最基本的 “H-X”结构而言 ( H 是中心语,X 是非 中心语成分) ,“最小搜索规则”自然而然地搜寻到 H 来进入下一步计算,而不是搜寻到 X 内部嵌套较深的中心语来进入下一步计算 ( Freidin 2014: 144) 。故 (12) 就等于 (13a) 和 (13b) ( <13b>是早期短语结构理论阶段采用的重写<rewritten>格式) 。
(13) a. K= { H,{ H,X} } b. H→H X
因此, “一次合并操作就是一个最简递归操作”(Freidin 2014: 144) 。比如,“D→D N” 规则所涉及的一次合并操作,就是一个最简递归操作,可生成一级递归序列 the cat。因此 Chomsky (2010: 52、55) 提出 “接口+合并=语言”和 “接口+递归=语言”两个等式,明确 表明合并就是递归 (Freidin 2014: 145) 。不过,Chomsky (2005: 11 - 12) 还强调,合并遵循 “无界合并”(unbounded merge) 原则,即两个成分合并成一个单位后,这个单位能够继续 与其他成分合并成更大的单位,且能够无限合并下去 (Corballis 2014: 28) 。无界合并概念的 提出旨在对应递归的反复性/无限性特征。就语言而言,无界合并可以是不同递归规则的连 续结合,比如 “D→D N” 和 “V→D V” 结合,形成 “V→D N V”,对应序列 the cat meows; 而且 “V→D N V”可继续和其他递归规则结合,比如它和 “Mod→Mod V”结合, 形成 “Mod→ Mod D N V”,对应 probably the cat meows; 无界合并也可以是同一递归规则的 反复调用,比如 “N→Adj N”被调用两次得到 “N→Adj [Adj N]”,对应 (7) 中的 big black balls,“N→Adj N”被调用 3 次得到 “N→Adj [Adj [Adj N]]”,对应 big black wooden balls。递归计算终止时得到的是递归序列,所以递归序列是有界的或者说是有级别的,比如 the cat meows 是一级递归序列,monkeys can eat the banana 等较长一级递归序列涉及的合并 次数较多,涉及 “D→D N”“V→D V”“I→I V”等递归规则的连续结合,但没有哪个递归 规则被两次或多次调用,故仍是一级递归序列,而上文中的 (5) —(7) 以及 (9) —(10) 是二级递归序列,是一个递归规则被连续调用两次的结果。总之,Chomsky 认为唯递归假说 中的递归就是合并。这样一来,关于唯递归假说的争议就转变成关于黑猩猩等动物能否学会 合并的争议 (Lowenthal 2014) 。
3. 3 另一简单的递归界定: 递归=合并+标注
与上文中 Chomsky 的合并观点有所不同,有研究者 (Fukui 2017; Boeckx 2008) 认为合并是 无序的,生成对称性序列。合并后必须再通过标注操作才能得到嵌套结构,生成非对称性序 列,所以合并和标注两个句法计算操作一起才是人类自然语言的基本属性。他们还认为, “合并+标注”操作所形成的嵌套同样可以解释人类自然语言的向心性,也就是说,“合并+ 标注”可以和 Chomsky 的合并达到同样的效果。Fukui (2017) 还认为,分析人类自然语言 中短语结构的性质时要考虑 3 个要素,即合并、嵌套 ( 嵌套即 “合并+标注”) 和迭代,涉 及 (14) 中的 4 种交叉情况。(14a) 中的非迭代性、非嵌套性合并是指两个相同句法范畴 成分 A 和 B 的并列,比如 “( 我喜欢) 唱歌、跳舞”; 而 (14b) 中的迭代性、非嵌套性合 并是指 3 个及以上相同句法范畴成分 A、B 和 C 的并列,比如 “( 我喜欢) 唱歌、跳舞、打 球”; (14c) 中的非迭代性嵌套是指两个相同或不同的句法范畴成分之间的嵌套,所生成的 序列比如 “[喜欢[苹果]]”“[[大学]老师]”; 而 (14d) 中的迭代性嵌套是指 3 个及以上 相同或不同句法范畴成分之间的嵌套,所生成的序列比如 “[我[喜欢[苹果]]]”“[[[大 学]老师]工资]”以及上文提到的 (5) —(7) 和 (9) —(10) 。Fukui 认为 (14d) 是合并、 嵌套和迭代 3 个要素都参与的结果,代表人类所有语言的共性,即唯递归假说中的递归。
(14) a. 非迭代性、非嵌套性合并 b. 迭代性、非嵌套性合并
c. 非迭代性嵌套 d. 迭代性嵌套 (Fukui 2017: 17)
4.争议三: 几级递归序列才是唯递归假说中的递归序列?
递归序列的 “级”是指在形成该序列时该递归规则调用自身的次数,调用一次就形成 一级递归序列,调用两次形成二级递归序列,等等,(5) —(7) 都是二级尾递归序列, (9) —(10) 都是二级内递归序列 (对比 Karlsson) 。有研究者比如 Fitch & Hauser (2004) 和 Freidin (2014: 144) 认为一级、二级及以上递归序列都是唯递归假说中的递归序列,都能体 现递归运算的存在。还有研究者 (Levinson 2014) 认为只有无限递归才是真正的递归。但绝大 多数研究者(Kinsella 2010; Roeper 2011; Pérez-Leroux et al.2012; Hollebrandse & Roeper 2014; 杨彩梅 2014; Pérez-Leroux et al. 2018; Terunuma & Nakato 2018; 施嘉伟,等 2019) 认为二级及以上递归序列 是真正的递归序列,因此至少要二级递归序列的习得才能真正反映儿童递归能力的获得,所 以他们的实验语料都是二级递归序列,其中,除了极个别研究者,比如杨彩梅 (2014) 的实验语料主要是类似 (9) —(10) 的二级内递归序列外,其他的实验语料都是类似 (5) —(7) 的二级尾递归序列。以上研究者之所以主要关注二级递归序列,并认为至少二级递归序列才 能体现递归运算的存在,是因为他们发现递归习得有两个明显不同的发展阶段,即二级递归 序列的习得要明显晚于一级递归序列的习得: 总体说来,儿童约 3 岁时能习得一级尾递归序 列,约 6 岁时才能习得二级尾递归序列 (Matthei 1982; Pérez-Leroux et al. 2012; Hollebrandse & Roeper 2014) ; 约 4 岁时习得一级内递归序列,约 8 岁时才习得二级内递归序列 (杨彩梅 2014) ; 此外,Fukui (2017) 还发现失语症者能理解和产出一级尾递归结构如 “哥哥的衣 服”,但不能产出和理解二级尾递归序列如 “哥哥的朋友的衣服”。一语习得研究所得出的 不同级别和类型递归序列的习得时间有所不同这一结论 (Yang et al. 2022) 与 Fukui (2017) 、Friederici (2014) 和 Friederici et al. (2017) 等神经语言学实验研究的发现在很大程度上一致。Fukui (2017) 对 7 类日语句型结构进行了成人 fMRI 脑成像实验研究 ( 如图 3 所示,这 7 类 句型具有不同合并度<Degree of Merger>、不同探查<search>次数和不同探查距离,这些概念 可以转化为不同类型和级别的递归序列) 。
图3. 7 类句子的合并度 ( 上方数字) 、探查次数 ( 下画线数字) 和探查距离 ( 连线曲折 度表示距离长短①) ( Fukui 2017: 254、183)
5. 结论
唯递归假说中 “递归”的界定即使在生成语法领域内部也存在较大争议,主要涉及递归的类型之争、递归与其他概念的区别之争、递归的层级之争等 3 个方面。这些争议随着研究的深入越来越明晰,并有望达到最终统一,比如越来越多的人认为,儿童对不同级别递归 序列和不同类型递归序列的习得时间有所不同,这表明,唯递归假说中 “递归”是个抽象的概念,是人脑的属性,但不同类型和级别递归序列的发展与人脑的神经发育成熟息息相 关,递归能力的完整获得很可能是一个逐步发展、最后成熟的过程。此外,文献中反复使用 却又纠缠不清的一些术语比如 “递归”“合并” “嵌套” “标注” “迭代/重复” “并列”等 的关系也越来越明确。
作者简介
个人简介:杨彩梅,女,1972年生,湖南湘潭人,博士,教授,博士生导师,苏州大学东吴学者,江苏省高校“青蓝工程”中青年学术带头人。研究方向为生成语法、一语习得和语言障碍研究。1995年在湖南师范大学获学士学位,2001年在湖南大学获硕士学位,2009年在北京外国语大学获博士学位,2010年-2014年在中国社科院语言所从事博士后研究工作。主持国家社科项目2项和省部级社科项目4项,独著学术专著3部,参编教材1部,2015年12月获教育部第七届高等学校科学研究优秀成果奖(人文社会科学),在SSCI,SCI收录期刊及其他国内外著名期刊上发表数十篇文章。联系方式:caimei87@126.com。
个人简介:董昕,(1995-) ,女,河南安阳人, 博士研究生,研究方向为句法学和语言习得,E-mail: 20204004007@ stu. suda. edu. cn。
本文来源:《解放军外国语学院学报》
点击文末“阅读原文”可跳转下载课程推荐
2022-07-07
2022-07-07
2022-07-07
2022-07-06
2022-07-06
2022-07-05
2022-07-05
2022-07-04
2022-07-03
2022-07-03
2022-07-03
“语言学心得交流分享群”“语言学考博/考研/保研交流群”
今日小编:薛定谔牌学习机
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd
点击“阅读原文”可跳转下载