其他
语料库搭配研究学术演变论要
0.引言
搭配不仅是英语学习中的一个重要概念,还是语料库研究的基本分析单位。对语言中搭配现象的关注最早可追溯到公元前 300 年的古希腊斯多葛学派(Robins 1967:21),他们拒绝“一词一义”这种机械对应,通过深入研究语言的语义结构,意识到词语意义并不孤立存在,依其所使用的搭配而不同。根据Barnbrook,Mason & Krishnamurthy 的考据,“collocation”一词不晚于 16 世纪从拉丁语借入到英语;1735 年至 1737 年,伦敦书商亚历山大·克鲁登在对钦定本《圣经》做逐字索引时,注意到了词语同现问题,并在词条中添加了两词搭配(2013: 3)。根据可检索到的文献,早在 19世纪后半叶,词语搭配就已进入英语语法学者的视野。伦敦学派的创始人 John Rupert Firth 通过研究词语搭配现象,提出语言分析可设立结构和系统两大内部关系,而通过搭配研究意义至关重要,词语通过同现的搭配词(语境)实现意义选择(Firth 1957a, 1968; Sinclair, Jones & Daley 2004)。尽管 Firth 的观点和理论在后来的研究中引起诸多讨论和分歧,但其语境意义理论开创了搭配研究这一新的领域。由于涉及搭配研究的领域非常多元广阔(参见 Pawley 2007),限于篇幅,本文主要聚焦并梳理与语料库搭配研究相关的学术思想源流及发展脉络,讨论搭配的概念化及演变,并评价其对语料库研究的意义和贡献。
1. 前语料库搭配研究:词语组合表达思想
这里所谓的“前语料库”是指 20 世纪 60 年代初现代电子语料库出现以前的研究。使用该术语只是为了叙述的方便,并不意味着语料库方法及其理念横空出世,是一种全新的研究范式。实际上,基于语言使用实例开展实证研究的思想,以及通过搜集大规模语言实际材料观察语言事实的方法,在电子语料库出现之前很早就已出现。很多学术思想、研究方法及技巧都表现为连续演变或革新的一种过程,既表现为共时维度上不断拓展和融合的应用,又表现为历时维度上的传承和积淀。梳理和反思搭配研究在以上两个维度上的演变和发展,能使我们更清楚地理解所面临的困难,并把握其未来的方向。 在前语料库的语法著述中,较早关注搭配问题的是丹麦英语语法学家 Otto Jespersen。Sinclair 说他是 “圈椅”语法学家与语料库语法学家之间居中而立的 “最好代表”,为基于实际用法进行语法分析树立了标准(2001: 342),其煌煌语法体系中每一条论断都有相应的语言实例。我们这里主要聚焦 Jespersen 在其著作中对搭配的研究和分析。Jespersen 对搭配最早的关注见于其 1894 年的著作;接着 Jespersen 观察到语言中不同的词语在组合中具有各自的含义(1904: 54);他还注意到在许多词语组合中,一个词的意义象“气味”一样弥漫整个语境(ibid.: 67),这一论断与后来的语料库搭配分析中语义韵分析思想颇有相通之处。此外,他还论述了词语组合对词汇学习的作用,认为背诵有助于单词及组合的记忆(ibid.: 88)。更值得一提的是,Jespersen 指出,如果把词语从其使用的环境中抽离出来,其功能就会萎缩;“孤立的词汇不足以表达思想,只是词语的鬼魂或尸体,只有词语组合才能表达思想”(ibid.: 114)。这一论断与后来 Sinclair的“词汇语法”(Lexical Grammar)及意义单位思想当可互相印证。Jespersen 进而观察到搭配对具体词语的选择和偏好,“有时真正的差异在于,某些搭配偏好某个词,而另外一些搭配偏好另一个词”(1905:136);一些词经常同现,构成搭配,表达相同的语法功能,如“few/little”在“little or no, few or no”中与“no”搭配,表达否定功能(1917: 39);搭配对词语意义具有区分作用,如“a post in the Post Office”中的“post”;此外, Jespersen 还区分了“自由表达”与“固定表达”(1922: 320)。搭配具有交际功能和心理学解释,与单一的肯定表达相比,双重否定搭配“not uncommon, not without some fear, not unknown”等相互抵消否定,构成语气弱化的较长表达,既减弱听话人的心力,又显示说话人的某种犹豫(1924: 332)。Jespersen 再次讨论外语教学中所谓的常用词汇,不能局限于从所搜集的文本中统计出来的高频词汇,而应该充分考虑词语之间的关系、它们在搭配中的使用,以及这些词语及习语的文体学价值(2010: 470);在之后的著作中,Jespersen 都不同程度论及搭配,分别讨论到搭配中名词的语法作用(2006),以及英语中充斥着各种“无形式”的搭配,而这些搭配不能被进一步分析(1937:116)。最后,Jespersen(1904-1949)在他的七卷本巨著 A Modern English Grammar 中有多处讨论到搭配现象,包括搭配对词语发音的影响、搭配中非人称代词的拟人化、搭配对名词复数的影响、搭配与复合词、句法中的搭配结构、搭配的修辞效果等。值得注意的是,Jespersen 使用到一些灵活的术语讨论不同种类的搭配,如频发搭配(frequent collocation)、确立的搭配(established collocation) 和固定搭配(fixed collocation),但他对这些术语似乎并没有分别界定。 总结 Jespersen 的搭配研究,可得出以下几个重要特征:(1)Jespersen 的观察视野并不仅仅限于两个词语的搭配,他所谓的搭配更多可以解释为在一个序列或句子中“同现”或“共存”的词语或语法特征;在他的分析中,我们既可以看到连续的词语序列,也可以看到非连续的词语同现。(2)Jespersen 往往从语法范畴和意义功能入手,如词类、名词的数、动词的体等观察词语搭配的内部关系。(3)Jespersen 分析了搭配或词语组合对词语意义的选择和区分,或单个词语在整个搭配中的影响,强调完整的思想表达只在词语组合层存在,否定孤立观察词语意义的做法,这些思想与当前的搭配研究思想有相通之处,对之后的Hornby(1935),Firth(1957a, 1968)以及 Sinclair(1991, 2000, 2004a; Sinclair et al. 2004) 应该产生了直接或间接的影响。然而,Jespersen 对搭配的研究和论述只是散见于他的著作中,并没有把它当作一个独立的或专门的范畴来对待。此外,Jespersen 对搭配的兴趣主要来自他对词语的语法范畴或功能的兴趣。虽然其相关论断吉光片羽,但其思考的方向及分析的方法与当代语料库搭配研究多有吻合。2. Firth 理论:由搭配而知词义 Firth 把搭配界定为具有惯常词伴的实际词语,并把搭配视作自己语境意义分析理论的重要入手点(Firth 1968: 182)。他认为,“一个词语的完整意义总是语境性的,任何离开语境的意义研究都不值得认真对待”(Firth 1935: 37)。Firth 本人并不是“搭配”这个术语的首创者,这是不言自明的。Cowie(1998: 3-8)和Pawley(2007)都提到从 20 世纪 40 年代起,在东欧尤其是前苏联的语言学及词典学研究中,短语学曾经占据重要地位,Vinogradov,Amosova 和 Mel’ˇcuk 三位学者区分了三类不同的短语单位,即纯习语、比喻性习语与限制性搭配,其中纯习语的意义不能由其构成词语的字面意义推知,比喻性习语的意义则是其字面意义的比喻性延伸,而限制性搭配中词语意义受其同现词或短语意义的制约;他们还在功能和结构上划分出“类词表达”和“类句表达”(转引自 Pawley 2007: 10)。Firth 的意义理论重点是“由其伴知其词”,“由搭配而知意义”(meaning by collocation)以及“情景语境决定意义”(Firth 1968)。但 Firth 使用“collocation”这个现成的术语时,没有明确说明其文献来源(或者是受了谁的影响)。根据相关文献推论,Firth 有关搭配的学说,应该受到 Jespersen 和 Palmer 的影响。按照Plug(2008: 342)的叙述,Firth 在 1919-1922 年间在印度旁遮普大学任英语教授时,其讲义笔记中包含有关搭配型式(pattern)的概述,并包含 Sweet,Palmer 和Saussure 的参考文献。Firth 应该熟读过 Jespersen 的著作,并访问过 Jespersen 本人,因为在 1922 年他是受后者推荐才到伦敦大学访学的(ibid.)。 Firth 更愿意把自己纳入到英国的经验主义传统之中,在语言思想上受到 Wittgenstein 和人类学家Malinowski 的影响。他赞同并引用 Wittgenstein 的观点,如“意义存在于使用中”,以及“不能去猜测词语的功能如何,而应该观察它如何使用,并从中获得结论”(转引自 Firth 1957b: 96)。此外,Malinowski(1935:217-342)在研究太平洋特罗布里恩岛(Trobriand)土著的咒语时,发现其由各种固定语式所组成,这些语式重复出现,其词语及节奏固定,其意义难以被字面翻译,具有语用功能。此外,Malinowski 对 Saussure 语言的二元论的反对态度,坚持把语言文本作为研究的焦点,以及认为情景语境,尤其是文化语境对语言的使用意义具有决定作用的一系列观点,都深刻影响了 Firth(Firth 1957b: 96-100)。在 Firth 的学说中,语言学最重要的目标是研究意义,而情景语境至关重要。Firth 承认自己的情景语境概念来自 Malinowski,而后者借用了 Wegener 的术语(ibid.: 102);Firth 强调自己在描写语言学中所应用的情景语境更抽象,是意义分析的层级之一。Firth 引述 Wegner 的情景概念包括:(1)所呈现的、可观察的客观情景;(2)具有直接响了 Firth(Firth 1957b: 96-100)。在 Firth 的学说中,语言学最重要的目标是研究意义,而情景语境至关重要。Firth 承认自己的情景语境概念来自 Malinowski,而后者借用了 Wegener 的术语(ibid.: 102);Firth 强调自己在描写语言学中所应用的情景语境更抽象,是意义分析的层级之一。Firth 引述 Wegner 的情景概念包括:(1)所呈现的、可观察的客观情景;(2)具有直接联系的记忆因素;(3)个人心态,包括个人意识与参与者的个人身份(ibid.)。但 Firth 只承认第一种情景是有效的,包括个人、物体、非言语事件及语言,认为这些因素构成了重要的关系,成为一套整体功能,但指出记忆以及个人心态是无法直接观察的。Firth 赞同Malinowski 的观点,即“把语言看成是一种与心理过程平行运行,或者准确响应心理过程的过程,以及认为语言的功能就是以一种次要的语言等值词流动的方式,反映或复制人们的心理现实,是再危险不过的了”(转引自 ibid.: 115)。 但 Firth 对 Malinowski 的思想并非全盘接受。他不赞同 Malinowski 把情景语境看成是一种“行为矩阵”,而语言在其中发生意义(Firth 1968: 176)。Firth否认存在一种“赤裸裸”的事实,独立并先于任何对事实的论断,认为情景语境是一种概要构念(schematic construct),应用于社会过程中的各种典型的“重复事件”(ibid.),其中的各种元素,包括文本,不过是对经验的抽象,而绝不是对情景的嵌入 (Firth 1957b: 111)。因此,文本是语境的有机组成部分,观察文本要与语境中其他有关部分联系起来。Firth 把语言事件看成是一个整体,意义分析可以在不同层级(levels)进行,而每一层级又可以从结构(structure)和系统(systems)两种视角去观察意义。结构是层级性的,由各种元素组成,即从具体词语或文本形式抽象出来的语法范畴,由上至下依次为情景语境、词语搭配句法、音系学、语音学,每一上阶层级构成下阶层级的语境;系统是界定各种“术语”或“单位”的聚合关系集,而这些关系通过结构的组合关系选择或实现获得意义。“搭配即惯常作伴的实际词语。一个惯常搭配中的词语以其本来面目盯着你的脸”(Firth 1968: 182)。不能把搭配看作简单的词语并置,而是一种词语间相互期望、相互捕捉的次序(ibid.: 180-200)。因此,在Firth 的搭配概念中,词语的意义,不论是语义的,还是语法的或音系的,都在搭配中得到选择和实现。这些概念与后来 Sinclair 注重确立意义单位的搭配研究有很大的不同(李文中 2016)。尽管 Firth 对意义研究提出了一套复杂的体系,但对搭配分析真正提出实际思路的则是 Halliday 和Sinclair,如节点词的确定、搭配词的跨距及频数分布,以及概率在搭配分析中的作用等 (Halliday 1966: 158-159)。Halliday & Hasan 把搭配看成是一种衔接手段,是“一个涵括性术语,用来指由于词项同现而产生的衔接,而这些同现的词项由于经常出现在相似的环境,彼此以各种方式联系在一起”(1976:287)。节点词与其他搭配词的联接方式,以及该联接所产生的意义联想,反映了文本(作者)独特的知识、意义或立场。 综上所述,前语料库的搭配研究反映了语言学家及语法学家从不同视角对词语搭配现象的关注,并提出了一系列富有前瞻性的思想、观点、术语和分析方法。值得一提的是,早期的搭配研究尽管视角和目的各有不同,但都共享一个最基本的关注,即搭配与英语学习及其教学应用价值,显示出搭配研究极强的应用取向,而这种取向一直影响至今。但早期的搭配研究只是散见于各种著作的叙述和论断之中,在整体语言学理论体系中并不占中心地位。此外,对搭配的操作定义、测量以及分析程序也缺乏成体系的论述。3. 语料库搭配初始研究:意义存在于词语组合 语料库搭配研究在这里主要指以 Sinclair 为代表的语料库驱动搭配研究,搭配或短语序列逐步替代单个词语研究,并逐步形成意义单位理论。如果以 20 世纪 60 年代初电子语料库出现为初始点,之后的搭配研究在语言意义研究中逐渐获得中心地位,同时在分析方法、过程和结果解释各环节形成一套严谨的路径。 Sinclair 把搭配界定为“文本中两个或两个以上词语在彼此较短距离内的同现。测量邻近度通常以四个词语为最大间隔”(1991: 170)。在搭配研究中, Sinclair 沿用了 Firth 所界定的“搭配”和“类联接”,界定了搭配分析中的一系列术语, 如“节点词”和“跨距”等,并测定了搭配分析的最优跨距。Sinclair(2000)发现,词语搭配或短语序列是意义分析的基本单位,短语学研究获得语言研究的中心地位;而不依赖词语组合具有独立意义的单个词语是一种边缘性现象。Sinclair 提出,在横向组合序列上选择什么词有两种制约因素,但完全的自由选择及完全的确定性选择都是不常见的。这是两种互相对立或竞争的组织原则,但二者之间产生丰富的连续统(2004a: 29)。Sinclair 把语言的这两个组织原则分别命名为“开放选择原则”和“习语原则”,把趋向开放选择的称之为术语倾向,即单个词语具有固定性的概念指称并独立表达意义;把倾向于习语的称之为短语倾向,即词语倾向于共同出现,并通过组合创造意义(ibid.)。但Sinclair 很快就发现,搭配的价值不仅仅在于选择某一单个词语的词义(Firth 1957a),而在于搭配中的词语共同创造意义。此外,仅靠观察搭配分析意义的视野太过局促,词语搭配本身尚不足以成为一个完整的意义单位。如欲观察到完整的意义单位,须扩展观察视野,在更远的跨距中寻找,即扩展意义单位(Extended Unit of Meaning)。4. 从搭配研究到扩展意义单位 可以说,扩展意义单位研究是语料库搭配研究的进一步深入,是受语料库驱动和文本导引的拓展分析。Sinclair(2004a)发现,扩展意义单位中五种范畴呈现共选关系:(1)节点词(或搭配核)与搭配词构成的词语同现,表现为纯粹的词语搭配,跨越语法边界,在位置上可分为邻近性的和非邻近性的;(2)语法范畴共选,即类联接;(3)搭配与语法范畴共选;(4)语义共选,即某一搭配-类联接型式与一组语义相似的词语共选;(5)词项型式与某一态度表达共选,即延展在整个意义单位的态度倾向——语义韵。这些范畴并非彼此截然分开,而是彼此适配,最终表达为一个完整的意义单位。支配这种适配关系的则是上述具有竞争关系的两大组织原则。由此,在 Sinclair 的共选连续统中,一端是完全受习语原则支配的确定性习语,表现在句法上是“冻僵”的,在语义上是不透明的,在词语选择上是高度限制的;在另一端是受开放选择原则支配的自由组合,表现为语义完全透明、词语选择自由以及句法结构良好。在两端之间存在大量倾向不一的词语搭配,表现为语义具有不同透明度、词语选择受到有限约束以及组合关系紧密等特征。 Sinclair(2004b: 281-288)对意义分析提出了九大假设,包括(1)对词项(意义单位)的描述须最大化(Maximal Approach,最大路径),而不是最小;(2)可以把语言中每一独特的意义与对应的词语型式关联起来,方法是结合最大词项与词频,提出该词项的典范形式(canonical form);(3)词语意义在两个层面上创造出来,即词项的一般意义,以及由于词项内部单个词语选择对意义的调节;(4)意义不是划分为词语意义及语法意义,而是某一语言片段的整体创造;(5)传统的句法结构范畴并不可靠地关联意义;(6)对意义敏感的术语具有不稳定性,因为意义通常是暂时的、可协商的;(7)词语偏好可由一些“超集”所表达,组成“超集”的各个词语集包含词语结构某一位置上出现的所有词语;(8)对语言创造意义方式的描述只有能解释所有复现型式时,才能被视作是充分的;(9)人们理解文本的途径是,把文本中的措辞与个人经验中储存的各种复现意义型式联系起来,并解读那些与经验相异的东西。 最大路径是 Sinclair 对词项的描述和分析提出的一个重要原则,其目的是在分析中尽可能拓展维度,捕获词项的使用型式,以保证该词项意义的完整性和单义性。Sinclair(2004b: 280)认为,传统的词语研究试图把意义与最小语言片段,即单个词语联系起来,这种方法叫最小方法。而最大方法则是尽可能包括一个节点词触发的结构型式,拓展意义单位的维度,直到歧义消失。他区分了“歧义”(ambiguity)和“变异”(variation)两个概念,前者是指单个词语具有多种可能的意义,而变异则是指多个词项系列表达同一个意义(其变异性体现在选择多个词语对意义进行微调)。最小方法聚焦最小语言片段,力图把变异性控制在最小,但同时也最大程度保留了歧义性;而最大方法则聚焦最大语言片段,放开变异性,把歧义减至最少。近年来,针对搭配的非邻近性和位置分布,有学者结合 N 元词统计及搭配分析理念,提出跳转词列(skipgram)和同现词列(concgram)的提取方法,以呈现搭配序列中的顺序变化和位置变异(Cheng, Greave & Warren 2006;梁茂成,李文中,许家金 2006);也有学者试图把意义单位理论与构式语法及认知语法结合起来,提出搭配构式(collostruction)这一概念,以搭配结构为观测节点,转而观察和分析与该结构共选的搭配词 (称为搭配词位)(Stefanowitsch & Gries 2003: 14),并提出新的统计方法,以呈现搭配共选关系的不对称性(Gries 2013)。 Sinclair 的搭配研究思想具有极强的开拓意义和发现价值。他在扩展意义单位分析中一系列的发现,充分验证了他所提出的“意义-结构一体化”思想,确立了以词项为基本意义单位的研究理念(李文中 2016: 43)。对于实际的搭配分析,Sinclair 根据自己的研究经验提出了警示:(1)搭配与概率统计。他认为“,在意义研究中,通常需要超越对复现的解释,因为语言意义与概率或统计显著性毫无关系”(Sinclair 2001: 344);词语同现的复现频率可作为搭配分析的初始条件,却不能成为搭配的核心特征。(2)信任文本。搭配分析最终要回到文本中,扩展意义单位分析是以节点词为中心向左右次第进行的,整个过程是一个基于文本的判断和决策过程。所以,Sinclair(2004a: 23)在他的著作中反复提倡的原则是,“我们要信任文本。我们要对文本可能告诉我们的东西持开放的态度”,“……我的恳求是信任文本”。(3)不能把词语和语法割裂开来,二者相互渗透,相互联结,相互依存,以至于不能独立分开。“如果在开始的时候分离了语法与词语,他们就再也不能把它们组合在一起了”(Sinclair 2004b: 279)“;强行把词语与句法分开,产生了一堆所谓的‘习语‘’短语‘’搭配’等术语垃圾。……如果越来越多的证据表明,语言描述中大部分都具有这种混合的性质,那么就有必要对原有的分隔(词语和语法)进行质疑。现有的证据已足以让我们严重怀疑这一思想,即把词语和语法分成两个领域”(Sinclair 1991: 104)。(4)意义研究并不排斥直觉“,直觉反应非常重要,哪怕它们不一定有证据支持”(Sinclair 2004b: 279)。Sinclair 的搭配研究思想是一种开放的发现程序,而不是直接告诉我们现成的结论;他所提出的一系列假设和理论需要更多的语料库证据去验证、丰富甚至修改。5. 结论 纵观语料库搭配研究,其演变可大致分为三个主要阶段:前语料库研究开始关注到词语组合现象对思想表达的重要意义,并以 Firth 把搭配引入语言学理论为重要标志;语料库搭配研究的初始阶段聚焦词语的搭配,重点分析词语在使用中的共选关系,并试图分析意义单位;扩展意义单位分析是搭配研究的延伸和深入:以搭配为核心,扩展分析围绕该搭配形成的完整意义单位,直到分析蕴含在该意义单位中的态度倾向。在这一概念化演变过程中,语料库搭配研究超越了通过分析语境获得单个词义的狭隘视野,扩展到表达完整意义单位的词项序列:如果我们能够分析出文本中所有的意义单位,我们就能进一步分析意义单位之间的关系,从而分析整个语篇的意义。到了 21 世纪, Sinclair 把自己的扩展意义单位思想归拢为短语理论框架(李文中 2018),并与局部语法路径结合起来,为意义分析进一步明确了方向。 语料库研究中把搭配作为基本的分析单位,其价值在于通过搭配分析词语的共选关系,并在序列的共选关系中找到意义,而该意义之于所在的序列而言具有特异性和辨识度。这也是意义移变单位(meaning shift unit)的基本思想(Sinclair 2008)。搭配具有语境属性,高度依赖语言使用者所处的社会生活和文化,也就是说,词语搭配中往往蕴含了丰富的社会文化信息。 人们喜欢把一些观点相近或具有传承渊源的思想或理论划分在一起,似乎确定这些思想和理念都可归置在同一个范式或阵营中。通过文献梳理,我们发现,语料库搭配研究具有很强的理论个性和差异性,新的思想范式以不同的立场和视角出现,随着传播和影响的扩大,产生一种前景化的效应。Firth 虽然多受 Wittgenstein和 Malinowski 的启发,但只是从他们那里获得一种“英雄所见略同”的激励或某种思考的方向,他自己的理论与前者并无太多一致。Sinclair 之于 Firth 亦如是,他虽然受到 Firth 和 Halliday 等的影响,但极大地拓展了搭配研究的视野,并开创出自己的理论与原则。作者简介:
(识别阅读原文)
语科教师群
邀您入同学群
欢迎留言并分享至朋友圈