学术观点|卫乃兴、陆军：基于语料库的二语学习研究述评:范式变化与挑战

七万学者关注了→ 语言学通讯 2021-03-17

点击蓝字关注我们

基于语料库的二语学习研究述评:范式变化与挑战

卫乃兴陆军

北京航空航天大学扬州大学

摘要：本文评述基于语料库的中介语对比分析模型 (CIA) 、元话语分析模型和基于用法的研究路径在语言学思想、分析方法、技术手段和主要贡献等方面的特征, 评析各研究范式的优越性、揭示所存在的问题, 并通过相互比较、相互借鉴来探讨相关问题的解决思路, 以期对二语学习研究的繁荣发展提供启示。

关键词：CIA分析; 元话语分析; 基于用法的构式研究; 基本原理; 变化与挑战;

作者简介：卫乃兴, 北京航空航天大学教授, 博士, 博士生导师, 研究方向:应用语言学。; 陆军, 扬州大学教授, 博士, 硕士生导师, 研究方向:语料库语言学、二语习得。

基金项目：国家社科基金项目“基于大型可比语料库的中国学术人员英语现状研究” (项目编号:13BYY074) 和“语料库驱动的二语隐性、显性知识调查与实验研究” (项目编号:15BYY067) 的阶段性研究成果;

1.引言

二语学习研究 (SLL, Second Language Learning) 大多基于语言数据开展, 语言数据按来源主要可分为诱导数据、内省数据和学习者的语言使用数据等类型。随着大规模二语语料库的开发, 研究者开始利用大量学习者语料库数据开展中介语对比分析研究 (contrastive interlanguage analysis, CIA, Granger 1998a) 。与此同时, 基于语料库的元话语分析和基于用法的二语研究也取得长足进展。下文从语言学思想、分析方法、技术手段和主要贡献等方面评述上述研究模型, 旨在评析各模型的优越性, 同时揭示所存在的问题, 通过相互比较和借鉴来探讨相关问题的解决思路。

2. 中介语对比分析模型

2.1 CIA的基本原理

首先, CIA基于语言的概率属性, 揭示典型二语特征。词语、词语组合、语法结构、语义特征和语用功能等语言现象都具有概率属性。有的在各类文本中高频出现, 而有的仅仅在特定的语体或语篇中出现 (Halliday1993;Sinclair 1991) 。学习者语言也不例外。概率属性决定了典型语言现象和可能语言现象 (Gilquin&Gries2009) 之别。在这一点上, 受制于人的语言直觉的局限等因素, 传统的诱导数据和内省数据难以反映语言现象的典型性。与之相比, 语料库是语言使用的样本, 能够很好地代表和反映真实语言使用的概率属性和分布特征, 而语料库数据处理技术则能够帮助揭示典型语言现象和典型使用特征。因此, 与传统的对比分析相比, CIA能够聚焦于典型语言现象, 既可以通过学习者语言与目标本族语对比, 也可以进行不同学习者群体的语言之间的对比;与传统的偏误分析相比, CIA不仅可以分析学习者语言形式或功能上的错误, 还可以揭示学习者语言现象的总体倾向, 是揭示典型二语特征的有效途径。

其次, CIA分析采用对比分析方法描述和解释学习者语言特征。所谓中介语对比分析, 顾名思义, 主要围绕学习者语言开展一系列的对比研究, 主要包括:1) 二语学习者语言与本族语之间的比较。这是最为基础、也是最为经典的对比分析活动。通过对比, 主要揭示中介语与目标语之间的异同, 较为直观地反映二语使用倾向;2) 二语学习者语言与本族语学习者之间的对比。与本族语语料库相比, 学习者语料库在库容上往往较为接近, 再加上语料都来自“学习者”, 且交际目的、任务、文类甚至题材都较为接近或相似而更具可比性, 这使得该类对比分析比第一类更具价值。不过, 二者都能反映多用、少用或误用等二语使用特征, 但侧重点有所不同:前者侧重于反映二语学习者语言与目标语之间的差距, 后者更侧重于反映二语学习者在特定学习阶段所面临的问题;3) 不同母语背景下的二语学习者语言之间的对比。这种对比分析有助于揭示不同母语背景的二语学习的共性特征;4) 同一母语背景、不同二语水平的学习者之间的对比, 有助于反映二语能力的发展特征;5) 学习者语言与母语之间的对比, 主要用于揭示母语迁移等影响因素。

上述各类对比分析可以单独使用, 也可以结合起来使用。其中, 第一和第二类经常单独使用, 也是早期的CIA研究所采用的主要对比向纬 (如Granger 1998a;Howarth 1998等) 。相比之下, 第三、第四和第五类常常与其他类型的对比结合使用 (如Paquot 2013等) 。Tono (2004) 的“多重比较模型” (multiple comparison model) 强调在同一研究中开展多种比较的价值:有助于确定学习者语言的具体特征及其影响因素。Xiao, Mc Enery&Qian (2006) 的“中介语对比分析修订模型”进一步拓展了CIA的内涵及其理论意义:通过多种比较相结合来诊断和预测学习者语言特征。由于词语搭配在近世语言学研究中的重要地位及其价值 (Hoey 2005;Sinclair1991, 1996) , 因而也是CIA研究的重点对象 (De Cock et al.1998;Foster 2001;Granger 1998a;Nesselhaulf 2003;Wiktorsson 2003;卫乃兴2006) 。研究发现, 二语搭配不仅在数量上与目标语差异明显, 同时还表现出其特有的语义趋向特征和语义韵特征 (陆军、卫乃兴2014) 。鉴于此, 陆军、卫乃兴 (2014) 提出“基于扩展意义单位的多重比较模型”, 强调同时在学习者语言、目标语和学习者母语之间进行词语搭配、类联接、语义趋向和语义韵等范畴的多重对比研究, 以期较为全面地揭示二语特征。

2.2 CIA的分析技术

学习者语料库是CIA的核心资源。中介语对比分析围绕学习者语料开展, 学习者语料库的建设与开发是前提条件。自从Granger (1998b) 建立了第一个英语学习者语料库 (ICLE, International Corpus of Learner English) 以来, 国内外的研究者先后建立了不同类型的学习者语料库。

图1.学习者语料库类型

如图1所示, 按照语体可划分为口语语料库 (如“中国学习者英语口语语料库”, 杨惠中、卫乃兴2005) 和书面语语料库 (如“中国学习者英语语料库”, 桂诗春、杨惠中2003) 。文秋芳、王立非、梁茂成 (2005) 开发的“中国学生英语口笔语语料库”中既包含了书面语又包括了口语语料。按照语料的加工状态可以分为标注语料库 (tagged corpus) 和非标注语料库 (untagged corpus) 。标注可进一步分为语法标注、错误标注和语音标注等类型。研究者可根据具体需要选用, 也可以去除相关标注。语料库标注有助于自动检索和统计分析, 为观察特定语言范畴提供方便。不过, 标注过程本身带有很强的主观性, 在一定程度上折扣了语料库数据的客观性。为此, Sinclair (1991) 提倡“干净文本原则” (clean text policy) , 即尽可能基于未作人工处理的语言数据开展研究, 以减少主观因素的干扰。

CIA的分析技术包括“过少使用”、“过多使用”和“误用”。SLL研究的常用分析方法包括定量分析和定性分析。CIA分析的优势在于其集定量和定性分析于一体。其中, 定量分析手段包括“过多使用”和“过少使用”;而定性分析以“误用”为基本分析手段。过少使用是指, 与本族语者相比, 二语学习者倾向于少用某些语言形式、意义或功能。例如, Howarth (1998) 发现, 与英语本族语者相比, EFL英语学习者很少使用限制性搭配 (restricted collocations) 。过少使用往往预设着某些特别的因素, 如缺少目标语搭配知识等, 但由于语料缺乏而难以深入分析。与之相对, 过多使用则意味着二语学习者过于频繁使用某些语言形式、意义或功能。例如, De Cock et al. (1998) 发现, 学习者话语中有过多使用某些程式语表达 (formulaic expressions) 的倾向。这些倾向预设着可能存在某些语言现象的误用。过多使用能够提供非常丰富的例证, 有助于进一步开展误用分析、揭示影响二语特征的潜在因素 (如母语迁移等) (如桂诗春、杨惠中2003;杨惠中、桂诗春、杨达复2005) 。

2.3 评价

首先, CIA通过大量真实语言使用数据提供了更为客观的实证发现, 大幅度提高研究信度和效度。传统的二语学习研究主要通过观察或比较诱导数据或内省数据, 或少量语言使用数据。这些数据的规模小, 制约了研究的深度和广度, 同时也易受学习者和研究者的主观因素影响, 影响了研究的信度和效度。CIA实现了数据规模与质量上的突破, 无论是在研究的广度和深度, 还是在信度和效度上都有大幅度提高。一方面, 客观的大批量数据有助于克服研究者和学习者个体的语言直觉的影响。另一方面, 语料库技术概括大量典型语言现象, 直指学习者语言之核心特征;多重语料库证据能更为全面、深入地反映二语特征。

第二, CIA研究的结果可直接应用于教学实践, 对促进二语教学具有很大潜势。二语学习研究的主要目的之一乃是为改进二语教学提供新的思路。传统研究路径的优势在于理论富有 (theory-rich) , 研究结论抽象度高, 但与教学实践并不具有特别紧密的关系。研究成果要转化为教学行为仍需要大量的中间过程进行调节和操控。相比之下, CIA的结论来自于真实语言使用数据, 具有很好的演绎性, 可直接应用于词典编撰、教材开发、语言测试、在线学习训练和课堂实践, 能为推动二语教学改革注入直接动力。

不过, CIA也有其自身弱点。作为一个新的研究路径, CIA也面临着各种挑战。在理论层面, CIA未能很好地与主流二语习得理论对接。经典的SLA研究主要是假设驱动的。各式各样的假设在各个历史阶段应运而生, 如情感过滤假说、输入假说、监控假说、自然顺序假说 (如Baily, Madden&Krashen 1974等) 。每一个假说背后都有一个重要的理论模型或哲学命题支撑, 指向一个或数个具有普遍意义的理论或实践问题。然而, CIA虽强于数据但弱于理论 (theory-light) 。也就是说, 尽管由大批量数据得来的型式具有很强的描述能力, 但是二语习得领域的研究者对之难免质疑, “那又怎么样综合征” (So-what syndrome) 随之而生。在实践层面, CIA在分析对象和分析手段上尚存缺陷。由于语料库数据是语言使用的产物, CIA研究主要聚焦于语言使用产物的比较分析, 而对学习过程难以深度探索。此外, 多用、少用或误用等分析技术聚焦于中介语的负面特征, 很大程度上忽略了中介语的积极特征。

3. 元话语分析模型

3.1 元话语分析的概念界定

“元话语” (metadiscourse) 最早由Harris (1959) 提出, 指作者或言者引导受众理解语篇的手段。现今所谓元话语有广义和狭义之分 (Hyland&Tse 2004:157;del 2010:70) 。狭义的界定认为元话语是“关于话语的话语, 与主题的关联不大” (Williams 1981:211) 。换言之, 元话语主要实现篇章组织功能, 而不直接相关于思想、论辩和事实的表达, 如In the following, ..., As I have stated, ...等 (del 2006, 2010;Mauranen 2010) 。与之相比, 广义的界定认为元话语是显示作者—读者或言者—听者互动的语言资源, 故也称作“篇章互动元话语”、“互动元话语”或“人际元话语” (Hyland 2005a, b) , 主要突出作者/言者对篇章命题的立场、评价以及对读者/听者的态度。

元话语概念范围的变化孕育了不同的分析模型。传统的分析模型以语篇元话语为中心。Kopple (1985) 发展了传统的分析模型, 将之分为语篇元话语和人际元话语。Hyland (2004, 2005a) 根据元话语与语篇命题信息的差异、作者—读者互动关系和话语内部联系, 划分为交际元话语 (interactional metadiscourse) (主要用于组织语篇信息和引导读者) 和互动元话语 (interactive metadiscourse) (主要实现作者或言者介入、表达和传递作者或言者的态度和观点) , 构成基于语料库的元话语分析模型。国外元话语研究视角逐渐从修辞功能到语用认知, 研究范围从学术语篇向非学术语篇拓展 (郭红伟2017:34) 。

3.2 基于语料库的元话语分析特点与比较向纬

语料库数据使得元话语研究取得空前发展。以Hyland为代表的学术英语元话语分析俨然成为该领域的显学。相关研究呈现以下特点。首先, 主要关注学术语言特别是书面语的元话语特征 (如Hyland 2004;Hyland2010;Hyland&Tse 2004等) , 学术口语的元话语研究也相继开展 (如Lee&Subtirelu 2015;Thompson 2003;Zhang et al.2017等) ;其次, 所使用语料库的规模大都在百万词级, 一般在100-400万词之间, 很少使用更大规模的学术语料库;第三, 文本的语体主要为期刊论文, 特别是引语 (如Rubio 2011) 和摘要 (如Gillaerts&Van de Velde 2010) , 其次是博士、硕士学位论文 (如Kawase2015;Hyland 2010) 。

基于语料库的学术语篇元话语研究的分析向纬包括两大类型。一是学生文本与专业作者文本的对比。该类分析含有很多中介语对比分析 (CIA) 的要素, 往往以专业作者的文本为参照, 揭示学生文本中存在哪些多用、少用或误用元话语倾向, 为学术写作提供启示。例如, Lee&Deakin (2016) 通过对比分析不同水平的学生论文后发现, 高水平学习者和本族语学生比低水平学习者使用更多的模糊限制语;二是不同学科领域的文本对比, 对比分析向纬以跨学科、跨领域比较为主, 如软科学和硬科学的元话语对比分析。Samraj (2008) 发现, 哲学论文引语中的第一人称代词主要用于呈述观点, 而在生物学论文中则是为了显示作者的行为主体属性。这一类对比分析的目的一般不在于发现过多或过少使用, 也不存在误用这一说法, 而是倾向于揭示不同语体、不同学术领域的文本在元话语使用上的异同, 为学术写作评价和教学提供启示。

3.3 元话语分析的主要论断

基于语料库的元话语研究有其特有的发现和学术立场。首先, 传统的学术话语观主要强调文本功能 (如Williams 1981) , 而基于语料库的元话语研究则有大量新发现:如学术话语有较强的主观性、评价性和作者—读者互动性等功能。具体表现为作者使用元话语来组织文本、介入读者、传递态度。Hyland的模糊限制语模型 (1998) 、元话语模型 (2005a) 、立场与介入模型 (2005b) 均揭示了作者如何通过操控各种语言手段来表达立场、保护交际双方的权威、提供同行讨论余地、建设话语社团共同体;其次, 通过不同领域的学术文本比较发现, 学科文化决定了作者在学术表达中的自我定位方式以及对相关命题和读者的态度表达方式 (Hyland 2000;Becher&Trowler 2001) 。例如, Hyland (2010) 发现, 文科生论文中的元话语使用频数高于理工科学生论文;此外, 通过不同水平的学生文本比较发现, 学生作者能通过使用恰当的元话语来提高学术表达的专业性 (如Yang&Sun 2012) 。这既能为英语教学提供启示, 也从另一个侧面揭示了元话语研究的价值。

3.4 评价

基于语料库的元话语研究取得了重要理论成果, 同时也具有很大实践价值。一方面, 元话语的概念得到深入系统的发展, 相应的分类标准也不断系统化。传统的元话语研究主要关注语篇组织功能, 这些元话语类型少, 形式和意义比较明显, 可视为显性元话语 (explicit metadiscourse) 。基于语料库的调查揭示了大量隐性的元话语现象 (implicit metadiscourse) , 将学术语篇的人际功能作为关注的焦点, 确立了一个重要的研究方向。研究表明, 它们普遍分布在学术文本中, 实现作者对篇章命题的立场、评价以及对读者的态度等功能。这些元话语形式、意义和功能的探讨大大促进了学界对篇章元话语、交际元话语和互动元话语的认知和理解。

元话语研究的另一重要功绩在于, 它首次将二语写作, 尤其是二语学术写作推至应用语言学领域的核心话题之位置。过去多年间, 元话语模型下的二语写作探索如火如荼, 触及许多前所未及的多方面和深层次问题。就研究路径而言, 如果说Swales (1990) 提出的CARS模型为ESP和EAP提供了一个篇章研究范式、确立了专门用途英语在应用语言学中的重要地位, 那么元话语模型则提供了关于这类文本态度意义研究的分析模型, 将研究推向新的层次。两类模型, 各领风骚, 相得益彰。毋容置疑, 元话语研究是二语研究的重要范式之一。与CIA相比, 它从另一个视角和侧面探讨了二语学术写作的篇章信息推进、主观态度表达、乃至话语策略使用等重要问题, 丰富了我们对二语学术能力发展的认识。

不过, 元话语所包含对象的不断扩大使其有囊括一切之嫌。用Hyland (1998:648) 的话说, 这些语言现象看上去像是各种互不相干的语用符号的大杂烩。而根据Sinclair (1991, 2004, 2006) , 话语以线性方式推进和展开, 将一部分语言手段称之为“元话语”意味着它们高出其他语言手段一个层级, 是所谓层级关系, 因而并不特别妥帖。再之, 就元话语研究的对象而言, 显然包括了篇章组织和衔接手段, 又包括了人际交互性质的态度表达语, 而这两类内容又与Halliday (1985) 所谓的概念意义 (ideational meaning) 交织一起, 难以截然分开。这就使得元话语研究所涉十分纷繁、杂合。从研究手段看, 元话语分析单位主要聚焦于单个词和固定短语, 而很少关注搭配、型式、构式以及其他短语单位。根据Firth (1957) 、Sinclair (1991, 1996) 等词语搭配理论, 同一词语可以出现在多种不同的词语组合或型式 (pattern) 之中, 而出现在不同型式中的同一词语也可甚至应该视作不同词语。从这个意义上讲, 任何词语都可能用于实现元话语的功能, 但元话语也只是词语的某些特定型式。由此可见, 型式的思想可为解决上述“大杂烩问题”提供借鉴。

4. 基于用法的研究路径

4.1 基本概念

基于用法的研究路径 (usage-based approach) 与Bybee和Langacker等人的贡献分不开。Bybee (1985, 2010) 强调了频率对语言使用和发展的影响。Langacker (1987) 进一步指出, 语言结构每使用一次都会得到一定程度的巩固 (entrenchment) 。该路径认为, 语言知识来源于交际中的语言使用, 语言学习本质上就是在交际中获取语言结构和规则, 即获取构式 (construction) (Bybee, 2010;Goldberg 1995, 2006) ;二语学习则是在二语输入的基础上获取或归纳相应的构式 (N.Ellis&Wulff2015:75) 。

Construction这一概念源自Bloomfield (1933) 的《语言论》一书。他根据直接成分分析法区分出“向心结构” (endocentric construction, 如poor John) 和“离心结构” (exocentric construction, 如John ran) 两类。此外, 他还谈及施事—动作结构 (actor-action construction, 如John ran) , 关系—轴心结构 (relation-axis construction, 如beside John) 等。由此可见, Bloomfield所谓的construction一定是大于单词层级的语言实体, 或是词组级的、小句级的、甚至是句子级的, 属句法层面的概念。与之相比, 认知语言学中的“构式”则是结构与意义之结合体, 并非纯句法的概念。例如, Lakoff (1987:467) 所使用的语法构式 (grammatical construction) 就体现了形式和意义配对的思想。Goldberg (1995, 2006) 将构式明确界定为“形式—意义配对”, 且形式或功能的某一方面不能通过构成要素严格预测 (not strictly predictable) 。根据Goldberg (1995, 2003, 2006) , 构式的范围很广, 分属不同层级:语素、单词、句法框架、习语、隐喻、稀有用法和被动式等。Ostman (2005) 甚至还提出了语篇构式 (discourse construction) 的概念。

4.2 主要价值与意义

基于用法的语言习得观认为语言习得在语言交际中发生, 与Chomsky的语言天赋论形成鲜明对比。天赋论认为人脑具有专门的语言习得机制 (LAD) , 人类通过LAD获得语言。与之相对, 基于用法的语言习得观则认为, 语言是后天学会的;语言的根本目的是交际, 任何自然语言使用都发生在特定的语境之中;语言使用者在具体交际活动中体验各种用法, 获得语言知识。也就是说, 语言交际是语言知识的主要来源。

基于用法的语言学习思想促使自然发生语言数据得到重视。“基于用法”实质上是强调了真实交际中语言结构使用的频次和概率属性 (如Langacker 1987:59) 。语言形式的接触频次被视为语言习得的一个机制 (参见Bybee 1985, 2010) 。基于用法的二语研究同样把频数作为目标构式学习的核心考量 (如R9mer, O’Donnell&Ellis 2014等) 。此外, 语言结构的共现频率是典型语言现象的另一特征参数 (Sinclair 1991, 1996) 。基于用法的研究虽然很少直接使用这一概念, 但已体现相关思想。例如, 基于范例的学习观 (exemplar-based learning) 认为, 人们在交际中记忆大量语言使用实例, 这些实例相互作用、产生“共鸣”, 就会抽绎出一定的规律 (Ellis 2002:166) 。而规律的抽绎实质上取决于共现频率。频次的重要价值意味着语言研究首先要重视真实语言数据。

基于用法的二语研究代表着一个全新的二语习得研究路径。构式的“形式—意义配对”思想促使相关研究更多地去关注那些意义/功能较为稳定的多词单位以及相关型式, 促使较大语块单位对表达意义和语言学习的重要性得到更多关注。相应地, 除了使用实验技术和方法获取数据以外, 大规模的真实语言数据也备受关注, 由此催生了语料库方法和实验方法相结合的新范式。例如, 基于Hunston&Francis (2000) 的型式语法 (pattern grammar) , Ellis团队开展了一系列VAC“动词—论元”构式研究 (如Ellis, Donnell, R9mer 2014;R9mer et al.2014) , 是新路径具有代表性的研究范例。

4.3 主要问题

1) “构式”概念与“形式-意义配对”的思想。这些并非基于用法路径的独创。如前所述, construction这一说法早在Bloomfield (1933) 中就有使用, 而“形式-意义配对”的思想在Pawley&Syder (1983) 中也有较为深入的详述。Pawley和Syder称之为词汇化句干 (LSS, lexicalized sentence stems) 。例如, NP tell-TENSE the truth就是一个典型的形式-意义配对, 可以有“Tell the truth!”等具体实现形式 (Pawley和Syder 1983:211) 。认知语言学的构式不同于Bloomfield的construction, 而其形式-意义配对之说与Pawley&Syder之LSS也有很大差异。后者所论属于程式化语言 (formulaic language) 的一部分, 是形式与意义的综合体, 是大于单词层级的语言实体, 焦点十分明确。此外, 构式与语料库语言学所谓的型式 (pattern) 也异大于同。据Hunston&Su (2017) , 一个构式可分属于多个型式, 一个型式也可对应多个构式, 并不存在一一对应之关系。但是, 相关概念及其渊源、异同并未被系统阐述。

2) 构式包括语素、单词等很多层级, 有囊括一切语言单位之嫌。如果构式囊括一切, 那不可避免地会弱化其描述力、解释力, 乃至具体论断的效力。比如, 当我们将诸如-ed和-ing等语素也视为构式时, “构式的意义并非可由其构成要素意义预测”就很难自圆其说。一方面, 尽管这些语言单位都是客观存在, 但相互之间存在交叉或重叠 (overlapping) 。例如, 在某些情况下语素可能单独存在, 但绝大部分情况下都是单词、小句、成语以及词语序列的构成要素。因此, 构式所反映的并不都是典型语言现象;二语学习者对这些语言单位有不同的体验。另一方面, 构式的“形式或意义不具有严格可预测性” (Goldberg 2006:5) 等论断尚需优化。根据Firth (1957:192) 的词语结伴说, “相互预测性” (mutual expectancy) 是普遍存在的, 且发生在不同抽象程度的语言“伙伴”之间。简言之, 构式的界定需要考虑抽象度问题。Hunston&Su (2017) 指出, 构式不宜过度抽象, 也不宜过度具体, 而应适度 (mid-level generalization) 。相比而言, Pawley&Syder (1983) 的词汇化句干和语料库语言学的型式概念则更为明晰和更具可操作性。

3) 部分论断的说服力问题。如果构式无所不包, 那么“构式是语言学习的最重要驱动力”之论断等于在说“语言中的一切都是语言学习的最重要驱动力”。再之, “基于用法”的路径认为, 语言中的意义是一种认知结构;语义结构与人的经验、认知策略以及文化规约等要素的概念化过程相对应 (武和平、王晶2016:3-4) 。然而, 意义并不简单地等于概念化。概念化主要是把不同的刺激因素加以联合、概括的主观认知处理过程。与之相比, 社会语言学者和语料库语言学者则认为, 意义即使用;意义存在于使用之中、语境之中、文本之中, 是客观存在 (Sinclair 2004) 。意义的文本属性说明, “构式之意义并非构成要素意义之和”这一论断适用于公式化语言等少数单位等, 但并非全部。此外, 能否把语料库的型式数据直接等同于人脑储存的认知型式?我们尚缺乏足够证据, 仍需更多的各类实验研究支撑。需要指出的是, 语料库所反映的型式可以较为客观地量化和描述, 揭示典型的使用型式;而人脑的认知存储型式要通过实验手段去发现, 但是由于受到实验条件和研究技术等因素的限制, 难以确定所测型式的代表性和典型性。在这个意义上讲, 参照语料库数据进行实验研究、探究人脑的认知型式应是一个好的选择。

5. 结论

CIA分析、元话语分析和基于用法的路径日益成为二语学习研究的重要研究活动。它们在语言数据使用、对比向纬诸方面有很多共同之处, 但在基本语言学思想、分析方法、技术手段和研究贡献上都各有侧重、各具特色, 分别显示出各自的优越性。与此同时, 三类研究模型/路径也各有千秋。上述讨论揭示了各自的主要特征、优势和缺陷, 并对如何实现各模型优势互补、解决潜在问题提出了建议。主要包括以下几个方面的思考:1) 构式研究探索了语料库分析与实验研究相结合的路径, 对解决CIA研究强于数据弱于理论、强于语言使用结果而弱于过程探索等缺陷具有启示意义。可以采用语料库分析和实验研究交叉验证的研究范式来加大对“过程”的考察力度 (参见陆军2017) ;2) CIA研究中各类型式的探讨对优化构式界定、改良元话语分析模型具有借鉴意义。例如, 参照语言型式, 适度概括构式, 可避免囊括一切的问题, 并适当解决抽象颗粒度的问题 (参见Hunston&Su 2017) , 而元话语分析不妨更多关注多词单位或词语型式/构式;3) CIA研究所揭示的典型二语型式和元话语分析所发现的典型元话语特征以及相关研究思想对开展有代表性的构式研究具有一定借鉴意义 (参见N.Ellis et al.2014) 。

编者按

本文编辑：语言学通讯特约编辑上海理工大学孙雨

参考文献略。

欢迎查询知网或者《外语教学》2018年第5期纸质期刊了解详情。

长按二维码赞赏语言学通讯

语言学通讯外文书店

科研助力|“语言·文学·文化研究系列丛书”征稿函

科研助力|“语言学通讯博士论丛”书稿征集

专著推荐|吴琳：动补式复合词的词法理论与应用研究

专著推荐|管新潮《语料库与Python应用》

专著推荐|龚晓睿：威•休•奥登诗歌中的绘画艺术研究

专著推荐|杨小虎：非语言因素对外语语音学习的影响研究