重视研究方法培养 提高外语教师的国际发表意识
1.导言
近十多年来,国内高校非常重视国际SSCI期刊论文的发表,把中国特色的研究成果推广到国际舞台上,增强我国社会人文学科在国际上的话语权。因此,如何在国际期刊发表论文已经成为我们亟待解决的问题。
长期以来,由于外语教师培养中缺少学科的意识,语言文字理论与研究方法的培养不够完善,尤其缺乏语言学研究方法的培养,造成广大外语教师在科研方面比较滞后,难以在国际SSCI期刊上发表学术论文。最传统、应用也最广泛的语言学研究方法是内省法,基于理论运用自身的语言直觉对收集的语料进行分析、判断和综合,进而得出结论。内省法有其自身的优点,具有最广泛的使用性,但其缺陷也在非常明显,主观性太强,缺少“客观”的证据。其它的方法可以弥补内省法的不足,例如行为实验的方法、神经科学的方法和语料库的方法。这些方法可以为研究提供相对“客观”的证据。
本文拟从语言学理论与实证研究方法的关系探讨国际SSCI发表的重要性和途径,尤其是结合认知语言学探讨实证研究方法对理论的验证,寻求理论与实证方法之间的互证关系,以期对广大外语教师有所启示。
2.认知语言学理论与研究方法
与以往的语言学流派相比较,认知语言学并非单一、密切铰接的理论,而是具有不同理论主张和研究方法的事业(Evans,2012: 129)。理论和研究方法的多样性正是认知语言学活力所在,使其成为当代语言各种发展趋向的集大成者(Geeraerts &Cuyckens,2007:15)。认知语言学特别强调“汇流证据”( converging evidence) 的原则,其核心就是重视方法论的多元化,强调不管是什么学科的方法,只要能为认知语言学理论提供证据就可以使用。
综观认知语言学四十多年的发展,我们不难发现,“开山鼻祖”在本“事业”建立之初大多运用“内省法”进行了大量的理论初探和创新,并取得了大量的有洞察力的研究成果(Green & Evans,2006; 张辉 孙崇飞,2015) 。正如我们在前言中所说Gonzalez-Marquez等( 2007) 指出,尽管认知语言学家承诺其理论建构在心理学事实基础上,但其多数工作仍建立在理论学家的语言直觉之上。这种建立在语言直觉之上的内省法存在一些固有的缺陷可能导致研究结果存在个人偏见的危险(Gibbs,2007: 4-5) 。Gibbs (2007: 7) 指出许多“门外汉”对认知语言学的抱怨之一便是无法证明其理论的虚实,这使其解释的充分性和可信性大打折扣,影响其研究的可证伪性和可重复性进而危及其科学性。
为了克服内省法存在的固有缺陷,最近十年来部分认知语言学家和心理学家开始从几个方面努力克服和弥补。Langacker ( 2008) 指出认知语言学家在做语言描写时,不仅要寻求心理现实性和解释充分性,还应注意语言研究的揭示性(linguistic revealing ) 。强调揭示性的目的很明确,即“语言研究不仅仅旨在寻求最可信的发现,还在于如何使其发现更易于被证实”(Gonzalez-Marquez et al. ,2007) 。Gibbs( 2007: 7-17) 也曾指出,虽然大多数认知语言学家并不必像认知心理学家一样做实验,但应该注意实验性假设形成过程中的一些重要特征,努力以一种可被其它学科的学者验证证伪的方式来阐述自己的观点或经验发现。因此在认知语言学领域,SSCI期刊大多重视发表具有充分的语言揭示性的论文。近年来,认知语言学越来越多地使用心理语言学和认知神经科学的实证方法以及语料库的方法。
下面我们从认知语言学理论与实证方法结合的视角论述国际SSCI论文发表的趋势。我们从两个方面探讨这一问题:一是如何利用认知神经科学方法如ERP检验认知语言学提出的理论假设;二是如何运用语料库方法检验认知语言学的假设。
3. 认知语言学与ERP方法
3. 1 运用ERP验证概念整合和概念隐喻理论
ERP技术是通过放置在头皮上的电极记录大脑中发出的自发电位的方法。通过叠加许多同一类型的试次(trials) ,形成对某一“事件”( 语言的视觉或听觉呈现) 敏感的脑电波,即事件相关电位(ERP) 。ERP技术的优势在于其毫秒级别的高时间分辨率,能够准确测量语言理解中各种信息类型如语义和句法信息等被加工的时间进程( time-course) 。某一类型的刺激(如语义与句法违反) 所产生的典型和可预测的模式称为ERP的成分(components) 。三个与语言加工密切相关的成分分别是N400、前额负波( Anterior Negativity) 和P600,均具有一个或多个功能意义。有关这三个成分所具有的功能意义,请参见Swaab等( 2012) 。
认知语言学中的概念整合理论是由Fauconnier和Turner在内省法基础上提出的,概念整合的过程由四个心理空间(mental space) (Fauconnier & Turner,2002) 构成,其中两个输入空间(input spaces) 分别表示隐喻的来源域和目标域,它们通过空间中部分信息的投射形成整合空间(blended space) 中的新创结构,而两个输入空间所共享的信息是类属空间(generic space) ,构成概念整合的基础。例如在理解“The surgeon is a butcher.”时,我们的头脑中形成两个输入空间,一个是关于外科医生的;另一个是关于屠夫的。从两个输入空间中投射一部分信息到整合空间之中,形成了一位外科医生拿的不是手术刀,而是屠刀,并以屠夫的方式做事的整合心理影像(或新创结构),说明了外科医生不合格和不称职。这一解释是否具有心理现实性,符合人们在理解这句话时的认知过程?
为解决这一问题,Coulson和Van Petten ( 2002) 在《记忆与认知》(Memory & Cognition) 发表了“概念整合与隐喻:事件相关电位研究”运用ERP实验验证了字面语言和隐喻语言的投射、整合过程、难易度连续体假说(continuity claim) (字面和非字面语言的加工发生在同一时间过程,且加工机制相同)与等值假设(equivalence claim) (隐喻语言的与字面语言一样容易理解) 。
概念整合理论认为,隐喻理解包含了两个概念上较远的输入空间的投射和整合,因此需要更多的认知努力。这一理论还认为,以上的认知操作并非是隐喻独有,所有语言理解(包括字面语言)都包含认知模式(或心理空间)的构建与其成分之间的投射关系。
这个实验的精巧之处在于,他们在字面义与隐喻之间设计了介于完全的字面语言和明显的隐喻语言之间的字面映现(literal mapping ) 。例如:1) That stone we saw in the natural history museum is a gem.(字面义) 2) I realized the new idea is a gem.(隐喻义) 3) The ring is made of tin,with a pebble instead of a gem.(字面映现) 。实验预期是,由于输入空间的距离不一,隐喻义句子最难理解,字面义句子最容易理解,而字面映现的理解难度处于两者之间。
实验结果验证了这一预期,隐喻句子引起N400大于字面义句子引起的N400,字面映现句子引起的N400居中;隐喻引起的枕叶和顶叶部的晚正波(Late Positivity ) 大于其他两种句子引起的晚正波,说明隐喻的两个输入空间的整合最为费力。Coulson和Van Petten认为N400振幅的梯度差异与连续假说一致,说明字面与隐喻语言有同样的加工机制,即心理空间之间的部分投射与概念整合。这一结果与等值假说矛盾,说明加工隐喻语言比加工字面语言需要付出更多的认知努力。这一实验为概念整合理论提供了重要的实验证据。这一研究符合认知语言学倡导的汇流证据的原则。
Lai和Curran (2013) 运用ERP实验探讨了常规和新奇隐喻的理解中是否发生了概念映现(mappings) 和比较的过程。首先,概念隐喻理论认为,“我们沿着生活的道路走下去”是隐喻的,理解这类话语需要关于“生活”来源域和“旅行”目标域的知识以及两者之间的本体对应(ontological correspondences) (Gibbs, 1994; Lakoff, 1993) 。在理解常规隐喻时,我们会激活相关映现(mapping) 。但Keyser等(2000) 则认为理解常规隐喻不需要无需额外借助映现。
另一个问题是隐喻理解过程。在此问题上心理语言学家分为“基于比较”与“基于范畴化”两个阵营。以Gentner为代表的基于比较的理论(Gentner & Wolff,1997; Bowdle & Gentner, 2005) 认为所有隐喻开始时都是新奇的。在隐喻理解中,人们通常比较来源域与目标域。基于范畴化的隐喻理论(Glucksberg & Haught,2006) 则认为,隐喻无需比较,而是通过“范畴化”理解,即把目标概念看作为来自来源域的一个临时建构的特定概念(ad hoc concept) 。
Lai的ERP实验采用关系启动(relational priming ) 范式来解决上述两个问题。关系启动指语义网络上的词或结点之间激活的关系可以促进其它词或结点之间相似的关系,例如“bear-cave”之间的关系可促进“bird-nest”的理解。研究主要考察在不同条件下的N400。实验一考察理解常规与新奇隐喻时是否使用了概念映现。被试先阅读相关与不相关启动句,然后再阅读目标句。而在非启动条件下,目标句由非相关的启动句在前。如:
启动句 | 目标句 | 隐喻 | |
常规隐喻 | I can see the path of life | I can see the path of life | LIFE IS A ROAD |
新奇隐喻 | I can see the path of his ideas | I can see the path of his ideas | IDEA IS A ROAD |
在2(启动与非启动条件)×2( 常规与新奇隐喻) 条件下,依据隐喻的神经理论(Lakoff & Johnson, 1999) ,相关的启动句应该促进常规隐喻目标句的理解而不是新奇的隐喻;基于Gentner等人的理论,映现应该影响两种隐喻的理解;而基于Keysar等(2000) 的理解,相关的映现应该只对新奇隐喻有启动效应。
实验二使用了“X-is-like-Y”的明喻形式作为启动句来启动隐喻目标句。实验结果指出,在非启动的条件下,常规和新奇隐喻句子比字面义句引起了更负走向的N400效应。而在启动条件下,两种隐喻比非启动条件引起的N400效应更小。如果把隐喻条件下的启动效应减去字面义条件下的潜在的词汇启动效应,常规隐喻的N400效应便变成边缘显著的,但在新奇隐喻中却仍然是显著的,这说明不管是常规和新奇隐喻都得益于明喻中的概念映现和比较。这一结果支持Gentner等人的理论,即首先把两个相关的概念连接起来然后再得出适当的推理。对于常规隐喻有多种概念映现的渠道,而对于新奇隐喻只有一种概念映现的渠道。这一实验结果也证明隐喻的加工是通过比较而不是通过范畴化。
Lai等人的实验通过ERP和关系启动范式为认知语言学概念隐喻理论提供证据,证明了隐喻理论不管是常规和新奇隐喻都是通过两个认知域或概念之间的概念遇刺而产生理解,概念映现在隐喻理论中起着重要的作用。3. 2 ERP 与认知语法 在本节中我们试图说明ERP的方法可以为认知语法中提出的组构性提供有力的证据。语义组构性指的是,熟语的构成成分“携带了其惯用非字面义中可被我们辨认出来的那部分意义(Nunberg et al. , 1994: 496) 。我们使用我们团队的研究(Zhang et al. , 2013) 说明汉语成语的组构性对其理解的影响。 Langlotz提出的“惯用激活集合”(Idiomatic Activation Set) 在认知语法的基础上研究成语组构性,并试图解释成语理解中意义建构的复杂认知结构(cognitive architecture) 和语法组织(Langlotz, 2006: 94-95) 。惯用激活集合指的是熟语使用中在说话人的思维中潜在地能够被激活的心理网络,它包括熟语内在的且相互关联的象征和语义次结构(substructure) 。正是这些次结构不同程度的激活力度塑造了成语语义结构中的多样性,语言使用者所识别的成语构成成分次结构对整体意义的贡献越大,其组构性便越高。我们依据这个观点把汉语成语分成低组构性、中组构性和高组构性的。 在高组构性的成语中,虽然词汇化后成语的部分次结构相对地处于凝固的状态,这些次结构在很大程度上会被激活,为认知构建中连接其它次结构提供一个捷径,字面义场境中所有的复合部分与比喻场境中所表达的意义几乎是重叠的和对应的,次结构与成语的“惯用激活集合”紧密地联系在一起,为目标的概念形成(target conceptualization) 提供了直接的通达,因此字面义和比喻义这两个场境是不可分割的整体。在中组构性的成语中,概念次结构部分地从其“惯用激活集合”中被删除,字面义和比喻义场境在听话人的心理状态中实际上是一种渐近关系。由于字面义场境中的次概念结构没有得到充分的激活,概念次结构处于不显著的心理状态,因此仅仅为侧重的目标概念的形成提供间接的通达。在低组构性的成语中,字面义场境几乎所有的概念次结构与“惯用激活集合”的联系被完全地阻隔并被剥夺了激活的可能性,在本体和目标中的各部分之间无法建立可感知的对应关系。在低组构性的成语中我们已不再需要被侧重的字面义场境(profiled literal scene) 作为识解目标中的概念架构( conceptual scaffolding) ,两个意义场境之间的概念差异难以消解。在这种情况下,人们开始借助其他手段来理解成语,如成语的来源和寓言故事等,以便在字面义和非字面义场境之间重新建立起某种联系。 成语表征和加工的认知语言学解释说明,语义组构性本质上是概念构建和认知识解的结果,而不仅仅是一个语言概念。成语语义组构性的认知观点有待于心理语言学实验的证实。由成语的字面义解释作为启动句,我们证实了不同组构性的146个成语可引起明显的层级的ERP波形,主要反映在N250和N400这两个ERP成分中。与N400相比,N250在基于西方语言的熟语研究中鲜有报道。通过基于行为反映和ERP数据统计分析上的详细讨论,我们证明了组构性对成语的加工产生了巨大的影响。本研究提供的证据表明,在不同组构性的成语之间存在心理上相关的差异,并支持其具有不同记忆表征的观点。我们在本研究的基础上提出了成语加工暂时的模式,其中包括早期与初始意义通达相重叠的成语形式的识别,还有后期与支配性语境( dominant context) 的语义整合。这一ERP研究为组构性假设的合理性提供重要的佐证。组构性假设指出,在成语理解的过程中,单个汉字的意义作为与惯用比喻义进行概念对比的背景,在认知上仍然是活跃和可通达的。熟悉的成语本质上是“熟睡的”、隐喻(“sleeping”metaphors) 而不是“死亡的”隐喻(Zhang et.al.,2013: 110) 。4.语料库方法在认知语言学研究中的作用 语料库为语言频率和用法分布的研究提供了重要的数据来源。但是,能够影响语言的因素相当繁多而且相互交织,仅凭简单的观察,我们很难得到真正对语言表征起作用的语言因素及各因素之间的关系。统计方法为客观表达语言现象、实现预测提供了有力的工具。另一方面,统计结果是否具有心理现实性?这就需要心理语言学乃至神经语言学实验的验证。因此,当前语料库方法在认知语言学研究中最突出的特点为:1) 语料库与实验,尤其是在线实验相结合的趋势;2)研究因素多且交织互动;3)量化推断模型方法的大量应用。 近年来,国际期刊刊载了大量采用语料库方法进行认知语言学研究的文章,充分反映了上述趋势。下面我们从语言习得、句法构式、语言社会认知等几个角度,介绍语料库方法在上述几个方面的发展趋势。4. 1 构式的心理表征:语料库和实验的结合 构式的思想近年来在认知语言学界受到广泛关注,甚至一些形式研究也开始借助构式的概念。掌握一个构式,是学习者从特定的样例中概括出构式的原型,并以此为基础拓展自己的创造性语言。因此,构式的特征由其用法决定,尤其受到频率和分布的影响。当前学界的一个热点话题就是证明这种影响的心理现实性及其大脑表征。 Ellis等(2014) 和Ellis(2016) 结合语料库和加工实验研究了VL构式,通过将在语料库中获得的各项分布数据和被试的行为数据对比,验证构式用法特征的心理表征的存在。 研究首先从BNC语料库中获得了由24个介词形成的VL构式中出现的动词列表、类符/形符频率排序、计算动词-构式单向关联度( contingency) 。然后通过WordNet计算每个构式中的动词的语义相对中央性( betweeness centrality ) 。研究发现,各构式的用法非常集中,绝大多数由极少量的几个动词构成,且构式和动词均具有强烈的选择性。 在此基础上,该研究进行了两个自由联想实验:1)被试在VL构式的动词槽中填入第一个想到的动词;2)在1分钟内填入尽可能多的动词。多重回归分析结果显示,动词在VAC中的频率、词和构式之间的单向关联度以及动词的意义典型性均对被试所产出的动词有独立、显著的影响。 为避免Ellis等(2014) 离线实验任务的干扰因素,Ellis(2016) 进一步采用词汇判断(lexical decision) 和意义判断( meaningfulness decision) 任务进行了三个在线实验。实验结果均发现动词频率和动词-VAC频率对加工产生影响。同时,词汇判断受到语义典型性的影响,但不受VAC-动词连接度(ΔPcw) 影响。意义判断受VAC-动词连接度(ΔPcw) 的影响,但不受语义典型性影响。研究认为出现这种差异的原因可能是词汇判断任务是一种无意识意义表征扩展激活过程,而意义判断任务则是有意识地选择唯一解读的过程。进行意义判断时,与构式义相关,语义更加具体、意象性( imagability) 强的动词加工更快。两项研究说明,自动化的VAC加工涉及丰富的关联知识,受动词类符和形符频率、它们用法的可预测度、它们的典型性和具体解读的历史(概率)等的影响,这些因素将句法、词汇和语义之间对接起来。 构式理论还进一步和神经科学结合,采取ERP或fMRI手段证明其观点,Goldberg已经在这方面迈出了第一步(Allen等,2012) 。该研究通过fMRI区分了被试在加工与格构式和双宾构式时,大脑模式的不同。多体素模式分析(MVPA) 显示,左半球BA22前区和BA47的激活模式能够区分两种构式。且由于这两个区域均和语义加工相关,说明它们之间可以在语义上区分。该研究采用MVPA方法,为构式理论的研究提供了新的神经科学手段,但此类研究目前还比较少。4. 2 句子结构:机器预测与语感选择 语言中存在大量的近义词,在不同的语境下,人们倾向于选择不同的词汇。这种选择背后的依据是什么,计算机如何辨别?最有效的办法便是从语料库中抓取大量的实例,对这些实例进行接近穷尽式的标注,然后利用统计方法建立模型,并通过与新的语料库实例或母语者的语感比较来判断统计模型的有效性。 Divjak等(2016) 考察了俄语中的六个“try”动词:probovat’ 、silit’ sja、pytat’ sja、norovit’ 、starat’ sja和poryvat’ sja。这些动词都对应英语中的“try”,但使用范围各不相同。 研究共包括三个实验。实验一要求母语被试从6个“try”动词中选择一个最合适的,填入60个测试句中。结果发现,多项逻辑斯蒂回归模型(polytomous logistic regression model) 的选择和被试的选择大致相同,对模型进行频率调整后,其预测力和被试的表现达到了完全一致的水平。实验二从18个模型变量中随机抽取特征配组,形成了134个“笨蛋”(dumb) 模型,用于模拟被试的个体差异。结果发现,这些“笨蛋”模型的预测结果仅稍低于母语被试,且模型之间的差异要低于母语被试的差异。因此,学习者在语境中掌握了哪些线索并不重要,更重要的是他们是否掌握了足够的线索。实验三将模型预测的60个句子中6个“try”动词出现的概率与母语被试的可接受度评价数据对比,发现两者在高概率事件上表现一致,但在低概率事件上不一致,被试在低概率事件上表现出一定的随机性。 与过去的研究中通常以二元选择为对象不同,该研究的选项多达6个,模型变量达到18个,难度极大。此外,也很少有研究尝试评估该文中所采用的多项逻辑斯蒂回归模型(polytomous logistic regression model) 的预测力(类似首个研究为Arppe &Abdulrahim,2013) 。 可以看出,当前的语料库研究中统计应用已经不再满足于简单的频率统计乃至统计计算,而开始走向复杂的模型建构。田臻和唐树华(2013: 431) 也曾指出,“探索新的方法来统计、测量及权衡从数据中获得的频率信息是今后语料库研究的重要发展方向。”显然,上述研究是新方法发展的一个重要趋势。4. 3 语言变异:个体选择和环境影响 在社会语言认知分析方面,语料库方法也出现了向复杂模型的转变,在语言变异研究方面尤其明显。Zenner等(2015) 通过语料库方法试图哪些因素能够解释荷兰语母语者日常对话中出现的英语插入语。研究以在电视真人秀节目“Expeditie Robinson”中出场的说比利时荷兰语(Belgian Dutch) 和尼德兰荷兰语(Netherlandic Dutch) 的节目参加者的话语为研究对象,共转写了该节目三个季度播出内容中35个小时,46位说话人的语料。 研究给语料标注了与英语插入语相关的说话人特征和语境特征。前者包括年龄、性别、职业、地区和在节目中的社会地位等。后者包括话题、情绪、节目阶段以及是否有对话对象等。混合因素逻辑斯蒂回归模型(mixed-effects logistic regression model) 显示,性别、年龄和地区等因素对插入语有强烈影响,而情绪和话题等语境因素也能够影响插入语的使用。 该文指出,回归模型在变异研究中的优势主要体现在:首先,由于在独立因素的计算中,所有因素的共同效应也被考虑了进来,回归模型对特定预测因素效果的估算结果更加可靠;其次,模型能够提供显著程度,准确说明数据中的模式能否适用于整体;再次,研究者能够通过模型发现预测因素之间的有意义的交互作用;最后,回归分析能够设定一个或多个随机变量,从而形成所谓混合效应模型。 类似的研究还包括Deshors和Gries(2016) 利用随机森林( random forest) 分析对英国英语、美国英语及三种亚洲英语变体( 中国香港、印度和新加坡) 的动词补语ing与to结构所做的研究。国内也已经有研究者开始尝试采用多变量模型进行社会语言变异分析,如郭鸿杰等( 2016) 。5.结语 从以上ERP和语料库两个研究方法的视角,我们可看到国际发表中的趋势之一:实证研究为理论语言学的建构提供重要的“客观”证据。我们强调要加强语言学研究方法的培养,为更多的外语教师发表国际SSCI论文打下较好的基础。作者简介
张辉,南京师范大学特聘教授,博士生导师。研究方向为认知语言学、神经语言学、句法加工。
陈松松,长江大学外国语学院教师。研究方向为认知语言学、神经语言学。
延伸阅读
语科教师
Y编邀您入群
欢迎留言并分享至朋友圈