好文荐读|杨静、王晓婵:双语心理词汇通达模型:70年回顾与展望
好文荐读(第二十四期)双语心理词汇通达模型:70年回顾与展望。
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
往期推荐:
2. 广东外语外贸大学外国语言学及应用语言学研究中心, 广东广州 510420
文章简介
文章来源:杨静,王晓婵.双语心理词汇通达模型:70年回顾与展望[J].解放军外国语学院学报,2023,46(02):1-10+160.
摘要:20世纪50年代至今,双语词汇通达模型研究历经孕育、形成、发展, 目前进入了成熟阶段。 本文系统梳理了双语词汇记忆表征、双语词汇产出与识别、二语词汇发展模型的发展脉络,简述了相关言语模型和计算模型的特色与不足,归纳了有关双语词汇通达的最新共识。建议未来研究应:1)重视语言情境在双语词汇通达和二语学习过程中的作用机制;2)强化双语加工和二语学习领域认知计算模型与神经模型的交叉验证与融合;3)重视汉语特色,拓展目前以西方语言研究为基础的理论模型,推动本土理论国际化。
关键词:双语词汇表征;双语词汇通达;二语词汇发展;言语模型;计算模型
基金项目: 浙江省哲学社会科学领军人才培育专项课题子课题 “外语学习经验影响认知控制的认知机制研究” (23YJRC01ZD-1YB)感谢《解放军外国语学院学报》授权推广,全文下载请点击文末“阅读原文”。
零.引言
双语现象(mbilingualism)指个体使用两种或者两种以上不同的语言表达或者交流,是一种普遍的社会现象和重要的语言学研究问题。双语者两种语言的心理词库 (mental lexicon)是独立的还是共同存储的?双语者如何从两种语言的心理词库中获得与输入信息最为匹配的编码, 选择并提取词汇, 实现双语词汇通达(lexical access)?在二语学习过程中,双语心理词库有怎样的动态变化?自20世纪50年代以来, 研究者们围绕这些重要问题进行了大量实验研究,并提出了有关双语词汇的记忆表征、产出及识别、二语词汇习得的认知模型。这些模型大致可以分为言语模型(verbal model) 和计算模型(computational model)。前者属于描述性模型,可进行定性分析;后者则是由数据驱动,研究者能系统操纵和控制变量,进行量化统计分析,模拟语言学习过程。本文按照孕育期、 形成期、 发展期和成熟期4个阶段回顾有关双语词汇通达的模型演化,以厘清发展脉络,阐明前沿趋势,为未来相关研究提供一个较为客观、全面的理论背景和方向指引。
一.孕育期
双语心理词库的记忆表征是双语词汇通达研究的源头和基础。 Weinreich(1953)最早从理论上区分了双语记忆表征系统, 提出词汇表征和概念表征的关系,将双语者的心理词库分为共存型、连接型和从属型。共存型即一语单词和二语单词各自与概念直接联系,双语记忆表征分离;连接型则是两种语言的词汇表征分离,概念表征共享;从属型指二语词汇表征不能直接通达概念表征,需借助一语的词汇表征通达一语的概念表征。Weinreich(1953)认为二语学习从初级发展到高级阶段,双语记忆表征模型由从属型转变为共存型。Weinreich的三系统说为双语心理词汇的记忆表征研究奠定了基础,与 Ervin-Tripp & Osgood(1954)提出的并列型和复合型,以及 Kolers(1963)提出的双语共享表征模型和分离表征模型非常相似。显然,早期研究者们最关注的是双语者两种语言的心理词库是独立表征还是同一表征的,即双语者存在一个还是两个语义系统。虽然他们对概念表征和词汇表征及其关系有所区分,但缺乏深入思考和科学验证。
二. 形成期
20世纪80年代至90年代,研究者们受认知科学的影响,开始从认知加工的角度提出了不少言语模型,对双语词库的记忆表征进行进一步的描述和阐释, 并广泛认同:1)双语心理词库由概念表征和词汇表征组成;2)概念表征与词汇表征的等级不同;3)两种语言的概念表征共享、 词汇表征分离。这一时期模型的差异主要体现在双语概念表征和词汇表征之间的关系。如 Potteretal.(1984)提出了词汇连接模型(lexical association moedel)和概念调节模型(concept meditation model)(下页图 1 左图) 以解释图片命名和翻译过程中二语词汇产出的过程。他们假设: 在词汇连接模型中,二语单词只能通过一语单词与概念间接联系;而在概念调节模型中,二语单词与概念直接联系,与一语单词仅仅是间接联系。他们让高水平汉-英双语者和低水平法-英双语者完成图片命名和单词翻译的任务,结果发现,两组双语者的研究结果都支持概念调节模型。 但后期不少研究发现词汇连接模型也成立(Chen&Leung 1989;Kroll & Stewart 1990;de Groot & Nas 1991;莫雷等,2005;李利等,2006 )。如 Kroll&Curley(1988)发现二语初学者双语心理词库具有词汇连接模型的特点, 学习时间增长。其心理词库趋于概念调节型。
Kroll&Stewart(1990,1994)糅合词汇连接模型和概念调节模型, 提出了修正层级模型(the revised hierarchical model RHM) (图1右图)。该模型提出了 “发展转移” (developmental shift) 的概念,假设一语词汇、二语词汇和概念表征三者之间的联系强度取决于二语水平,即在二语学习初期,二语主要通过一语和概念建立联系, 一语和概念的联系强于二语和概念的联系;随着二语水平提升,二语和概念联系得到强化,但此时一语词汇和二语词汇之间的联系并没有消失。修正层级模型是最广为接受的双语词汇通达模型之一, 它易于阐释理解, 也较好地解释了双语翻译不对称、 启动效应量不同等现象(Heredia& Altarriba 2001;Altarriba & Basnight- Brown 2007),反映了二语水平提高、双语词汇通达的途径变化。但它未考虑双语词汇的识别过程,不能解释二语学习初期二语词汇直达概念(Duyck& Brysbaert 2004)、二语成为优势语(Heredia 1997)等现象,因此也被某些研究者所诟病(Brysbaert & Duyck, 2010) 。
修正层级模型认为双语表征共享同一概念系统,而de Groot(1992) 发现双语者翻译具体词和同源词反应快过翻译抽象词和非同源词,认为两种语言对应的概念并不完全一样。她提出了分布式概念特征模型(the distributed conceptual feature model, DFM)(图2)(de Groot 1992;van Hell & de Groot 1998),假设两种语言词汇的意义是由众多分布式表征的概念单元组成的,翻译对等词的一语和二语词汇既有各自特有的概念特征, 又共享某些概念节点,不同类型的对等词之间共享的概念节点数量有所不同。其中,具体词(如父亲和 father)指有形的实体,有跨语言的共性, 共享的概念节点多,激活更快;而抽象词 (如自由和 freedom)受不同语言环境的影响 (Schwanenflugeletal.1988),概念上并不完全对等,激活较慢。虽然分布式概念特征模型很好地解释了两种语言的词汇语义概念重叠时的加工,但它无法说明多少程度的特征重叠会影响到两种语言书面或者口语词汇的加工,也没有明确概念层中究竟包含哪些信息,什么样的信息算作特征。后续模型对此进行了拓展, 如 Kroll & de Groot (1997) 的分布式词汇/ 概念特征模型(the distributed lexical/conceptual feature model),Fin、kbeineret al.(2004) 的感觉模型 (sense model),董燕萍(1998)的共享分布式非对称模型 (the shared distributed symmetrical model)。而 Pavlenko(2009)把分布式概念特征模型中双语概念部分共享的思路与修正层级模型融合,提出了改正层级模型(the modified hierarchical model)。
20 世纪 80、90 年代,各种模型主要描述了双语记忆表征、双语词汇产出过程,重点是两种语言的概念层、词汇层之间的层级关系,节点之间的重叠和相互影响。除了这些单编码模型,还有双语双编码模型(bilingual dual-coding theory,bilingual DCT)(Paivio & Desrochers 1980) 。 该模型假设两种语言和图像 (镜像)3个系统之间存在功能性连接,因此具体词和抽象词的加工有别(Paivio 1991,2010;Jaredet al.2013)。 但无论单编码还是双编码,这一时期的模型主要是聚焦二语词汇产出的言语模型,并非数据驱动或者可进行量化统计分析的计算模型,且对于词汇的语音、字形和语义之间的连接并无详述。
三.发展期
经过前期调研,我们已经看到国际中文教育的人才培养实际与学科归属问题,这会带来 诸多弊端
20世纪末,双语词汇通达模型研究有了重大进展。一方面,新增了双语词汇识别模型。另一方面,由于研究者发现双语者单语加工过程中非目标语的自动激活,双语词汇通达模型增加了自上而下的控制机制。此外,当时恰逢联结主义第二次发展高潮,不少研究者开始采用联结主义的计算模型 (computational model)模拟双语词汇识别(Grainger & Dijkstra 1992,Dijkstra & van Heuven 1998; Li 2009; Zhao & Li 2010),因为这类模型可根据词汇的语音、字形和语义节点的连接强度模拟词汇通达或者学习的速度。这一时期也产生了较为成熟的二语词汇的发展和表征模型 (Jiang 2000;Li 2009;Zhao & Li 2010)。
Dijkstra & van Heuven 1998要求荷-英双语者完成同形异义词、同源词和控制词的词汇判断任务。他们发现在单词识别过程中,词汇的语义层和字形层都存在语言非选择现象,但这一现象受语言混合状况和任务要求的影响。 他们以McClelland & Rumelhart(1981)的单语交动激活模型为框架, 提出了双语交互激活模型(the bilingual interactive activation model,BIA模型)。如图3左图所示,该模型是一个自下而上的视觉词汇识别模型, 其特征为同一心理词库中双语词汇非选择性通达、 存在不同语言层面的语言节点以及自上而下的抑制。BIA 模型较好地解释了跨语言的同形异义词效应和跨语言的相邻词效应,也阐释了双语词汇非选择性通达现象 (Marian & Spivey 2003 ),但该模型对于自上而下的语言区分原理、 激活目标语、 抑制非目标语的机制不明,也没有明确说明词汇语音或者语义的表征。
与此同时, Green(1998)创新性地把认知领域中的图式(schema)概念和监控注意系统(supervisory attentional system, SAS)引入双语领域, 提出抑制控制模型(inhibitory control model,IC),以解释双语词汇产生过程中的抑制加工。Dijkstra& van Heuven(2002)吸收了 IC 模型中的任务图式和抑制概念,推出了双语交互激活模型的增强版(BIA+模型)(下页图 3 右图)。该模型除了之前的词汇识别系统(identification),还增加了任务决策系统(task schema)。在词汇识别系统中,BIA+模型增加了词汇的语音和语义表征,语言标记节点只负责词汇表征功能, 不影响词汇识别系统中的词汇单元激活。词汇加工过程影响最后的任务决策,是一个自下而上的认知加工过程。遗憾的是,BIA+模型未能体现二语学习中双语心理词库和任务控制系统的变化,也没有明确地解释语境或者任务如何影响词汇识别,或个体的任务决策系统如何调节双语词汇加工 (van Heuven & Dijkstra 2010;Yang & Li 2012)。值得一提的是,Graingeret al.(2010) 提出的BIA-d模型, 从发展的角度对BIA模型进行了有益的补充。
2000年,Jiang提出了系统的二语词汇发展和表征的认知模型。他认为,一语心理词库中每个词条都由词元 (lemma) 和词位(lexeme信息,一旦词条被激活, 这些高度整合的信息即被自动提取。而在二语学习过程中,一方面缺乏大量语境化的语言输入,无法形成母语般高度整合的词条;另一方面,由于母语概念系统已建立,学习者容易依赖母语系统。据此,他认为二语词汇发展可以分为3个阶段:形式阶段,词条中部分形式信息及发音和拼写确立;一语词元调节阶段,一语词元信息被复制到二语相应的词条位置;二语词条整合阶段,二语单词的语义、句法 形态等信息在二语词条中整合,学习者获得二语词汇能力。他认为由于现实因素大部分学习者二语词汇学习发展到第二阶段就会僵化。Jiang(2000)的模型区别了词汇知识和词汇能力这两个概念, 系统分析了课堂环境下二语词汇学习的动态发展及其表征变化。然而该模型对于词条中各种信息是如何整合和发展的和双语词汇通达的具体心理过程并没有详细说明。
Li(2009) 采用自组织神经网络模型II(DevLex II)模拟双语词汇学习、 表征和加工过程。作者仿照真实情境下的自然语言学习,通过给两个语言参数设置相同的独立模型输入不同语言的语料,观察自组织学习后名词、动词及形容词在双语心理词库中的词汇表征(基于自组织神经网络模型的双语词汇发展模型),并考察了二语学习年龄及顺序因素对这些词汇表征分布的影响。 显然,通过自组织神经网络模型II这样的计算模型,人们可以观察二语词汇学习的动态发展过程,考察如二语学习年龄等重要的调节因素,分析双语词汇表征形成的模式和原因,也能解释二语词汇学习困难现象(Li & Xu 2022)。但如图4 所示,自组织神经网络模型II 主要是自下而上的被动学习,并没有包括个体认知能力及任务要求等自上而下的重要调节因素,而且该模型中尚未明确两种语言在字形、语音和语义层面的交互作用,以及两种语言表征和概念表征之间的交互作用,因此还有待完善。
综上所述,20世纪末至21世纪初,双语词汇产出和识别,二语词汇表征和学习模型进一步发展。一方面研究者们采用联结主义的建模方式,提出了 BIA 模型、自组织神经网络模型Ⅱ等,并强调了情境、任务及个体认知注意能力对双语词汇加工的影响。另有一些研究者则从二语词汇发展的角度构建了双语词汇表征的创新模型。此外,仍有研究者坚持修正层级模型和分布式概念特征模型这些具有较大影响力的言语模型,对这些模型不能解释的现象, 采用修正改良的方式推动其向前继续发展,包括近年来我国学者肖巍、 倪传斌(2016)提出的拓展层级模型(extended hierarchical model)和李德高(2017)的语义表征层次选择模型。显然,面对双语词汇识别或是词汇产出的众多模型,需要一个能综合阐释双语词汇产出、识别、翻译和发展的词汇通达模型。
四. 成熟期
Dijkstra & Rekké (2010) 强调修正层级模型和双语互动激活模型等各有优势,他们在其基础上,提出 “多链路” (Multilink)模型(Dijkstra et al. 2019) ,用以解释不同二语熟练水平的双语者进行词汇识别、提取和产出的认知过程。该模型的基本假设是语言非选择性通达,不同语言词汇的语音、 字形、语义表征不同 (与双语互动激活模型相同)。由于语言经验和水平不同,两种语言的心理词库大小不一,词形和语义之间的连接也有语言间差异 (类似修正层级模型)。此外,多链路模型假设为了获得恰当的词汇意义, 被激活的语义节点还会激活与之密切关联的其他语义节点,因此语义激活其他相关概念的程度与它们之间的联系强度和相关联系概念的数量有关。
如图5所示,多链路模型作为一个计算模型囊括了以往模型中众多因素:它能同时解释双语词汇产出和理解、词汇音形义不同层面的加工、语言学习对这些变量关系的影响;它能预测不同二语水平的双语者进行词汇提取和翻译的反应时间,并可以处理不同词频、词形和同源性质的词汇理解和产出; 它还具有任务系统(输出层)。因此多链路模型是一个极具潜力的双语词汇通达模型。然而,该模型还处于发展初期,依然在不断测试和完善, 以验证和解释更多的研究结果,如多义词加工。其任务和监控系统的参数设置还有待进一步完善。此外,这一模型主要基于荷兰语-英语双语和单语者的测试及模拟,因此是否适用于使用两种不同语系语言的双语者也有待未来验证 (Dijkstra et al. 2019;van Heuven&Wen 2019)。最后,由于多链路模型的原理及计算方法较为复杂, 目前真正了解并使用这一模型的研究者还不多。
五.未来发展
综上所述,在过去 70年,双语词汇通达模型研究经历了孕育、形成、发展的不同阶段、目前刚步入成熟阶段,取得了一定的共识,包括:1)共享与独立词库:双语者多种语言拥有一个共享整合的心理词库;2)局部与分布表征: 概念或者感觉特征分布式模型更为合适;3)语言选择性与非选择性通达: 非选择性通达;4)单编码与双编码系统:目前理论模型尚以单编码系统为主。未来研究可重点着力于以下3个方面,以构建更完善的双语词汇通达模型:
1)语言情境在双语词汇通达和二语学习过程中的作用机制。Green(2011)指出,当前双语研究需要注意情境对双语加工的影响。Green& Abutalebi (2013)提出了适应控制模型(adaptive control moedl),强调不同的语言情境(单语、多语、 语码转换密集)中,双语控制涉及到的加工成分及其投入程度不同。这一研究思路不但适用于自然情境中语言加工的实际情况, 也将为双语交互激活模型增强版(BIA+模型)和多链路模型中假设的任务控制系统带来更多的实证数据。此外,二语社会学习理论(Li & Jeong 2020)强调真实环境或模拟真实环境下进行语言学习,因为个体通过与物体及其他个体互动,对语言和相关的感知信息(包括视听、运动感觉信息) 进行综合编码。经过这样的二语学习,二语词汇产出和理解才能产生母语学习的效果:实现具身认知,即语言刺激 (词汇)与感觉信息之间产生强烈的联系,二语词汇与更多的感觉特征捆绑。因此语言情境对于二语学习影响及其认知神经机制也将会成为新的研究趋势,如虚拟课堂中的语言学习。
2)双语词汇通达模型应是理论假设驱动的认知计算神经模型合体。双语词汇通达模型的发展是多学科协力的成果。因此,未来研究应继续坚持多学科交叉融合,实现创新。一方面,心理语言学和认知语言学研究者可以通过认知神经科学领域的数据对言语或者计算模型进行验证。如 van Heuven & Dijkstra(2010)回顾了采用功能磁共振和事件相关电位技术的双语心理词库研究,提出可以通过这类神经科学数据印证现有模型的理论假设。Li(2009)将双语者名词和动词加工的功能磁共振结果与DevLex II计算模型模拟的结果进行验证。另一方面,神经语言学研究者需要理论假设驱动的认知框架来解释和说明双语者语言加工的脑活动模式。如 Deluca et al.(2020)提出了 “联合双语经验轨迹” (unifying the bilingual experience trajectories,UBET理论框架,强调双语经验是多维度指标构成的连续体, 双语者语言表征及加工的脑机制受到不同语言经历(如语言类型、 语言使用、 转换频次、 熟练程度、习得年龄) 的塑造。Pliatsiikas et al.(2020) 从二语学习动态过程的角度, 基于双语儿童和成人脑结构的研究结果, 提出了 “动态重组模型” (dynamic restructing model, DRM),论述了二语能力动态发展伴随的脑结构变化及其原理。认知模型与脑模型融合,形成可以解释和预测双语者行为-脑数据的认知神经计算模型, 这是未来研究有望突破的一个重要方向。
3)强化汉语学习研究对双语词汇通达及二语学习理论模型的有益补充。母语与二语的概念系统并非完全重叠,二者既有共同的节点,又彼此有所区分。董燕萍(1998)提出的共享(分布式)非对称模型更是首次将概念系统划分为一语元素、二语元素与共享元素。近年来对于歧义词翻译将这类研究进一步推进,不论是扩展的分布式概念特征模型还是改正层级模型都认为两种语言在词汇层面和概念层面并不是完全一一对应的,如汉语中的 “杯子”,在英文中有 cup、glass、mug等多种表达方式。语言特征如何影响到双语者的词汇和概念表征及其连接,使用相同或者不同语言双语者的心理表征模型又有哪些不同,这些都有待进一步的探索。Blasi et al.(2022)指出目前学界 “Over reliance on English hinders cognitive science” (过于依赖英语有碍认知科学),研究往往基于印欧语系的语言(如多链路模型),却称结果具有语言普遍性。我国汉-英双语者词汇加工的研究框架大多参照西方的理论模型,尚未能充分揭示汉语语言特征对母语者和外语学习者的影响。未来研究可以通过汉英双语者或者汉语二语学习者双语词汇加工的创新研究,对主要基于西方语言的现有理论模型进行拓展,从而实现语言研究本土化 (文秋芳 2019)及本土理论国际化(刘海涛 2018) 。
六.结论
综上所述,双语词汇研究是双语研究和二语学习研究的基础,因此需要系统成熟的理论假设和模型作为研究的基础和框架。本文梳理了70年来双语词汇通达模型发展的脉络,总结分析了双语词汇的记忆表征、产出与识别、 二语词汇发展等代表性的言语模型和计算模型,根据当前理论模型和科学研究的最新进展,对未来方向提出了展望, 强调语言情境的影响、认知模型与脑模型的融合、汉语学习研究的创新价值,以期深化双语和二语学习的相关知识体系,形成更加完善的双语词汇通达和二语学习模型。
作者简介
杨 静
个人简介:杨静,浙江大学外国语学院教授,担任硕士生导师、博士生导师,为中国英汉语比较研究会心理语言学专业委员会常务理事。先后在北京师范大学心理学系获理科学士学位,香港大学语言学系获哲学硕士和哲学博士学位,在美国宾夕法尼亚州立大学心理学系从事博士后研究工作。2011-2020年在广东外语外贸大学外国语言学及应用语言学研究中心从事教学科研工作。目前研究兴趣包括双语加工和第二语言学习的认知脑机制。在Brain and Language,Journal of Neurolinguistics,《外语教学与研究》等国内外学术期刊发表语言学习及语言障碍相关的研究论文二十余篇,主持并完成了1项国家自然科学基金项目和5项省部级研究课题。作为第一完成人,获得广东省哲学社会科学优秀成果奖一等奖(第七届)和二等奖(第六届)。
研究领域:心理语言学、神经语言学、双语加工、第二语言学习、语言障碍
联系方式:yangjing17@zju.edu.cn
学习经历:
2005/12-2009/12 香港大学 语言学系 博士(神经语言学)
2003/09-2005/12 香港大学 语言学系 硕士(神经语言学)
1998/09-2002/07 北京师范大学 心理学系 本科(心理语言学)
王晓婵,女,广东外语外贸大学外国语言学及应用语言学研究中心,硕士研究生,研究方向为心理语言学。电子邮箱:sherry@queenlogistics.net
本文来源:《解放军外国语学院学报》
点击文末“阅读原文”可跳转下载推 荐
2023-08-16
2023-08-15
2023-08-13
2023-08-13
2023-08-12
2023-08-12
2023-08-11
2023-08-10
2023-08-08
2023-08-06
欢迎加入
今日小编:言海小鱼
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd