好文荐读|高思畅、邹申:汉语二语口语韵律能力评估维度的任务类型效应
好文荐读(第八十二期)汉语二语口语韵律能力评估维度的任务类型效应。
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
1. 上海外国语大学国际文化交流学院
2. 上海外国语大学英语学院
文章简介
文章来源:高思畅、邹申.汉语二语口语韵律能力评估维度的任务类型效应[J].华文教学与研究,2023(04):59-91.
摘要:本研究考察汉语学习者在朗读篇章、听后复述和回答问题这三种口语任务上是否会体现出韵律能力的差异。共有 38 名汉语二语学习者参与实验,16 名评分员对这些参与者在 3 种口语题型上的韵律表现进行评估打分,评估维度包括韵律策略能力、自然度和流利度。方差分析的结果显示学习者在回答问题上体现出更好的韵律策略能力和自然度,回答问题的流利度也优于听后复述任务,但与朗读任务并无差异;朗读与听后复述任务在三个韵律维度上的表现均无差异。同时,通过相关性分析发现评分员在评估时对三个韵律维度的感知具有高相关性,且这三个维度均对韵律能力总分有较强的解释力,因此,在实际的口语能力评估中,不建议对韵律能力评估标准进行三个维度的细分。
关键词:二语韵律评估;汉语作为第二语言;任务效应
感谢《华文教学与研究》授权推广,全文下载请点击文末“阅读原文”。
1. 引言
第二语言的发音准确性需要掌握音段特征(辅音和元音)和超音段特征(韵律特征,包括语调、声调、重音和节奏等),其中,韵律与言语的可理解性(comprehensibility)和可懂性(intelligibility)息息相关(Anderson- Hsieh、Johnson、Koehler,1992;Kang,2012;Kang、Rubin、Pickering,2010;Munro & Derwing,1995a、1995b;Kang、Rubin、Pickering,2010;Trofimovich & Isaacs,2012;Trofimovich & Baker,2006、2007)。韵律在传递交际信息方面的作用非常重要,例如,恰当的韵律切分可以提高信息传递的效率,也 具有解歧的用(如Kjelgaard & Speer,1999;Watson & Gibson,2004),重音可以凸显沟通中的新信息和重点信息,语调的起伏变化则传递着说话人的语气和态度(Selkirk,1995)。因此,二语韵律能力可以帮助学习者进行有效、高效的沟通,但是,汉语作为第二语言的教师和学习者往往不太重视韵律问题,口语交际产生问题时也大多忽略韵律层面,即便意识到韵律层面的问题,也往往不能定位是韵律的哪个层面出现了问题。本研究利用汉语学习者口语韵律能力的评估标准(Gao & Pan,2022),探索学习者的韵律维度是否更容易被特定类型的口语任务检测出来。
关于汉语二语韵律的研究大部分集中在声调的发展模式上(如冯丽萍、胡秀梅,2005;张林军,2010;陈默,2012;陈默、王建勤, 2010)。少量研究关注了汉语语调的习得问题(张静,2018;桂明超、杨吉春,2000;王萍等,2017),关于汉语重音、汉语节奏习得的相关研究则较为匮乏(Ding et al.,2020;Gu & Hirose,2014;张劲松等,2020;王蓓等, 2020)。在汉语二语口语课堂里,除了声调教学,韵律维度较少融入教学,其他的韵律维度(如句重音、语调)是否该在课堂中加强、该如何加强则鲜有关注。韵律评估量表(rating scale)可以为教师和学习者提供一个可实操的、专门针对韵律能力的标准(Davis et al.,1999),评估量表的开发和运用也体现了通过评估来探索、衡量韵律能力构念的过程。本研究以口语任务类型特征为切入点,采用已研制的汉语韵律评估标准(Gao & Pan,2022),将声调、语调、节奏、重音等韵律组成全部纳入考虑,以此为基础考察汉语二语者在不同类型的任务中的韵律表现差异,并对汉语二语韵律评估标准提出改进建议。
2. 二语口语韵律能力评估标准的开发
口语韵律能力逐渐成为二语口语韵律能力评估与测试关注的焦点。《欧洲语言教学与评估的共同参考框架》(CEFR,Common Europe⁃ an Framework of Reference for Languages)的发音量表最新版的开发报告中提供了详细的英语作为二语的韵律特征的描述(Piccardo,2016)。中国英语能力等级量表(CSE,China's Standards of English Language Ability,教育部, 2019)也对英语二语韵律能力从 1 到 9 级进行了细致的描述。然而,汉语能力量表对韵律能力的讨论则几乎是空白。对外汉语教学领域最早的能力标准是 1988 年出版的 《汉语水平等级标准和等级大纲》,这个标准把汉语水平分成三等五级,对口语韵律能力几乎没有涉及。在汉语水平口语考试(HSKK)的相关标准中也未对初、中、高三个能力水平的学习者的口语韵律能力进行描述。新近颁布的《国际中文教育中文水平等级标准》(教育部 & 国家语言文字工作委员会,2021,以下简称“标准”)对口语韵律方面的描述鲜有提及。
CEFR 的发音评估量表详细描述了语调、节奏、韵律组块、重音(包括词重音和句重音)以及语速,从A1(水平最低)到 C2(水平最高)都 对 这些韵律特征进行了描述(Piccardo 2016:42)。如:“能够表达流利的、易懂的口语,只在控制重音、节奏和语调方面偶尔出现失误,但这些不影响言语的可懂性和有效性(Can produce smooth,intelligible spoken discourse with only occasional lapses in control of stress, rhythm and/or intonation,which do not affect intelligibility or effectiveness)”“能为了完成交际目的而改变语调和使用正确的句重音 (Can vary intonation and place sentence stress correctly in order to express precisely what he/she means to say)”。CSE 是专门针对中国的英语学习者所开发的量表,该标准对韵律能力从 1 级到 9 级均进行了描述,主要体现在量表“语音系统和书写形式知识运用能力”中。从 CSE 的语音系统知识运用能力的量表中可以看出语调、重音、节奏、连读是主要衡量的韵律维度,级别的差异主要体现在不同的交际目的上。
已有的韵律能力评估标准的开发、研制均遵从这一核心原则:对韵律特征的衡量建立在是否能提高说话人的言语可理解度(compre⁃ hensibility)和可懂性(intelligibility)上 。例如,CEFR 的量表中关于韵律能力的描述语主要围绕语音的可理解性和交际目的展开。CSE的受众主要为中国的英语学习者,比 CEFR 更加强调具体语境下韵律能力的体现,如“能在表达观点和态度时,运用重音和节奏”,强调学习者是否能使用韵律来完成具体的语言任务——这是韵律策略能力的体现。Bachman 和Palmer(1996)的交际语言能力框架就强调了以交际为主要目的的语言知识和策略能力的运用。在口语交际中,通过不同程度的抑扬顿挫、轻重缓急可以表现出说话人的情感、目的和重点。在日常交际中,学习者也常常不仅需要明白对方说了什么,更需要通过对方说话的方式、语气来了解他对某一事件的态度、看法等,对情感态度的正确识别在社会交往中具有重要的价值(傅小兰,2016)。
以往对评估标准的效度验证往往从定量和定性两个方向入手。部分研究者通过定量的方法,大规模运用研制好的评估量表并结合统计分析来验证量表的可靠性(East,2009;Knoch,2009,另一部分研究者则通过定性的方式,针对评分员的访谈、小组讨论来调整评估量表的内容(Harsch & Martin,2012)。Harsch & Martin(2012)认为定量和定性的结合是验证评估量表效度的必要方式。以上研究对量表的验证多为评估二语写作,关于二语口音评估的研究则较少(Isaacs & Harding,2017;Isaacs & Thomson,2013;Yates et al.,2011)。Isaacs & Thomson(2013)考察了评分员的经验和量表的分数类别长度(5 分量表和9 分量表)对二语发音评估的影响,Yates 等(2011)通过对评分员进行评估前和评估后的问卷调查来获得针对雅思口语发音量表的修正部分的看法,该研究认为尽管理论上来说发音和流利度是两个构念,但是评分员在实际的评分操作中很难将二者很好地 区分开来,这说明理论上的两个构念在人的感知中不一定容易区分,这也是人工评估中不可忽略的影响因素。
除了评分员的背景、评估标准的特点,对口语任务的特点和类型的 考察也是对评估标准进行效度验证的重要方面。二语者在不同类型的任务上会有不同的语言表现(In'nami & Koizumi,2016;Pae,2018;Tavakoli, 2009),Tavakoli(2009)发现学习者在半结构式的口语任务上的流利度优于非结构化的口语任务,学习者的口语语法复杂度也受到任务复杂度本身的影响,情节线较为复杂的任务会引发学习者更复杂的口语表达。In'nami & Koizumi(2016)也表明,任务类型会对二语口语和写作评估的分数差异带来影响,任务效应所带来的影响超过评分员背景的影响。由此可见,学习者所参与的任务类型影响其语言表现的维度。在具体的评估过程中,韵律的某一维度可能会在不同口语任务上体现出敏感性,即该维度在某特定任务类型上会占有较高的比重,例如,韵律策略能力在自由表达任务上的重要性可能会超过流利度。或者,在某一口语任务上流利度较难体现,例如,参与朗读任务的学习者的流利度水平可能相差不大。此外,不同的评估维度彼此之间也具有交互影响作用,对于本研究来说,是否需要对韵律能力的评估细化为三个维度也需要探讨,因为在实际运用中需要考虑评估标准的可操作性和运用的便捷性,过细的分类也会为评分员带来不必要的工作量。因此,本研究将从口语任务类型的角度入手,通过16名评分员对三项口语任务的评估来考察:
(1)学习者在不同口语任务类型(朗读篇章、听后复述、回答问题) 上的韵律表现是否有差异?通过对这个问题的探索来验证某种任务类型是否更倾向于检测出某韵律能力维度的优劣,以期为 HSKK 的题型设计提供参考;
(2)口语韵律能力标准的三项维度的贡献权重在不同任务类型上是否有差异?通过该问题探讨汉语学习者的口语韵律能力评估量表是否有必要进一步细化和分类。
3. 口语韵律能力标准在不同口语任务类型上的使用
本研究采用单因素被试内的实验设计考察不同口语任务对三项评估维度的影响,自变量为口语任务类型,为被试内变量,包括三个水平:朗读篇章、听后复述、回答问题。因变量有四个,包括:韵律能力总分、韵律策略能力、流利度和韵律自然度。16 名评分员对 38名学习者在 3 项口语任务的表现进行打分。其中,韵律策略能力、流利度和韵律自然度由 11 名 评 分 员 根 据 Gao & Pan(2022) 所研制的汉语韵律评估标准来评分,韵律能力总分的数据来自另外 5 名评分员,评分员对114份(38x3)语料的韵律给出整体印象分。
3.1 被试本实验的被试为来自上海外国语大学大二、大三和大四的本科留学生,一共 38 名,其中男性 20 人,女性 18 人。参与者来中国的平均时长是 3 年 6 个月,其中来中国时间最短的是 1 年 6 个月,最长的是 5 年 6 个月。参与者的母语背景包括 Igbo(非洲方言)、乌尔都语、日语、亚美尼亚语、韩国语、塞尔维亚语、土库曼语、白俄罗斯语、泰语、乌兹别克语和吉尔吉斯语等 11 种语言。3.2 评分员16 名汉语教师,均为女性,其中13名为汉语国际教育专业的在读研究生,平均教学时长为6个月,另外3名为汉语老师,平均教学时长为 4 年,每名评分员获得100元的报酬。3.3 实验任务三个实验任务分别为朗读篇章、听后复述和回答问题。实验任务在隔音效果较好的教室完成,通过 Praat 软件进行录音。朗读任务是一段未注音文本,共计 151 字,选取的语段并非学习者课本上的内容,朗读之前,给每位被试一分钟的时间浏览文本,然后再进行录音。听后复述任务要求被试听取录音后立即复述听到的内容,听力材料为母语者的一段录音,谈论话题为“选择不是越早越好”,听力材料时长为 36 秒,共计 129 字。播放听力材料时,被试不可以使用任何工具记下录音样本里的内容。播放结束之后,被试需要立即复述听到的内容。回答问题任务要求被试根据问题自由表达,问题是 “ 留学生活中印象深刻的事”,符合被试的生活经验。回答问题之前,给每位被试 3 分钟时间组织语言,任务为不限时的自由表达,回答问题的录音样本仅截取一分钟语段,截取的语段从被试的第一个连贯表达开始,以第60秒时最后一个句子结束。 3.4 评估任务11 名评分员根据Gao & Pan(2022)的汉语二语韵律能力评分量表对 38 名学习者口语语料进行评分,评分包括三个维度(韵律策略能力、自然度、流利度)的分数,评估任务开始前,对评分员做了 15 分钟左右的一对一培训,先由评分员解释他们对评估标准中的描述语的理解,主试根据评分员的理解进一步解释量表中各项指标的具体含义,培训的目的是让评分员对各条描述语有一致的理解,以便评分员准确地评估语料,评分员明确评分标准之后主试播放语料,评分员为每一段语料确定各个维度的分数(满分100 分),11 名评分员在三个维度 (韵律策略能力、自然度、流利度)的评分者间信 ICC(Intraclass correlation coefficients)指标分别为 .90、.91和.91,均在.90之上,信度良好。同时,另外有 5 名评分员不参考上述标准,对学习者的语料进行口语韵律能力总体印象评分(满分 100 分),虽然不为 5 名评分员提供评分参照,但是主试在组织评分前也会和五位评分员明确对汉语学习者韵律能力的具体要求。5 名评分员的评分者间信度 ICC 指标为 .82,信度良好。
3.5 单因素被试内重复测量的方差分析结果
统计分析通过R(4.2.1)(R core team 2022)中的bruceR (Bao,2022)包进行方差分析和多重比较,三项口语任务对韵律能力的影响结果显示(见表1),口语任务类型对韵律能力总分、韵律策略能力、流利度和自然度的影响效应均显著。
这一部分采用回归分析的统计方法,预测变量包括韵律策略能力、自然度、流利度,被预测变量为口语韵律整体印象分。预测变量的数据来自 11 名评分者的打分平均数。被预测变量韵律能力总分的数据来自另外 5 名评分者的打分平均数。预测变量和被预测变量的分数通过 SPSS 26.0 进行多元回归分析。朗读任务的评分研究结果显示所有的变量之间的相关性均是显著的,其中,自然度和流利度与韵律能力总分之间的相关性最高(.86),韵律策略能力和总分之间的相关性最低(.83)(见表 6)。回归分析时,变量间最佳的关系是预测变量间的相关呈现中低度相关,而各预测变量与被预测变量间的相关呈现高度相关。根据表6的相关矩阵可以发现,韵律策略能力、流利度、自然度与韵律能力总分呈显著相关 性(p< .05),相关系数在.83-.86之间。由于各预测变量之间共线性较高 (预测变量之间的相关系数在.90-.98之间),同时,共线性的允差(tolerance)和方差膨胀因素(variance inflation factor)分析均显示三个预测变量之间具有高多元共线性,因此,不再进行多元线性回归模型的模型选择,否则回归所估计的参数值的变异量会变得很大,影响推论统计的结果。因此,我们认为评分者在运用这三个预测变量进行评分时,对这三个预测变量的感知具有较高的相关性,且这四个预测变量均对被预测变量有较强的解释力。
4. 结论与讨论
本文的两个研究问题为:(1)学习者在不同口语任务类型(朗读篇章、听后复述、回答问题)上的韵律表现是否有差异?(2)口语韵律能力的三项维度的贡献权重是否有差异?以下分别展示两个研究问题的结果:
4.1 学习者在不同口语任务类型(朗读篇章、听后复述、回答问题)上的韵律表现差异
尽管学习者的韵律能力整体印象分在三个口语任务中没有体现出差异,但是学习者在回答问题中的韵律策略能力和自然度表现要优于听后复述和篇章朗读,体现出任务效应。具体来看,学习者回答问题的韵律策略能力优于听后复述和朗读篇章,朗读篇章和听后复述之间并无显著差异;学习者回答问题的自然度表现也优于听后复述和朗读篇章,朗读篇章和听后复述任务之间也并无显著差异;学习者在回答问题上的流利度表现优于听后复述,和朗读篇章无显著差异,朗读篇章和听后复述之间也并无显著差异,听后复述的流利度最差。
4.2 口语韵律能力的三项维度的贡献权量
三种类型的口语任务中,三项维度 (韵律策略能力、流利度、自然度) 和韵律能力总分均呈显著的相关性,且三项评估维度之间也具有高相关性,因此本研究没有进行进一步的回归分析。
综合两项研究发现,不同口语任务类型在韵律能力维度上有所倾向,本研究的口语任务是模拟目前的 HSKK(高级)的三种题型设计的,学习者在不同题型上的韵律表现也是不同的。学习者在回答问题中体现出最好的韵律策略能力和自然度,但是如果将韵律能力作为整体去评分,却并不能体现出回答问题的任务效应,这说明如果口语考试看重考生的韵律策略能力和表达的自然度,则需要选择更能体现这两项维度的口语题型,如回答问题,或与回答问题相似的口语互动任务。回答问题对在线认知加工的要求最高,需要先备知识,因此,这个任务是一个更加贴近实际生活、更接近交际问答的口语任务,而韵律策略能力正是交际中不可或缺的能力。因此,学习者在这个任务中能体现出韵律策略能力和自然度。朗读篇章和听后复述对在线认知加工要求较低,朗读篇章没有互动,听后复述虽然有听众的存在,但是并不是有语境的沟通,而是需要复述听力材料,因此,这两个任务的沟通压力较低,无法体现出学习者的韵律策略能力和自然度。
对于是否应该将韵律评估标准继续细化成三项评估维度则需分情况考虑。如果一项考试或者评估任务是诊断性的任务,需要通过测试来给考生提供学习建议,那么,对韵律评估标准的细分则是有必要的。在本研究中,韵律策略能力和自然度需要通过更开放式的口语互动任务来体现,如需对学习者提供这两个方面的诊断建议则需要设计更开放的题型,并让评分员采用细分的标准来进行评估,或者为考生提供更加详细的包含评估描述语的清单(check⁃ list),以促进学习者某一子能力的提高。如果一项口语评估任务是为了鉴定学习者的口语能力,为学习者分级,对于评分员的听感判断来说,学习者口语韵律能力中的韵律策略能力、流利度、自然度主观上较难区分,在评估韵律能力时则不宜继续对其细化分类,以避免评分者的评分疲劳,对评估效率也会造成影响。
在流利度上,回答问题的流利度优于听后复述,与朗读篇章没有显著差异,听后复述与朗读篇章也没有显著的差异。尽管已有研究表明,提前准备(pre-task planning)将会增加口语表达的流利度 (Yuan & Ellis,2003),但是由于朗读文本和听后复述均提供了语言素材,且听后复述的语言难度相较于朗读文本更加简单,而回答问题的准备时间最长(3 分钟),因此,这三项任务在提前准备上并无太大差异,从而体现在流利度上并无差异,如口语考试想要侧重对流利度的考察,则需设计其他题型来侧重关注考生的口语流利度,如与面试官即时互动或者压缩回答问题的准备时间。
未来研究需要在以下几方面进一步展开。首先,关注不同母语背景对口语韵律能力的影响。本研究的被试背景较为复杂,选取复杂母语背景被试的原因是为了考虑该评估量表的生态效度,即该量表是否可以扩展到真实的评估场景中。在真实的评估场景中,教师或评分员不可能只遇到同一母语背景的学习者。但是,二语口语韵律能力与被试母语背景息息相关,不同母语背景的学习者在不同评分维度上是否也存在不同?未来研究应该关注通过考察不同水平、不同母语背景的汉语学习者在口语韵律方面的表现,以此讨论口语韵律能力评估标准在区分水平方面的可行性。其次,进一步探讨二语韵律构念的问题,在本研究中,三个维度的共线性高,可能是评分员在运用该量表时无法主观上区分三项维度,也有可能是学习者的三个维度的构念高度相关,三个维度的构念本身体现在口语表达上有较大的重合,这究竟是评分员听感感知的问题,还是二语口语韵律构念的特点,还是二者兼有之,都是未来值得探索的问题。
作者简介
个人简介:高思畅,女,陕西神木人,语言学及应用语言学博士,硕士生导师。主要研究领域:第二语言习得、二语韵律、二语发音评估。擅长通过实证研究的方法考察汉语作为第二语言的口语能力的发展、习得与评估的问题,主要利用方差分析、结构方程模型、因子分析、多层面Rasch模型等定量统计方法进行数据分析。主要关注以下研究问题:汉语二语学习者口语韵律的发展特征是怎样的?汉语学习者和汉语母语者的韵律切分机制有哪些异同?影响汉语二语学习者的口语发音评估的因素有哪些?
联系方式:sichagao@gmail.com
教育背景:
2017 北京语言大学对外汉语研究中心 博士 第二语言习得
2012 美国罗格斯大学教育学院 硕士 语言教育
2010 上海财经大学人文学院 学士 对外汉语
邹申,1956年生,教授,博士生导师,享受国务院政府特殊津贴。曾任九三学社上海市第十六届委员会委员、九三学社上外委员会主委;教育部高等学校外语专业教学指导委员会委员、英语专业教学分指导委员会副主任委员、国家社科基金学科规划评审组专家。近年来主要从事外语教学法及语言测试研究,曾主持1993、1996 版及2004版高校英语专业四、八级考试大纲的修订工作。目前负责英语专业四、八级考试的相关研究及工作。已发表相关论文数十篇,出版论著及主编教材多本。
本文来源:《华文教学与研究》
点击文末“阅读原文”可跳转下载课程推荐
2024-02-09
2024-02-09
2024-02-08
2024-02-07
2024-02-06
2024-02-04
2024-02-04
2024-02-03
2024-02-02
欢迎加入
“语言学心得交流分享群”“语言学考博/考研/保研交流群”今日小编:的嘞着呢
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd