好文荐读|王璐、刘元满:汉语音位负担与二语者言语可懂度研究
好文荐读(第五十五期)汉语音位负担与二语者言语可懂度研究
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
1. 南京师范大学 国际文化教育学院,南京,210024
2. 北京大学 对外汉语教育学院,北京,100080
文章简介
文章来源:王璐、刘元满.汉语音位负担与二语者言语可懂度研究[J].世界汉语教学,2023,37(04):563-576.
摘要:本文基于《国际中文教育中文水平等级标准》,对汉语音位负担量进行了理论计算,并通过实证研究验证了音位负担之于二语者言语可懂度具有解释力。结合计算所得音位负担序列和学习者普遍性偏误数据,可以将语音难点划分为重点和非重点。可懂度实验结果表明,负担量不同的语音成分和可懂度的相关性不同,二语者在高负担声韵母上产生偏误,对言语理解的影响要大于低负担成分;声调数据未显示出相应特点。研究结果体现了汉语音段音位负担对可懂性导向语音教学的参考意义。
关键词:音位负担;言语可懂度;汉语二语者;语音教学
感谢王璐老师授权推广,全文下载请点击文末“阅读原文”。
一.引言
二语语音教学有两大主要导向,一是母语标准原则(Nativeness Principle),即要求学习者语音要达到母语者的水平,消除所有口音,但母语标准在实际教学中很难达到,绝大部分学习者也无须达到;二是可懂性原则(Intelligibility Principle),在英语成为通用语的背景下,不同母语背景的英语二语者形成了各式各样的外语口音,而口音并不一定妨碍言语理解和交际。外语语音教学逐渐开始倡导可懂性原则,关注真正影响言语理解的成分,这被认为是现代语音教学发展中的重要转向(Munro & Derwing, 1995;Birdsong, 2005;Levis, 2005、2020)。母语标准原则下的研究充分探讨了二语者的语音难点,对其进行纠音和训练,但不同语音成分的重要性并不相同,语音难点不等同于重点,并非所有语音偏差都会影响理解和交际。可懂性原则之下,我们需要重点关注那些影响理解的语音偏差,问题的关键在于:如何衡量不同语音成分对言语理解的影响?音位负担或是一个可行的重要依据。
音位负担的观念最早可以追溯到布拉格学派所强调的音位二元对立,能够测算不同语音成分在系统中的地位(Hockett, 1955:211-212;赵元任,1968:61-63)。音位负担被语音教学重视则在近十余年间,以英语二语为主的不少研究指出音位负担对语音教学具有重要意义(Munro & Derwing,2006;Kang&Moran,2014;McAndrews&Thomson,2017;Rehman et al.,2020;Suzukida&Saito,2021、2022;Alnafisah et al.,2022),目前汉语二语还缺乏相关实证研究。本研究旨在通过计量研究考察汉语音位负担分布,并进一步设计汉语二语者言语可懂度评估实验,探讨音位负担之于汉语二语者言语可懂度的解释力。
二.文献综述
2.1 音位负担的概念与计算
Hockett(1955:211-212)正式提出音位功能负担的概念,定义为音位在语音系统中承担的功能负担量(functional load, FL),它提供了度量语言信息系统冗余度的分析工具。尽管这一概念很早就为人关注,但要提出具体的计算方法并不容易。Wang(1967)首次实现音位功能负担量的算法,为之后的研究建立了基本的理论框架,并指出音位负担是可以量化解释语言演化、历史音变的重要指标。随着语音技术的发展,算法得以不断完善,研究者基于大规模语料库对英语音位进行全面统计(Carter, 1987;Surendran & Niyogi, 2006)。汉语研究者基于《人民日报》语料库对音位功能负担进行了一系列研究(Zhang et al.,2010;Wu et al.,2014;陈月等,2017)。
对音位功能负担量(FL)的计算需要基于大规模语料展开,这在一定程度上造成了算法的局限性。孔江平(2013)根据汉藏语声、韵、调多项对立的特点,提出了新的音位负担(phoneme load, PL)算法。该算法只需利用基本语素,操作便利,适用性广,通过全面统计封闭空间内音节间的对立关系,从而计算语音系统内部的音位结构、音位分布和音位功能负担。本文将在3.1节对具体算法进行说明。
2.2 音位负担与二语语音教学
Catford(1987)、Brown(1988)最早面向二语学习展开英语音位功能负担(FL)的计量分析。通过分析学习者易混淆音位的对立分布,计算音位承担最小对立对数量,Brown提出音位负担等级序列,该序列为之后的实证研究和教学应用打下了重要基础。Munro & Derwing(2006)依据Brown序列对英语二语者语音问题进行等级标注和统计,并进行母语者言语理解难度评估实验,分析发现,高负担等级的音位错误对言语理解的影响更大,首次通过实证研究证实了音位负担对言语理解的影响。Kang & Moran(2014)分析不同水平英语二语者语音发现,高水平二语者依然存在一定比例的低负担音位错误,但不会对言语理解造成影响。之后的研究者考察不同水平学习者、不同言语产出任务的影响,结果进一步验证了音位负担对英语二语者言语可懂度的解释力(Suzukida & Saito, 2021、2022;Alnafisah et al.,2022)。不少研究者指出,音位负担能够为语音测试和教学提供参考。Kang & Moran(2014)指出,语音测试应纳入对音位负担的考量,考虑对不同负担的音位错误赋予不同权重。依据Brown的音位负担序列,可以制定英语语音教学重点(McAndrews & Thomson, 2017;Rehman et al.,2020),并设计针对性的知觉训练(Lee & Hwang, 2016;Qian et al.,2018)。
音位功能负担进入二语语音研究的视野已有一段时间,但已有研究还存在一些可商榷的问题。首先,音位负担不能等同于音位频次,就音位功能而言,重要的不是音位本身,而在于音位间的对立(Surendran & Niyogi, 2006)。其次,汉语作为声调语言,系统中多为二项、三项对立,若仅统计单项对立分布,不能全面体现音位功能。已有研究多为对大规模语料进行的音位功能负担量计算,缺乏面向汉语二语的专门分析,因此,本研究立足《国际中文教育中文水平等级标准》(下称《等级标准》)材料展开计算和实验,以期为可懂性导向下的汉语语音教学提供参考。
三. 汉语音位负担计算
3.1 音位负担计算方法
本研究选取的材料为《等级标准》中的音节、汉字表,包括3000个汉字及其对应的1110个不重复音节,我们选用孔江平(2013)的音位负担算法,有以下两个原因:一是该算法适用于封闭材料,《等级标准》的数据量符合其计算要求;二是避免以往研究仅考量最小对立对的局限性,全面考察包括最小对立在内的多种对立类型,具体包括(1)三项对立:声母、韵母、声调皆不同;(2)两项对立:声母、韵母不同,声母、声调不同,韵母、声调不同;(3)单项对立:声母不同,韵母不同,声调不同;(4)无对立,即同音字数量,是该音节的负担量,可反映音节地位。(孔江平、李永宏,2016)
根据汉语语音特点,本研究中的音位单位采用声母(S)、韵母(Y)和声调(D)。参考李永宏(2016)的处理方法,我们将韵母i区分为舌面元音i和舌尖元音ɿ和ʅ,没有声母以及半元音i、u、ü作为音节开头的情况(对应拼音符号为y, w,yu)处理为零声母,声调中的轻声虽然严格意义上属于语流音变,但考虑到《等级标准》音节表中出现了轻声音节,本研究将其纳入计算范围。
以下介绍负担量具体计算方法。设音节i的同音字个数为T(i),声/韵/调(SYD)三项对立分布有SYD(i)次,声韵调各承担总负担量的1/3;声/韵、声/调、韵/调两项对立分布各有SY(i)、SD(i)、YD(i)次,声母承担SY(i)、SD(i)总负担量的1/2,韵母承担SY(i)、YD(i)总负担量的1/2,声调承担SD(i)、YD(i)总负担量的1/2;而在单项对立分布中,声、韵、调各自承担S(i))、Y(i))、D(i))所有负担量。由此可得,音节i中声母负担量PL_S(i)=T(i)×(SYD(i)÷3+SY(i)÷2+SD(i)÷2+S(i))÷(3000-T(i)),所有音节中相同声母负担量叠加,出现频次为N。可以得到该声母负担量PL_S=∑(PL_S(i))÷N。韵母、声调的计算公式类似。
我们以“bā(八)”为例进行说明,如图1所示,是“bā(八)”与语料中另外2999个汉字的对立关系。其中无对立4项,说明音节bā在总负担量中共占据5个负担量,要计算声母b在音节bā 所承担的5个负担量中占据多少负担量,即声韵调三项对立负担量的1/3,声/韵和声/调两项对立负担量的1/2,以及声母单项对立分布所有负担量相加之和,要计算声母b的总负担量,需叠加所有含“b”的音节中b的负担量。
3.2 音节负担量分布音节是音位组合构成的最小语音结构单位,一个汉字一般对应汉语的一个音节,而一个音节对应的汉字数不定。《等级标准》音节负担量分布及其所属等级如图2所示。
由图2可知,音节负担量呈指数分布(拟合函数:y=238.45e-0.309x),这与李永宏(2016)对《汉语方音字汇》的统计结果呈现的规律基本一致:随着音节负担量逐渐升高,对应的音节数量越少。《等级标准》中1110个音节对应3000字,音节平均负担量为2.70,音节被划分为初中高三等。观察不同等级音节的负担量分布,可以发现音节大纲体现出以下特点:音节负担量越高,初等音节的占比越高,高负担量音节(负担量>10)全部被划分为初等音节,绝大部分高于负担量均值的音节(79.5%)被纳入初等音节;反之,音节负担量越低,初等音节数量占比逐渐降低,中等、高等音节的数量占比逐渐提高。
由表1可知,韵母承担的总负担量最高,声调最低。但就平均负担量而言,声韵调平均负担量比值为1.67∶1∶5.23,声调的平均负担量最高。这与李永宏(2016)的计算结果基本一致,体现了声调在汉语语音系统中对区别意义具有重要作用。正如曹文(2018)指出的,声调的平均负担量最重,表明其在汉语语音教学中的重要性。
(1)声母负担量声母负担量计算结果如图3所示。由图3可知,声母负担量分布并不平衡,零声母负担量最高(127.36),舌面塞擦音j的负担量次之(85.33),舌尖后擦音r的负担量最低(15.59)。参照已有研究的做法(Munro & Derwing, 2006),我们将计算所得声母负担量序列进行二分,前50%确定为重点成分,后50%为非重点成分,具体分组如表2。
3.4 负担量与教学重点分析
依据上述汉语声韵调负担量序列的理论计算结果,我们可以将汉语学习者常见的声韵调偏误分为重点和非重点。
从声母的发音部位来看,舌面音(j、q、x)、舌尖后音(zh、ch、sh、r)和舌尖前音(z、c、s)均属学习者常见偏误(施向东、丰琨,2008;冉启斌、于爽,2019),计算平均负担量可知,舌面音平均负担量最高(66.18),舌尖后音次之(47.83),舌尖前音最低(26.91),体现出舌面音在汉语音位系统中的重要地位。冉启斌、于爽(2019)分析25种母语背景学习者偏误数据指出,舌尖后音r是学习者偏误频率最高的语音项目,其次是舌尖后音zh、ch、sh。由上述分析可知,r的负担量在所有声母中位列最后(图3),可见,从负担量分析结果来看,r的重要性程度并不高,属于典型的非重点的语音难点;而zh、ch、sh均属于重点成分(表2),即语音重点和难点。
我们统计了单元音韵母、复元音韵母和鼻音韵母不同类型韵母的平均负担量,结果发现,单韵母平均负担量最高(42.89),鼻韵母(27.72)和复韵母(26.25)较低,体现出单元音韵母在音系中的地位相对重要。从已有研究偏误普遍性数据来看,舌尖元音i[ɿ]和[ʅ]、复韵母、鼻韵母、撮口呼韵母、元音e以及er音等韵母项目的偏误频率较高(冉启斌、于爽,2019)。依据韵母负担量分组(表3)可知,舌尖元音ʅ、单元音ü和e的负担量相对较高,属于重点和难点;而舌尖元音ɿ、其余撮口呼韵母和er音的负担量相对较低,属于语音系统中相对不重要的难点。
不少研究者就汉语声调的难度进行了讨论:王韫佳(1995)分析非声调的英语母语汉语学习者声调偏误,认为二声、三声难度高于一声和四声;Chen(1997)指出,汉语二语者声调习得顺序为四声、一声、三声、二声;喻江(2007)认为,声调难度从高到低为三声、二声、四声、一声;冉启斌、于爽(2019)从偏误数量绝对值提出声调偏误普遍性序列为:三声>一声>二声>轻声>四声。虽然各家结论并不完全一致,不同声调背景的学习者声调难点也存在差异,特别是声调母语背景的学习者情况尤为复杂,但已有研究普遍认为二声和三声的难度要高于一声和四声,同时负担量也比较高,因此是声调的重点和难点。
以上是依据音位负担量理论计算结果做出的分析,那么学习者在不同语音成分上产生偏误,对言语理解造成的影响大小是否符合音位负担序列的预期呢?下面通过学习者言语可懂度实验进一步考察音位负担和可懂度的关系。四 音位负担与二语者言语可懂度的关系
4.1 发音人及语料收集
为排除学习者母语背景和语言水平的影响,本研究选取了30名日本中级水平汉语学习者为发音人,16名男性,14名女性,年龄为18-28岁,HSK 3-4级,参照《欧洲语言共同参考框架》进行语言水平自评,评估结果为B1或B2。2另有4名汉语母语者发音人录制填充材料。学习者自然口语语料一般有看图说话和命题说话两种形式,看图说话要求不同发音人完成同样的图片描述任务,产出内容相似,易让听音人产生疲劳感,或有练习效应,容易推测出语义,从而对评估结果造成影响(Saito & Akiyama, 2017)。因此,本研究选取的言语产出任务为命题说话,说话人围绕“介绍一个熟悉的人,说说你们一起做过的事情”或“分享一件最近觉得开心或者难过的事情”任选一题进行两分钟以上自由说话。题目改编自HSK真题,话题难度较低,适合中级水平学习者。要求发音人在安静房间内完成任务,正式开始前有三分钟时间进行准备。受新冠疫情的影响,我们以线上会议的形式收集录音,发音人完成任务后会得到一定报酬。
4.2 语料处理、评估及标注
为排除语料中可能出现的词汇、语法错误对言语理解造成干扰,本研究在不影响话语完整性的前提下首先剔除有词汇、语法错误的句子。为了控制语音样本流利度一致,删除了样本中的长停顿(>0.3s)和修正,样本语速范围为2.13—2.33音节/秒之间。处理后的语音样本经10名汉语母语者评估自然度(1-9分),平均得分为8.6。为避免评估过程过长,参照已有研究(Suzukida & Saito, 2021、2022)的做法,我们选取处理后语音前30s左右完整片段作为样本,每个样本长度为63—69个音节。
语料标注由两位语音学专业研究生完成,二人分别对语音样本中的音位错误进行标注,并就标注结果达成一致。音位错误指的是将一个音位发成汉语的另一个音位,比如将p [ph]发成b [p];与之相对的是语音错误,即虽然发音上不到位,但没有将一个音位发成汉语的另一个音位造成音位混淆,比如将h[x]发成双唇擦音[ɸ]。参照已有研究(Munro & Derwing, 2006)的做法,我们将所得声母、韵母负担量序列(图3、图4)中的前50%确定为高负担音位,后50%为低负担音位,由于声调数量较少,将各个声调单独进行计算。表4为语料中出现的各类声母、韵母错误示例。
本研究选择的评估人为30名汉语母语者,普通话水平为二级甲等及以上,年龄为20—25岁,男女各半,均为没有受过语言学专业训练的在校大学生,并报告对日本口音汉语不熟悉。对言语理解的评估一般采用可懂度测试和理解难度评估的方法,前者要求听者进行转写,计算正确率作为可懂度分数,后者是听者对理解话语的容易程度进行评分(Nagle et al.,2019)。前者能够得到精确的量化结果,将二语者言语中难以理解的部分清晰地呈现出来,实验结果可靠性高,是目前最为常用的测试方式。本研究采用言语可懂度测试转写任务,实验在E-prime 1.1软件中进行,被试在安静环境下佩戴耳机,将听到的内容尽可能完整地转录下来。为帮助评估者更好地熟悉实验程序,正式实验开始前设置了练习,包含1个母语者样本、3个学习者样本的测试材料。正式实验部分共有30个材料(27个学习者言语片段,3个填充材料为母语者言语片段),刺激按照随机顺序播放。
4.3 分析结果
我们对各类音位错误分布进行统计,计算出现相应错误的音节数量在音节总数中的占比值。表5是高低负担声母、韵母错误分布情况。
通过对30名评估者的可懂度分数进行一致性分析,得到Kendall’s W系数为0.76,表明其一致性较高,因此可以对可懂度分数取平均值,将所有评估者的平均分作为每个语音样本的最终分数。接着,进一步分析不同负担音位错误量占比与可懂度分数的Pearson相关系数,分析结果见表6。
由表6可知,声韵母错误总量占比、高负担声韵错误总量占比、高负担声母和韵母错误量占比与可懂度分数呈较高的负相关关系,低负担声母错误总量占比与可懂度分数呈低度负相关关系,低负担声韵错误总量占比、低负担韵母错误量占比与可懂度分数不相关。
由于声调数量较少、负担量分布差异较大,我们对不同声调错误量的分布逐一进行统计,计算了包含声调错误的音节数在所有音节数中的占比,结果见表7。可以发现,四声和轻声的错误量占比都比较低,其中,轻声数量本身占比就很低,而四声数量占比最高,且最不易出错;三声的声调数量较之除轻声外的其他声调是最少的,三声的错误量占比最高,由此可见对日本学习者而言,三声的难度是较高的。
进一步对不同声调错误量占比与可懂度分数进行相关性分析,Pearson相关系数计算结果如表8所示。可见,声调错误总量占比和各类声调错误占比与可懂度均没有呈现出显著的相关关系。
五. 讨论
5.1 音段音位负担对汉语二语者言语可懂度具有解释力
从前文对各类负担的声母、韵母、声调错误量和二语者言语可懂度分数的相关性分析结果可以看出,声母和韵母中的高负担量音位与可懂度分数显现出较高的相关关系,体现了高负担量音段音位和言语可懂度的密切关系。这与我们的预期结果是一致的,即语音系统中不同负担量的音位成分对可懂度的影响程度是不同的,音位负担量可以在一定程度上预测这种影响程度的大小。音位负担量之所以对言语可懂度具有解释力,是因为人们对外语口音的感知基于学习者发音和母语者的偏差,但并非所有的语音偏差都会影响言语理解,音位负担量恰恰能够很好地刻画音位在语音系统中的地位高低,高负担的音位承担了更多的音位功能。因此,二语者如果在高负担的音位上犯错,造成信息损失的可能性就大;反之,低负担音位上的错误造成信息损失的可能性较低,对言语理解的影响也就相对较小。这就可以解释不同负担的音位对言语可懂度的影响为何不同。
我们也注意到,属于超音段音位的声调数据分析结果与音段音位的声韵母结果有所不同,声调各项数据与可懂度分数没有显现出相应的相关性。实际上,关于音段与超音段成分之于言语可懂度乃至语音教学重要性的比较,一直是研究者讨论的热点问题,也有过不少实证研究的探索。Pinet & Iverson(2010)、Winters & O’ Brien(2013)、Sereno et al.(2016)对韩语、德语母语的英语二语者进行言语可懂度评估实验,结果一致表明,音段成分较之超音段成分对言语理解的影响更大。张林军(2015)通过英语、日语母语的汉语二语者言语理解和口音感知实验,发现音段和超音段成分都会影响外语口音感知,但对言语理解有显著影响的只有音段成分。可见,大多数研究都指明了音段音位对可懂度的重要性程度更高。另外,不同声调之间的负担量差异较之声韵母内部差异相对较小,这可能也是导致不同声调调位和可懂度数据统计显著性不如声母、韵母的原因。
还有研究者认为,音段成分之于低水平二语学习者更为重要,超音段成分之于高水平二语者更为重要(Lee & Liu, 2012)。可见,学习者的语言水平也是一个重要的影响因素。本研究中,不同声调的负担量差异较之声韵母是相对较小的,这与我们所选取的中级水平汉语学习者的声调错误量差异比较小有关。学习者水平很可能会对语音错误分布与可懂度分数的相关性分析结果造成影响。值得注意的是,本研究所得结论只适用于特定水平、特定母语背景学习者,并不能否认声调对汉语二语者言语可懂度的贡献。我们必须明确,音段和超音段成分的具体影响是与学习者母语和目的语有关的,将音段和超音段成分笼统二分亦不足以深入揭示影响学习者言语可懂度的语音因素,超音段和音段成分的训练在语音教学实践中也是不能截然分开的。5.2 音位负担能够为汉语语音教学提供简洁有力的参考方案
Sewell(2021)曾指出,音位负担之所以具有如此持久的吸引力,是因为它提供了一个足够简洁的视角,可以对包括历史音变、言语可懂度在内的丰富语言现象进行有力的解释。本研究所探讨的汉语音位负担序列能够为汉语语音教学提供有力参考。前文对汉语声韵母音位负担序列的计算结果体现了不同声母、韵母在语音系统中的地位高低,可以反映其重要程度。对于特定母语背景的学习者来说,受其母语语音系统的影响,语音学习的难点分布可能有所不同,但音位负担序列的重要性顺序是适用于所有母语背景的学习者的。也就是说,序列中的语音重点可能对某些学习者来说不是难点,但难点的重要性顺序是相对一致的。
结合本研究所得音位负担序列和对日本学习者语音的分析,我们可以将日本学习者的语音难点划分为属于重点的难点和不属于重点的难点(表9)。在语音教学实践中,着重训练属于重点的语音难点,而对于非重点的难点,它们虽然难度较大,但对言语理解的影响相对较小,在时间有限的教学中,其优先级可以滞后一些。
六.结语
本研究通过对《等级标准》音节、汉字表材料进行计算,就音位负担和二语者言语可懂度做出了理论计算和探索性的实证研究,得出汉语音节和声韵调的音位负担序列,并就语音教学重点和难点进行了理论探讨。对汉语二语者言语可懂度评估实验基本符合音位负担序列的预期。分析不同负担的音位错误对言语理解的影响发现,负担量不同的语音成分和言语可懂度的相关性不同,学习者在高负担声韵母上产生偏误,对言语理解造成的影响要大于低负担成分。
本研究虽然初步明确了音位负担具有一定解释力,但仍存在一些问题需要进一步探讨:(1)扩大考察范围:音位负担作为一个相对新的研究视角,还需扩大学习者的母语背景、语言水平展开进一步研究,来验证音位负担的适用性;(2)细化音位负担分级:为便于实验统计分析,本研究对汉语音位负担序列进行高低二分,未来需要细化音位重要性分级,进而为语音教学提供更精确的参考;(3)开发应用价值:本研究得出的相关结论需要教学实践或相关语音训练实践来验证,以发挥其应用价值。作者简介
个人简介:王璐,北京大学语言学博士,南京师范大学国际文化教育学院教师。主要研究方向为实验语音学、国际中文教育,主要关注语言产生与感知、二语语音习得与教学等相关问题。在《世界汉语教学》《民族语文》《大学图书馆学报》《中国语音学报》等期刊发表论文多篇,曾参与科研项目多项。
刘元满
个人简介:刘元满,北京大学对外汉语教育学院教授,博士。主要研究领域为国际中文教学研究、教材研究及教师教育与教师发展研究。出版《汉字在日本的文化意义研究》《英语日语汉语第二语言教学学科研究》(合著)等专著,主编及作为第一作者出版汉语教材多部。发表论文40余篇。获得项目基金支持如日本住友基金会“日本相关问题研究项目”、国家社科基金项目“汉语作为外语在美国发展的综合研究”、国家社科基金重大项目《面向全球孔子学院的中国概况教学创新研究及其数字课程建设》子项目“孔子学院中国概况教学大纲的创新研制”等。
本文来源:《世界汉语教学》
点击文末“阅读原文”可跳转下载推 荐
2023-11-22
2023-11-19
2023-11-19
2023-11-17
2023-11-16
2023-11-16
2023-11-15
2023-11-13
2023-11-13
2023-11-11
2023-11-10
2023-11-08
“语言学心得交流分享群”“语言学考博/考研/保研交流群”
今日小编:三 金
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd