查看原文
其他

好文荐读|曹娜、曹贤文:汉语二语学习者主语回指语显隐的多因素分析

曹娜、曹贤文 语言学心得
2024-09-03


好文荐读(第101期)汉语二语学习者主语回指语显隐的多因素分析

好文荐读不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~




汉语二语学习者主语回指语显隐的多因素分析
曹娜1 ,曹贤文2

1. 南京大学文学院

2.南京大学海外教育学院 / 中国语言战略研究中心


文章简介

文章来源:曹娜,曹贤文.汉语二语学习者主语回指语显隐的多因素分析[J].语言教学与研究, 2024, (2): 24-34.


摘要:本文依托全球汉语中介语语料库,采用多因素分析方法考察了初、中、高级汉语二语学习者使用主语回指语的显隐现象。分析结果显示:除了汉语水平对二语学习者主语回指语的显隐具有显著影响以外,字符间隔距离、句式平行性、先行词句法位置、指称生命度、名词短语间隔距离、回指距离(句子)、回指距离(小句)等因素也对二语学习者主语回指语显隐具有显著影响,且这七个因素的影响权重不同,不过回指距离(段落)与关联词两个因素对主语回指语的显隐没有显著影响。

 

关键词:主语回指语显隐; 多因素分析; 中介语语料库; 汉语水平

感谢《语言教学与研究》授权推广,全文下载请点击文末“阅读原文”。

一. 引言

根据回指语的形态,汉语中的回指语可分成显性回指语与隐性回指语两类,显性回指语包括代词回指与名词回指,隐性回指语即零形回指(陈平 1987;Almor 1999;徐秀玲 2020)。根据以往研究(周晓芳 2011)和笔者观察,二语学习者在使用汉语进行语篇表达时,更倾向于在每个句子的主语位置上使用名词或代词,较少使用隐性回指语,这与汉语母语者的表达差异甚大。

关于汉语回指语的选择及其影响因素,学界展开了一系列研究。如:Li(1985)和Chen (1986)指出回指距离会影响回指语的显隐;陆振慧(2002)从指称生命度的角度对比研究了英汉语篇中的回指语现象;蒋平(2004)、许余龙等(2013)均指出先行词的句法位置会影响回指语 形式的选用。也有一些学者对二语学习者的回指语习得情况进行了研究,如:焦阳(2004)考察了 初、中、高级水平且母语为英语的二语学习者汉语隐性回指语的使用比率。李姝姝(2020)对已有研究进行归纳时指出,汉语学习者即便到了高级阶段,对零形回指使用不足的情况仍存在。

从过往研究可以发现,这些研究虽然涉及到探究影响学习者回指语显隐的因素,而且关注到语言本身的因素会影响回指语形式的选用,不过采用的是内省式与单因素分析方法,这种单因素分析方法,一般只关注其中某个因素或某个方面,还缺乏从多种影响因素的角度,综合分析二语学习者使用汉语回指语的规律。

本文在前人研究的基础上,将初、中、高级水平的二语学习者主语回指语显隐作为研究对象,通过标注语义、句法、语篇等多个层面的因素,采用多因素分析方法,尝试探索以下两个问题:

(1)在二语学习者的汉语书面表达中,主语回指语的显隐受到哪些因素的影响? 各因素的影响权重如何? 

(2)不同汉语水平的二语学习者对于选择显性或隐性主语回指语的倾向性是否存在显著差异?



二. 研究设计


2.1 语料来源

本研究依托“全球汉语中介语语料库”,以“语篇”为条件,剔除华裔学习者的作文和以对话形式呈现的作文,从该语料库中随机提取出初、中、高级每个等级的学习者语料分别2万字左右,共约6万字语料。鉴于学习者的汉语水平不同,语篇长短有所差异,其中2初级水平学习者的作文共65篇,中级水平学习者的作文共5 篇,高级水平学习者的作文共44篇。


2.2 标注方案

在语义层面,陈平(1987)和陆振慧(2002)的研究均论证了在汉语语篇中,指称对象的生命度是影响回指语显隐的一个重要因素。在句法层面,句式平行和句中使用关联词都是影响隐性 回指生成的重要因素。朱勘宇 (2002)、蒋平(2004)和许余龙等(2013)研究都论证了在汉语语篇中,句法层面的因素会影响汉语回指语的生成。具体的影响因素为先行词的句法位置、句式平行与句中含有关联词在语篇层面,Li(1985)和 Chen(1986)都讨论了先行词和回指语之间的距离(回指距离) 对回指语显隐的影响,句中若采用的是隐性回指语,先行词通常位于回指语同一小句或前一小句中。回指距离越大,越倾向使用显性回指。本文采用许余龙(2004:181)的划分方法,将回指距离分为段落、句子与小句三个维度进行测量。语篇层面有多个制约回指语生成的因素,如,回指距离(段落)、回指距离(句子)、回指距离(小句)、名词短语间隔距离、字符间隔距离。除了语言结构本身的制约因素外,部分学者还指出学习者的汉语水平也是一项重要的影响因素。徐开妍、肖奚强(2008)和周晓芳(2011) 的研究显示,初、中、高级水平的学习者均存在回指语使用不足的问题,即便到了高级阶段,隐性回指语使用不足的问题仍然存在。语言的各种复杂因素会制约回指语的显隐,包括上述语义、句法、语篇等多个层面的制约因素,以及学习者的汉语水平等。本研究参照上述研究成果,共确定了语义层面、句法层面、语篇层面与学习者语言水平等10项影响因素,根据这10项因素制定多因素分析和标注方案,具体如表1所示。



2.3 语料标注

依据表1中的标注方案,对语料进行人工标注。下文对语料标注进行举例说明。

1)主语回指语

本文所指的回指语均为主语位置上的,并且所有的回指均为句间回指。

例(1)中,零形回指是位于宾语位置上的回指,不属于本文研究范围,在本研究中将其排 除。例(2)中,第二个“我”为显性回指,虽然处于嵌入小句的主语位置上,但其属于句内回指,因此也排除。例(3)中,零形回指位于句子主语位置,先行词是“我”,且属于句间回指,因此该例可纳入本文研究。


2)指称生命度

例(4)中先行词是“天气”,零形回指语所指的对象为“天气”,属于“无生”,标注为0;例(3)中,先行词是“我”,零形回指语指称的对象是“我”,属于“有生”,则标注为1。
3)先行词句法位置例(5)中“他”属于显性回指语,先行词为“我的父亲”,其语法位置为主语,因此标注为 0;例(4)中的先行词为“天气”,其语法位置既不属于主语,也不属于主语领属语。根据标注方案,属于“其他”,因此标注为2。
4)句式平行性

例(6)中先行词为“一个东西”,前后相连的谓语小句句法结构相同,该例属于句法平行,根据标注方案,标注为0;例(7)中先行词为“北京的风景”,后面的结构都以副词“简直”开头,前后是平行句法,因此根据标注方法,标注为0。
5)关联词

例(8)中先行词是“我”,前后相连的句子由关联词“只有...才...”相连,根据标注方案,应该标注为0。


6)字符间隔距离

例(9)中先行词是“朋友”,第二个小句用的是显性回指语“他”,与先行词之间隔了9个汉 字字符,因此标注为 9;第三个小句用的是显性回指语“他”,与先行词之间隔了15个汉字字符,因此标注为15。


7)名词短语间隔距离

例(10)中先行词是“我父亲”,第二个小句用的是显性回指语“他”。先行词与回指语之间间隔了1个相关名词短语“我母亲”,因此标注为1。
8)回指距离

对于回指距离的测量,参照Givón(1983:14)提出的“回数法”。如:话语中碰到一个显性回指语“他”,从“他” 所在的句子开始往回数,这个句子不计算在内,一直数到先行词所在的句子为止。这样我们就能算出两者之间的距离。如前文所述,本研究具体测量回指距离时需数出回指语与先行词 之间间隔多少段落、句子、小句。如例(10)所示,先行词为“我的父亲”,第一段第二句的第一小句使用了显性回指语“他”,回指距离为0个段落,1个句子,1个小句。第一段第二句的第二小句使用的是隐性回指,先行词是“我的父亲”,回指距离为0个段落,1个句子,2个小句。第二段第一句使用的是显性回指语“他”,先行词仍是“我的父亲”,回指距离为1个段落,2个句子,3个小句。


根据上述标注方案与标注方法完成所有语料的标注,最终得到的语料数量共1157例,具体如表2所示。



三. 统计模型与结果解读


3.1 确定统计模型

基于统计模型的多因素研究在语言学研究中应用的时间不长,各类统计模型的应用具有探索性,逻辑斯蒂回归(logistic regression)、决策树(decision tree)和随机森林(random forest)是多因素分析(multifactorial analysis)常用的三种模型(房印杰 2016)。 

为了保证统计结果的科学性与有效性,本研究首先使用上述三种模型对数据进行拟合,然后通过比较三种模型的受试者工作特征曲线(Receiver Operating Characteristic Curve,简称 ROC曲线)来确定本研究最终采用的统计模型。为了更加直观,通常直接比较受试者工作特征曲线下的面积(Area Under the Curve,简称AUC值)的大小来评判其拟合度。


如图1、图2和图3所示,逻辑斯蒂回归模型的AUC值为0.91,决策树模型的AUC值为0.86,随机森林模型的AUC值为0.88。比较三个模型的AUC值,逻辑斯蒂回归模型拟合的效果最优,其次为随机森林,最后为决策树。通过ROC曲线的验证,逻辑斯蒂回归模型最适合本研究,故下面采用逻辑斯蒂回归模型来进行多因素分析


3.2 逻辑斯蒂回归建模

将数据导入R语言软件的操作平台R Studio中,通过模型处理和训练后,构建起第一个逻辑斯蒂回归模型,模型的统计结果如表3所示:



由表3可知,模型1中的回指距离(段落)、关联词两个因素不显著;先行词句法位置这个因素在主语领属语这一水平上不显著。根据模型简洁性的要求,需要删除模型1中不显著的因素再次对数据进行建模,构建第二个模型,得到第二个模型的统计结果如表4所示:



根据表4可知,模型2中的所有因素均有显著影响。然后,对模型1与模型2进行卡方检验(Chi⁃square test),得到的p值为0.67,模型1与模型2无显著差异。根据模型简洁性的要求,模型2为最优模型。接着,我们对模型2的拟合度进行验证。模型的C值与模型的总体分类准确度是衡量模型拟合度常用的两个指标。模型2的C值为0.93,大于0.8,分类准确度为0.85(994/1157),高于基准分类准确度0.64(743/1157),证明模型2对数据的拟合度较高,具有较好的分类和预测能力。



 根据表5可知,初级水平的调整截距值大于零,即初级水平的学习者更多使用显性主语回指语;中级水平与高级水平的调整截距值小于零,即中级水平与高级水平的学习者更多使用隐性主语回指语。


四. 分析与讨论

4.1 固定效应结果与分析

本研究中的固定效应指的是语义、句法、语篇等层面的使用特征对汉语主语回指语显隐机制的影响效应。观察表4中的p值可知,汉语二语学习者在使用汉语进行书面表达时,主语回指语显隐受多个因素的影响,具体如下:指称生命度、先行词句法位置、句式平行性、字符间隔距离、名词短语间隔距离、回指距离(句子)、回指距离(小句)。

进一步观察表4中的回归系数可以发现,各因素的影响权重有所差异:当回指语与先行词之间相隔的汉字字符越多,使用显性回指语的发生比(odds)是使用隐性回指语的26.4088倍; 当语篇中不是平行句式时,使用显性回指语的发生比是使用隐性回指语的7.1299倍; 当先行词位于除主语与主语领属语以外的其他位置时,使用显性回指语的发生比是使用隐性回指语的3.1015倍; 当指称对象为有生命的人或动物时,使用显性回指语的发生比是使用隐性回指语的2.1695倍; 当回指语与先行词之间相隔的相关名词短语越多,使用显性回指语的发生比是使用隐性回指语的2.1569倍; 当回指语与先行词之间的距离为句子时,使用显性回指语的发生比是使用隐性回指语的1.7398倍; 当回指语与先行词之间的距离为小句时,使用隐性回指语的发生比是使用显性回指语的1.2917倍。


综上,各因素的影响权重由大到小排列依次为:字符间隔距离>句式平行性>先行词句法位置>指称生命度>名词短语间隔距离>回指距离(句子)>回指距离(小句)。 

  1. 当语篇中回指语与先行词之间相隔的汉字数量越多时,学习者显著更多使用显性回指语;
  2. 当语篇中句式不平行时,学习者显著更多使用显性回指语;
  3. 当先行词句法位置是除了主语和主语领属语的其他位置时,学习者显著更多使用显性回指语;
  4. 当指称生命度为有生时,也就是指称对象是人或者动物时,学习者显著更多使用显性回指语;
  5. 当语篇中先行词与回指语之间相隔的相关名词短语越多时,学习者显著更多使用显性回指语;
  6. 当回指距离为句子时,学习者显著更多使用显性回指语;
  7. 当回指距离为小句时,学习者显著更多使用隐性回指语。


本研究发现,字符间隔距离对回指语显隐有显著影响,即当回指语与先行词之间间隔的汉字字符数量越多时,二语学习者更多使用显性回指语。通过回溯学习者语料发现,在二语学习者的语篇中,回指语与先行词之间的间隔在10个汉字以内时,学习者更多使用隐性回指语; 回指语与先行词之间的间隔超过10个汉字时,学习者更多使用显性回指语。字符间隔距离是本研究中影响权重最大的因素,这反映了二语学习者在使用汉语回指语时,受回指语与先行词之间间隔距离影响的权重很大。从深层次看,说明二语学习者在使用汉语回指语时受人类基本认知规律的影响。焦阳(2004)、周晓芳(2011)等前人研究也指出,汉语学习者在使用隐性回指语时,零形回指与先行词间的距离一般较短。

名词短语间隔距离有显著影响当回指语与先行词间隔的相关名词短语越多时,二语学习者更多使用显性回指语。许余龙(2003)对民间故事语料进行研究时发现,有五分之四的隐性回指语与它最近的先行词中间没有其他相关名词短语。即在民间故事语料中,当先行词与回指语之间没有间隔其他的名词短语时,会更多使用隐性回指语。二语学习者在使用汉语回指语时,同样会受先行词与回指语之间是否间隔其他名词短语的影响

回指距离(句子)与回指距离(小句)均有显著影响,当回指距离为句子时,二语学习者更多使用显性回指语; 当回指距离为小句时,二语学习者更多使用隐性回指语。Chen(1986)、蒋平(2004)等以往研究也指出,当回指距离为句子时会促使显性回指语的生成。许余龙(2003)对民间故事语料中的零形回指的篇章分布进行研究时发现,先行词与回指语之间的间隔距离为小句时,语篇中易生成零形回指。通过回溯学习者语料发现,在二语学习者的语篇中,显性回指语与先行词之间的间隔距离大多集中于1个句子或2个句子,隐性回指语与先行词之间的间隔距离大多集中于1个小句

本研究证实了句式平行性对二语学习者回指语显隐机制具有显著影响,并进一步发现,若句式不平行时,二语学习者更多使用显性回指语。从影响权重来看,句式平行性仅次于字符间隔距离。这一研究结果表明二语学习者在使用回指语时,除了受先行词与回指语远近的影响较大,句法因素的驱动也不容忽视。朱勘宇(2002)对汉语语篇中零形回指的产生规则进行总结时认为,平行句式有利于零形回指的生成,也就是若相邻句的句法结构相似,易生成零形回指。

先行词句法位置对二语学习者回指语的显隐具有显著影响,并且进一步发现当先行词位于其他位置时,二语学习者更多使用显性回指语。说明二语学习者在使用回指语时同样会受到先行词可及性的影响。蒋平(2004)、徐秀玲(2020)发现,当先行词位于主语或主语领属语的位置时,可及性高,回指语倾向选择零形式;当先行词位于其他位置时,选择零形回指的概率要低于主语或主语领属语。

本研究发现,指称生命度这一因素对二语学习者回指语形式的选择具有显著影响,不过二语学习者在指称有生命的人或动物时,更多使用显性回指语。陆振慧(2002)认为,汉语指称对象生命度会制约回指形式的选择,隐性回指常用于指称有生命的人或动物,而指称无生命的事物或概念多用显性回指。本文的研究结果与陆振慧(2002)的结论不一致。通过回溯学习者语料,笔者发现学习者语料中大量出现显性回指中的代词回指,很多应该使用隐性回指的地方使用了显性代词回指。周晓芳(2011)对叙述语篇中的回指习得研究也发现,汉语二语学习者的一项典型偏误为大量使用代词回指。二语学习者使用汉语回指语可能会受到其他语言因素的影响。如: 陆振慧(2002)指出,在使用人称代词时,英语中的用例比率明显多于汉语。不能忽略的是,汉语隐性回指的复杂性以及二语学习者对于隐性回指使用规则掌握不足也都是导致其大量使用代词回指的原因。尤其对于初中级水平的汉语学习者来说,很难掌握隐性回指的使用规律。因此,二语学习者在涉及指称生命度这个因素上使用显性和隐性回指语时,可能还受到了多重复杂因素的影响。

如前文表3所示,回指距离(段落)、关联词两个因素对二语学习者使用显性主语回指语和隐性回指语没有显著影响。回指距离(段落)这个因素的数据整体上分布不均匀。通过进一步分析语料发现,二语学习者的作文篇幅通常较短,尤其是初级水平学习者的作文,大多为一段或者两段,文中几乎不会出现段落回指。虽然中级水平学习者的文章篇幅较长,但是其文章也大多集中在三段左右,很少会使用段落回指。高级水平的学习者会使用段落回指,但使用的频率也不高。因此,回指距离(段落)不太适合预测初、中级水平学习者的回指语显隐规律

从关联词的数据分布情况来看,学习者语篇中使用关联词的频率很低。刘亚男(2021)对 HSK动态作文语料库的语料进行检索时发现,由于学生采用了回避策略,尽量避免使用关联词,作文中关联词所占比例不大。因此,关联词这个因素不显著的原因可能受学习者回避策略以及汉语关联词本身的复杂性等因素的影响。


4.2 随机效应结果与分析

本研究中的随机效应指的是汉语水平对汉语主语回指语显隐产生的影响效应。从表3的统计结果可以发现,不同汉语水平的二语学习者使用显性和隐性主语回指语时存在显著差异。

如图4所示,学习者的汉语水平与显性和隐性回指语的使用呈现相关关系。中级水平学习者与高级水平学习者的截距值均小于零,表明更多使用隐性回指语,并且高级水平学习者比中级水平学习者的倾向性更明显; 而初级水平学习者的截距值大于零,表明其更多使用显性回指语。学习者的汉语水平越高,越倾向于使用隐性回指语


综上所述,本研究依托全球汉语中介语语料库,采用多因素分析方法,考察了影响二语学者主语回指语显隐的因素

统计结果发现,二语学习者对显性和隐性主语回指语的使用并非任意的,受多个因素的制约制约回指语显隐的显著因素,按其影响权重大小依次为: 字符间隔距离>句式平行性>先行词句法位置>指称生命度>名词短语间隔距离>回指距离(句子)>回指距离(小句)另外,不同汉语水平的二语学习者对于显性和隐性主语回指语的选择是不同的,初级水平学习者更多使用显性回指语,中、高级水平学习者更多使用隐性回指语,呈现出学习者的汉语水平越高越倾向于使用隐性回指语的规律


作者简介


曹娜女,安徽安庆人,南京大学博士研究生,研究方向为应用语言学、国际中文教育,电邮: caona1022@163.com 。







曹贤文

个人简介:曹贤文,男,安徽安庆人,博士,南京大学海外教育学院教授、中国语言战略研究中心研 究员,兼任世界汉语教学学会理事、世汉学会教师发展专业委员会副主任委员、南京师范大学博士生导师、北京语言大学语言资源高精尖创新中心特聘研究员。长期在国内外从事一线教学和研究工作,发表学术论文50余篇,出版专著、教材等多部。近年来,主持国家社科基金、教育部人文社科基金、教育部哲学社会科学研究重大攻关项目子课题、国家汉办重点课题等多项。研究方向为应用语言学、国际中文教育,电邮:xcao@ nju.edu.cn。


本文来源:《语言教学与研究》

点击文末“阅读原文”可跳转下




推  荐



好文荐读|李宇明、梁京涛:语言数据的生产要素功能与产权制度构建

2024-05-21

好文荐读|罗琼鹏:名词融合与复杂谓词的形成

2024-05-12

好文荐读|马瑞祾、徐娟:国际中文写作智慧教学模式构建与应用探索

2024-05-10

好文荐读|熊仲儒、郭霞:“把”字句中功能范畴的句法语义作用

2024-04-30

好文荐读|马秋武、翟海莹:动态语音教学:国际汉语语音教学的有效手段

2024-04-26

好文荐读|李先银等:汉语互动语言学研究的新进展

2024-04-22

好文荐读|陆俭明:人工智能语言模型ChatGPT不会影响人类的修辞知识生产范式

2024-04-20

好文荐读|曹友谊、张洁:国际组织语言政策研究综述

2024-04-14

好文荐读|江新等:词间空格对汉语母语者和二语者拼音文本阅读的影响

2024-04-10

好文荐读|尉薇:基于多维聚类的语体研究热点与发展趋势探赜

2024-04-06


欢迎加入“语言学心得交流分享群”“语言学考博/考研/保研交流群”


请添加“心得君”入群务必备注“学校/单位+研究方向/专业”

今日小编:young

审     核:心得小蔓

转载&合作请联系

"心得君"

微信:xindejun_yyxxd

点击“阅读原文”可跳转下载
继续滑动看下一个
语言学心得
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存