查看原文
其他

基于印欧语系语言的词汇丰富性指标可以预测汉语二语者的写作质量吗?

郝瑜鑫、金子涵 计量语言学
2024-09-03
最近小编在查阅语料库时,看到条语料,“我的妈妈很漂亮,我的妹妹也很漂亮”“我的妈妈既漂亮又善良,妹妹很可爱。”如果你作为评分人员,你会给哪位考生更高的分数呢?小编选择第二位(不知道大家会选谁呢)!小编觉得,相较于前者,第二句话使用了更多样化的形容词,而不是重复地使用“漂亮”。给人的感觉就是第二位学习者所掌握的词汇更丰富,并且能够恰当地运用。

要知道,词汇在语言中的地位可是不能小觑的。英国语言学家威尔金斯(Wilkins)认为:“没有语法,能表达的东西很少;没有词汇,则什么也不能表达。”可见,要想成功地习得第二语言,掌握大量的词汇是必要的前提之一。在写作中,要想得到评分员的青睐,获得更高的分数,我们可能还要关注产出文本的“质量”。

词汇丰富性(lexical richness)是词汇质量研究的重要内容。Read2000)认为,使用富于变化的词汇、与话题或情境有关的高级词语、相对较多的实词、较少的词汇错误,能够体现学习者的词汇使用能力。他提出考察词汇丰富性的四个维度,词汇多样性、词汇复杂性、词汇密度和词汇错误。词汇丰富性不仅反映学习者语言产出中词汇运用的丰富程度,也体现学习者语言表达中词汇知识的质量。研究发现,词汇丰富性是学习者总体语言水平的预测因素之一,是学习者写作和交际的重要指标。

此刻,我们联想到一篇文献:Liang & Liu2013研究发现七种语言的名词比例大约在31%-34%之间。可见,名词比例的规律性不仅存在于一种语言内部,而且具有跨语言的普遍性。基于上述研究,我们不禁思考:针对印欧语言的词汇丰富性理论和指标是否也适用于其他语言的研究,比如汉语?郝瑜鑫等2023年发表于System的文章“To predict L2 writing quality using lexical richness indices: An investigation of learners of Chinese as a Foreign Language”,对该问题进行了探讨。

这项研究探讨了 44 种基于印欧语系语言的词汇丰富性指标在汉语中的适用性,重点研究了这些指标对汉语二语(CFL)学习者写作质量的预测能力。

研究发现了一些有趣的结论,有些指标对于不同的语言有同样的适用性,而有些指标则可能更适用于测量某一种语言

具体来说,词种数、Uber指数、词频概貌等五项指标既能有效预测印欧语系二语的写作质量,也是测量汉语学习者写作质量的有效指标。动词多样性、助词比率、代词比率等六项指标能有效地预测 CFL 学习者的写作质量,但可能不适用于英语。作者还发现词汇多样性、词汇复杂性和词汇密度分别可以解释16.5%34.6%13.1%汉语学习者写作质量变异。

综合考虑三个维度的指标对写作质量的预测效果时,发现共有18个指标可以解释39.1%的写作质量变异,达到了本研究的最大效应量。这表明研究不应局限于单一视角,应从多个维度去考察二语学习者的写作质量

这些结论背后的原因是什么呢?作者指出,尽管英语和汉语分属于不同类型的语言——屈折语和孤立语,在形态变化方面存在明显差异,但词种数是两种语言文本中都存在的语言现象。且这项研究控制了文本的长度(词种数会受到文本长度的影响),从而确保了该指标预测的可靠性。

此外,这项研究还发现有些指标可能更适用于测量汉语二语,比如两项动词多样性指标,究其原因,可能是因为英语和汉语动词之间存在的差异。刘丹青(2010认为就汉语与英语比,汉语明显接近动词型语言,汉语中动词的作用比英语中动词的作用更加重要。汉语句子经常使用多个动词,英语句子一般仅用一个谓语动词,多用非谓语动词形式、名词形式或其他词类。这是由于英语动词有形态变化,有非谓语动词形式,而汉语是孤立语,动词没有严格意义上的形态变化。并且,在汉语中,常用的句式有连动式、兼语式、流水句,这种句式都包含两个或两个以上的动词。比如:他着石头河(He crosses the river by feeling the stones)、大家经理(Everyone chose her to be the manager),表达同样的意思时,英语句子一般只保留一个谓语动词。

助词比率也被证明是预测汉语学习者写作质量的有效指标。然而,Connor1990)和Ferris1994)发现,高级英语学习者在写作中倾向于使用更多的介词,这可能是由于英汉之间的类型学差异造成的。正如 Nida1982)所指出的,形合和意合可能是英汉之间最显著的语言差异。英语强调形式上的连接,经常使用介词来实现句子之间的连贯,而汉语强调意合,句子之间主要通过语义连接。此外,汉语作为孤立语,主要通过功能词和词序来表达语法意义。具体来说,汉语句子的时态通常通过动态助词(如着、了、过)来表达。此外,汉语有大量的语气助词(如啊、呢、吧)。

研究还发现代词比率与写作质量呈负相关,表明代词用得越少,学习者的作文得分越高。与英语不同,汉语不是一种主语突出的语言,很多时候并不需要主语,通常根据上下文省略,而英语似乎强调短语或句子结构的精确性和连贯性。以往的研究发现,英语中代词的使用频率远远高于汉语,且二语学习者在构思句子时倾向于使用其母语。在写作的早期阶段,学习者很可能受到其母语的影响,导致代词的过度使用。随着水平的提高,学习者逐渐掌握汉语作为话题型语言的类型学特征,在写作中减少代词的使用,从而获得更高的分数。

小编觉得这些发现好有趣啊!同一个指标对于不同的语言具有适用性,而基于不同语言的特征,某些指标可能更适用于一种语言的测量。作者是通过何种方式得到这些结论的呢?小编已经迫不及待地想要一探究竟了!欢迎各位点击“阅读原文”下载全文。


继续滑动看下一个
计量语言学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存