查看原文
其他

【大百科词条(稿)】语言采样

王健 今日语言学 2021-05-02

语言采样

英文条头:Language Sampling

学科主编:刘丹青

分支学科:功能—认知语言学和语言类型学

分支主编:张伯江   副主编:金立鑫 束定芳


类型学研究中对语言样本所进行的采样和选取。类型学的研究需要跨语言、跨方言甚至跨时代的视角。语言采样对类型学研究非常重要。但是,因为研究者不可能搜集到人类所有语言的相关材料,所以语言采样也一直是困扰语言类型学家的一个大问题。


虽然类型学目前还无法建立一个包括所有人类语言的样本库,但类型学家还是根据已有的数据并根据不同的研究目的,构建了不同类型的样本库。


第一种是“概率样本库(probability sample)”。如果研究目的是为了验证某种统计趋势(比如是否倾向采用某种语序或者某种形态策略)和不同语言特征的相互关系,类型学家可以建立这种“概率样本库”。它选取的语言特征有限,但特别重视语系和地域分布的平衡。


第二种是“多样化样本库”。它重视提供某种语言特征(语言参数)在人类语言中的最大程度的变化(maximum of variation)。这种类型的样本库必须尽可能多地包含各种变体。所以,即便是亲属语言,有密切接触关系的语言,只要在语言特征上有不同的表现,就收入样本库。


第三种是“便利型样本库(convenience sample)”。这种样本库的建立取决于研究者能够得到什么样的材料。有时对研究很重要的某种语言或者方言因为缺乏足够的调查,只能忍痛割爱。在建立“便利型样本库”的时候,虽然无法获得所有希望得到的语言材料,但还是要尽可能地考虑样本语言在亲缘和地域分布上的平衡。


类型学研究的目的是通过考察不同语言差异之极限来探求人类语言的共性。所以,作为研究基础的语言样本库一定要保证一定的语言数量;而且,在建立“概率样本库”和“便利型样本库”的时候还要考虑到这些语言在语系、地域、文化等方面的分布。为了使样本库中的语言材料更有代表性和说服力,国际语言类型学界主要采用三种建立语言样本库的方法。


第一种方法是建立基于比例的代表性样本库(proportionally representative sample),代表是Tomlin(1986)。建立样本库的过程大致为:研究者在每个语系和每个语言区域中都挑选一定比例的语言进入样本库。这样做的结果就是,大语系的语言在样本库中的绝对数量要超过小语系语言,以此为基础的统计结果难以平衡。


第二种方法是建立独立语言样本库(sample of independent languages)。按照这种方法建立的样本库中的语言在亲缘关系和地域分布上距离越远越好,唯有如此才有代表性。这种方法的好处是可以排除历史等非语言因素的干扰,更能体现语言特征的某种倾向性。不过,有些地域的语言,不管其亲缘关系如何,由于其处于长期互相接触、影响的状态,形成了很多共同的区域特征。这样的语言区域可能非常广阔,包括的语种也可能非常多,这时如何挑选有代表性的语言就成为一个难题。


针对以上两种方法存在的问题,Matthew Dryer(1989;1992)提出了新的建立语言样本库的技术路线。第一步是确保语言基因的平衡(genetic balance)。做法是,把所有语言分配到322个类(genera)中去。每个类中包含的语言都可以追溯到大概2500年以前的共同祖先。比如罗曼语言类中就包括拉丁语、西班牙语、法语、意大利语等不同的语言。第二步是确保样本库中的语言在地域分布上的平衡。做法是,根据地理分布将世界分为五个区域:非洲、亚欧大陆、澳洲和新几内亚、北美以及南美。然后把每个类分别分配到五个区域中去。比如罗曼语类和日耳曼语类都在亚欧大陆这个区域内;除此以外,这个区域中还有一些语类不属于印欧语类,比如芬兰—乌拉尔语类(包括芬兰语、爱沙尼亚语、匈牙利语等)。第三步就可以决定某种语言特征跨语言的分布是否具有统计上的显著趋势。做法是,选定某种语言结构特征,考察它在不同的语言类中是否存在。如果在所有五个区域中的大多数语言类中都能发现这项特征,那么我们就可以说这项特征代表了显著的共性趋势。


Dryer的方法也有不足:某种语言在亲缘上(或者说在基因上)属于哪个类(genus)不是一目了然的,许多语言到底该归为何类还存在争议。


参考文献:

Bakker, Dik 2011 Language Sampling  In Song(ed.):100-27. Oxford University Press.

Dryer, Matthew S. 1989 Large Linguistic Areas and Language Sampling.   Studies in Language 13:257-92.


Dryer, Matthew S. 1992  The Greenbergian Word Order Correlations. Language 68:81-138.


Greenberg, Joseph H. 1966 Some Universals of Grammar with Particular Reference to the Order of Meaningful Elements.  In Greenberg (ed.) 1966:73-113.

Greenberg, Joseph H. (ed.) 1966  Universals of Language (2nd Edition). MIT Press.

Moravcsik, Edith A. 2013 Introducing Language Typology. Cambridge University Press.

Song, Jae Jung (ed.) 2011 The Oxford Handbook of Linguistic Typology. Oxford University Press.  

Tomlin, Russell S. 1986 Basic Word Order: Functional Principles. London: Croom Helm.

Velupillai, Viveka 2012 An Introduction to Linguistic Typology. John Benjamins Publishing Company.

Whaley, Lindsay J. 2009 Introduction to Typology. 世界图书出版公司& Sage Publishings, ING.

(王健)

相关阅读

【大百科词条(稿)】语言类型学

【大百科词条(稿)】格林伯格

【大百科词条(稿)】认知语言学

【大百科词条(稿)】否定类型

【大百科词条(稿)】构式语法


>>>中国社科院语言所网信室编辑

今日语言学 


语言之妙    妙不可言


 


长按指纹,识别加关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存