查看原文
其他

罗仁地Nature评论:汉藏语系语言的起源和扩散

语标 2021-03-18

小编有话说:

     近期"语标"公众号推出系列文章(请戳当语言学遇见Nature语言学家热议《自然》汉藏语系起源!潘悟云从语言学角度评论与解读Nature首篇大陆语言学文章全文翻译| Nature首篇大陆语言学研究:汉藏语起源于新石器晚期中国北方的谱系发生学证据)热切关注了此次语言学迎来了新突破,今天又带来了新的福利。本文以更为精密的有力计算方法为汉藏语系语言起源于中国北方和约在5900年前开始分化为不同语族的观点提供了有力证据。借助不同的方法,从不同角度来研究语言的起源和发展,为我们拓宽了研究的视野!

 长久以来,有关汉藏语系语言起源的时间及地点一直都饱受争议。从世界范围来看,汉藏语系语言拥有近15亿使用者,是仅次于印欧语系的世界第二大语系。一种观点认为汉藏语的祖语(原始汉藏语)起源于大约四千至六千年前的中国北方[1],[2],另一种观点则认为原始汉藏语起源于九千年前的中国西南部或印度东北部[3],[4]。



 张梦翰及其同事[5]发表于《自然》期刊的一篇论文有望解决这一难题。他们从众多学科中收集了有关汉藏语系语言及其使用者的证据,包括发生学、计算生物学、语言学、考古学以及人类学等,同时还考虑到了农耕文化发展进程及其在特定区域内对人类移民的影响,然后运用概率测试法对建立于上述证据的语言谱系树进行了评定。


 历史语言学通常使用一种叫“比较法”的方法来判定语言之间的亲属关系。语言学家通过寻找不同语言中的同源词(即不同语言中有着相近意思、因此在早期原始祖语中具有共同来源的词),来试图解释为什么这些词现在看起来不再相同,比如它们的语音经历了哪些变化,词形附加了哪些成分,以及是什么导致了所使用的词在相关语言中有了不同的意义(在某些情况下)。例如,英语中的cow(奶牛)和法语中的boeuf(牛肉)同是由原始印欧语中词根为*gwou-(星号“*”表示原始构拟形式,连字号“-”表示它是一个可形成许多不同词语的词根)[6]的同源词族的一部分分化而来,这个结论已在印欧语系语言学的相关研究中得到了证实。通过了解语言的这些基本和共通的变化,就可以帮助判定语系分化为不同语族的方向,比如印欧语系分化为罗曼语族、日耳曼语族以及斯拉夫语族等。


 另外,通过借助具有同源关系的某些词,以及结合来自其他领域的证据,有助于对语言与人类迁徙和人类文化萌芽的关系作出推测。此外还有助于确定某一原始祖语使用者的最初居住地,了解该人群及其语言开始分化、形成不同语族语言的时间范围。但是历史的多变性通常将我们引入窘境,由于迁徙往往是错综复杂的,不同语言和文化间存在频繁接触,拌以其他社会学因素的影响,想要识别出一个与语言历史准确对应的谱系树可谓困难重重。对相同数据的不同解读可能会导致研究者生成截然不同的谱系树,而对某种语言则可能推导出不同的语言起源和扩散模式。即便是能够接触到许多可用数据,但是要评判定语言亲属关系的所有可能性也是极其困难的。


 现代计算机技术使得处理大批量数据和快速计算成为可能。最初服务于生物科学研究、使用了一种叫做“贝叶斯系统发育模型”(Bayesianphylogenetic modelling)概率测试模型的软件同样可以运用到语言学中。这个软件能够对可得数据中计算出的多种可能的语言谱系树提供测试,进而确定不同语言里可能性最大的谱系树和可能性最大的语言分化时间范围。


 张梦翰及其同事致力于汉藏语系研究,该语系包含了数百种语言,其中包括汉语、藏语、缅甸语等,也不乏许多使用人数较少的语言。作者采用了“汉藏语系词源辞典”(Sino-Tibetan Etymological Dictionary and Thesaurus,见go.nature.com/2uombqo)在过去30年间搜集的同源词词条作为数据基础进行计算,而不像过去的研究那样选择了还未被证实为同源词族中的词随机进行比较,这一关键点使得张梦翰及其同事的研究结果大大区别于那些不够牢靠的结论。


作者在使用语言本体数据进行研究的同时也融入了其他像人类学等学科的知识,通过运行数百万次的迭代运算,发现了现代汉藏语使用者的祖先最有可能的居住地,以及随着某些早期汉藏语使用者从该居住地往外迁徙时,汉藏语系语言最有可能开始分化的时间及其形成不同语支的时间范围。同时,作者还确定了最具可能性的汉藏语系语言谱系树,以及最能反映实际语言关系的谱系分支结构。张梦翰及其同事就汉藏语使用者居住地起源的两种对立的观点进行了比较,结果显示原始汉藏语起源于黄河流域(图1),也即现今的中国北方,其分化时间应为大约5,900年前。该区域与当时黄河流域的仰韶文化,以及之后的马家窑文化(以仰韶文化为背景的人向西迁移而形成的一种文化圈)息息相关,这些文化圈都有着像陶器、丝制品、家畜驯养习惯,以及大面积固定住所等典型的文化标志。


该文的研究结果表明:在汉语和藏缅语进一步分化为更小的语支之前,这两个语族已经由原始祖语经历了一次主要的分化。这个结论与当今认为汉语和藏缅语并非形成于一个上位的原始祖语,认为诸多语族形成于同一时间的观点截然不同。此观点认为汉语族语言并不形成一个独立于其他语言的主要分支,而通常被称为藏缅语族的语言也不应该归于一个独立的语族。


张及其同事的研究在诸多方面都有着显著的重要性。由于汉藏语系语言研究的历史不及印欧语系语言那么长,相比之下,对某些核心观点的研究也都还处在尚未确定的阶段,正如汉藏语系语言的起源等议题。所幸的是,张及其团队的研究就这一关键性问题做出了更牢靠的解释,在此基础上其他研究者可更为深入地探讨汉藏语系语言的历史关系。同时,该研究还帮助建立了语言学研究与其他学科之间的联系,比如考古学和历史学等。


汉藏语起源位置图示


 张梦瀚及其同事使用了汉藏语系语言(现今15亿人使用)相关的数据来进行分析,通过概率测试得出了汉藏语起源和分化的结果为:与现行的模式1(见上文脚注)一致,汉藏语的原始祖语大约于5,900年前起源于中国北方黄河流域[7]。他们指出,汉藏语的起源及最早的分化分别与仰韶文化及马家窑文化有关(阴影部分表示文化圈所在的位置)


[1]参看罗仁地(LaPolla, R. J),《区域传播及发生学:比较语言学中的问题》,Aikhenvald, A. Y. & Dixon, R. M. W.编著,牛津大学出版社,2001,225-254页。

[2]参看Bradley, D. 第十届演化语言学国际研讨会,南京大学,2018.go.nature.com/2udgyy9

[3]参看van Driem, G. 《跨喜马拉雅语言学》,Owen-Smith, T. & Hill, N. W.编著,2014, 11-40页。

[4]参看罗仁地(LaPolla, R. J),藏缅语族区域语言学,第39期,282-297页,2016。

[5]参看张梦翰,严实,潘悟云,金力,《自然》https://doi.org/10.1038/s41586-019-1153-z(2019)。

[6] Buck, C.D. 《印欧语系主要语言同义词选词典》,芝加哥大学出版社,1949年。

[7]参看Li, L. & Chen, X,《中国考古学:从晚期旧石器时代到早期青铜器时代》,剑桥大学出版社,2012年。

赵日新:语言不是任人打扮的小姑娘|大家小文

孙德金:应当持有一种多元语法规范的理念|大家小文

周有光:天网恢恢,早已没有网外桃源 | 大家小文

于根元:新词新语是词汇这棵大树枝端的嫩芽 |大家小文

“盘他”符合词汇规范吗?周祖谟谈词汇规范四大问题|大家小文

音韵学为何被称作绝学?赵元任多角度谈音韵规范|大家小文

叶圣陶:普通话使全国各族人民心心相通,毫无阻碍|大家小文

普通话也挺够味儿!吕叔湘谈推广普通话|大家小文

本期责编:祝天瑞

语言风向标


请留下你指尖的温度

让太阳拥抱你

记得这是一个有温度的公众号

         




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存