查看原文
其他

趣 谈|汉语到底有多少“亲戚”?


首先,我们先看看几个冷知识降降温:


  1. 语言和文字是两码事,同系文字可能语言上毫无关系,同系语言可能文字完全不同。

  2. 世界上绝大多数的文字,无论看着多吓人——都是“拼音”而已。

  3. 文字也会反作用于语言,除了影响词汇,甚至会影响音系。

  4. 日语、韩语在源头上和汉语没半毛钱关系;英语却和伊朗波斯语、印度印地语等同源。

  5. 一门语言里可能会超过一半都不是自己的词汇,包括我们熟知的英语。



1.


汉语在世界上到底有多少“亲戚”?



首先,我们上一张图,列出以下一串语言中,表示“回家吃饭吗”怎么说?

图 从上到下依次为“日语、韩语、越南语、缅甸语、藏语”。


  • 问,以上哪门语言,和汉语属于同一“语系”?


相信以人均985的水平,大部分人觉得这题太简单了。不过我相信肯定有不少小伙伴暗搓搓的选择了第一项的日语,有的可能会加上个韩语、越南语。



  • 在语言学意义上来说,和汉语同一语系的,却是最后两个看起来完全不像的——缅甸语藏语
  • 这到底是咋回事?那堆鬼画符是啥?这语言学家脑子是瓦特了么?



那么,我们先不用汉字,我挑了一些词汇,把以上所有语言都写成拉丁字母,让大家再扫一眼
图 拉丁字母转写的五门语言的七个词汇,有的我根据读音略加调整了下。

就算不仔细看,大家也能明显的发现,所有语言中,属越南语最像汉语,其次是韩、日两门语言,尤其部分南方小伙伴可能感同身受。

而最不像的就是老长一串的缅、藏两语了,那么语言学家为啥还要把后两位列为汉语的“血亲”,并创造了一个“汉藏语系”呢?

那么我们就再来看一张图——从1到10的数字,在五门语言中怎么读?
图 拉丁字母转写的五门语言的数字词,同样略根据读音调整了下。

到了这里,我们会发现一种截然不同的状况,尤其是南方小伙伴,你会发现缅、藏两语却酷似中文方言,而前三个反倒面目全非了。

为什么同样两组词汇,在这五个语言中,和汉语的关系会出现截然相反的效果呢?


  • 我相信,这时候一定会有人和我说——你胡说!我咋记得日语的数字是:ichi、ni、san、shi、ngo,不是和汉语很像么?——还会有人说,对!我也听过韩语,他们的数字是:il、i、sam、sa、o,也不是你写的那玩意啊?


其实,这就引出我们下面要说的两个问题了


  1. 语言和文字是两码事——同种文字可以是截然不同的语言,同系语言也可以是截然不同的文字
  2. 文字也可倒逼语言——无论是否亲缘,A语采用B语文字,多半因文化落差或政治落差而起,往往会出现大量的借词现象。



首先,就是大家都很喜欢的日语和汉语的关系,这个我之前有个答案已经详细说了,这里就不细讲了

如何评价「日文里有汉字,没学过也能大概看得懂」这类说法?


  • 如果你懒得看这个,或者打算留在之后看,我可以拿韩语说明一下同样的问题


先来上一个文本:

광명성-3호 2호기 위성 발사성공——12월12일 평안북도 철산군 서해위성발사장에서 운반로케트 은하-3호를 통한 광명성-3 호 2호기 위성의 발사가 성공했습니다. 위성은 예정된 궤도에 진입했습니다.                       

那么这段话什么意思呢?我们先不翻译,换上另外一个韩语写法:

光明星-3號 2號機 衛星 發射成功——12月12日 平安北道 鐵山郡 西海衛星發射場에서 運搬로케트 《銀河-3》을 通한 《光明星-3》號 2號機 衛星의 發射가 成功했습니다. 衛星은 豫定된 軌道에 進入했습니다.

是不是基本上不用我翻译了? 

之所以选取这段话,就是因为,这句话除了使用朝鲜语的语法、若干助词,所用词汇基本都为汉语借来的汉字词,写成拉丁注音应该是这样的

图 新闻稿拉丁注音版本。

你看看,一段新闻稿,真正的韩语词(粗红)连凤毛麟角都算不上,除此外,还给你加上个来自于英语“火箭(rocket)”的词汇“로케트(loketeu)”(绿色部分)——剩下的内容主体,全都是汉语词。

不仅如此,大家都熟悉的韩语打招呼

阿娘哈塞哟“안녕하세요(an nyeong ha se yo)”   以及谢谢——康桑阿米达“감사합니다(gam sa hab ni da)”。

其实都应该写成“安宁하세요”以及“感谢합니다”

是的,阿娘、康桑,其实是“方言感”的——安宁感谢


  • 那么韩语真的算是汉语的“方言”了么?自然不是,因为除了“安宁”、“感谢”外,韩语还留着“哈塞哟”和“阿米达”,这都是妥妥的固有语法;也正如上图所示,虽然韩国人大多数时数数用的是“il、i、sam、sa、o”这样的“汉语方言”读音,但仍不影响人家有着hana、tul、se、ne、taseo这样的固有词。



更别说韩语的语法是典型的黏着语,往往用:“主语+宾语+助词+动词+黏着后缀”这样的语法,也就是和日语一样   “你滴、花姑娘滴、有?你滴、什么滴、干活正在?”  这样的语言特征,和汉语也存在本质区别。


所以,就算韩语在2000年中国文化优势下,文化上大量采用汉字,政治上多为附庸的情况下,已经拥有高达6成以上汉字词汇,却仍不属于汉语的“汉藏语系”,而是一种孤立语言的原因。

那么如果韩语里拥有这么多汉字词,现在韩语里那些勾勾圈圈的鬼画符是啥呢?

其实,这玩意完全就是一套拼音系统每一个结构都是表音的,大致是这样

图 韩语的基础辅音和元音,以及以“大韩民国”举例的拼写方式,和汉语一样,也拥有声母、韵母、韵尾三个组成部分。


相信到了这,大家对韩语这门语言的认识更具体之外,也能对“语言”、“文字”、“固有词”、“借词”等概念有了一个大致的了解了。

其实,韩语的这套系统又被称作“谚文”,是由朝鲜李朝国王李祹推广的一套拼音扫盲系统(训民正音),历史不过500多年前,相当于我们的明朝,而这位大神因为庙号世宗,又被称为“世宗大王”

然而就在当时,就有大量士族大力反对,比如朝鲜大儒崔万里就称:

“我朝自祖宗以來,至誠事大,一遵華制,今當同文同軌之時,創作諺文,有該觀聽—用音合字盡反於古……若流中國,或有非議者,豈不有愧於事大慕華”。

“自古九州之內,風土雖異,未有因方言而別爲文字者,雖蒙古西夏女眞日本西蕃之類各有其字,是皆夷狄事耳無足道者,未聞變於夷者也

歷代中國皆以我國箕子遺風,文物禮欒,比擬中華 —今別作諺文,捨中國自同於夷狄是所謂棄蘇合之香而取螗螂之丸也,豈非文明之大累哉”。

我们可以看出,朝鲜一直以来的文化圈,都以中华文化为尊,以小中华自居,甚至不惜自认朝鲜语为“方言”—所以整体来说,这套文字系统一直也没登上大雅之堂。真正彻底取消汉字,被定为朝鲜(韩国)官方文字,已经是北朝金日成时代,南朝80年代之后的事情了。

不过,这套文字到底是咋创制出来的呢,我个人比较接受的说法,是受到了蒙古八思巴文的影响,以及朝鲜人根据发音特点、汉字体例综合发明的产物。
图 八思巴文的k、t、p、s、l和朝鲜谚文的k、t、p、s、l对比。

那么八思巴文是个啥玩意呢?

我们终于要说到我们片头提到的小兄弟—藏语了。

蒙古人在彻底灭亡南宋,占领3/4的亚欧大陆后,落后的文化基础和其占领的先进文明们产生了巨大冲突,尤其在文字角度来讲,你说人家中原人,可以让日韩这些八竿子打不着的语言使用汉字

蒙古语文字却还是不久前成吉思汗让维吾尔国师塔塔统阿搞出来的回鹘字母,这种系统连表述蒙古文都并不精确,认读困难,更别说其他语言了。


图 回鹘蒙文,源自叙利亚字母书写系统,字母只有辅音无元音,和阿拉伯字母同源,为竖写方式。

于是,当年作为蒙古汗国总部的元朝,当然希望创造一种可以描写帝国内所有语言的文字系统,那么谁来担此重任呢?

如果你看过神雕侠侣就会知道,一个西藏大喇嘛金轮法王在蒙古人那里吆五喝六。

实际上,就在蒙古帝国进入到忽必烈汗时期,藏传佛教(萨迦派)就随着来自西藏的国师八思巴被封为法王后,迅速成为元帝国的第一教派。八思巴虽然没有大金轮子,却为蒙古带来了一种能够书写蒙、汉、维等若干语言的文字系统——八思巴文。


图 元代八思巴文字母系统,元音a时只写辅音不另标元音。

于是,终元一朝,八思巴文都是官方文字——比如这个“大元通宝”


图 大元通宝上的八思巴文,其实就是“拼音”版的汉语。

虽然八思巴文到了元朝灭亡后,就连蒙古人都不用这玩意了,但作为大元帝国统治下的“国际音标”之尝试,可谓是人类文明中的先河。

不过,这么好玩的一个玩意,到底是哪里来的呢?

别忘了,八思巴可是西藏的金轮(划掉)法王啊。


图 藏文辅音,八思巴文就属于方体的藏文字母。

藏语字母同样是辅音为主的字母,不标注的就是a元音,这一点和八思巴文是一样的。

那么其他元音该怎么标呢?——其实更简单

图 藏文元音系统,为辅音字母上的辅标符号——如上图辅音为“ka”,则1为ka、2为ki、3为ku、4为ke、5为ko。

总之,藏文的本质,同样是一套拼音体系。

而这套体系,同样有母系统——没错,和干净又卫生的印度三哥有关——一个极为广泛的字母体系——婆罗米字母


图 印度古文字婆罗米字母分化成的现代字母。(注:天城文乃如今印度印地语的官方文字。)

关于这套书写体系,相信大家能看到一个很直观的现象,除了藏文之外,它的圈圈极其之多,尤其是南印度系统以及东南亚系统,基本上已看不到直线。

实际上,北印度古代抄写文字,除了石碑外,大多是写在一种较厚的树叶“贝叶”、或者桦树皮上写就的,这一类材料纹理固定,直角转折太多书写困难,所以笔画多为圆形。

因为不像中国的方块字,也没有过竹简这样的天然对齐工具,所以在书写时一般沿着横向脉络写,多带有“上基线”、“右衬线”等结构以整齐美观,比如如今的印地语天城体——“देवनागरी”。

图 北印度的贝叶经。

这一系列文字中,也就是藏文乐意在纸张、动物毛皮上书写,所以用不着瞎画圈,和民族主义无关,我至今也觉得藏文字母是这套体系里看着最顺眼的。因为等到了南印度就更麻烦了。

在那个炎热的地区,书写材料大多为脆弱的棕榈叶、芭蕉叶,就连本来的基线、衬线都会一写就破,所以一种纯粹的勾勾圈圈字体诞生。

这一类字体衍生出大量的后代时,又传入东南亚,从如今缅甸一带开始,成为缅文 、高棉文(柬埔寨)、 泰文、老挝文等一系列圈圈鬼画符文字的谱系。

图 缅文、老挝文、泰文、高棉文等字母体系对比,虽然和印度字母已相差不少,当仍为辅音主体,元音标注体系。

说到这里,你应该会发现了,这看起来难懂的藏文,以及奇葩的缅甸文,只不过借用发展了源自印度的书写系统,他们的语言,很可能并非如此。

当然,也确实不是如此——如今的藏、缅两族,即便是从生物学意义,也是源自于青、甘、川一带的古老民族“古羌人”,和中国的汉族同源同种。

图 汉藏语族群的起源和分布。

那么我们就来看看语言上——三门语言的底层词汇显著的同源关系

比如缅语的眼睛都城“mjak”,和汉语的“目”同源,缅甸语表示可能为“nong”,和汉语的“能”同源,缅甸语的返回为plan,和汉语的“返”同源等。

还有如下的对应关系
图 构拟的上古汉语同藏、缅语同源词的比较。

要知道,这些词可都是一个语言最基础的“底层词汇”,包括大家都听说过的藏语“尼玛”,其实就是“太阳”的意思,这个读音和上古汉语的“日、母”(njiɡ、maːʔ)即同源,所以你用尼玛骂人,原则上没啥问题,且颇具上古遗风。


  • 从这里你也能看出,上古汉语的面貌极其奇怪,它拥有大量的复辅音、辅音韵尾等成分,是现代汉语早就消亡掉的,不过在汉字中你仍能找到复辅音的蛛丝马迹
  • 比如“监”、“蓝”同声旁,却分别为“jian(中古音为gam)”以及“lan”
  • 再比如“格”、“洛”同声旁,却分别为“ge”、“luo”



实际上,监的上古构拟读音,正是 klams;各的上古音,为klaɡ——虽然你觉得这玩意看起来外语一样,但目前也成为了学术界的共识。

总之,这种复辅音在历史演变中,竟然分化出俩辅音各留下一个的结果,这才有了监蓝、各洛这样的神奇现象。

虽然下面这段配音略无厘头,但用的是郑张尚芳先生构拟的上古汉语读音,听个感觉还是没问题的。

                             
       
         


  • 那么问题来了,文章开头那些“高科技”词汇中,缅、藏两门语言怎么又那么复杂,差别那么大呢?



没错,这些词汇,不少都来自梵语、巴利语等印度语言。

比如缅甸语的社会、化学、生物学、经济学,分别为lhuaahpwalaahcaee, dhartubayd, jewabayd, hceepwarrrayy等,都来自于巴利文(通俗梵语),你咋看这都和汉语差太远了。

这一点在藏语中也非常常见,尤其在古代藏、缅语言中,高级词汇大量和佛教相关,佛教词汇又都是梵语、巴利语等,所以印度之于藏缅,颇似中文之于日韩。

只不过,在近些年来,藏语中的汉语借词大量增加,某种程度上,也是两位远亲同胞的殊途同归,这里就不细说了。


如果说作为大陆最东侧的朝鲜、日本等国,只能以中国为中心汲取先进文明的话,对于东南亚地区可就绝不是如此了——我们可以看下使用婆罗米系字母的地区。

图 婆罗米系字母分布。

在以上地图中,你会发现以印度为中心,东南亚地区都大量受到婆罗米系字母的辐射,除缅甸外,泰国、老挝、柬埔寨等主要以佛教为信仰的国家,无论文字、词汇都大量被印度系语言置换。

那么在这里我们又出现了两个问题,我们已经说了缅甸语是从中国西南跑过去的“亲戚”,那么老挝、泰国又是什么呢?


  • 而且放眼上图,你会发现,在整个东南亚地区,还有这么几块没被“婆罗米化”的“净土”存在。
  • 分别是更遥远的菲律宾、印尼、马来西亚外,以及下面要讲的“越南”了。


这些语言都有着什么关系?和汉语又有没有什么关系呢?


2.



越南语到底是哪里来的?和中文有关系么?



我在学越南语时,不止一次遇到有人问我,这玩意是不是和“粤语or闽南语or客家话”很像?

但我相信,全中国任何一个地方没学过越南语的人,除了广西越南交界海岛上的“京族”人外,都不可能听的懂这个歌词,那是因为,越南语其实是个和汉语毫无关系的语系——孟高棉语系

孟不孟且不说,这个“高棉”相信有人略有耳闻。当年柬埔寨曾经有过一个奇葩的政权“红色高棉”。其中的高棉,正是柬埔寨主体民族的称呼,相当于“中国”和“汉族”的感觉。

也就是说,越南人的越南语,在语言学上,和柬埔寨的“高棉语”是亲戚关系,那么柬埔寨高棉语又是个啥感觉呢?



  • 别看现在柬埔寨经济不咋样,国土也狭小,郭德纲说个“柬大毕业”都能逗别人一笑——这个国家的历史,其实曾有过巨大的辉煌——如今你看到的东南亚,曾经大部分都是人家的。



图 高棉帝国极盛时期疆域。

高棉帝国的首都叫做吴哥,你们现在看到那个著名的“吴哥窟”,就是这一王朝的遗址。其实,高棉人自古以来,就是东南亚地区的扛把子,不仅如此,和他拥有亲缘关系的西侧的孟族,也才是缅甸真正的原住民,这才是“孟—高棉”的由来。



  • 那么这么厉害的一个扛把子,现在咋混成这样了呢?


首先,就是西侧的孟族,就在高棉帝国全盛时,从云南一带杀过去的汉藏语系民族。听起来就很彪的骠人占领缅甸,将孟族边缘化为少数民族,建立“蒲甘王朝”

图 从缅甸(蒲甘国)运往重庆和黄石的物资被扣住啦!

后来,因为云南大理国的压力,一支彝族南迁,骠人又被这群同属汉藏语系的“同胞”战败,这一支彝族,就是如今缅甸的主体民族“缅人”,这才有了我们前面所说汉、藏、缅同源的故事。

那么高棉人的下场又是啥呢?如果你看一下那张地图就会发现,当年的高棉是包括泰国、老挝两国的,高棉最终的结果,正是被“泰人”占据了绝大部分的领土。

但如果说到这个泰人的来源,就不得不提到一个中国境内经牛x闪闪的族群——百越了。

图 百越、百濮两个族群集团的曾经分布位置。

首先图里最显眼的,就是这个被我们称为“百越”的族群,他们的分布也很好玩,基本是靠着海岸线一圈,也是如今中国经济最发达的地区。

其实,在秦汉两代的耕耘下,本分布在浙江温州一带的东瓯越、福建的闽越、广东的南越都被逐渐同化,只剩下广西、云南一带山区的“西瓯越人”依旧坚挺,直到如今。

他们是谁呢?没错,就是如今的广西壮族

而广西壮族使用的壮语有亲戚么?当然有,但并不是离他们很近的越南,而是泰、傣等语言,两种语言的近似程度极高,可以说等于“方言”关系,我一般称之为“壮傣语”(学术界叫壮侗语或侗台语)。


图 壮语和泰语的对比。

而根据那个构拟上古汉语的郑张尚芳先生对我们记载的古越人音译词汇的研究,也基本坐实,所谓“百越”,基本上都是壮—傣系语言的民族,他们在中国南方的阵地丢失后,本来只能盘踞在广西贵州云南山区。


  • 然而,在当年大理国被灭后,一支壮傣人受到蒙古人压力,南下投奔了高棉帝国,没想到却成了农夫救下的蛇,他们在高棉遇到大洪水和干旱等天灾时迅速崛起,最终占领高棉人大部领土,高棉只得迁都金边偏安一隅,成为如今可怜的柬埔寨的前身。
  • 而本来在大陆上已经十分边缘化的“百越人”,却由泰人的带领下,在东南亚找到了新的天地,成为了“泰国”的前身。


那么孟高棉人就是自古以来的东南亚土著么?其实现在一般认为,整个孟高棉系民族,应该是本分布在云贵川高原一带的族群,我们称之为“百濮”,上古重庆的“古巴国”、“夜郎自大”的贵州夜郎国,云南一带的哀牢国,都有着从屈原《天问》中就记载百濮的“沉木化龙生子”传说。

“水滨之木,得彼小子”——“女岐无合夫,焉取九子?”

那么,远在中国西南的百濮人,是怎么分布成为东南亚的民系的?我们还是看下地图

图 百濮民系的迁徙,最惨的就是沿着长江进入湖北江西的,很早就被楚国干掉了。

孟高棉人的分布不同于百越,他们同样在春秋战国的楚、以及后来秦汉的压力下,开始逐渐向南分布迁徙,迁徙路线基本是通过怒江、湄公河、红河等河流顺流而下的,所以怒江一带有了缅甸的孟族;湄公河有了高棉族;而红河一带,就是我们所说的越南京族了。


  • 比起后来被缅人驱赶的孟人、泰人驱赶的高棉人,红河这一支的孟高棉民族却非常持续——他们早期和大量西瓯越人融合,被中原政权称为——雒(luò)越人,不过正如我们所说,他们虽被叫越,却不是说壮傣语的“百越”人——这就是如今越南人的祖先


雒越人的命看似很不好,因为没多久他们就成了秦始皇“南取百越之地”顺手搞掉的存在,成为了中原政权的一部分——一直到了1000年后的五代、铁血大宋

当然了,在铁血大宋的时代,任何一个政权都是可能独立的,以大宋的本事,能把中原保住都已经算超额完成任务了。至此,越南正式脱离中国。

要知道,越南北部地区,可不是“中国附属国”这样的存在,而是实实在在郡县制管辖下的中国领土,和河南、河北都毫无区别的那种。

所以,正是这1000多年的时间,让中原文化彻底的渗入到了这个族群的骨血中,甚至就像广东广西一样,这里也形成了“城市精英阶层说汉语,农村大众说少数民族语言”的基本状况。

客观的讲,如果越南直到如今还是个“越南京族自治区”,那么他们应该已经变成如下差不多的样子了。

总之,在越南独立后,当地的越南语开始迅速从农村包围城市,逐渐替换掉本来已经大量使用官话的上层。

好玩的是,与之对立的是一直作为附属国或完全独立的云南地区,先后经历滇国、爨氏、南诏、大理等政权后,随着蒙古人彻底扫平大理段氏,终于让云南地区彻底归入中国,成为了一个省——和河南、河北也没有区别的那种。

我看你是不想让我大理帮忙了。

所以,云南地区迅速接受了川、贵一带的汉语北方方言——西南官话,成为了就算北京人过去都能交流的地方

图 整个东南亚,或者说“中南半岛”——还有另外一个词,叫“印度支那半岛”——它本身就是印度怼中国屁股时,形成纵向的横断山脉后,“大山在大海里的一个延伸”,所以在地理上来说,云南其实更多属于“东南亚”这个地理单元。

当然,因为复杂多山、多河谷的地理环境,加上本身就存在的“孟高棉”、“壮傣”、“汉藏”等民系的分布,终究导致面积不大的东南亚,难以走向一个统一的国家。

总之,越南孟高棉系的京族人,终于建立了属于自己的国家,说上了自己的语言,最此时的越南语——则早就和那个柬埔寨的烫嘴复辅音无声调语言相去甚远了。


3.


中国人最好学的语言是什么?“声调”是中文独有的么?



神奇的是,越南语保守估计,也有70%以上的词汇是从中文借来,而表示专业术语高级词汇更是近9成都来自于汉语,越南人称之为“汉越词(Từ Hán Việt)”。

举个最简单的例子,越南河内的胡志明纪念堂前,有这么一串字。


图 越南胡志明纪念堂广场上的标语。

这句话打出来,是——nước cộng hòa xã hội chủ nghĩa việt nam muôn năm 

那么这里面有多少是汉语呢?

nước 共和社会主义越南 muôn năm

其中nước 是国家的意思,muôn năm是“万岁”的意思,除了这两个写成拉丁字母的是越南固有词,关键部分的“共和社会主义越南”,都是汉字词。

你看,越南的英语“vietnam”,其实就是汉语词“越南”的越南读法,一个国家的国号,都用了汉字词。当然,不仅越南,韩国(hangug)、日本(nippon)的国号也是汉字词。

不过到了这里,我相信你一定有个疑问,这个越南语的语法,怎么这么怪?

是啊,上面那句话的语法,乃是“国 共和 社会主义 越南 万岁”,发现没,形容词全都跑到后面去了,你只要把万岁前面的部分倒过来,就通顺了。

其实,这不是越南人标新立异,而是整个孟高棉语,都是一种“形容词后置”语法的语言,所以越南语的核心语法,至今也没“汉化”,保持着自己的说话方式。

就比如,越南语的“女人”为Người phụ nữ,其中Người 是“人”的意思,后面的phụ nữ就是“妇女”两字;再比如“越南语”,写成tiếng viẹt ,其中tiếng 就是“语言”的意思,而viẹt则是“越”这个汉字。

也就是说,越南人和日本一样,也曾长期使用汉字、汉语书写文书,直到你看到的这套拉丁字母体系的出现。


图 同志们,没文化多可怕。



  • 估计有不少人听说过,越南近代曾被法国长期统治,有人也会想当然的认为,这套体系是来自于法国人的构建。实际上,这套体系历史颇为悠久,大约在400年前时,就已经由去越南传教的葡萄牙传教士,为了给底层百姓书写小册子,用拉丁字母搞出了这么一套“扫盲”系统



后来,从法国人到来后——第一本用拉丁字母做成的越南语字典,标志着拉丁越文的正式诞生。


图 越南第一部拉丁越文词典。


然而,就算法国人大力推广这个被称为“国语字”(Chữ Quốc Ngữ)的书写系统,越南本土文化阶层对此也有保留意见,所以法国的总督也曾颁布条令——

“国语字的推广,对我们与本地人之间的关系扩大更加容易。”

“在所有的公文、行政证件、身份证中,国语字和汉字并行使用。——因为汉字任何时候都是必需的,用它来维系家庭社会、行政组织,尤其是风俗习惯和各种思想信仰、维系越南语民众的精神生活和道德。”

所以,越南真正废除汉字,反倒是如今的越南国父胡志明所建立的越南社会主义共和国时期,才彻底得以实行,而且这项活动推行的异常顺利,原因也很简单。

越南原来的书写系统,太难了。

就像前面说的日、韩语一样,越南语就算汉字再多,他也有自己的词啊,这东西用啥写呢?日语用了表音的“假名”、韩国用了拼音的“谚文”,越南的这个玩意……就有点奇葩了,这个东西叫“喃字”。

还是找回之前那个“越南社会主义共和国万岁”,如果它写成“喃字”,应该是这样的。


图 越南社会主义共和国万岁。


这个就是典型的汉、喃混合写法,第一个字的“渃”就是越南固有词“nước”的“喃字”,它的“若”旁做表音,三点水为表意(越南人早期认为国立于水边),后面的两个奇葩字同样如此,“门、南”作为偏旁表音(muôn năm)“万、年”作为偏旁表意。

我们再看下越南数字的喃字写法


图 喃字越南语数字,都是把“拟音”的汉字偏旁,配上二三四的字样。


再比如,这句“我说越南语”(tôi nói tiếng việt nam),前三个都是越南语固有词



就这玩意,你让个中国人学,他都得以为是不是电脑出了BUG乱码了,更别说对于越南人了。

总之,这套以汉字描写“汉越词”、以喃字描写“固有词”书写方式,最终落得个被抛弃的下场。

当然,是否取消汉字,除了“文化精神”这些玄之又玄的东西,也有着实实在在的使用便利性问题,就拿音系简单的日语来说,如果取消汉字,别说基础词,就连“校内写生大会”都能和“口内射x大会”完全成了一个写法——“こうないしゃせいたいかい(kou nai sya sei tai kai)。

这样来看,越南语之所以彻底取消汉字,还能够书写基本无障碍,多亏了在漫长的历史中,他们把我们的声调,都给学来了。


图 越南语的六个声调。


总的来说,越南语作为一门外语,确实能够非常规整的保留了中古汉语的“四声八调”系统,这一点不仅远优于日语、韩语,更是比被吹成“古汉语”的粤语,要更为规整的多(粤语声调分裂的更厉害了)。

这也就是本无声调的孟高棉语中,越南语为何成为了一个听起来很像汉语的奇葩。
其实在现在语言学家看来,就算是原始的汉语,很可能也不存在声调——直到如今,我们的同胞藏语、缅甸语两门语言中,声调系统都非常不发达,产生时间不超过800年。

声调到底是怎么产生的?直到现在也没人能给出一个定论。但目前看来,前面所说的汉藏、孟高棉、壮泰三族语言,在音系构成上,都是以“辅音(声母)+元音(韵母)+辅音(韵尾)”的“单音节”构成每个基本单元,然后组成词汇、句子。

我们发现,越是声母、韵尾系统复杂的语言,以声调来区分词义的发展就越缓慢。而像汉语、越南语这种在发展中彻底丢失复辅音、韵尾也大量丢失的语言,元音(韵母)系统开始变得发达,声调也发展成为极为重要的组成部分,否则海量的同音词会让人找不到北。



  • 然而,在整个东亚和东南亚,也同样存在一个奇葩——如果有细心的小伙伴应该已经意识到——菲律宾、马来西亚、印度尼西亚这三位老哥,你还没说属于什么语言。




图 东南亚诸国。

那么我们还要从另一个故事讲起了——看累了可以喝口茶,我这两天都写累了



  • 当年,就在麦哲伦策划那个伟大的环球计划后,他们向西绕过美洲进入太平洋,在太平洋一个无名小岛登陆后——发生的事情让所有船员都非常费解。



麦哲伦的一个奴仆亨利,竟然完全听懂了当地土著的语言——这亨利本是一个葡萄牙人从东方印尼的苏门答腊贩卖来的奴隶,麦哲伦知道,他这一圈,算是有门了。

但老麦没想到的是,他在这一片的小岛上太能作死了,没过多久就被上面的土人砍了。当然,麦哲伦没白混——这里最终成为以西班牙国王菲利普二世命名的殖民地——菲律宾

总之,麦哲伦用他的航海打开了一个位于大洋上的宏大画卷——随着西方人对大洋的继续探索,一片片群岛开始被他们命名,比如太平洋东南的“波利尼西亚”、太平洋中部的“密克罗尼西亚”、“美拉尼西亚”,包括后来荷兰东印度公司的大本营——印度尼西亚、马来西亚。

他们惊奇的发现——就这群“亚”中

东到智利的复活节岛土著、南到新西兰的毛利人、西到非洲的马达加斯加,北到中国的台湾岛原住民——这波人的语言、体貌,都有着惊人的相似,这种奇怪的现象让走到土耳其就无法交流的欧洲人大为震惊。


图 太平洋上的波利尼西亚人,距离中国距离比美国还远。


因为这些岛屿大多位于南部,最北不超过中国台湾——一个被冠名以“南岛语系”的民族区域,开始奠定他们的语言也有一个典型特征,那就是发音都是极为简单的一个单辅音单元音构成音节组成多音节单词Siapa nama anda?Nama saya.的系统。


图 几乎占领世界上大半海洋的“南岛语系”。


然而,就在语言学家对台湾的南岛语系民族进行调查时,他们发现,就阿美族、排湾族、泰雅族、布农族、卑南族、赛夏族、达悟族几个民族之间的语言差异,竟然远远大于太平洋上波利尼西亚到夏威夷到菲律宾、马来西亚、印尼甚至到新西兰、马达加斯加之间的差异

啥意思呢?也就是说,整个南岛语系民族,很可能只是台湾原住民中某个部落跑出去的结果。这个本被以为是“南岛人”分布最北界的区域,反倒很可能是南岛人的源头

不过,台湾一个小岛,也不可能土生土长长出了人。随着分子人类学的兴起,人们发现整个南岛语系民族中,有着高频分布的O1单倍型,这一单倍型最为接近前面所讲的百越民系;除此之外,南岛人有着非常类似的文化习惯,涂黑牙齿、在脸上纹身。

而中国自古就记载,浙江一带的瓯越人

翦发文身,错臂左衽,瓯越之民也。黑齿雕题,卻冠秫绌,大吴之国也

不过,比起已经有着高度发达稻作系统的百越人,南岛人文化极度落后,他们一直都没发展出真正的农耕文明,只能以采集为生。个人比较接受的一种说法是,南岛人可能本与百越同源,却早在新石器时代时期,就与之分裂,最终从浙江一带东渡进入台湾岛,开始了后来的“海洋游牧”生活。

在考古上,中国浙江余姚的新石器时代遗址河姆渡遗址、以及杭州一带的良渚遗址,也在学术界更多被认为和壮傣、南岛民族有着强烈联系。

在语言上,南岛语系语言也被认为和古百越的壮傣系语言有着密切关系,只不过壮、傣系语言受到汉语影响,开始变得“萨瓦迪卡”,甚至数数也借用了汉语的系统;而南岛系语言,则发展出了那种独特简单的音系。

总之,大家只要知道,一个从中国浙江一带跑出去的神奇民族“南岛人”,最终彻底霸占了海洋上的小岛,离我们比较近的菲律宾、印尼都是他们的根据地,不仅如此,这群爷还来了个“反占大陆”——大陆上的马来西亚、以及前面图中,如今越南中部的“占城古国”,都是他们的文明。


图 占城国,中国在宋朝正是引进了这里的“占城稻”,最终得以免于饥荒的。


如果去过越南芽庄,还能看见这个占城人修建过的印度教寺庙“占婆塔”,和吴哥窟的感觉很像。



  • 那么这个占城的结果是啥呢,是的——它竟然最后被独立了的越南给干掉了




图 越南先后灭亡占城、高棉沿海(水真腊),成为了现在的细长条国家。

总之,越南以东南亚唯一一个汉字文化圈国家、儒教国家的身份,像中国一样,从北方的红河流域,逐渐占据南方的湄公河三角洲,成全了自己“两条大河,精耕细作,南国孔孟”的“小中华”状态——无论从哪个角度来说,我们两个国家的故事,都仍会继续下去。

话说回来,越南这个国家,地形长的,楼也都盖的贼长(土地永久使用,生的越多越往高了盖),人也都贼瘦,关键是,牛也特别瘦……


图 越南楼房。

按理说,故事说到这里,已经接近尾声了,但是这一部分的小标题,还是要给大家回答下——中国人学啥语言最容易,我们先来用一张图,展示下整个文章描述的东南亚地区各大语系的分布。


图 如今东南亚各国主体民族的概括图。

整体来讲,东南亚所有语言,都不存在如英语、德语、俄语等印欧语系所存在名词变格(主格宾格与格属格等),也没有动词变位(不定式、分词、人称等)。属于通过词序、虚词等引导的“分析语”(孤立语),这一点和汉语是很类似的。

同时,除了马来、印尼外,因为都是单音节语言,或多或少都有点声调。所以,全世界所有语言中,中国人学习东南亚语言都是相对有优势的,甚至掌握速度要高于虽然借用汉字词众多,却语法相差较大的日语、韩语。



  • 而按照发音难度来说,前面也讲了,缅甸语、高棉语复辅音多,都有着不同程度的烫嘴现象,且受印度语言影响严重。



所以,马来语、印尼语(这俩语言的差别相当于美式英语和英式英语),发音简单、语法简单,而且也已抛弃了拿阿拉伯字母改的爪夷文,用了拉丁字母,整体来讲,是大部分外语学习者公认的“容易语言”。

然而,如果说文化亲近感、发音相似性、语法相似性来说,越南语无非都是和我们最接近的外语,只要攻克它那个软绵绵湿哒哒的发音关(元音系统发达,音调紧喉),后期学习相对会一马平川。

而且,越南语的汉借词,也是研究古汉语发音的宝贵材料,对你研究文学作品、日语韩语都有极大帮助。


图 汉字文化圈。


总之,中日韩越四门根源上完全不同的语言,却因为中国文化、汉字文化和汉语牢牢的绑定在一起,比起那些远房的亲戚,这些邻家的兄弟,或许才是应该最后走下去的。



山川异域,风月同天,寄诸佛子,共结来缘。



本文来源:知乎
作者:安森垚
鸣谢!侵删


课程推荐

必备课程|“统计女王”和你讲:每一个文科生都能成为SPSS操作能手!


往期回顾


好文推荐|陈申等:探索国际汉语教学研究的新途径


招  聘|光明日报社2021年校园招聘正式启动!


刊讯|《方言》2020年第4期


新年特辑|外国人最早是怎么学会汉语的?


新年特辑|等春来,我们再好好团圆!


欢迎加入
“语言学心得交流分享群”“语言学考博/考研/保研交流群”
请添加“心得君”入群



今日小编:心得君

审     核:心得君

转载&合作请联系

"心得君"

微信:xindejun_yyxxd

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存