查看原文
其他

世界语言文字知识知多少

语标 2023-07-17

The following article is from 语言资源高精尖创新中心 Author 高而杰

4月22日,语言资源高精尖创新中心推出“世界语言基本知识库”“世界文字基本知识库”“世界语言文字名称中文译写规则”(两库一蓝本)。小编特意整理了一些重要知识点,一起来学习一下吧!


发布会更多详情,可戳↓:





世界上语言数量最多的国家

巴布亚新几内亚(852种)、印度尼西亚(719种)、尼日利亚(527种)、印度(462种)、澳大利亚(401种)、中国(323种)*、墨西哥(289种)、喀麦隆(284种)、巴西(237种)、美国(231种)

世界上语言数量最少的国家

朝鲜(1种)、安圭拉(2种)、马尔代夫(2种)、冰岛(2种)、圣马力诺(2种)、梵蒂冈(2种)、关岛(2种)、基里巴斯(2种)、纽埃(2种)、萨摩亚(2种)

世界语言数量的国别分布是非常不平衡的,多的国家可以有数百种语言,少的国家只有一两种语言。语言的数量是构成国家语言多样性的重要指标。*关于中国语言的数量,我国学术界一般认为有140种左右,上表是根据国际组织的统计结果(323种),即将一些语言的方言识别为语言。无论哪种算法,中国都是世界上语言多样性最丰富的国家之一。

世界作为母语使用人口最多的20种语言


这20种语言的使用人口合计为42.47亿,占世界总人口的近2/3。

世界上作为官方语言分布国家最多的10种语言

   (及其在“一带一路”国家的分布数量)


“阿拉伯语、俄语、英语是‘一带一路’地区作为官方语言使用最广的三种语言,因此中小学外语语种规划上,要重视培养俄语和阿拉伯语的人才!”——北京语言大学 李宇明教授

全世界主要文字的源流关系

世界现行文字有近4000种,其中书写超过10种语言的文字有拉丁文、阿拉伯文、天城体、基里尔文、依索比亚文、孟加拉文、汉字、藏文、泰文、希伯来文、老挝文、缅甸文、奥里亚(奥迪亚)文、泰卢固文。
如果不包括近现代新创制的拉丁字母文字,世界大多数语言传统上只有口语,没有文字。
世界文字具有明显的共同字母源流和走向,即人类绝大多数的文字源于公元前1500年中东迦南地区的腓尼基文(Canaanite-Phoenician)。
腓尼基文对于现今世界诸文字的意义和影响主要是:
向西方先后演化及再演化出希腊字母、拉丁字母、基里尔字母等欧洲主流文字;
向东方衍生出阿拉米字母,继而衍生出希伯来字母、阿拉伯字母、粟特字母、婆罗米字母等亚洲主流文字。

中国文字与世界文字的源流关系

中国的汉字是独立发生的,并且是在文字系统上唯一没有中断一直沿用至今的文字。
历史上,汉字曾是东亚日本、朝鲜、越南的官方文字,同时也对我国壮族、白族等南方诸少数民族的文字产生过广泛的影响。
中国蒙古文、满文、维吾尔文、哈萨克文、藏文、傣文等传统少数民族文字,都可以溯源到世界古老东方文字文化的传播与影响。


中国民族古文字的谱系分类

●  阿拉米字母系文字
(1)佉卢文
(2)婆罗米字母文字:焉耆-龟兹文、于阗文;藏文、八思巴字;西双版纳老傣文、德宏傣文、傣绷文、金平傣文
(3)突厥文

(4)粟特系文字:粟特文、回鹘文、蒙古文、托忒式蒙古文、满文、锡伯文

●  阿拉伯系文字

察合台文、维吾尔文、哈萨克文、柯尔克孜文、乌孜别克文、塔塔尔文

●  汉字系文字

(1)仿汉字:方块壮字、方块白文、方块苗文、方块瑶文、方块布依文、方块侗文、方块毛南字、方块哈尼文
(2)变汉字:契丹大字、契丹小字、女真文、西夏文、水书

拉丁化对现代中国文字的影响

拉丁字母具有字符的国际通用性,因此目前无文字语言的文字创制一般都采用拉丁字母的形式,世界上主要的非拉丁字母文字也都制订了拉丁化(罗马化)的转写方案。
中国 1950 年代制订和推行的《汉语拼音方案》,以及为没有文字的少数民族新创的壮文等10多种拼音文字,均采用国际通用的拉丁字母形式。


世界语言文字名称的中译规则

语言文字名属于词汇中的专名(与通名相对)。目前英语专名中文译写最全面和规范的领域是世界人名和地名。如国家地名标准化委员会发布的《外语地名汉字译写导则》,是非常重要的世界各国地名译写中文的国家标准。
世界民族名、世界宗教名因为它们的总量相对少一些,因此这类专名的征集、翻译与知识阐述等基础工作,主要由民族学、世界宗教研究等学科开展。

世界语言文字名要比世界民族名、宗教名在数量上多的多,但是尚未形成规范的译写规则和权威的译名手册。

本项目世界语言文字名中文翻译的语料来源:

国家标准《语种名称代码 第2部分:3字母代码》(GB/T 4880.2-2000)

国家标准《信息与文献 文字名称表示代码》(报批稿2016)

谷歌、百度、微软、有道、必应、金山等翻译软件既有世界语言文字名称译名。


世界语言文字名称中文译写规则蓝本(部分)


既有世界语言文字名称中译样本


未译世界语言文字名称中译样本


数据来源:语言资源高精尖创新中心”语言识别理论及语言数量统计的方法论研究“重大项目(项目负责人:孙宏开、黄行)



读懂标点符号“国标”了吗?



拾荒,培根,车厘子



李宇明:母语教育的语言学支撑体系问题


本期责编:鱼

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存