4月22日,语言资源高精尖创新中心推出“世界语言基本知识库”“世界文字基本知识库”“世界语言文字名称中文译写规则”(两库一蓝本)。小编特意整理了一些重要知识点,一起来学习一下吧!
发布会更多详情,可戳↓:
巴布亚新几内亚(852种)、印度尼西亚(719种)、尼日利亚(527种)、印度(462种)、澳大利亚(401种)、中国(323种)*、墨西哥(289种)、喀麦隆(284种)、巴西(237种)、美国(231种)朝鲜(1种)、安圭拉(2种)、马尔代夫(2种)、冰岛(2种)、圣马力诺(2种)、梵蒂冈(2种)、关岛(2种)、基里巴斯(2种)、纽埃(2种)、萨摩亚(2种)
世界语言数量的国别分布是非常不平衡的,多的国家可以有数百种语言,少的国家只有一两种语言。语言的数量是构成国家语言多样性的重要指标。*关于中国语言的数量,我国学术界一般认为有140种左右,上表是根据国际组织的统计结果(323种),即将一些语言的方言识别为语言。无论哪种算法,中国都是世界上语言多样性最丰富的国家之一。
这20种语言的使用人口合计为42.47亿,占世界总人口的近2/3。 (及其在“一带一路”国家的分布数量)
“阿拉伯语、俄语、英语是‘一带一路’地区作为官方语言使用最广的三种语言,因此中小学外语语种规划上,要重视培养俄语和阿拉伯语的人才!”——北京语言大学 李宇明教授世界现行文字有近4000种,其中书写超过10种语言的文字有拉丁文、阿拉伯文、天城体、基里尔文、依索比亚文、孟加拉文、汉字、藏文、泰文、希伯来文、老挝文、缅甸文、奥里亚(奥迪亚)文、泰卢固文。如果不包括近现代新创制的拉丁字母文字,世界大多数语言传统上只有口语,没有文字。世界文字具有明显的共同字母源流和走向,即人类绝大多数的文字源于公元前1500年中东迦南地区的腓尼基文(Canaanite-Phoenician)。向西方先后演化及再演化出希腊字母、拉丁字母、基里尔字母等欧洲主流文字;向东方衍生出阿拉米字母,继而衍生出希伯来字母、阿拉伯字母、粟特字母、婆罗米字母等亚洲主流文字。中国的汉字是独立发生的,并且是在文字系统上唯一没有中断一直沿用至今的文字。历史上,汉字曾是东亚日本、朝鲜、越南的官方文字,同时也对我国壮族、白族等南方诸少数民族的文字产生过广泛的影响。中国蒙古文、满文、维吾尔文、哈萨克文、藏文、傣文等传统少数民族文字,都可以溯源到世界古老东方文字文化的传播与影响。
(2)婆罗米字母文字:焉耆-龟兹文、于阗文;藏文、八思巴字;西双版纳老傣文、德宏傣文、傣绷文、金平傣文(4)粟特系文字:粟特文、回鹘文、蒙古文、托忒式蒙古文、满文、锡伯文
● 阿拉伯系文字
察合台文、维吾尔文、哈萨克文、柯尔克孜文、乌孜别克文、塔塔尔文
● 汉字系文字
(1)仿汉字:方块壮字、方块白文、方块苗文、方块瑶文、方块布依文、方块侗文、方块毛南字、方块哈尼文(2)变汉字:契丹大字、契丹小字、女真文、西夏文、水书拉丁字母具有字符的国际通用性,因此目前无文字语言的文字创制一般都采用拉丁字母的形式,世界上主要的非拉丁字母文字也都制订了拉丁化(罗马化)的转写方案。中国 1950 年代制订和推行的《汉语拼音方案》,以及为没有文字的少数民族新创的壮文等10多种拼音文字,均采用国际通用的拉丁字母形式。
语言文字名属于词汇中的专名(与通名相对)。目前英语专名中文译写最全面和规范的领域是世界人名和地名。如国家地名标准化委员会发布的《外语地名汉字译写导则》,是非常重要的世界各国地名译写中文的国家标准。世界民族名、世界宗教名因为它们的总量相对少一些,因此这类专名的征集、翻译与知识阐述等基础工作,主要由民族学、世界宗教研究等学科开展。世界语言文字名要比世界民族名、宗教名在数量上多的多,但是尚未形成规范的译写规则和权威的译名手册。
本项目世界语言文字名中文翻译的语料来源:国家标准《语种名称代码 第2部分:3字母代码》(GB/T 4880.2-2000)
国家标准《信息与文献 文字名称表示代码》(报批稿2016)
谷歌、百度、微软、有道、必应、金山等翻译软件既有世界语言文字名称译名。
数据来源:语言资源高精尖创新中心”语言识别理论及语言数量统计的方法论研究“重大项目(项目负责人:孙宏开、黄行)
本期责编:鱼