代码 | 英文全称 | 释义 |
zh-CN | Chinese (PRC) | 中国大陆使用的简体中文 |
zh-HK | Chinese (Hong Kong S.A.R) | 香港特别行政区使用的繁体中文 |
zh-MO | Chinese (Macao S.A.R) | 澳门特别行政区使用的繁体中文 |
zh-SG | Chinese (Singapore) | 新加坡使用的简体中文 |
zh-TW | Chinese (Taiwan) | 台湾地区使用的繁体中文 |
按照上期文中的思路,这次我们直接去 ISO 的官方网站去查找,很快就找到了 ISO 3166 标准 (https://www.iso.org/glossary-for-iso-3166.html)
What is included in ISO 3166?
ISO 3166 has three parts: codes for countries, codes for subdivisions and formerly used codes (codes that were once used to describe countries but are no longer in use).
The country codes can be represented either as a two-letter code (alpha-2) which is recommended as the general-purpose code, a three-letter code (alpha-3) which is more closely related to the country name and a three-digit numeric code (numeric-3) which can be useful if you need to avoid using Latin script.
The codes for subdivisions are represented as the alpha-2 code for the country, followed by up to three characters. For example ID-RI is the Riau province of Indonesia and NG-RI is the Rivers province in Nigeria. Names and codes for subdivisions are usually taken from relevant official national information sources.
The formerly used codes are four-letter codes (alpha-4). How the alpha-4 codes are constructed depends on the reason why the country name has been removed.
可见 ISO 3166 由三部分组成。其中 ISO 3166-2 是国家/地区的子地区代码,主要是省或州的简称代码; ISO 3166-3 是删除且不再使用的 4 位代码。所以 ISO 3166-1 是最为主要的标准。
Alpha-2 code 是代表国家地区的两位字母代码,是比较通用的代码
Alpha-3 code 是代表国家地区的三字母代码,与国家名称更为相近。
Numeric code 为数字代码,主要是方便不使用拉丁字母的人
全球有 200 多个国家和地区,两位代码已经完全足够了,所以我们日常工作基本用不上三位代码。
虽然不同国家和地区使用同一种语言的情况非常多,但是在常规本地化的应用中,我们只需要关注几个语言,即一般只需在这几种语言中指明国家和地区,其他语言我们可以不用标明。1. 西班牙语。首当其冲的是西班牙语。西班牙语是很多国家的母语,这是历史原因造成的。在大航海时代,西班牙首先发现了美洲大陆,进而在当地殖民。受西班牙文化影响,今天美洲大部分地区都是以西班牙语为母语。所以要翻译成西班牙语时,需要指明是哪个地区的西班牙语。下图是 MemoQ 中西班牙语的常见变种。我们一般只需要关注 4 个地区。西班牙的西班牙语,简称代码是 es-ES。墨西哥的西班牙语,es-MX。美国西班牙语 es-US (在美国有很大一群人的母语是西班牙语,他们拥有强大的购买力,是本地化的目标客户群体之一)。最后一个是拉美西班牙语,指在拉丁美洲国家通用的西班牙语。拉美没有明确的国家标识,所以用 es-419 来指代,沟通时一般用全称 Spanish (Latin America)。
2. 法语。同样因为航海和殖民的原因,法语是非洲的大部分国家和地区的通用语言,其在本地化中主要有三个主要的变种:法国法语,fr-FR;加拿大法语,fr-CA;非洲法语,fr-02,沟通时候要使用全称 French (Africa) 避免误解。
3. 葡萄牙语。同理,葡萄牙曾在巴西殖民,巴西独立后,葡萄牙语依然是巴西的主要语言。因此,葡萄牙语有两个常用变种:葡萄牙葡萄牙语 pt-PT 和巴西葡萄牙语 pt-BR。
在欧洲西班牙、德国等国家代码是沿用本国语言来定义的。其中西班牙是 ES 而非英语中的 SP(Spain),德国是 DE 而非英文中的 GE(Germany)。而在亚洲国家的代码使用的是英语中的国家名称,如中国大陆的代码是 CN (来源于 China) 而不是中文拼音 ZG,日本的代码 JP (来源于 Japan) 而不是日语的 NH(nihon)。
究其原因,我们猜测是因为 ISO 3166 的维护者在瑞士,他们更熟悉欧洲国家,而不了解不同文化圈的其他地区。
另外一个问题是英国的代码是 GB,而不是 UK,那是为什么呢?我们找到了如何定义代码的官方说明:
The codes are chosen, according to the ISO 3166/MA, "to reflect the significant, unique component of the country name in order to allow a visual association between country name and country code". For this reason, common components of country names like "Republic", "Kingdom", "United", "Federal" or "Democratic" are normally not used for deriving the code elements. As a consequence, for example, the United Kingdom is officially assigned the alpha-2 code GB rather than UK, based on its official name "United Kingdom of Great Britain and Northern Ireland" (although UK is reserved on the request of the United Kingdom). Some codes are chosen based on the native names of the countries. For example, Germany is assigned the alpha-2 code DE, based on its native name "Deutschland".
根据说明,简称代码主要是反映国家/地区的独特名称。英国的全名是 United Kingdom of Great Britain and Northern Ireland (大不列颠及北爱尔兰联合王国)。因为 Kingdom, United 等词太过常用而没有特色,因此取用英国国名中的大不列颠 (GB)。这样一来,辨识度很高,但是缺了北爱尔兰,不知道英国人在不在乎。
继续延伸这个问题,既然 United 等词太常用不合适,那么美国的代码 US 呢?这是因为美国名称确实找不到独具特色的词,The United States of America,只有美洲是个地名,还是共用的,所以选择 US 也是没有办法的事。