查看原文
其他

当名字里查无此字,会有多少麻烦出现?|有数

复数实验室 湃客工坊 2023-07-24

“黄杭?”“黄杭 la”“黄杭_”“黄杭口”……这些都是黄杭 là(⿱足用)的“曾用名”,多次出现在她的高考准考证、银行卡、户口本上。
“là(⿱足用)”,是潮汕方言里的一个音节,并没有对应的普通话发音,目前在输入法中无法直接用汉语拼音打出。在云南丽江,“nià”姓家族近 700 人被迫改姓“鸭”,就是由于办理二代居民身份证时,“nià”字无法在信息系统中被输入和显示。
4 月 21 日,“#因姓氏太罕见全村集体改姓鸭”这一词条登上微博热搜,阅读量达 1.4 亿。两周以后,该话题的阅读量锐减至 1408。到今天,该话题已无人问津。

生僻字又称冷僻字、僻字、罕用字、奇字,泛指现代汉语中因使用率极低被排除在常用字外、甚至音义均难以考证的汉字。据中央广播电视总台经济之声《天下财经》报道,我国有超过 6000 万人名及大量地名、古籍、方言中包含生僻字,其中多数尚未实现数字化。

“还记得小学老师往我家打电话,第一句是‘是张羽中家吗?’”,张翀(chōng)在知乎回答中这样写道,被叫错名字已经是习以为常的事。
户口本、录取通知书、登机牌上的名字都要手写并盖章证明;身份核验存在困难导致无法开通移动支付;工资比其他人晚发放一到两天……这些看似离谱的经历,对于名字在电子系统中无法显示的人来说,都是最真实不过的体验。有知乎答主调侃自己,“一直怀疑,工作头八年的年会抽奖从来没抽到我,是因为我的名字根本录不进去”。如果名字中的生僻字字形奇特,被取外号也是常有的事。马騳(dú)骉(biāo)坦言,自己小时候很长一段时间因为被喊“马 6”“一群马”而心理不适,甚至不想上学。
既然生僻字姓名在生活中带来了如此多困扰,是否大家取名都应该避开生僻字呢?河南省社科院研究员祁雪瑞对此持否定意见,“使用生僻字取名是家长追求个性化的结果,无可厚非”。“明”字因象征“光明前程”,深受为孩子取名的父母喜爱,“小明”逐渐成为烂大街的名字。而“昪(biàn)”字同样含有“日光明亮”之义,自然成为了家长们追求个性化、独特化的选择。
生僻字姓名在社交破冰中容易打开话题,给人留下深刻印象;因为老师不认识生僻字,在第一次上课时不容易被点名提问等经历,也给部分姓名中有生僻字的人带来了新奇体验。

并且,让有文化意涵的生僻字通过姓名用字的方式,进入公众的日常生活中,一定程度上能够唤起人们对古文化的重视。“如今每个班都会有五六个一下子叫不上名字的学生。每次新学期开学,班主任都会提前从教务处要来学生名单,准备古汉语词典、大辞海等早下手”,河南郑州二七区外国语小学辅导员李贺楠说,不然点名时就会出现尴尬,给学生的第一印象就会大打折扣。
黄杭là(⿱足用)选择与生僻字和解。“⿱足用”是“(不耐烦)够了”的意思。黄杭là(⿱足用)是家里的幺女,爷爷觉得家里孩子够多了,就给她取了这个名字。但她本人还是比较喜欢这个字的,“个人理解为没感情色彩的‘够了’,意为知足常乐”。

去年黄杭là(⿱足用)加入了微信“姓名生僻字交流群”,群友们根据自身经验,传授她解决办法。“我自己积极向有关部门反映问题,通过不同部门的相互配合,才能解决小部分问题”,现在她的银行账户名字终于可以正确显示,“但是大部分还没法解决”。

想要在电子系统中打出汉字,就需要将其进行编码录入字符集,输入法系统从中选取一定数量的字符构成输入法的字库。用户可通过拼音、五笔、手写等方式输入汉字,但只有字体库中存在的汉字才能成功输出并显示在电子屏幕上。

GB2312、GBK、GB18030-2005 是中国大陆采用过的主要字符集。GB2312 于 1981 年实施,中国大陆几乎所有的中文系统和国际化的软件都支持 GB2312,基本满足了汉字的计算机处理需要。不过,它不支持绝大部分生僻字和繁体字。

我国在 1995 年对其进行扩展,发布了 GBK《汉字内码扩展规范》。GBK 为目前我国大多数应用软件实际的支持标准。2005 年,国家修订了汉字收录范围更广的 GB18030-2005 超大型中文编码字符集,包含汉字 70000 余个。

而生僻字电子化困境的源头就在于,虽然很多字已经被收录进了标准字符集(如 GB18030-2005),但是产品并不充分支持该标准。大多数应用、输入法、软件产品支持的汉字量为 2 万-3 万个,与前者相比缺失甚多。
“姓名生僻字交流群”的群友们告诉黄杭 là(⿱足用),微信和身份证系统的字使用不同的编码方式,即使微信中能正确显示“⿱足用”,一旦使用身份证进行认证,还是会出现乱码问题。

姓名是生僻字在现实生活中影响最大的方面,但不是唯一方面。地名生僻字也给人们的生活带来了不便。黄杭 là(⿱足用)的家乡在汕头市礐(què)石街道,“礐”的原字在输入法中无法输入,“当地人都是手写路牌”。
四川外国语大学地名研究中心的统计结果显示,全国共有 3108 个地名用字未被收录进《通用规范汉字表》,这意味着它们的显示和使用都可能存在困难。

汉字的使用遵循省力原则,有些字形复杂、发音困难的字,就会被替换为同音字或形近字,逐渐边缘化,成为生僻字。生僻字呈现出简化、被替代的趋势,然而,这些字背后蕴含的历史与文化意义是否能被取代,还有待考证。
与地名相比,我国对于文物中使用的生僻字的保护更加深入。即便使用频率低,文物古籍蕴含的丰富的文化价值,还是让许多生僻字得以保留和传承。

随着互联网信息技术的广泛应用,大部分网民越来越少手写汉字,而是逐渐习惯使用各大输入法预设的通用汉字。如果不是有特别需求,生僻字几乎不会出现在日常网络语境中。

从今年 2 月 15 日到 5 月 15 日,在人数最多的三个豆瓣小组的所有发帖中,如果以通用规范汉字表作为生僻字的量表,生僻字的使用频次几乎为 0,仅有一个可以被纳入生僻字范围的“嬢”,是云贵、川渝等地的方言中对父母亲的姐妹或者与父母同辈妇女的称呼。
无论是拥有生僻字姓名的群体的迫切需求,还是地名、文物生僻字所具有的重要文化内涵,都表明部分生僻字需要被保护、生僻字数字化难题亟待解决。

虽然网络社区里有博主和用户进行生僻字科普,但是关注度明显不高、影响很小。即使偶尔有数据较好的笔记,也多是因为与某一热点事件或是流行文化相契合。
想要真正让生僻字问题受到大众关注,仅靠民间力量显然不够。官方与各商业机构也在寻找生僻字数字化困境的破解之法。“电脑是为人服务的,不能因电脑打不出来就建议大家改名,有关部门应该想办法扩容字库”,祁雪瑞说。
新版《信息技术中文编码字符集》强制性国家标准(GB18030-2022)已于去年发布,将于 2023 年 8 月 1 日正式实施。新版标准共收录了 87887 个汉字,在 GB18030-2005 的基础上增加了 17000 多个生僻字,基本满足了人名、地名、古籍和科技用字的数字化需求。新版标准要求,所有用于政务服务及公共服务的信息技术产品与系统均须包含本标准内的全部汉字。
四川外国语大学地名研究中心研究员杨璐对该政策进行了解读。“就标准本身而言,它只针对部分行业强制实施。真正的落实进度,还要看各行业的推进程度”,主要是直接关系到大家的证件、金融业务办理等问题的公共服务行业字库的更新进度。而开放使用的购物网站、支付平台等应用是否支持显示,要看其自身推进程度及业务办理流程的优化度。“目前可能还是打补丁式的解决多一些,比如金融业的内部系统已经研讨并制定了行业标准”。

2022 年 11 月 11 日,工信部和搜狗输入法联合多方共同发起“汉字守护计划”公益行动。此外,今年 4 月 20 日,全国首个“生僻字征集”微信小程序上线。用户可以在微信小程序和搜狗输入法 App 拍照上传无法输入的生僻字。审核通过的生僻字将被赋码并录入国标字库,最终实现在电脑、手机等设备及信息系统中无障碍输入与显示。
文字是中华文化的一部分,不该因字库储备不足而弃用生僻字,我期盼着有一天,能够让生僻字不再是生僻字。”黄杭 là(⿱足用)说。

作者 / 史卓然 王博雅 余秋芳 朱怡璇 唐添悦

指导老师 / 周葆华 徐笛 崔迪

复旦大学新闻学院《数据分析与信息可视化》(本科生)课程专栏

编辑 / 张铃媛
封图来源:视觉中国


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存