《国家通用盲文方案》成长史全纪录|《语言规划学研究》
小编说
作为“语标”的忠实读者,相信大家对于“语言文字”这个名词并不陌生。根据《国家通用语言文字知识手册》,我国是个多民族国家,56个民族使用着大约80种语言。我国的通用语言文字是普通话和规范汉字。需要注意的是,盲文也是一种特殊的文字。
《国家通用盲文方案》于2018年3月9日发布,2018年7月1日实施,也是我们“语言文字规范标准大家庭”的成员之一。
今天的文章作者钟经华老师将带领我们梳理该方案的“成长简史”。经过多位专家的努力,现行盲文方案中存在的问题已经得到解决。
最后,小编又来征稿啦!文末附有征稿启事,有意投稿的读者朋友们可下滑至文末查看。同时您也可以点击文末的征稿启事完整版链接了解更多。
本文原载于《语言规划学研究》2017年第2期
编者按
《国家通用盲文方案》是由国家语言文字工作委员会语言文字规范标准审定委员会审定,由中华人民共和国教育部、国家语言文字工作委员会、中国残疾人联合会联合发布的语言文字规范。该方案2018年3月9日发布,2018年7月1日实施,是国家语言规划的重要组成部分。为了记录新的语言文字规范标准的制定,更好 地体现该方案在研制过程中的学术问题,本刊特将该方案的研制报告呈现给各位读者。
《国家通用盲文方案》研制报告 *
作者简介
钟经华,北京联合大学特殊教育学院二级教授。主要研究方向:盲文。
摘要
现行盲文一般不标调,存在严重的“一词多形、一形多词”问题,猜读是现行盲文的常态。国家通用盲文以全面标调为基础,利用零标记原理以声母为单位省写一个声调,标出其余三个声调,从任意省略一至四个声调转变为按规范省略一个声调。课题组通过对较大规模的汉语语料库和盲文语料库的语料进行统计,发现了汉语拼音四个基本声调在每个声母组的分布都具有非均衡性,每个声母都可以赋予声调省写的标志功能。经过大量实证研究和两年的全国性试点,国家通用盲文经受住了实践的检验,受到了广大盲文使用者的普遍欢迎。
关键词
盲文 声调省写 韵母简写 语料库
* 该研究受国家社科基金重大项目“汉语盲文语料库建设研究”(13&ZD187)、国家语委后期资助项目“国家通用盲文方案(试行)量化 评价研究”(HQ135-12)的资助。文中部分内容以笔者《〈国家通用盲文方案(试行)〉研究过程》(《盲人月刊》2017 年第 5 期)一文为 基础进行了修改和引用。
60 多年来,现行盲文方案对我国盲人教育、文 化、出版事业的发展和盲人文化知识水平的提高发挥了非常重要的作用。但是,现行盲文方案为了节约盲文篇幅,以“一般不标调,需要时才标调①”为标调总原则,声调大量随意省略,标调率低,使得盲人时常需要依据上下文猜测读音,计算机自动处理盲文的难度也较大,难以适应信息化时代盲人文化教育和盲文信息化的需要。
随着信息化的发展,现行盲文标调问题越来越突出,成为我国盲人文化教育中迫切需要解决的现实问题。为此,中国残疾人联合会(以下简称“中国残联”)、国家语言文字工作委员会(以下简称“国家语委”)在2011年9月设立了“国家通用盲文标准修订” (ZDA125-4)重大课题,就现行盲文标调问题进行科研攻关。跨学科联合课题组经过五年的研究,取得了突破性成果,2015年12月通过了国家语委、中国残联结题论证,形成《国家通用盲文方案(试行)》。该 方案经过全国22个试点单位两年的试点,进一步修改 完善,形成了《国家通用盲文方案》,2017年通过国 家语委语言文字规范标准审定委员会审定。
①中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会 . GB/T 15720—2008 中国盲文[S]. 北京:中国标准出版社, 2009。
一
项目研究概况
本项目于2011年9月立项,11月正式开题,2015 年9月完成研究任务,12月完成结题报告。
本项目按照研究计划进行,研究思路、研究方法、主要研究内容与项目预期设定一致,按时完成了研究任务,取得了预期的研究成果。
本项目的主要成果有:
(1)《国家通用盲文方案(草案)》;
(2)《〈国家通用盲文方案(草案)〉研制报告》;
(3)发表核心期刊论文5篇,普通期刊论文2篇, 全国学术会议论文4篇;
(4)申请相关盲文计算机软件著作权3项;
(5)开发现行盲文隐性标调检索应用软件1个;
(6)建立普通汉语数据库1个;
(7)在建汉语盲文语料库1个。
二
研究基础
2.1
研究起点
现行盲文是拼音系统,声韵调各用1方①盲文符号。为了节省篇幅,现行盲文“一般不标调,需要时才标调”,盲文出版物标调率仅为5% 左右(黄乃,1999)。不标调的盲文读音有高度的不确定性,需要根 据上下文猜读的情况比较普遍,严重影响了盲人的阅读理解。由于标调规则的可操作性低,标调经常出现不一致的情况,造成了“一词多形、一形多词”的现象。这也成为盲文信息化的主要障碍。
随着盲人文化教育水平的提高和信息化的发展,解决现行盲文标调问题的迫切性越来越高。《国家手语和盲文规范化行动计划(2015—2020 年)》要求,到 2017 年,颁布国家通用手语和通用盲文方案。本项目 以任务为驱动,以问题为导向,从现实出发,在保持现行盲文根本稳定的前提下,重新定位现行盲文“准确”与“节约”的关系,重新认识声调在汉语中的地位和作用,力求从理论和实践上解决现行盲文标调问题。
2.2
资料库建设
资料库建设包括:建立了基本音节表I(以人民教育出版社《语文》及《人民日报》为语料来源,260 万字)、基本音节表II(以国家语委现代汉语平衡语料库②为语料来源,1500 万字)、高频词词表(37 000 词)、常用同音词词表、人民教育出版社小学和初中《语文》分年级词表、轻声词表等③;进行了汉语盲文语料库建设④(1000 个语篇,500 万方盲文)。
①“方”是盲文里最小的、可独立运用的单位。
②网址为 http://www.cncorpus.org。
③参见国家语委现代汉语平衡语料库。
④参见汉语盲文语料库建设研究课题组网站:http://124.207.106.21:30。
2.3
基础数据分析
基础数据分析包括:以汉字、实有音节、基本音节以及按声母分组的声调使用频率为基础数据,进行了大量的拆分、组合、筛选、数值查寻、累加等基本数据统计分析;进行了不同语料数据的交叉比对、不同语料数据的相关性分析、极大值突出性分析等;在定量初选阶段,计算过候选音节省写的贡献率(P1nP0)、记忆指数(P1/nP0)、综合指数(P1-nP0)nP0/P1等 基础数据。其中,P1 是候选者频率,n 是本音节中包 含的其他音节个数,P0 是这 n 个其他音节的频率之和。 研究过程中进行了上亿条数据运算。
三
研究目标
解决现行盲文标调问题不仅仅是为每个字标上声调符号,必须同时实现“读音准确、新旧衔接、省时省方、易读易写”这四个目标。
3.1
读音准确
读音准确是标调规则的首要目标,是制定标调规则的根本目的。
中国的国家通用语言是声调语言,音节带调是国家通用语言的突出特点。汉语盲文是表音文字,声调必须准确。过去60年实践中遇到的读音不准、词义不清问题主要源于标调率低和标调不一致。不标调的词语虽然通过上下文的语境能够确定,或者猜读出一部分,但是不熟悉的词、新词等就难以猜出;由于没有标声调,使用者请教他人也困难。依靠上下文确定或者猜读声调很多时候是不可靠的,标调准确才是实现读音准确的根本方法。
不论采用什么样的标调方式,读音准确是前提。只要能够保证现行盲文读音确定、无歧音,只要读音准确这一条不产生变异,省略、隐藏、隐性标调等方式(以下称为“省写”)都是可以采用的。
为了读音准确,同音不同调的音节不能同时省写声调。否则,省写了声调符号的音节可以还原出多个不确定的声调。新标调规则必须保证省写后的音节都能且仅能还原出一个声调,保证现行盲文从“一词多形、一形多词”转变成“一音一形、一形一音”,在表音层面上,实现汉语的音与盲文的形一一对应,实现从“一对多”到“一对一”的嬗变。
3.2
新旧衔接
新旧衔接方面要做到保持现行盲文体系不变,使掌握现行盲文的读者可以很自然地阅读新标调方式的读物。
新标调方式要在不改变现行盲文方案的前提下进行,不设计新的符号,不改变任何原有符号。新标调方式实施后要保障现行盲文的稳定性,要保障盲人的文化传承。现行盲文通过新标调方式改良后,要平稳、顺利地实现新旧过渡,做到“学新会旧,懂旧识新”。学习了新标调方式的盲人如果要阅读以前的旧版盲文书籍,无须进行准备性学习。掌握旧版盲文的人只需经过很简单的学习和记忆新标调方式,就可以顺利阅读新版盲文,避免了猜测读音。没有掌握新标调方式的人也可阅读新版盲文,并且阅读困难小于旧版盲文,新版盲文对使用者来说只是多了一些声调符号而已。
新标调方式只是完善现行盲文标调规则,规范声调符号的用法,读者感觉不到大的变动,更不会感觉又出了一套新盲文。
3.3
省时省方
省时省方是在全面标调的基础上省写部分声调,达到便利省时、少增加篇幅的目的。
触觉的感知特点决定了作为触觉文字的盲文必须简洁,尽可能地提高盲文阅读和书写速度,通过省方进而省时,这是盲文的共性。英语盲文走在了前面,有比较成熟的两级简写方案。
显然,字字标调会增加篇幅。在字字标调的基础上省写部分声调,可减少篇幅,提升阅读与书写效率。字字标调虽然填平了原来计算机不能跨过的“猜”的鸿沟,可以消除汉语盲文信息化一直存在的巨大障碍;但是,在纸介质上字字标调会大幅度增加篇幅与盲文简洁的共性背道而驰。直接字字标调虽然解决了读音不准的问题,但是又产生了新的问题。通过省写解决篇幅冗长问题,最大限度地省时省方,是本项目研究的主体内容。囿于现行盲文设计之初的时代背景,省方(省纸)被看得非常重要,甚至重于准确。随着经济的巨大发展和盲人阅读的多元化,现在省时比省方更重要,盲文信息化对声调准确性的要求更高。
3.4
易读易写
易读易写是指要使新标调方式简便易行,既容易阅读,也容易书写。
要达到易读易写,就要使新标调方案简单、规律性强,避免规则层级过多或者例外过多。新方案要做到使阅读顺畅,书写方便,也使教和学省力,记忆负担小,同时实现“易读”和“易写”,而不使其互相制约;要尽量使各年龄段的盲人,不管是新学盲文的人还是盲文的老读者,使用新标调方式时都感到省力。方案简单也可以在保障出版物标调准确的同时,降低劳动强度,提高生产效率。
充分尊重并尽可能延续多数盲人的阅读习惯是易读易写的一个方面,习惯改变越多越费力。易读易写还包括省写后盲文符号的触觉易感性,因此容易造成触觉辨认困难的就不省写,尽量提高触觉品质。
整体实现读音准确、新旧衔接、省时省方、易读易写这四个目标,核心在于把握好读音准确与省方的关系。前两条是宏观的上位要求,后两条是具体要求,要力求综合平衡,不偏废任何一条。
3.5
小结:利于信息化
通用盲文本质上是字字标调的,在计算机后台每个字都带调。不论纸质版的盲文怎样省写,都不改变字字标调的本质特征,这为盲文的计算机朗读提供了可靠的基础。现行盲文原来“需要时标调”是非形式化的,是计算机无法实现的目标,通用盲文的省写规则都是计算机可执行的形式化规则,汉盲翻译不再是无法实现的目标了。由于通用盲文字字带调,盲汉翻译的难度大大降低,准确率能够大幅度提高。更进一步,通用盲文还可以与其他版本的字字带调的汉语盲文自由转换,包括台湾使用的点字等。
四
过程性成果
以定量研究数据为重要参考,语言学专家、盲文专家、特殊教育专家经过反复研讨、筛选、比较,做 出定性分析,先后形成了三类 12 个方案。其中有些方 案征求过盲文编校、盲人、盲校教师的意见,也做了摸读实验。要在保持盲文方案根本稳定的前提下拟定现行盲文标调规则,课题组起初的研究视野内有三种方式:字字标调、按声调省写、按音节省写。字字标调仅仅是过程性的,目标在后两种之间。课题组在研究中发现了“按声母省写”的方式。
整个方案设计过程充满了波折和反复,总趋势是删繁就简。以下是对“按声调省写”“按音节省写”与“按声母省写”三类方案的介绍与比较分析。
4.1
按声调省写
在现代汉语四个基本声调中,去声的使用频率最高,约占35%。将所有去声符号都省写,对使用者来说没有记忆负担。但是,这样选择只考虑了使用频率一个因素,出现了很多不符合盲人阅读习惯的情况, 如:wò 省写为wo,而绝大多数盲人很容易将其读成 wǒ,要读成 wò 就很费力。比较突出的还有“你、和、他、有、一、也”等,如果将这些字所在的音节作为特例筛选出来另外处理,会形成很多例外,记忆负担会大大增加,不用记忆的优势也会大打折扣。
另一方面,如果将所有去声符号一刀切地省写,读多了新版盲文书的盲人再读旧版会很不习惯。省写规则的导向清晰而强烈,使盲人遇到未标调的音节总认为是去声,不利于猜读旧版盲文,新旧衔接困难较大。
按声调省写去声形成了“去声为主型”和“去声兜底型”两个方案,这两个方案形成得很快,于2012年暑期被淘汰。
4.2
按音节省写
如果不采用一刀切式省写去声的规则,而采用从基本音节中筛选省写声调的方式,每个基本音节中都有一次独立的选择机会。选哪个声调省写,不同音节之间没有制约,有些低频音节可能会被弃选。课题组进行筛选时,在每个基本音节内综合考虑各声调的使用频率、盲人的阅读习惯、音节的构词能力、触觉品质、轻声等多种因素。
但是,这些单独筛选出的省写音节是孤立的,相互之间没有自然的逻辑联系,除了符合盲人习惯这条以外,其他因素对盲文读者的记忆没有直接帮助。不容易记忆是按基本音节灵活选择省写声调的严重缺陷。
按音节省写先后形成了7个方案。多音节单音节双全型的方案有1个,含 33个三音节、240个双音节、 182 个单音节。多音节仅限于唯一读音范围内,设计假设是读者不用记忆。由于多音节省方效率较低,并 且使方案显得很复杂,2013年在全国盲人协会(以下 简称“盲协”)主席会议上征求意见后,课题组下决心淘汰了该方案。
将多音节排除在研究视野外之后,课题组形成了6 个单音节型的方案,起初是增加单音节省写的数量,以弥补淘汰多音节的损失。这6个方案的差别是省写音节数量的增减,最少的含160个音节,最多的含286个音节,其中容易记忆的唯一常用声调的音节 数量基本维持在40个不变,增减的是需要机械记忆的高频音节,这是省方效率和读写难度的博弈。
课题组对这些方案的满意度总体不高,感觉记忆没有规律,难度过大,生怕影响方案的接受度。因此在这一研究思路下,课题组的徘徊摸索较多。2014年 冬,课题组发现按声母省写法后,这些方案被整体淘汰。
4.3
按声母省写
此方案是课题最终成果,详见下节。
五
最终成果
5.1
声调分布的非均衡性
按声母省写是从声母相同的音节中不同声调的使用频率出发,对同一声母的音节只选择同一个声调符号省写。这类方案省写效率较高,规律性较强,记忆负担很轻,便于掌握使用。
课题组按音节开头的音将汉语音节分成22组,其 中有声母的音节21 组,零声母的音节1组,每组内进 行一次选择,共选择22 次。这样选择既不会太灵活, 受到的制约也不是太大。在每个声母组内可以综合考虑使用频率、盲人摸读习惯、构词能力、触觉品质、轻声等多种因素,慎重选择一个声调省写。这样省写的利弊都不像按声调省写和按音节省写那么突出,以“省时省方”上的小损失换来“易读易写”的大进步。
课题组在文献中没有发现声母与声调匹配的频率分布数据。课题组从国家语委现代汉语平衡语料库中 随机抽取了8000 个语篇,包括1500 万个汉语音节(不计标点符号、阿拉伯数字、外文符号等非汉字字符)。该语料一、二、三、四声总的分布与常见的数据 接近,声母使用频率与汤云航(1995)统计数据的相 关系数为0.98。表1是不同声母组中各声调使用频率 的分布情况(各声母中声调使用频率的最大值覆盖了阴影)。
从表1 可以看出,每个声母组内各声调的使用频 率具有非均衡性,这就有了提高省写效率的可能。均衡性越差、最大值越突出的声母组省写效率越高。最大值特别突出的声母组中,最大值起决定性作用。其他声母组中,构词能力突出的音节、盲人阅读习惯、触觉品质、轻声等特殊音节起重要作用。相关声母的 关联性与一致性也起一定作用,如:zh 与 z、ch 与 c、sh 与s等。
5.2
按声母省写
课题组按声母省写形成了3个方案。这3个方案的差别在于特例的种类和数量,是省方效率和读写难度的博弈。最早的方案包含4种46个特例,最后的方案仅含区分常用轻声的3 个特例和韵母自成音节的7个特例。
按声母省写的核心是在字字(轻声字除外)标调基础上,声母相同的音节(个别特例除外)不论韵母 是什么,省写一个相同的声调符号。例如:声母b和16 个韵母相拼,形成16个去声音节,这16个音节的去声符号都省写。其余的39 个阴平、阳平、上声音 节的声调符号都不省写。当读到声母为b 的音节(不论韵母是什么)时,没有声调符号的读去声(个别时候也有可能是轻声,需要读者在语境中消歧)。在书写时,以b 为声母的去声音节不写声调符号,所有的阴平、阳平、上声音节都字字标调。
这样,每个声母都增加了省写声调标志符的功能, 具体是(用数字 1、2、3、4 分别表示四个声调): b-4、 p-2、m-2、f-1; d-4、t-2、n-2、l-4; g-4、k-4、h-2; j-4、 q-2、x-4;zh-4、ch-2、sh-4、r-2、z-4、c-2、s-4;零声母-4①。按照省写规则,没有声调的 qishang dashu 一定是qi2shang4 da4shu4(骑上大树),无须猜测, 不会是“旗上大书”。而“旗上大书”必须一致地、规范地写成qishang dashu1,不论哪个出版单位,不论哪个编辑。
①参见《国家通用盲文方案》。
5.3
韵母简写
韵母简写以国家社科基金项目“汉语盲文简写方案”的研究成果为基础,筛选出实用性最强的部分。最早的方案含23个多音节词、7个单音节和6个字。 在2013年全国盲协主席会议上征求意见后,课题组删 除了多音节词部分,形成了新的简写方案。2014年春, 课题组征求成年盲人意见,发现其对单音节简写韵母 反对的呼声很大,尤其是bu、pu、mu、fu简写韵母u。他们普遍认为,简写后像外语字母,省方不省时,与传统习惯严重冲突。最终方案仅含“的、你、么、他、她、它” 6 个简写韵母字,主要是为了区分同音同调字 而采取了定型简写。
按照本方案,声调省写的覆盖率约为42%,韵母 简写的覆盖率约为6%,每百字平均增加33 方左右, 每字平均2.18 方。由于标点符号、外来符号、空方等不产生增量,盲文篇幅的增加量约为 12%。
六
实证研究
实证研究是本项目的重要组成部分,问卷调查、专家访谈、现场访谈、电话咨询等贯穿了研究始终。 2012 年以来,课题组利用每年一次的全国盲协主席会 议的机会,对全国盲协委员和省级盲协主席进行调研和访谈,获得了大量的对方案修正有重大贡献的宝贵意见和建议,也经历了从质疑到肯定的过程;对全国各地参加全国盲文基础能力竞赛的选手进行了三次调 研;根据研究进度,对参加2013年(南京)国培班和 参加 2015 年(上海)全国盲校信息技术大赛的盲校教 师(均接近200 人)进行了问卷调查;对参加成人教 育入学考试的盲人进行了两次规模超过60人的调研。 其他小型调研、访谈涵盖了上海、北京、青岛、呼和浩特、泰安、淄博、德州等地盲校师生,也包括北京联合大学、长春大学的盲人大学生。课题组在北京、内蒙古、山东、云南等地进行了多次社会盲人调研;对盲文出版社、北京师范大学、教育部语言文字应用研究所、南京特殊教育师范学院等单位的盲文专家或语言学专家进行了多次访谈,也对北京、内蒙古、陕西、天津、山东、江西、云南、河南、吉林、安徽、福建、甘肃、黑龙江等地的盲文专家进行过访谈,这些调研对理清研究思路、解决轻声等疑难问题起到了重要作用。
从 2012 年 11 月第一次全国盲文基础能力竞赛开 始,课题组陆续增加了测试法和实验法的研究内容,对北京、上海、重庆、广东、新疆、泰安、浙江、呼和浩特、淄博等地盲校的中小学生,以及北京联合大学、长春大学的盲人大学生,进行了阶段性方案和例文的测试,为方案的修正提供了重要参考。
七
试点检验
2015年12月,《国家通用盲文方案(送审稿)》 通过教育部、国家语委、中国残联鉴定,形成了《国家通用盲文方案(试行)》。中国残联、教育部(残联 厅发〔2016〕18 号)决定,2015—2017年在全国9 所 盲校(特殊教育学校)、2 所高等特殊教育学院、9 个 省级盲协、2 个盲文出版单位进行《国家通用盲文方 案(试行)》试点。试点工作可以通过实践检验《国家通用盲文方案(试行)》的科学性、适用性,为进一步修改、完善方案提供依据。
本次试点单位来自不同方言区,区域分布广,代 表性强。参加试点的11 所院校是:北京市盲人学校、 上海市盲童学校、安庆市特殊教育学校、南昌市盲童学校、青岛盲校、长沙市特殊教育学校、广州市盲人学校、重庆市特殊教育中心、乌鲁木齐市盲人学校、 北京联合大学、河南推拿职业学院(2017年增补)。 参加试点的9 个省级盲协是:北京市盲协、内蒙古自 治区盲协、江苏省盲协、浙江省盲协、福建省盲协、广东省盲协、重庆市盲协、云南省盲协、甘肃省盲协。 全国仅有的2个盲文出版单位——中国盲文出版社、 上海博爱盲文印刷有限公司都参与了试点。
试点分两个阶段进行,2016 年为第一阶段。试点 盲校由4 名教师试教,小学二年级在语文课中试学试 用,中学以上学生以课外活动小组方式试学试用。每个省级盲协由3 名骨干带领15 名(以上)成年盲人在 业余时间试学试用。2 个盲文出版试点单位按照《国 家通用盲文方案(试行)》印制试点材料,包括小学二年级语文、数学、思想品德等盲文教材,也包括古文、白话文、医学、科技类盲文图书。
2016 年底第一阶段试点结束,国家手语和盲文研 究中心召开试点总结大会。各试点单位提出了具有针对性的意见和建设性的建议,未发现课题组完全没有研究过的全新问题。课题组经过深入研究整理,形成了《〈国家通用盲文方案(试行)〉意见汇总处理表》(中期)。课题组与2个盲文出版试点单位一起研究, 形成了第二阶段试点材料补充意见,增设了“轻声符 号、9个唯一声调音节省写特例、3个简写定字特例”; 增设了“需要声调符号提供点位参照或者区分音义时, 声调符号可以不省写”;将声母h 组的省写声调调整 为去声,实现了声母 h-x 组省写声调的一致。据此形 成的新版试点材料在2017 年再行试点,为了不给小学 二年级学生增加过多的学习负担,小学二年级试点教材沿用旧版。
根据第二阶段试点反馈意见,课题组研究整理出《〈国家通用盲文方案(试行)〉意见汇总处理表》(最终),据此修改形成了《国家通用盲文方案(修订稿)》。 2017 年 10 月,中国盲协和课题组召开了试点 单位代表和课题组成员共同参加的国家通用盲文试点总结暨《国家通用盲文方案》修订研讨会。大会确定了《国家通用盲文方案(送审稿)》,决定保留“需要声调符号提供点位参照或者区分音义时,声调符号可以不省写”,第二阶段试点材料补充意见增设的其他内容没有经得起试点的检验。试点单位普遍反映新增内容的效益是虚无的,困难是实在的。这些增设和调整的内容没有进入送审稿。与试行稿相比,送审稿仅增加了1条规则和1个特例(“le4 不省写”,与轻声le0 区分)。
经过两年的试点,试点单位普遍欢迎《国家通用盲文方案(试行)》,希望其尽快落地推广,认为它解决了现行盲文60 多年来的猜谜问题,没有另起炉灶, 学习难度小,增加篇幅不大,阅读顺畅。对于具有较好盲文基础的初中以上文化程度的盲生及成年人而言,国家通用盲文在古文和科技文章阅读方面的效果十分显著,通俗易懂的白话文阅读方面的效果不显著。对小学二年级盲生而言,国家通用盲文全面降低了阅读难度。方言区试点单位普遍反映国家通用盲文书写难度较大,既需要思考是什么声调,还需要思考哪个声调省写,影响书写速度。
重庆特殊教育中心小学二年级试点班同学的晨读自然流畅、字正腔圆、声情并茂;非试点对照班(由于视障生人数少,普遍没有对照组)同学则磕磕绊绊、边猜边读。北京市盲人学校在试点过程中,申报了北京市教育学会“十三五”教育科研课题“《国家通用盲文(试行)》实践研究”,其对中学生分组进行了4 次测试,通用盲文的阅读速度比现行盲文平均高出22.1%,错误率平均低32.3%。其中,2017年6月6日的第二次测试差异最大,通用盲文的阅读速度比现行盲文平均高出41.2%,错误率平均低 67.3%。
八
成果的创新点
8.1
按声母分组省写声调
在汉语拼音声调、声母使用频率的非均衡性基础上,课题组进一步探究发现,每个声母组内声调的使用频率仍然具有非均衡性。这一发现为现行盲文声调省写开辟了新的途径,还进一步探究了汉语音节的分类,常见的有声调组、基本音节、实有音节三种,分别是按一、二、三个语言要素分类的代表。按照汉语声韵调三要素全组合,总共可以有七种分类方法。如果以分类的常量命名,其他四类分别是:声母组、韵母组、带调声母组、带调韵母组。其中,对带调声母组的研究在本项目中发挥了重要作用,形成按声母分组省写声调的方法。
8.2
使用在建盲文语料库进行实证研究
课题组通过使用在建的汉语盲文语料库(国家社科基金重大项目)进行实证研究,挖掘出一些可用功能,为国家通用盲文标准修订服务。本课题组是盲文语料库建设核心团队,这是得天独厚的优势。我们从 汉语盲文语料库中随机抽取21世纪以来的383个语篇, 约 88 万字,经过计算机自动处理和人工勘验,发现 21 世纪以来现行盲文出版物平均标调率约为11.35%, 分半信度系数为0.99。不同类别语篇的标调率差异没 有达到显著水平(P=0.912>0.05)。(钟经华等,2015) 现行盲文标调的重心偏移到了单方音节。标调应回归区分同音异调词的本位,才能提高现行盲文表音的准确性,减少猜读现象;才能提高盲文沟通的有效性,减少盲文沟通的障碍。
由于本次较大规模的实证研究结果与以往广为流传的5%标调率的差异很大,因此,有必要重新评估 猜读问题(至少是21 世纪以来的语料中的猜读问题)。 现行盲文标调规则修订后,标调率上浮空间比原先估计的大,篇幅增加的幅度小。标调规则修订的注意力应更多地集中在表音准确上,不必太强调减少篇幅。未来国家通用盲文中标调率的上升对盲人阅读和盲校教学的冲击比原先估计的更小,新旧衔接的跨度更小,更容易适应和接受。
8.3
从符号兼用与消歧视角研究标调问题
从符号兼用与消歧的视角进行探究,普通话语音 中声母g、k、h 与 j、q、x 具有互补关系,因此现行 盲文声母g 与 j、k 与 q、h 与 x 两两兼用一个符号是 无歧义兼用。韵母e、o 则是对立关系,由于e、o 互 斥的消歧条件不存在,现行盲文韵母 e、o 兼用一个符号是有歧义兼用。随着盲文信息化的发展,这种有歧 义兼用造成的混淆会更加凸显。心目克明①和台湾使用 的盲文中e、o 没有兼用(滕伟民、李伟洪,1996), 各有专用符号。本研究通过省写方法消歧,即:音节o 的各个声调符号都省写,音节e 的各个声调符号都不省写。这样在不使用新符号的情况下,实现了韵母 e、o 的无歧义兼用。
现行盲文一般不标调,这造成了海量的声调歧义,计算机运算窗口越大,歧义越大。现行盲文很难进行盲—汉翻译以及其他盲文信息化的处理。课题组通过对标调的规范,首先消解声调歧义,然后消解其他兼用符号的歧义,可以突破现行盲文信息化的瓶颈。这对盲文出版提高了要求,但是盲文出版信息化却有了支点,提高盲文出版的效率和降低劳动强度也有了可能。
①这是 20 世纪初以南京语音为基础设计的一套拼音盲文,又称“老盲文”。
8.44
在继承基础上创新
本研究以保持现行盲文稳定为重要原则,在现行盲文主体结构保持不变的前提下,对其标调理论和标调方式进行重大调整,使现行盲文表音准确,又不大幅度增加方数;兼顾了汉语表音的准确性和触觉文字的简洁性,显著提升了现行盲文的品质,并且新旧衔接较自然,容易被接受;对盲校教学冲击更小,盲生可以边学边用,不同学科教材甚至可以新旧版本并用,盲生读写也可以不同步。本研究是在全面继承现行盲文方案基础上对声调符号使用的规范化,现行盲文方案的根基没有动,风险小。省写规则局部可调,适应性强,如果在实践的检验中需要做出调整,也不会出现连锁反应,不会影响到整体的稳定性。
九
成果价值
通用盲文将率先规范盲文出版物的标调,并逐渐引导盲人规范标调,也充分照顾了方言区盲人的特殊困难;使读者很容易读准省写了声调的音节,消除语音猜读现象,减少语义猜测,使汉语盲文能够更好地满足盲人日益增长的文化教育需求,适应信息化时代的发展要求。本项目成果使得我国盲人有了相当于汉语拼音功能的文字工具。
本项目研究吸收了心目克明、台湾盲文、双拼盲文等多套汉语盲文的优点,也借鉴了英语盲文简写方面的一些优点,还吸收了国内外盲文推广试行的一些经验教训,避免与原盲文方案冲突,在继承的基础上发展,减少推行过程中社会、文化、心理、习惯、应用等方面的困难和风险,以最小的政治、学术、社会代价,最大程度地提高现行盲文语言表达的准确性。该研究经过实践检验后,可以形成比较完善、成熟、科学、好用、易行的通用盲文新标准。
通用盲文以全面标调为基础,利用零标记原理按声母省写一个声调,标出其他三个声调,从任意省略一至四个声调转变为按规范省略一个声调。通用盲文吸收了双拼盲文字字标调的精髓,保持了现行盲文的“形”,具有了双拼盲文的“神”,以两文融合取代两文之争。这是自“康熙盲字”诞生之后130 多年来第一次没有文化断层之虞、没有以牺牲文化积淀为代价的汉语盲文升级(钟经华等,2014)。
通用盲文杜绝了“一词多形”,减少了“一形多词”(只在同音同调词范围内存在),实现了从“一对多”到“一对一”的嬗变,为盲文信息化提供了支点。全面标调可以排除现行盲文因一般不标调在信息化方面产生的严重障碍,帮助计算机跨过“猜”的鸿沟,扭转我国盲文信息化远远落后于英国和美国,内地(大陆)盲文信息化也落后于港台地区的局面。使用通用盲文的形式化省写规则可以为现行盲文与双拼盲文及台湾盲文的计算机转换打下基础,在信息技术条件下,实现两岸盲人的沟通;可以为盲文信息化打下良好的基础,对盲人共享改革成果,促进盲人语言文字权益平等有重要意义。
十
尚待深入研究的问题
课题组借用大规模汉语语料库,结合有针对性的动态语料,保障了本研究基础语料的平衡性和代表性;使用信息化的语言分析处理技术进行较大规模的语言信息处理,探索了现行盲文全面标调省写的新路。由于汉语盲文语料库尚未建成,具有现行盲文标调特色的基础书籍贫乏,我们无法全面把握现行盲文标调习惯的全貌。盲文语料库建成以后,我们可以对省写规则和既有标调习惯的衔接进行深入研究。
具有学科特色的省写和简写是另一个需要深入研究的问题。盲生随着年级的升高,阅读能力逐渐增强,教材内容增多,阅读量增大,具有学科特色的多音节专业术语有进一步省写和简写的空间及需求,例如: 双曲线、氧化还原反应、肱二头肌等。像 diu1、hei1、 sen1、fou3、gei3、nuan3、ce4、ri4、te4 等唯一声调音节,省写潜能的进一步挖掘也值得深入研究。
汉语盲文的分级也是一个需要深入研究的问题。全面标调未省写的现行盲文可以规定为一级盲文,本方案为二级盲文,分学科简写的为三级盲文,分对象、分阶段使用不同级别的盲文,既符合国家的标准规范,也与国际上盲文简写的惯例接轨。
港澳台与内地(大陆)两岸四地汉语盲文的互相借鉴与沟通也需要深入研究。尽管港澳台与内地(大陆)盲文的形态迥异,但毕竟都是汉语盲文,深入研究应该能够找到可以互相启迪的地方,也有可能形成互补,至少能够提供不同的研究视角,譬如现行盲文的分词连写和标调省写等值得台湾盲文借鉴。要使信息化条件下汉语不同版本盲文互相转换的可能性变成现实,也需要深入研究。
-end-
征稿
《语言规划学研究》是语言规划学学科的重要刊物。本刊欢迎以下各类来稿:
1. 语言文字规范标准研究
2. 少数民族语文应用研究
3. 语言政策与语言规划研究
4. 语言生活调查研究
~~ 稿件要求 ~~
1. 字数:8000字左右。
2. 来稿请用电子邮件以附件方式发送至yyghxyj@blcu.edu.cn。
完整版征稿启事链接指路:
往期回顾
语言文字规范标准丨
国家语委印发《信息化条件下语言文字规范标准体系建设规划》(附《规划》全文)
《语言规划学研究》| 陈双新 语言学家谈语言文字规范 ——“语言文字规范标准建设调研”项目专家访谈总结
特殊的语言文字丨
本期责编:千语
语标,你的语言风向标
长按识别二维码关注
点击右下角,告诉我你在看~