李守奎:汉字到底有多难
前面我们说过,很多人认为汉字是很难的,我也承认汉字难,但是汉字到底有多难?今天我们就一起来讨论讨论这个问题。
按照西方的文字学理论,汉字真的是很难,我们前面也讲过,有些学者认为,汉字难到了要灭国的程度。
相比较西方的拼音字母,我们确实是字形很多。3000余个常用字,6000余个通用字,大字典里边有好几万,而罗马字母只有26个。我们得承认,作为文字符号,汉字确实是难的,尤其是刚入门的时候,那简直就像进入了魔幻世界。但是汉字到底有多难呢?这个问题我们做过认真的研究和分析吗?我们做过实验吗?简单的数字对比有时候会掩盖一些事实的真相。下面,把我的个人理解在这里向大家介绍一下。
第一,汉字有多少字就够了?
我们总说汉字字数多,其实汉字总量多少并不重要,为记录语言,汉字需要用多少个的问题很重要。有学者早就做了统计和研究,通过下面这一组数字,看看汉字出现的概率。
所以说,就汉字的一般使用来说,2400字达到99%,剩下的所有的字,只占应用的1%。那些字,通过一些技术上的处理,也可以一定程度上避开。总之,有3000多个字基本就够用了。
第二,汉字有个非常重要的特点,是字与词的一致性,这尤其适合于上古汉语。
上古汉语中,我们的字记录的单位就是词,那意味着什么呢?你会了字,也就会了词。比如说《春秋》第一年就记载了“郑伯克段于鄢”这么一件事,《左传》中这一篇很多朋友都学过。这里边“郑”是国名,“伯”是爵称,“克”是战胜,“段”是人名,“于”大致相当于我们现在的介词“在”,“鄢”是地名,每一个字都是一个词,所以说我们学习了3000个汉字,就至少掌握了3000个词。对于现代汉语来说,不仅是3000个词,还有所有的词素了。
假如我们学习了3000个常用字,那么你就掌握了3000个常用词。3000个常用词,我们全部的构词词素也就包含其中了。这就是汉字字与词的一致性。大家可能会问,你讲这个东西干什么呢?哪一种文字不是这样的?
大家最熟悉的外语是英语。英文很简单,使用的字母一共就26个。但是它的特点是什么呢?它是通过字母去记录词素,再通过词素去组成词。
我就问你一个问题,你掌握了1000个如山水草木、鸟兽鱼虫等常用字,你肯定会1000个汉语的词或者词素,你掌握了26个字母,你会了几个英语单词?所以从这个角度来说,我们说汉字到底有多难,你不能只用26个字母和我们3000个常用汉字做这种简单的比对。
第三,常用字与常用词结合是非常稳定的。
现代汉语中常用的单音词大都来源非常古老。天地鬼神、山川草木、牛马龙蛇等,这些文字来源非常古老,即便是字形发生了变化,但是它们与意义的结合是稳固的。所以说我们的语言因文字而具有了延续性。
第四,汉字的构字部件非常有限。
汉字不论有多少,它们的构成材料是非常有限的。汉字不是一堆笔画的任意组合,我们在发刊词里说,通用字表里有6000字,或者有7000字,不同的时代通用字也是不一样的。通用字中笔画最多的是“齉”,36画。而这个36画的字,我们可以分解一下,首先可以分解出两个部件来,一个是鼻子的“鼻”,一个行囊的“囊”,只要我们先学会了这两个字,再认识最复杂的“齉”就是几秒钟的事情了。常用字表有3500字,笔画最多的是矗立的“矗”,24画,是三个“直”摞起来,矗立,高高地耸立。我们常用字表中,23画的字就没有,22画里边有3个,一个是蘸着酱油吃的“蘸”,另两个是金镶玉的“镶”、瓜瓤的“瓤”,从22画到24画,一共就4个字。
如果我们认识这些繁难字之前,认识了鼻子的“鼻”,认识了行囊的“囊”,认识了金属的“金”,认识了“瓜”,这些繁难字就不难认识了。
汉字的构成,不是没有规则的一堆散沙,而是非常有规则、非常有规律的。构字部件非常有限,大概有多少呢?《说文解字》中有9000多个字,加上古文重文有1万多字,部首是540个。这些部首还并不都是已经分解到了不能再分解的构字部件。我们如果把它分解到不能再分解的构字部件,加上一些只作表音的部件,实际上只有300多个。现代汉字同样也就是这么300来个。所以,我们认字要先从简单的认起,如果先把这300来个简单的字掌握了,它们再彼此层层组合,就构成了万千的汉字。从这个角度来说,汉字的难度也是可以在一定程度上消解的。
第五,汉字是有理据的。
文字的字形与它记录的音义之间是有联系的。有些理据非常简单,比如说“理据”这两个字,我们分析分析,我们看一看,都是左右结构,一半表意,一半表音。
但因为汉字非常古老,有些理据隐藏得很深。例如刚才说过的“隐藏得很深”中的“隐”“得”“深”等字,现在是高频常用字,为什么这么写?汉代的学者有些就弄不清楚了,我们想要弄清楚它,确确实实是非常难的。
汉字构形有字理,它可以帮助我们记忆。任何事情都有两面性,探索理据有时候很难,但知道了理据,可以帮助我们认识难字。
通用字表中30画到36画的字只有两个:爨、齉,我们可以说这两个字是难到了极致。我们不要说大家写不出来,字号小了看都看不清楚。“爨”这个字我们现在还在使用。为什么这么写?追溯到小篆,《说文》说了,“爨”就是生火做饭的意思,就是炊爨做饭。这个字上面是什么?是两只手。两只手中间是什么?用许慎的话来说,那是个灶门,灶下面我们想一想,要做饭该往里边放什么?放柴火,就是那个“林”。这里的“林”就是木头,就是柴火。两只手把木头送到灶门里,双手的下面还有个什么呢?火!那得用火把它点着了。
《说文》小篆
这个字这么一讲,我不知道现在你能不能把这个字正确写出来?我们如果懂得这个字理,再看这个字,大概就没那么难了。
当然这种字理识字法,必须是掌握了一定量的汉字之后,对部分字形繁难但字理简单的字是有效的。对于“日”“月”“牛”“马”这样的字来说,就完全没有效果了,对“隐”“得”“深”等字理复杂的字也就更不可行了。
关于汉字的难度,我希望能够用实验的方法进行科学的研究,而不是感性的、经验的、任意地说难说易,说是说非。
目前我们对汉字难度的认识,我个人认为可以归纳的结论如下:
结论一,就应用层面,我们不能说汉字不难,表意字系统复杂,数量多,结构难,理据深,这是事实。我们不能爱屋及乌,我们不能说它比26个字母还简单。
结论二,汉字虽然难,但是没有那么夸张,我们不能把汉字妖魔化。汉字数量是可以控制的,结构是可以稳定的,字与词素是统一的,字与大部分词是统一的。
结论三,汉字历史悠久,积累深厚。如果想深入了解,就会有想象不到的难。
例如“庖丁解牛”,这是个成语,读过《庄子》“庖丁解牛”也就知道这个成语的来源。“庖丁”就是厨子,“解”就是分解。厨子分解牛,意思很容易理解。每一个字为什么能够记录它相对应的词呢?这个“解”字的意思是分解、解开。这个字结构是什么呢?左侧是一个“角”,右侧上部是个刀,下面是个牛。试想开始分解牛,怎么分解牛呢?得用刀。“庖丁解牛”这个词例,是对这个“解”字最好的解释。那“丁”呢?庖丁的“丁”是什么意思呢?最初怎么写呢?为什么这样写呢?怎么会变成这个样子呢?一个“丁”字,会牵涉很多很多的问题。
我曾经写过一篇叫作《目不识“丁”》的小文章,就是单谈这个“丁”的,大家有兴趣的话,可以看一看。
如果我们不关心历史文化,只是为了应用,3000常用字之外的那些字可以忽略,理据的难也完全可以忽略。
在这里说解汉字想达到两个目的:
第一,把简单的讲难了,从认识的汉字里知道“不知道的知识”,于无声处听惊雷。
第二,把复杂的讲简单了,戳穿难字那些“纸老虎”。
选自李守奎、王永昌《说解汉字一百五十讲》陕西师范大学出版社2021年12月第1版
汉字是中华文化的标志性符号之一,但这个符号本身的含义却经常被误解,产生了诸如“家里藏猪”“止戈为武”“波为水之皮”的笑话。汉字究竟是什么意思?几千年来发生了哪些变化?为什么一个字形可以表达某个意思?针对诸如此类的问题,中国文字学学会副会长李守奎教授在本书中用近700个汉字予以解答,晓畅通透,文字活泼,既有靠谱知识的讲解,也有深层文化的阐释,是难得一见的优秀汉字知识读本,为汉字文化爱好者提供了一堂堂精彩的古文字通识课。