辞书研究 | 甘于恩:电脑编纂语言学书目的初步尝试——介绍《中国语言学分类目录》
1970年,作为美国普林斯顿大学和英国剑桥大学联合开展的“汉语语言学研究”的一部分,剑桥大学出版社出版了由美柏克莱加州大学William S-Y. Wang(王士元)和Anatole Lyovin主编的《中国语言学分类目录》(Chinese Linguistics Bibliography on Computer),简称CLIBOC。这是部利用电脑编成的中国语言学工具书。虽然至今时日已久,但由于国内利用电脑来编纂语言学工具书并不多见,特别是语言学的分类目录,种类还较少,介绍这样一部工具书,对于我们在这一领域开展研究,可能有些参考价值。
#1
分类目录内容简介
这项工作开始时,只是在俄亥俄州立大学的《语言分析报告》杂志上登载有关北方方言的目录,仅有千余条。1967年,《东亚和东南亚语言学》(这是T. A. Sebeok主编的《当代语言学趋势》丛书卷二)出版,其中王士元写的《中国语言学书目》增加到了近三千条目录。在此基础上,王等人利用电脑进行分类、整理和增删,编成这部有3045条目录的工具书(资料截止期为1967年年底)。
此分类目录的收录种类较多,既有历时的比较研究,又有共时的描写。而且不限于收入研究汉语的论著,有关中国境内外汉藏语的论著及中国境内非汉藏语的论著,都在收入之列。
本书共分七部分。第一部分是绪言,第二部分是目录正文,第三部分是主题索引,第四部分是中日文简目(只含作者和论著题目两项),第五部分是近六百条的目录提要,第六部分是中日文期刊的缩略字母及全称的对照,第七部分是几个拼音方案的对照表。书末另附两张地图,一为汉藏语言分布图,一为汉语方言地图。
#2
电脑编目过程简介
CLIBOC使用的是经改编的Mart Sort and Merge(商场分类与综合)子程序,由于这套子程序只能为固定长度的磁带进行分类整理,而工具书中条目的长度是不等的,故编者在作了统计测量后,将每一条目的平均磁带长度固定为八张IBM卡片,超过这一长度的条目则加以压缩。
为了保存格式,输入部分给每一条目提供了不输出的编码卡(第一卡),上有供正确分类所需的六个域。每一条目的第二卡则有三个域:一——五四列写主要内容(作者姓名、标题等),五九——六四列写主要题标识符,六七列写卡片顺序号。后面的六卡都只有二个域:一——五二列还是写主要内容,六七列写卡片顺序号。卡片顺序号输出时都要擦去。在完成总的分类整理后,运用编定的各种主题标识符和电脑自动标记的索引号码,便可作准备编制主题索引。其过程是这样的:先将主题标识符简单地打在IBM卡某一规定的区域,在输出卡片叠部分,这些IBM卡将附上索引号码。然后,整个输出卡片叠通过分类机,有主题标识符条目的IBM卡由分类机同其他卡片分开,再按字母顺序和主题标识符进行分类,接着每一堆卡就以适当的小标题印出。
#3
分类目录的特色
这部分分类目录,不仅在70年代,即使在目前,仍是比较有特色的。这可以从以下几方面体现出来:
一.收录范围不限于大陆。国内这类工具书大多有相当大的局限性,即收录范围仅限于大陆的出版物,而且不录专著目录。而这部分目录从数量上说,虽远不及国内语言所编定的两卷本《中国语言学论文索引》,但可贵的是,它收入一些港台和海外学者的重要论文专著的目录,可在一定程度上弥补国内这个索引的不足,开阔语言工作者的眼界,以便全面地了解中国语言学的研究成果。
二.一些比较重要的论著,专门请廿二名著名学者(如张琨、桥本万太郎等)撰写了英文提要。这是这部目录最有份量的部分。如谢信一关于《马氏文通》的提要写道:“这是参考规范的拉丁语而写成的最早的汉语语法著作之一。作者在讨论语法时提供的例句皆引自古典文献。此书分十卷:①正名;②—⑥实字;⑦—⑨虚字;⑩句读。后来的汉语语法学者沿用了不少此书首创的专门术语。”特别是一些目前难寻的著作的提要,可令读者对这些著作有初步的了解,更显示出这部目录的效用。
三.体例安排也有可借鉴之处。作为此书的主要构件,目录正文、主题索引、中日文简目和提要四部分以索引号为引导,互为参照,检索甚便。如要查找王力有哪些论著,可在目录正文按字母顺序查到Wang li,即知从2205至2252号皆为王力论著,如要了解基本内容,可再按索引号到提要部分查找。要是读者想了解某一领域的研究情况,可求助于主题索引。主题索引共列445个主题,按音序排列。如查找广东方言的语法研究情况,可先查Cantonese一栏,再找Grammar这个次目,即得313、2141、2156、2339、2755五个索引号,有了索引号,检索就毫不困难了。
#4
分类目录的不足
当然,这部分类目录现在看来,显得陈旧了些。即使按当时的条件来要求,也可以发现一些不足。主要有以下几点:
首先,材料收集不全。本来利用电脑编纂目录,应该尽可能地发挥优势将目录编全,但编者有时把注意力过于集中于海外学者(这种倾向在提要部分表现得尤为明显),国内的研究成果反而有所疏忽。如马宗霍的《说文解字引方言考》出版于六十年代初,距该工具书开始编纂已有好几年时间,却没有被收入;又如著名学者黄典诚有不少研究闽方言的论文,也一篇未见收入。这样便影响了这部工具书的完备性。
其次,主题索引有的分类不够科学,像汉语的“海南方言”本应归属于闽方言,编者却把它独立为一类,从而模糊了其语言系属。而且不少目录不入主题索引,如从2221(王力:词和仂语的界限)到2229连续九个目录都没有主题索引,因此在相当程度上减弱了主题索引的实用性。
再次,校核欠精,也使这部分类目录存在不少差错。其中主要是笔误,例如中日文简目的1126号的作者误为“李华”,“”应改为“峰”,目录正文678号中Tookyoo规范的写法是Tokyo(东京),190号作者之一Wan-ru Bai(白婉如)错成Nan-ru Bai,655号标题Han Yu Pin Yin Ci Wui(汉语拼音词汇)中Wui应为Hui;有的笔误则可能是打印时的疏漏,如目录正文2344号Hokkien错为Hokien,提要部分1074号误打成074。不过有的差错则是技术性的,如目录正文“黎锦熙”的论著放在“李华峰”和“李临定”之间,按音序排列法,“黎锦熙”应在最前,不应插在中间;主题索引部分,2940号(新化方言与普通话的差异)误入闽语类,应归入湘语类。
尽管有种种的不足,对于国内的语言学工作者来说,这部分类目录还是值得利用的。如果能结合使用语言研究所的论文索引(两卷本),以及美国乔治敦大学杨福绵教授编纂的《中国语言学分类参考书目》、《中国方言学分类参考书目》(香港中文大学出版社出版),那么,就可以比较全面地掌握八十年代以前海内外研究中国语言的主要信息。
(原载《澳门日报》1987年11月15日第20版“语林”27期,修改后发表在《语言学通讯》(武汉)1988年1期。编按:《语言学通讯》为《汉语学报》的前身)
本期文案 | 甘于恩
本期编辑 | 邵启彰
本期审读 | 邵启彰
本期责编 | 甘于恩
投稿邮箱 | jnufyzx@163.com
【往期推荐】