查看原文
其他

学人 | 李蓝:《中国方志中语言资料集成(全42册)》序(节选)【转发】

语言资源快讯 语言资源快讯 2022-12-22

以下文章转自今日语言学



由于微信公众平台推出新功能,“语言资源快讯”左边显示的名称并非原作者,而是公众号管理者,原作者将于大标题和文末显示,感谢各位读者的谅解!


01

中华文明,源远流长。浩如烟海的汉语文献是人类文明宝库。各种地方志是汉语传世文献的重要组成部分。


      地方志记述一个地区的综合状况,举凡该地的天文、地理、政治、经济、人物、历史沿革、风土人情等,都有详尽描写。从古到今,地方志都是中国区域文化的百科全书,是研究中华文明最重要的第一手资料,历来备受关注。


       明清至民国时期的地方志是中国地方志的主体,尤其是清代的地方志。依据中国科学院北京天文台主编《中国地方志联合目录》(中华书局1985年版)的统计,1949年之前的地方志有8264种,其中,宋代28种、元代7种、明代2193种、清代5865种、民国171种。收录的范围包括通志、府志、州志、厅志、县志、乡土志、里镇志、卫志、所志、关志、岛屿志等,也收录了具有地方志性质的志料、采访册、调查记等。另据金恩辉、胡述兆主编《中国地方志总目提要》(上、中、下,台北•汉美图书有限公司印行,1996年),1949年前编纂的地方志为8577种,比《中国地方志联合目录》多出313种。这两个目录是阅读、研究中国地方志最基本的工具书。


      中国著名社会经济史专家陶希圣先生在《搜读地方志的提议》中提议学者“下工夫从地方志里搜求经济的社会材料”,指出方志是研究一地历史最方便的书。瞿兑之在《读方志琐记》中建议分类摘抄方志,并罗列出方志中的珍贵资料。


       汉语是世界最古老的语言之一,拥有自甲骨文以来三千多年连续不断的文献记载。从《诗经》等典籍来看,汉语自古就有方言差别。中国历来有重视方言记录的传统,早在春秋时期就有采风习俗,西汉时扬雄写出了全世界第一部方言词汇专著《輶轩使者绝代语释别国方言》,中国历代典籍中也记载了一些语言资料。而保存语言资料最为丰富的,是中国历朝历代积累下来的地方志。由于地方志先天的时代属性和地域属性,保存在其中的语言资料就成了研究语言共时分布和历史演变的重要材料。但地方志数量巨大,卷帙浩繁,分散保存在不同地方,在其中寻找语言材料,其难度与工作方式恰如沙中淘金。


02

       地方志中语言资料的重要性向为学界重视。民国时期著名学者夏廷棫先生曾逐册翻检历史语言研究所的馆藏方志,在68种地方志中发现了语言资料。1960—1980年代,日本著名学者波多野太郞在306种地方志中查到汉语方言资料,影印成册后逐册编写索引,最后编成《中国方志所录方言汇编》(九个分册)。显而易见,这是研究汉语的重要资料。因此,这套书甫一出版,学术界即好评如潮。《方言》杂志1980年第三期全文刊登了《中国方志所录方言汇编》第一至第九篇目录。这充分证明了这项成果的学术影响力。


       但毋庸讳言,这部书的不足也是很明显的。


       第一、日本保存的地方志有限,波多野太郎教授个人的能力也有限,因此,他仅辑录了一部分地方志,未辑录的地方志资料还很多。


       因专业原因,本人在山东大学读书时就开始关注地方志中的语言资料,翻阅过大量的贵州地方志,曾在二十多种志书中抄录到语言资料。但《中国方志所录方言汇编》仅辑录了《遵义府志》一种。显然遗漏太多。


      第二、《中国方志所录方言汇编》按辑录时间的先后来编排各册的顺序,在一篇中排列省的顺序,因而在篇与篇、篇内的省与省之间没有明确的逻辑顺序,使用起来颇为不便。


      第三、《中国方志所录方言汇编》只编了分册索引,没有编写总索引。分册索引和总索引的用途并不完全相同。只有做了总索引,才方便读者穷尽查找某一个词语的全部用例,否则只能一册一册分别查找。


       第四、只辑录汉语资料,未辑录少数民族语言资料。


03

有鉴于《中国方志所录方言汇编》遗漏的语言资料较多,1990年代,著名语言学家李荣先生组建学术团队,申报了中国社科院重大项目,拟以语言研究所原来整理的地方志为基础,扩大辑录范围,校勘原文,分类整理,建成语料库以飨学界。由于李荣先生2002年因病去世,加之人事变迁,这个项目后来没有延续下去。


2015年我们申请了国家社科基金重大招标项目“方志中方言材料的辑录、整理与数字化工程”(15ZDB108),组建了项目团队,计划穷尽查阅中国现存的地方志文献,辑录和整理地方志中的汉语方言资料。


中国地方志文献极其繁富,要在上万种地方志里查找到可用资料,首先要选择合适的地方志文献目录,确定文献查找范围。经过比较,我们决定采用金恩辉、胡述兆主编的《中国地方志总目提要》(台北汉美图书有限公司,1996年)。这个《提要》收录了8577种方志书目,不仅对每部方志做了详细题录,还记录有馆藏,并按省级行政区域进行编排。所以,我们就以这8577种见于著录的地方志为检索入口,开始资料查找工作。


中国地方志馆藏量最大的是国家图书馆。2012年,国家图书馆开始将馆藏的民国前地方志扫描成图片文文件,发布在国图网站“数字方志”平台(http://mylib.nlc.cn/ web/guest/home)上,对注册用户免费开放,24小时开放原文浏览和图片下载。截至到2017年1月,国图“数字方志”上线的地方志为6475种。 


但国图数字方志仍不能满足我们的要求。课题组成员于是分赴全国各地,查阅了24个省市级图书馆中的地方志,进行纸质文献的查找、阅读、扫描等资料撷取工作。2018年,我们又在武汉大学图书馆查阅了鼎秀全文数据库中收藏的1393种地方志。


前后历时三年,课题组共查阅了11780种地方志,在742部地方志中查找到8376个页面的语言资料。


课题设计时的资料辑录目标是汉语方言材料。但在地方志阅读过程中我们发现了众多的少数民族语言资料。于是决定扩大辑录范围,把少数民族语言文字资料也纳入辑录范围。在查阅澳门的地方志时,我们发现这部志记录了葡萄牙语。


04

        对辑录到的语言资料归类处理,大致有以下几种情况。


        一、绝大多数语言资料都有可编制索引的词语。


       二、一些地方志只有语言特点或语言分布地域的简单说明,没有可索引词汇。


       三、民国时期的地方志中,有一些地方志使用了新的编写方法,出现了音系表以及同音字表等,这种材料没有做索引的必要。


      我们认为无论是语言特点说明还是语音描写分析,都是重要的历史信息,都值得保存,但这类语言材料宜单独编辑成册。


       四、西南地区、东北地区、西北地区历来是汉民族与少数民族的混居区,语言文字的使用情况非常复杂,语言相互影响的情况很普遍,即使是明清及民国时期编写地方志的汉族官员也尊重这种情况,不但为当地汉语方言立志,也为当地的各种少数民族语言文字立志。这种态度从今天的眼光看也是进步的。我们今天辑录语言资料应该继承这个优良传统,把汉语方言和少数民族语言文字都纳入辑录、整理的范围。


      五、澳门的地方志中收录了葡萄牙语,不足以单立为一类,归入少数民族语言。


05

在批评《汇编》时我们指出,没有做总索引是其不足之一。因为如果没有总索引,研究者在考察某一个词语在全国各地的分布和用法时,势必要把各个分册逐一检查一遍,这是很化时间的。只有编了总索引才能解决这个问题。


基于上述情况,我们把这套书命名为《中国方志中语言资料集成》,说明这部书的多语多文性质,不限于汉语,也不限于只有可索引条目标语言资料。


加上总索引,本集成共编为42册。下面是各册的名称。


第1册:北京  天津

第2册:河北卷一

第3册:河北卷二

第4册:河北卷三

第5册:河北卷四

第6册:河北卷五

第7册:山西  内蒙古

第8册:辽宁  吉林  黑龙江

第9册:上海

第10册:江苏卷一

第11册:江苏卷二

第12册:浙江卷一

第13册:浙江卷二

第14册:浙江卷三

第15册:安徽  福建

第16册:江西

第17册:山东卷一

第18册:山东卷二

第19册:河南

第20册:湖北

第21册:湖南

第22册:广东卷一

第23册:广东卷二

第24册:广东卷三  广西

第25册:重庆

第26册:四川

第27册:贵州  云南

第28册:陕西

第29册:甘肃  宁夏  新疆


(以上29册为汉语方言资料)


第30册:民族语卷一(内蒙古 辽宁 吉林 黑龙江)

第31册:民族语卷二(湖南 广东 广西 海南 四川)

第32册:民族语卷三(贵州上)

第33册:民族语卷四(贵州下)

第34册:民族语卷五(云南上)

第35册:民族语卷六(云南中)

第36册:民族语卷七(云南下)

第37册:民族语卷八(西藏  新疆  澳门  台湾)


(以上8册为民族语资料)


第38册:一、方音差异;二、汉语音系;三、故事谚语;四、语言分布;五、民族文字及歌谣;六、手抄本及印板模糊

(第38册无索引)

第39册:总索引卷一(一、汉语方言索引首字笔划目录;二、民族语索引首字笔划目录)

第40册:总索引卷二(汉语方言上)

第41册:总索引卷三(汉语方言下)

第42册:总索引卷四(民族语)


      和同类著述比较,这部《集成》有以下优点。


       一、资料收集丰富,远远超越了前辈学者的著作。


       二、不仅辑录了汉语方言资料,也辑录了少数民族语言文字资料。因此,这部书不仅可服务于研究汉语方言的学者,也可服务于研究民族语言文字的学者。


      三、不仅编制了分册索引,还编制了总索引,这为研究者提供了便利。


      四、不仅辑录了可索引的资料,也辑录了只列音切、只有同音字表、只有方言特点及语言分布说明等不可索引的语言资料。


      这些资料,从地域分布看,覆盖了全中国。从时间跨度看,历经明、清、民国三个时期,前后历时581年。依据这些资料,不同领域的语言学家可以从语言关系、汉语共时分布、汉语历时演变、语言地理分布、汉语词汇史、方言语音史等方面展开研究。


综上,这部大型的语言资料集成不仅是语言研究者案头必备的重要资料,还可成为海内外各级图书馆必备的重要书目。


       这套书即将正式出版,面对读者,面对社会。对此,我们一则以喜,一则以惧。


      喜的是多年的辛苦终于有了一个结果,这个成果的学术性和重要性是不言而喻的。对此,我们有足够的自信。


      惧的是我们是团队协作,多人参加,包括我在内都是新手,编写这样一部内容复杂、体量巨大的学术著作难度很大,肯定存在一些不足之处。尤其是在资料辑录的完备性方面。中国的地方志实在是太多了,肯定还有一些地方志我们没有查阅到,遗漏一些语言资料几乎是不可避免的。我们只能期待以后有机会弥补这个缺憾。


       感谢项目组所有成员,期待读者批评指正。


 李蓝谨识于南方科技大学寓所


(节选自《中国方志中语言资料集成(全42册)》,李蓝主编。原文为繁体字,此处为便于阅读改换为简体字。)


编辑:徐蕊

审读:牙一淇

责编:甘于恩

投稿邮箱:jnufyzx@163.com

往期推荐:

1.学人(视频)丨李荣先生专题纪念片[转发]

2.学术探论丨沈明:汉语地理语言学研究70年(一)[转发]

3.方言学史 | 谢留文:汉语方言研究70年(一)【转发】

 保护母语方言

你我共同努力


做语言资源保护公众号不容易,每天更新公众号更不容易,而每天提供新语料尤其不容易。很多读者还没养成打赏习惯,提倡每个月打赏一元钱,积少成多,我们的事业就有希望。谢谢各位!





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存