其他

夏明方|大数据与生态史: 中国灾害史料整理与数据库建设

2018-01-23 夏明方 信息史学

大数据与生态史:中国灾害史料整理与数据库建设



[摘要] 本文在系统回顾有史以来中国灾害史料之发掘、整理和数据化过程的基础上,从人与自然交互作用的生态史角度,借鉴目前流行的大数据思维,对历史时期,尤其是建国以来国内灾害史学者业已进行的大规模史料整理与数据库建设展开批判性分析,一方面充分肯定这些工作对推进中国灾害史研究做出的重大贡献,另一方面则分析其内在局限与诸多不足,进而以清代为例,提出有关中国灾害历史数据库建设的最新构想,以为打造一个服务于国内外中国灾害史研究者的可持续扩展的公共学术交流平台而张本。


[关键词] 生态史 大数据 清代 灾害数据库


[中图分类号] K249 [文献标识码] A [文章编号] 1002 - 8587 ( 2015) - 02 - 0067 - 17




21 世纪的中国历史学已进入前所未有的史料新革命时代,历史研究的数据化、信息化已成刻不容缓的必然之势,可谓大潮所至,浩浩荡荡,不可遏止。尽管在其初起之时,难免鱼龙混杂,泥沙俱下,不少学者竟而忧心忡忡,但 “河行百里者清”,相信经过史界同仁持之不懈的批评、反思和相应的规范、调整和重构,积而久之,此类数据化工作及其对史学的影响终将走向健康发展的轨道。作为自然科学和社会科学多学科交叉的灾害史研究,更应该发扬中国历史学研究的优良传统,继续奋进,成为这一潮流的排头兵,从而推动中国史学的新发展,亦借此推进史学为社会服务的步伐。这里拟从灾害史学界正在兴起的生态史研究范式出发,借鉴当前广为流行的大数据思维,对历史时期特别是建国以来中国灾害史料的文献整理与数据化建设进行较为系统的梳理和批判性分析,进而以清代为例,就中国灾害历史数据库建设提出某些新的构想。不妥之处,亟盼方家指教。


一、有史以来中国灾害史料的发掘与整理



中国自古以来就是一个自然灾害极为严重的国家,也为人类文明宝库留下了最为系统、丰富,最有连续性的灾害记录。尤其是历代正史设置的 《五行志》、《灾异志》或 《本纪》等部分对灾害、灾异事件的记录,更是构成了连续两千年之久的灾害系谱。《太平御览》等类书以及通志、通考等典志类文献往往也专列 “咎征部”、 “灾祥略”或 “物异考”等,分类记述水、旱、风、火、地震等灾害。北宋以来开始出现、明清时期大为兴盛的地方志,几乎普遍设有 “灾祥”、“祥异”、“灾异”等专门类目,记录各地发生的各种灾害事件以及其他异常事件。明清档案 ( 中央、地方及民间组织) 以及晚清时期出版的近代新闻报刊,更是今日学者研究历史时期中国灾害及救荒活动的资料宝库。


这些记录,早期主要服务于王朝政治。至迟从明清以来,中国学者即专门对其进行较大规模的文献整理,并进行定量分析,以揭示历史时期中国自然灾害的特点与规律,探讨灾害与社会的关联。目前所见最早对中国灾害记录进行时空分布之量化分析的,应属徐光启 《农政全书·荒政考》中对蝗灾发生规律的探讨。康熙末年陈梦雷编纂的 《古今图书集成》,其 《庶征典》、《食货典》、《乾象典》、《职方典》、《草本典》等分典中均载有灾害史资料,可以说是中国历史上第一次大规模的灾荒史料整理。其中尤以 《庶征典》内容最为丰富,包括 “旱灾部”、“水灾部”、“风灾部”、“雹灾部”、“寒暑异部”、“丰歉部”、“蝗灾部”、“鼠异部”、“虫豸异部”等。另有《食货典·荒政部》,分汇考、总论、纪事、杂录诸类,收录历代救荒文献。


民国年间,竺可桢、邓拓等学者开始运用现代自然科学和社会科学的理论与方法研究中国灾害史、气候史,但无不建立在对中国灾害史料整理的基础之上。竺可桢于 1920 年代初期开始的中国历史气候研究,依据的史料主要是 《古今图书集成·历象汇编·庶征典》及其本人从清代九朝 《东华录》中整理出的水旱记载; 邓拓的 《中国救荒史》,其灾情统计依据历朝正史,有关救荒制度的讨论则是依据宋至清代的救荒专书如汪志伊 《荒政辑要》、《康济录》、《筹济篇》等。胡厚宣1944 年 《气候变迁与殷代气候之检讨》,则大量利用了其时新发现的甲骨文中的灾害记录。


建国以后,出于国家经济建设和社会安全保障的需要,各级政府和相关科研机构对中国灾害历史更是高度重视,曾动员全国大量科研力量对流传下来的文献史料中有关水、旱、地震、潮灾等灾害的记录和信息进行了有史以来最大规模的搜集、整理和汇编工作。


其中之一系中国地震历史资料汇编。1954 年,著名地质学家、中国科学院副院长,中国科学院地震工作委员会主任委员李四光,倡议整理编辑中国地震历史资料,并委托范文澜、金毓黼主持。在中国科学院地球物理研究所和有关单位的支持下,中国科学院历史研究所第三所 ( 现中国社会科学院近代史研究所) 的工作人员,从 8000 多种正史、别史、笔记、杂录、诗文集、方志和档案等古籍中,收集公元前 1177 年至公元 1955 年近万次地震资料,编成 《中国地震资料年表》。 1977 年开始,又由中国科学院、中国社会科学院、国家地震局联合发起,组织各省市自治区的历史工作者和地震工作者对地震史料作了更加广泛的搜集和发掘,对已有年表进行了全面修订和大规模扩充,历时 5 年,完成了 5 卷本的 《中国地震历史资料汇编》。 时间起自远古,止于 1980 年,其中第三卷即清代历次地震资料。所收文献,除历代正史、实录、地方志之外,包括若干未曾利用的善本、抄本,以及各地区的特藏文献和石刻、题记等实物资料。此外还有中国第一历史档案馆清代地震档案 ( 选译部分满文档) 、中国第二历史档案馆民国档案资料以及西藏自治区历史档案。该书未能尽收的资料,则由相继出版的各地区地震史料汇编予以收录,以便互相参照。所收文献资料,均 “保持原貌,依据年月顺序编排,不作地震学的分析和综合,以便研究者可以直接利用原始资料,依据自己的观点和方法进行研究判断”; “对于历史文献中被当时的记述者视为前兆的记录,一并收入,以供研究者参考”。


其二系气候历史资料。从 1950 年代起,为适应新中国水利建设的需要,中国科学院南京地理研究所研究员徐进之即矢志于系统整理我国历史气候资料,从各省大量的方志中找出某一地区2000 年来旱涝、霜冻、巨雹等历史气候灾异记载,然后分类整理并制成年表,以揭示该地区历史上的温度、雨量及气象灾害的波动情况及其对农业生产的影响。至 1976 年,他总共完成了黄淮平原及河北、山东、山西、河南、北京、江苏、上海、江西、安徽、浙江、湖南、湖北、云南、贵州、广东、广西、内蒙古、甘肃、宁夏、青海、陕西、福建、台湾等 24 个省 ( 市、自治区) 的气候历史记载的整理工作。各地气象局、文史馆、水利局或农科院,也因兴办农田水利的需要,纷纷从事有关旱涝灾害记载整编的工作。从 1955 年到 1979 年,湖北、广东、湖南、辽宁、内蒙古、陕西、江苏、青海、宁夏、山东、甘肃、江西、山西、河南、浙江等省均相继推出各该地的自然灾害资料或年表。1972 年,中央气象局研究所 ( 现中国气象局气象科学研究院)联合华北、东北 10 省 ( 市、区) 气象局着手整理历史气候资料,至 1975 年编成 《华北、东北近五百年旱涝史料》; 1977 年,又与南京大学气象学系等全国十几个单位协作,完成西北、西南、华东、华南等 19 个省市的旱涝史料。其中上海、江苏、安徽、浙江、江西、福建等省市气象局合作编纂了 《华东地区近五百年气象历史资料》,于 1978 年印行。选用资料包括地方志、明实录、清实录、清史稿,以及各省民政资料,各省气象局有关旱涝灾情的调查、分析资料,近代仪器观测的降水量资料等。由此汇总并转化而成的 《中国近五百年旱涝分布图集》 ( 1981) ,所据 1470 至 1979 年间的旱涝史料约 220 万字,主要源自 2100 余种地方志以及明清实录、正史、故宫档案,以及解放后各地进行的有关旱涝调查资料和现代仪器观测雨量记录,堪称持续几十年之久的历史气候资料整编工作带有总结性的阶段性成果。


此后,中国科学院地理研究所的张丕远研究员又组织大批人力对各地方志中的气候信息再次进行整理,同时补充了包括散藏于台湾及美国国会图书馆在内的近 1000 种方志; 而且,除旱涝之外,还整理了诸如饥馑、霜灾、雪灾、雹灾、冻害、蝗灾、海啸和瘟疫等项目的灾情状况,时间起自 1470 年,讫于 1950 年,内容愈加丰富。规模更大的扩编工作则是中央气象局张德二主编的 《中国三千年气象记录总集》。该书自 1985 年启动,于 2004 年出版,历时 20 余年,堪称是中国已经出版的气候资料集中最系统、最完善的,为中国历史气候的研究提供了坚实的基础。在吸取前人经验的基础上,该书对中国古籍中的气象记录进行了大规模的采集、勘校和考证,共收集有关记录 22 万余条,并以编年体形式进行汇编,系统反映了公元前 13 世纪至公元 1911 年三千多年间全国各地的天气、气候、大气物理现象 ( 如水、旱、雨、雪、冷、暖、冰、冻、霜、雹、风、尘霾、风暴潮、雷电、大气光象等) ,各种气象灾害的范围、危害程度和灾后赈济、蠲免情形,以及与气象条件有关的物候、农业丰歉和病虫害及疫病、饥荒的记述。所搜中文史籍共8228 种 ( 实际采用 7835 种) ,包括地方志 7713 种、纪传体史籍 28 种,以及各朝代的官方文书、文人笔记、石刻碑文等。其所辑录的史料均作详细勘校和考订,每条史料均注明其文献出处。最近,张德二又对清以前部分做了较大幅度的增订。


最近一次全国规模的资料整合工作是温克刚主编的 《中国气象灾害大典》, 该书以现有行政区划为单位,收列各地先秦至 2000 年各种气象灾害历史资料,是一部实用性极强的大型工具书。


此外,有关海潮、疾疫以及与灾害有关的天象、水文、地质等方面的历史资料整理工作也陆续完成,有的结集出版。主要有刘正刚、刘波编著 《广东旧志疫情史料辑录与研究》( 广东人民出版社 2005 年版) ,张剑光著 《三千年疫情》( 江西高校出版社 1998 年版) ,陆人骥编 《中国历代灾害性海潮史料》( 海洋出版社 1984 年版) ,以及章义和著 《中国蝗灾史》 ( 安徽人民出版社2008 年版) 等。


以上史料,其基本来源是正史与方志,但对档案史料中灾害信息的发掘从一开始即备受重视。前述地震历史资料整理过程中使用的档案,后来大都结集出版,如 《清代地震档案史料》 ( 中华书局 1959 年版) ,《西藏地震史料汇编》 ( 第一卷、第二卷,西藏自治区科学技术委员会、档案馆编译,西藏人民出版社 1982 年版) 等。此后,蒋克训、齐书勤等学者又与中国第一历史档案馆和台北故宫博物院合作,先后整理出版 《明清宫藏地震档案》“上卷”和 “下卷”。

从 1956 到 1958 年,水利水电科学研究院也在原中央档案馆明清部 ( 现中国第一历史档案馆)的支持下,由水利史研究室的 20 多名同志,从该馆百余万件清宫奏折中,采用抄写、打字、拍照等办法,整理出近 14 万张图片、2 万余件抄件的档案资料,主要包括 1736 年至 1911 年 ( 乾隆元年至宣统三年) 间部分 “宫中”、“朱批”及 “军机处录副”,内容涉及雨情、水情、旱涝灾情、河道变迁及治理、水利工程技术和内河航运等。继而从 1981 年开始,按各大流域如海河滦河,珠江韩江,长江流域,西南国际河流,黄河,淮河,辽河、松花江、黑龙江流域等,分别整理其中的洪涝史料,以 “清代江河洪涝档案史料丛书”为名陆续出版。其中的旱灾档案史料,也已整理完毕,并正式付梓。 西藏自治区历史档案馆也先后编译 《灾异志———雪灾篇》 ( 西藏人民出版社 1985 年版) 、《灾异志———水灾篇》和 《雹霜虫灾篇》( 中国藏学出版社 1990 年版) 。


文献资料之外的实地调查和实物资料,也得到相关研究部门的重视。从 1950 年代开始至1970 年代末,我国水利部门,对西部高寒山地之外的全国各大小河流无水文记录时期的历史洪水,普遍进行了实地调查,主要内容包括洪水发生时间、最高洪水位、洪水涨落过程以及对洪峰流量的分析估算。其汇总成果系骆承政主编的 《中国历史大洪水调查资料汇编》 和 《中国历史大洪水》上下卷。水利部长江水利委员会、重庆市文化局、重庆市博物馆编的 《四川两千年洪灾史料汇编》,亦收录大量碑刻文献和洪水调查资料。


以上史料,主要是围绕单一灾害或单一灾种如气象灾害汇编而成,其中也有将某一特定地域各类自然灾害尽可能包括在内的综合性灾害史料汇编。这类史料汇编,按高建国的分类,一是区域性,一是全国性。前者有 《广东省自然灾害史料》、《山东历代自然灾害志》、《贵州历代自然灾害年表》、《山西省自然灾害年表》、《海河流域历代自然灾害史料》 ( 涉及公元前 781—公元1980 年旱、涝、风、雹、霜、雪、寒、暑、蝗、疫和地震等灾害记载,多达百万字) 、《浙江灾异简志》、《黑龙江省 240 年旱涝史》、《西北灾荒史》和 《北京灾害史》等; 后者主要有张波、冯风等主编的 《中国农业自然灾害史料集》。


建国以后相当长的时期内,对气候灾害史料的整理主要是由自然科学工作者主持的,社会科学工作者总体上只是其中的辅助性力量。改革开放以后,这一局面逐步有所改观,近年来则发生了重大变化。相应地,对灾害史料的整理,逐渐向灾害的社会影响和人类响应方面扩展。其中较早的有中国社会科学院历史研究所资料编纂组编的 《中国历史自然灾害及历代盛世农业政策资料》,陈振汉编的 《清实录经济史资料 ( 顺治 - 嘉庆朝) 农业编》第二分册以及李国祥、杨昶主编的 《明实录类纂———自然灾异卷》。 但对后来的研究产生突破性影响的还是李文海主持编撰的 《近代中国灾荒纪年》。该书编撰始自 1985 年,1988 年完稿,1990 年由湖南教育出版社出版。在三年多的时间里,中国人民大学 “近代中国灾荒研究”课题组, “查阅了大量的官方文书、文集、笔记、书信、日记、地方志、碑文以及报纸杂志,尤其是查阅了清宫档案,摘录了历年各省督抚等官员就各地灾情向清政府的报告,共搜集、整理数以百万字计的有关资料,并在此基础上详加考订甄选,条析缕分”, “采取传统的编年体的形式,对历年全国发生的各类重大的自然灾害,分别省区,予以说明,尽可能将各地自然灾害发生的时间、地点、受灾的范围和程度加以详细介绍,而且对灾区人民的生活状况、清政府救荒措施及其弊端予以说明”,系统地呈现了 “近代史上自然灾害的概貌和受灾地区的具体情况”。 进入 21 世纪,在李文海先生的指导下,该课题组的第二代成员又如前述,先后编纂并点校出版了宋至清末专门性的救荒文献 《中国荒政全书》及其扩编版 《中国荒政书集成》。


在其影响之下,一些科研机构或国家图书馆等图书收藏单位,也充分利用馆藏优势和现代印刷技术的便利条件,将历代地方志和官私文献中有关灾异的专门记述以及与灾情、救灾相关的文献,汇而总之,影印出版。其中规模较大的有: 来新夏主编的 《中国地方志历史文献专辑: 灾异志》,共 90 册; 贾贵荣、骈宇骞选编 《地方志灾异资料丛刊》,已影印第一编 12 册,第二编35 册; 中国社会科学院赵连赏、翟清福主编的 《中国历代荒政史料》, 所收内容上至原始社会,下至清末民初,涉及各类不同的灾害 ( 如旱灾、水灾、虫灾、雹灾、冻灾、风灾、疫灾、地震、山崩等) 和政府的救灾对策,如各级官员的应对措施以及历代皇帝针对各种自然灾害的谕旨,并有意收录历史上记载的丰收内容。资料来源主要是 《太平御览》、《文献通考》、《册府元龟》、《历代名臣奏议》、《古今图书集成》,已出版部分明清档案中有关灾情、救荒的部分,以及 《救荒活民类要》、《救荒活民书》、《救荒策会》、《救荒本草》等。 此外,国家图书馆还将民国时期有关救灾的文献影印出版,现已出版 《民国赈灾史料初编》( 共 6 册) 及 《民国赈灾史料续编》( 共 15 册) ,前者部分著作涉及清代。此外,中央民族大学图书馆亦从馆藏云南省地方志,包括通志、州志、府志、县志、厅志和专志中截取有关寒暑气候、雨雪风霜、水旱蝗震等方面的内容,按文献出版时序编排影印,汇成 《云南气候与灾异资料辑录》。


二、明清以降中国灾害史料的数据处理和信息化进程


在灾害史料的数据处理方面,以往研究作出的大量开创性工作,为探讨中国长期气候变化和灾害演变规律奠定了比较坚实的基础。


早期的工作是以年表形式出现的灾害频次或空间分布统计。邓拓的 《中国救荒史》从 《汉志》所引 《礼记疏》,认为我国最早的灾害统计是古代阴阳家对 “水旱之大数”的推测。但依据史料记载进行较为严格的灾害发生时空分布统计的,还是明末徐光启的 《除蝗疏》。 至 19 世

纪 70 年代,英国人谢立山先后发表了有关中国历史时期 ( 始于唐而终于明) 旱涝次数的统计结果。 清末民初以降,此类统计更为多见。清人黄伯禄曾从 10 多部史书和 391 种地方志中搜集公元前 1767 年至公元 1895 年间的大小地震记载 3322 次,后由法国传教士整理、补充,于 1913年编译出版,名为 Catalogue des Tremblement de Terre en Chine Ⅱ,是为第一部法文发表的 《中国地震目录》。 其他如 1921 年存吾的 《历代地震一览表》 ( 《地学杂志》1921 年 12 卷 4 期、5、6、7 期) ,1933 年邓清安的 《历代灾祥录》 ( 真平印务局 1933 年版) ,1935 年陈家祥 《中国历代蝗虫记载》( 《浙江昆虫局年刊》1935 年第 5 号) ,1949 年的 《钱江历代之潮患》( 《工程建设》1949 年第 1 期) 等都是此方面史料的汇编。其中较有代表性的成果,则有武同举 1926 年编著的 《淮系年表全编》,分栏列载传说中的唐尧至清宣统三年约 4200 余年淮河水系 “水患”、“水利”事件; 王树林的 《清代灾荒: 一个统计的研究》 ( 《社会学界》第 6 卷,1932 年 6 月) ; 以及沈怡编纂、赵世暹增补、郑道隆绘图的 《黄河年表》 ( 1935 年) ,共列表七,按年摘录公元前 2297 至公元 1933 年有关决溢、修筑的文献记载,并在 “总论”中分别以河道变迁和朝代为次,统计史籍所载黄河决溢次数。 但最为重要的,当属陈高庸的 《中国历代天灾人祸表》,此系民国年间历史学者从事的唯一一次大型综合性的灾害文献整理,所收文献包括 《资治通鉴》、《续资治通鉴》,《明史》、《明纪》,《清史稿》、《清史纪事本末》、《清鉴》等,还包括二十五史的本纪和五行志、《古今图书集成·庶征典》、十通、各朝会典、会要、实录以及其他有关史籍。


解放以后,这种处理方式得到更为广泛的运用。诸如前面提及的很多资料整理,或纯以年表形式出现,如江苏省革命委员会水利局 1976 年 6 月编印的 《江苏省近两千年洪涝旱潮灾害年表》,张秉轮、方兆本主编 《淮河、长江中下游地区旱涝灾害年表》 ( 安徽教育出版社 1998 年版) ,或附加年表,如 “清代洪涝档案史料丛书”。其中的集大成者为宋正海主编,广东教育出版社 1992 年出版的 《中国重大自然灾害及异常年表》。全书按天象、地质象、地震象、气象、水象、海洋象、植物象、动物象、人体象等九大分科共列 254 个年表,100 余万字。其中自然异常类数较多,但多为短表、中表,自然灾害类数较少,但多为长表、超长表,其所占篇幅远超前者。


从 1970 年代开始,研究者开始对历史时期的旱涝或地震灾害按其影响或危害程度进行等级划分,经数据转换以后制成可视化、数字化的图集。其中最具标志性的成果,是 1970 年代末 80年代初出版的 《中国近五百年旱涝分布图集》和顾功叙主编的 《中国地震目录: 公元前 1831—公元 1969》( 科学出版社,1983 年) ,两书迄今仍是国内外学术界从事中国气候变化和水、旱、地震等灾害研究的最重要的数据基础。此后又有 《明时期中国历史地震图集》、《清时期中国历史地震图集》以及 《远古至元时期中国历史地震图集》, 将历史时期破坏性地震以等震线和其他形式绘制地图,每震一图,并附简要文字说明和部分记载地震的历史文物,陈正祥的蝗灾分布

图也别具一格。


从 1991 年到 1996 年,中国测绘科学院联合北京大学、中国人民大学、复旦大学、中科院地理所、北京市社科院等单位的数十位专家,查阅了明清两代 530 余年大量的历史实录、文集、笔记和方志,将明清两代各类重大自然灾害史料整理、统计、摘录出来,经过定级、定量研究和计算机处理,形成编制图集的主要素材,继而选用经过历史考证、反映明清两代行政疆域的两种地理底图,将不同时期的灾害专题按照等级和灾种转绘其上,直观地表现出灾害发生的时间、空间、强度、频率、危害程度以及人类与自然灾害作斗争的经验。其最终成果即为 《中国自然灾害地图集》明清卷。据介绍,该书共分水灾,旱灾,水旱与灾伤,地震,蝗灾、风潮灾、冰雹灾、寒霜、冰雪灾、瘟疫、饥荒,黄河决口等 6 个图组,总计 356 幅地图; 另有分析灾害强度、频率的 “直方图”数十幅,每图均对灾情和救灾措施有简要的文字说明。 可惜此图制成后,迄今未见出版。


此方面的后续进展可见于史培军的 《中国自然灾害系统地图集》 ( 科学出版社,2003 年)和 《中国自然灾害风险地图集》 ( 科学出版社,2011 年) 。尤其是前者,收录了近 500 年地震、洪水、台风、暴风雪和冰雹等自然灾害的宝贵资料,其中的 400 多幅地图及 50 余张统计表格,有助于分析我国各类灾害的形成、特点、演变及其分布格局。


必须指出的是,不管是年表,还是图集,毕竟是以纸本的形式而存在,难以容纳我国数千年来积累的极为丰富的灾害、气候记录; 另一方面,将历史时期不同来源的资料汇聚在一起进行简单的频次统计,往往又忽略了这些资料因体例互异而造成的不均一性,不利于在较大的时空范围内进行对比研究。20 世纪 20 年代,竺可桢广泛搜集我国历史文献中 “雨旱灾荒、严寒酷暑”等记载,作为降水、气温等相关气候变化的代用资料,并首次运用每百年水旱灾比率作为标准,探究公元 100—1600 年间气候干湿变化的周期性 “脉动”,为后人研究历史气候指明了方向。1970 年代末中央气象局旱涝等级体系的确立,更是一个突破性的进展。从 20 世纪 80 年代开始,随着计算机的普及和发展,历史气候变化与自然灾害史料的信息化处理和数据库建立终于走进科学工作者的研究日程之中,并呈现不断的发展变化之势。


1980 年代的史料信息化处理,主要是延续竺可桢的思路,将灾害信息转化成气候变化参数,消除不均一性,再通过数字编码等程序,实现信息化、标准化,节省存储空间。陈家其在 《从太湖流域的旱涝史料看气候信息的处理》一文中指出,历史气候信息处理的目的,在于建立一套方法,在信息提取的基础上将定性的历史气候信息转化为气候变化参数,并消除各种不均一性,从而建立历史气候序列,并着重介绍了建立太湖流域历史旱涝等级序列的方法和步骤。林振杰和郑斯中根据我国自然灾害史料的特点,设计了一套由灾情发生时间、地点、灾情种类及严重程度、参考文献等要素组成的数字编码方案,详细给出了用于灾情描述的编码表,如大气圈异常、水圈响应、动植物响应、人类初级响应及政府响应等描述用语的编码表。


至 1990 年代,史料信息化处理和数据库建立的流程更加科学、完善,包含的信息量也更大,并且采用现代数据库技术对系统进行总体设计和使用流程编制,以实现数据库之间的互访,并建立属性数据与空间数据的联系。郑景云等提出了对主要源于历史档案的民国时期自然灾害史料进行信息化处理的方法,其中包括逐条史料的字段分解、对字段进行统一编码以建立数据库这两个过程,主要字段包括受灾地点、受灾范围、受灾成数、时间要素、天气状况、灾害级别、受灾程度、收成状况、人类响应措施等。 王静爱等根据所搜集的中国自然灾害数据和图件,应用数据库技术建立了由中国自然致灾因子数据库、中国省级报刊所载自然灾害 ( 1949—1990) 数据库、中国农村自然灾害灾情数据库、中国历史自然灾害数据库和中国行政区划 ( 县级单元) 空间数据库等 5 个子数据库所组成的中国自然灾害数据库,每个子数据库又分为原始资料库和派生数据库,并以国家统一县市代码作为各子数据库的公有字段,实现数据库之间的互访,建立属性数据库和空间数据库的联系。方伟华和王静爱探讨了中国历史水灾案例数据库的建立和存在问题。


21 世纪以来,随着计算机技术的发展、信息共享网络的普及,气候变化和灾害史料的信息处理和数据库建立开始有了一些比较专门的研究,使得信息化更为规范,数据库功能开发更为全面,并力求能够提取与国际全球变化接轨的数字信息。郑景云等建立了过去 2000 年的环境变化数据库,通过各种历史环境要素重建的方法,将各类史料派生的资料或数据重建为历史环境变化的代用数据,采用树状与网状相结合的思路设计数据库的总体结构,从而实现了资料与数据的存储、检索、处理和空间分析功能。 2004 年,中国气象局经多部门合作完成了中国古籍中气象记录的采集、勘校工作,出版了 《中国三千年气象记录总集》,进而研制生成历史气候基础资料系统,推进了历史气候基础资料的规范化和客观定量化。 徐榕焓等以 《中国古代重大自然灾害和异常年表总集》为数据源,设计了包括灾害表、灾害时间表、灾害地点表、方志典籍表以及灾害数据主表等 5 张表在内的历史自然灾害数据库。 方修琦等建立了清代长江三角洲地区干旱、洪涝、台风灾害数据库,其设计采用三层结构,可实现查询、检索、简单分析和可视化的功能; 同时还建立了全国尺度的历史时期气候变化影响与适应数据库,构建了历史时期气候变化影响与适应研究的指标体系,重建了人口变率、农民起义频次、农业丰歉等级、社会经济波动等


4 条全国序列及 10 余条区域尺度的代用指标序列,并建立了不同层次和区域的历史气候变化影响与社会响应的典型案例库。


目前,有关气候变化与自然灾害史料的信息化处理和数据库的建立,主要有以下几家单位的代表性成果: ( 1) 中国气象局 “中国历史气候基础资料系统”; ( 2) 中科院地理所 “过去 2000年环境变化数据库”; ( 3) 中国水利水电科学研究院 “水旱灾害网络共享数据库”等。这些数据库为研究中国气候历史变化与自然灾害的时空演变规律提供了坚实的基础。


三、灾害史研究的范式转换与已有史料整理存在的问题


对于中国灾害史研究的学术梳理大都是从民国时期开始的,而实际上,以上揭示的有史以来灾害信息的记录和整理过程,并不能简单地看成是现实发生的灾害事实本身,而实际上是不同时期国人灾害认知的产物。


这样的认知体系,大体经历了三个阶段,概括说来就是 “天命观”、 “科学观”和 “生态观”。纵观几千年的历史长河,其中绝大多数时间都是浸润在具有浓厚神秘主义色彩的 “天命观”或 “灾异观”之中,主要作为自然变动过程的灾害通常被看成人事活动的响应,因而也就与人间社会生活杂糅在一起,成为了中国文化传统的有机组成部分。清末民国以来,现代科学思想的传播与影响,使灾害逐渐成为一个独立的研究对象从人文视野中分离出来,并因之确立了一个具有现代科学特质的现代灾害学理论体系,是为灾害的 “科学观”,但是在建国以后相当长的时间里,人文社会科学的长期缺场,使这样的研究日渐趋于唯科学主义的路径,灾害研究的主体,灾害研究的对象,乃至灾害信息的搜集与整理,均偏重于自然科学或自然变异方面。 大约从 1980 年代中后期开始,随着自然科学学者对自身研究的不断反思,尤其是人文社会科学的重新介入,灾害形成的社会根源、灾害的社会影响以及人类对灾害的反应,越来越引起学界的重视,故而使得人文社会科学与自然科学逐渐结合起来,这实际上也是一种以人与自然相互作用为核心的生态系统分析模式———灾害的 “生态观”在灾害史、灾害学领域的诞生与成长的过程。


以这样的生态观来考察灾害问题,首先需要对灾害本身有一个重新的认识,亦即所谓的自然灾害,并不仅仅是纯粹的自然力量异常变动的结果,而无论是在其形成之动力、作用之过程及其对人类生存的自然、社会环境造成的结果等方面,无不体现了自然与社会的双重属性,因此对于灾害的史料整理,也必须兼顾这两个方面。与此同时,对于灾害事件,则相应地需要一种过程的眼光,不再像先前那样,将其当做一个相对封闭的固化结构或个别的独立事件,而是把它看成一个开放着的,自然与社会两种力量不停地交互作用、相互转化的动态演化系统,既要看到灾害发生前其在自然、社会中的酝酿,更应看到之后其在自然与社会系统层层扩散的过程,这就要求我们必须扩展文献资料的搜索范围,不能仅仅局限于灾害发生即所谓成灾之时,局限于成灾的时间、地点、范围、程度等灾害要素,而应该以此为中心,扩及灾前之自然、社会变动,灾后人类的回应与调整,以及人们对灾害事件的认知与评价。而且,作为一种开放的动态演化系统,各类灾害之间,灾害与环境之间,实处于普遍联系、互为关联的复杂网络之中,这要求我们必须有一个整体的眼光,普遍联系的眼光,不仅要把各类灾害事件看成相互作用的整体网络,更应将其置放于包括自然与社会在内的整个生态系统的变动过程之中进行考察。


对过去的灾害记录亦即灾害史料,也应作如是观。以往的研究当然不会简单地把这些记录与实际发生的灾害完全等同起来,除了资料的真伪之外,灾害信息记录的完整与否也是学界长期以来倍加关注的问题,但关键在于那些经过考证已被确定为 “真”的历史记载,并非像绝大多数学者一直认为的那样,是对自然变动过程的客观反映,当然也不能将其完全看成是主观建构的产物,就像近年来一些受后现代解构思潮影响的学者所坚称的那样,而应当把它视为灾害过程与灾害认知相互作用的结果。如此一来,我们就必须尽可能地穷尽各类不同的灾害描述或灾害记录,从各自不同的话语特征出发,进行系统的交互式校勘,才有可能对其性质进行较为准确的判定,从而为数据转换工作奠定坚实的历史考证基础。


据此重新审视历史时期,尤其是建国以来中国灾害史的资料整理和数据化工作,我们当然不能否认其为推动中国灾害史研究做出的不可磨灭的巨大贡献,也不能否认其在未来研究中所起的基础性作用,但是必须看到,相较与新时代灾害史的最新研究态势,其中的诸多不足之处似亦勿庸讳言。


首先,从文献学的角度来说,以往的灾害史料整理,大体上有四类,一是根据特定的研究需要,从文献中查找史料,予以摘录、归类、校核、编排,如各类气候历史资料; 二是对各类资料进行综合比勘,在保留史料原貌的基础上做总结性描述,如 《近代中国灾荒纪年》; 三是对反映灾情与救荒的专门文献进行标点,汇总出版; 四是将有关灾害史料从原始文献中分离出来,大致分类后,据原始文献直接影印。就资料来源而言,第一种类型的史料汇编,多为自然科学工作者所为。这些资料,利用范围各有所长,亦各有所短。目前为学界广为利用的 《中国近五百年旱涝分布图集》所收资料基本上以方志为主,档案、报刊、官私文献及其他相关史料涉猎甚少,而所用方志虽然多达 2100 余种,仍不及现存方志总量的五分之一。《中国三千年气象灾害总录》收录文献达 7855 种,但主要是正史或地方志,见于私人日记和清代的宫廷档案气象记录,因其体例另成一格,编者并未对此作系统收录。《中国地震历史资料汇编》涉猎的文献种类最为多样,但是在档案、碑刻文献等方面仍有大量增补的空间。至于晚清报纸对于灾情的连续报道,均告阙如。清人文集收录亦少。对于地方志,也主要利用 “灾异志”、“祥异志”或 “大事记”等部分,对于其他部分无从涉及。第二种类型的灾害史料,对档案、报纸及文集的利用力度较大,但是对地方志利用很少,外文报刊对中国灾情的报道也未见采用。《近代中国灾荒纪年》将各类史料揉为一体进行叙述,有利于从总体上反映灾害全貌,却不利于从文种角度分析史料本身的价值。第三种类型的资料汇编,主题鲜明,便于从政府与民间两个角度探讨人类对于灾害的应对与响应,而且其中大多数文献都是围绕特定重大灾害事件编撰而成,如 《钦定辛酉工赈纪事》,内含全面、系统的灾情描述和救灾过程,有助于从个案角度对灾害影响模式进行深层次的分析,但仍有许多重要文献未加收入。第四种形式为专题文献复制。如历代方志之 《灾异志》汇总,以及 《中国历代荒政史料》,规模庞大,又系影印,便于保存史料原貌和查核史料,但所占纸本容量太大,利用仍有不便,流传不广,难以在更大范围内实现资料共享,亦未加甄别,属于剪刀加浆糊式的古籍整理层次。此外,还有一种是作为子集收录于其他非灾害类专题的史料集之中,往往比较零散,不系统。


其二,从史料的灾害信息而言,主要由自然科学工作者整理的资料汇编,其涵盖的灾害种类,主要是涉及影响中国社会的三大主要灾害,即水灾、旱灾与地震,其他灾害如蝗、疫、风、雹、霜、雪、寒冻、酷热以及山崩、滑坡、尘暴、火灾等,尚缺少全面、系统的整理; 对灾害之前的异常现象或灾害导致的其他方面的变化,如旱涝之后农作物的异常丰收 ( 史载 “大有”、“大有年”等) ,亦未给予足够的注意,不利于更全面地揭示灾害的成因及其环境后果。更突出的问题是,这些资料大都偏重于雨情、水情等自然变动方面的信息,对灾害导致的社会后果则相对简略,不利于更全面地揭示灾害影响的社会扩散过程。建国后最早成书的 《中国地震资料年表》,仅聚焦于描述地震成灾的过程,而有关灾前震兆、灾后救济方面的内容则较少。后来的《中国地震历史资料汇编》吸取这一教训,对所选资料原样保存,可算是一大进步,但并未被其他著作效仿,殊为可惜。如 “清代洪涝档案史料丛书”,在这一方面尚有改进的余地。


其三,对于搜集的资料,大部分著作都是照单全收,未能与其他史料进行比勘,亦未对资料记载的历史语境进行客观的分析,以致难以识别史料记载的陷阱与雷区,最终有损研究结论的可靠性。如有清一代成灾标准的更改与变化,连续多年的甘肃冒赈案对资料记载的影响以及道光中叶开始江南及其他部分省区日趋严重和普遍的灾歉捏报问题等。尤其是 《中国气象灾害大典》一书中涉及建国之前的灾害史料,基本上是以 1980 年代以前整理的气候历史资料为依据,在灾情叙述过程中又将各种来源的史料杂糅在一起,且绝大多数分卷没有交待资料出处,难以查核,不能不说是一件令人遗憾的事情。即便是 《近代中国灾荒纪年》对此有明确意识,但也存在一些问题。


第四,以上资料汇编,有不少是以清代作为独立的时限,但更多的是以几千年或近五百年作为研究尺度的,虽然大都将清代包括在内,但并未将其作为独立的对象予以处理。实际上,与此前其他时期相比,有清一代遗留下来的灾害资料最为丰富,最为多样,最能反映近世中国自然环境变动与救灾机制嬗变的过程。尤其是在新世纪国家清史工程启动之后,大规模的文献整理工作随之喷涌而出,给世人增加了更为丰富的文献宝库可以供发掘,这当然包括灾荒史料在内。


以年表和地图形式对灾害史料进行的数据处理,经过学界多年来的探讨与实践,其内在局限也越来越充分地显示出来:


首先,就空间而言,《中国近五百年旱涝分布图集》是以 1—2 个府为单位进行计算的,且仅仅选择全国 120 个站点作为样本进行类推,在一个气候、地理类型极其多样化的国度,这一做法显然不足以反映相对真实的旱涝情势。这种情况,当然也为后续工作留下了大有作为的空间。其次,就时间而言,又是以 “年次”进行统计的,无法反映灾害的年内 ( 具体到月、日) 及年际变化。在确定灾害频次和等级时,又按照一定的比例进行统一核算,与事实不尽相符。 第三,包括其他灾害在内,各种统计数据往往是以单一灾害或单一灾种为对象,不利于对各类灾害的时空分布和内在关联进行综合性、整体性和相关性的分析,不利于动态地揭示灾害生成与演变的规律。第四,也是最重要的问题,就是对灾害社会性的淡化,以及由此而导致的灾害数据处理的 “自然化”和 “气候化”倾向,前者是指偏重对旱情、雨情和震情等自然现象的关注,而相对忽略了灾害形成、扩散过程中的社会因素,甚至将由社会因素所激发、加剧的灾害也统统纳入统计范围之内,结果有可能夸大自然界的变化程度; 后者与此息息相关,即是将史料中有关旱、涝灾害的记载,转换为气候变动现象进行统计分析,忽略了 “旱涝”概念的气象学界定和灾害学界定两者之间的区别, 结果造成评定后的气候情势与实际气候状况存在不小的差距。如何将学界最新的批评和相关建设性的意见转化到新阶段的资料整理与数据转化工作中去,也是一项极富挑战性的创新工作。


这些问题,有的已在发端于 1980 年代的历史灾害与气候史料的信息化过程和数据库建设中得到较好的解决,有的则因思维定势,仍继续存在。大体说来,以上介绍的几种主要数据库,在数据库设计思路、子数据库结构、史料信息的字段编码处理、数据库功能等方面为未来的研究提供了很好的借鉴和基础,但是另一方面,在灾害史料的丰富性与均一化处理、更完善合理的数据库结构、灾害指标序列的提取、自然灾害本身与人类响应过程信息的融合等方面仍有进一步探讨、发展的空间。其带有普遍性的特点和问题在于:


其一,已有数据库,其目标所指均非灾害研究,因而在资料的取舍方面也各有侧重。《中国三千年气象记录总集》主要搜集了天气、气候、大气物理现象方面的史料记录,旨在为中国历史气候研究提供基础资料; “过去 2000 年环境变化数据库”主要囊括历史文献中的旱涝、冷暖、灾害、雨雪、收成、粮价记录,还包括自然证据、现代观测资料等,目的是重建历史环境变化 ( 温度、降水) 的代用数据; “水旱灾害网络共享数据库”主要搜集水旱灾害方面的资料,为防洪抗灾提供网络信息平台。其他学者的研究,或关注自然灾害史料或历史气候信息化处理方法和数据库建立,或侧重某区域自然灾害数据库的建立,或聚焦于人类对气候变化影响与适应的序列和案例数据库等,亦复多样而纷杂。首都师范大学的阎守诚从 1999 年起曾组织力量开展这样的项目,设想建立一个专门的自然灾害数据库,终因力量有限,半途而废。故而,到目前为止,国内外还未曾建有一个能够记录灾害发生完整过程和信息,亦即包括从天气、地质等自然变异现象到成灾过程,乃至对人类社会影响及响应的综合性灾害史料数据库,以便更全面地揭示灾害成因和环境后果,更好地满足自然变动 ( 如气候变化) 、灾害分异、灾害影响与适应、防灾减灾应用等多方面研究的资料需求。


其二是数据源各不相同,所据资料或以自行整理的史料为主,或以他人的工作为前提,都有很大的局限性。如张德二的数据库,水利水电科学研究院的数据库,主要是洪涝档案史料与此前学界整理的部分气候历史资料,新近出版的旱灾档案史料及 《再续行水金鉴》均未收录。中科院的环境变化数据库,多为雨雪粮价、土地利用等方面,直接的灾害史料所占比例相对较小。至于其他方面,前文在讨论史料汇编时已有涉及,兹不赘述。事实上,随着人文社会科学对灾害史研究的介入,学界对灾害认识更加全面,以往被遮蔽的信息逐渐引起广泛的关注,而且由于数字化进程的加速,原来未能利用、未曾发现的资料喷涌而出,如何构建一个更具包容性的方法论体系和技术系统,将这些资料纳入数据库建设之中,是未来数据库建设的重要目标之一。


其三是现有数据库建设中未能体现资料校核、考证和比勘的过程。原始资料一经录入,即不再进行校核、考证,往往以讹传讹,而且不同种类的史料相互之间的比勘也不够深入,在很大程度上影响了最终成果的准确性、科学性。


其四,从原始资料整理到数据库之间缺少一个过渡环节,即原始文献资料的信息集成,难以实现真正的资源共享,形成资料基础的累积性机制。毫无疑问,这些数据库,以其不同于纸本的存储形式,便于进行增补和修正,可惜多为单兵作战,未能聚为规模,难以形成重大突破,亦因彼此之间缺乏合作,未能形成资料基础的累积性成长机制,以致后续学者从事相关研究时每多重复劳动,浪费了大量的人力物力资源,延滞了学术发展的步伐。另一方面,这些资料,均经摘录转化而来,除少量公开出版之外,其原始文献的储存介质,或为原文复制的纸质、胶片,或为资料摘录卡片,量大体大,保管未尽完善,多有遗失、霉变,难以复原、查核。如 《中国自然灾害图集》,仅有纸本形式,且一直不曾出版。如此一来,这些数据库,大都未能实现资源共享的初衷,能够共享的仅仅是数据库的最终产出,即以数据库为基础而生成的各类分析性结论,因之难以形成真正的学术批判和学术交流机制。


限于各自所处时代的历史条件,上述资料,尤其是旱涝气候史料的整理,还存在诸多重要缺陷,已经不能适应现时代灾害史研究的新要求。目前所要做的,就是在进一步扩展、夯实数据库资料基础的前提之下,将数据库共享的环节从输出结论的终端移向输入资料的始端,也就是在原始文献库和原始资料库的环节,建立文献校核平台,文献增补平台,形成互惠式公共信息交换机制,充分发挥学界整体力量,实现资源共享,以最小代价获取最大效果的资源积累和扩展,造福学界和人类。当代新技术的不断出现和发展,能够推动数据库设计的合理性、科学性、共享与多功能的实现。

四、新时代中国灾害历史数据库建设构想——以清朝为中心


通过上文的梳理和分析,似乎可以得出这样的结论,即一种在生态观视野下建设的灾害信息数据库,最起码应该达到如下之目标: 文献资料的集成性和累积性; 资料来源的多样性和整合性; 数据处理的精细化与科学性; 信息交流的公共性与开放性; 服务功能的多元化与可视化等。幸运的是,所有这些,从技术路径上来说,都可以在当今世界蓬勃兴起的 “大数据革命”① 中得到有效解决,而借助于这种新型的计算机和网络技术的发展,大量被尘封的历史文献资料,亦得以在短时间之内得到大规模的整理和公开,且势头迅猛而强劲,也为建立这样的数据网络奠定了极为雄厚的资料基础。


当然,即便如此,欲对整个历史时期的灾害史料进行一次全面的校核和增补,绝不是少数研究者或科研单位短期内所能完成的,这将是一项长期艰巨的历史任务。以往的研究,或动员全国力量,或穷个人数十年心力,均非短时间所能一蹴而就。但是,如果根据现有条件,选择其中一个灾害记录相对丰富的断代作为重点,集中攻关,在未来五到十年的时间内,应是可以取得突破性进展的。处于明清小冰期之内、横跨传统与现代社会转型时期的清朝,应该是一个最具代表性的时段。此种清代灾害信息集成数据库若能如期建成,将会大大方便全球变化、灾害研究领域中史料的使用,并可望形成完整的一套史料考订和信息化集成的方法。这样的数据库也不仅仅是史学工作者的任务,应是和自然科学工作者分工合作的产物,若此将更有利于提高历史灾害数据库的完备性、可靠性以及科学问题的针对性,而兼容、便捷的信息化数据,亦便于未来学者对历史灾害规律、发生机制以及人类应对等问题进行更加深入的科学研究。从清史研究的角度来说,该数据库的建设,将和国内外学界已经完成或正在建设中的其他领域各种类型的数据库,相互衔接,相互配合,共同推动清史研究的信息化进程。


正是基于这样的考量,中国人民大学清史研究所与北京师范大学地理学院、南开大学、中国政法大学、中山大学等兄弟单位的诸多同仁,决定携起手来,共同承担此项使命。其总体目标,是以人与自然交互作用的研究视野为中心,运用生态系统分析方法,在国内外已有研究的基础上,从事清代自然灾害史料的搜集、整理、校核、整合与数据转化工作,建立一个融资料的采集整理、存储更新、查询检索,以及服务于数据统计分析、制表绘图、动态演示等信息处理功能为一体的,可持续积累的扩展型灾害信息集成系统,为未来清代自然灾害地图集与清代自然灾害动态演示系统奠定资料与技术基础,进而也为国内外学界研究清代乃至中国自然灾害、环境变化以及灾害与社会的诸种关系提供公共信息平台,以期进一步推动清代灾害史、环境史乃至清代政治、经济、社会、文化等多方面的研究,亦为当代全球变化研究和国家减灾工程建设提供更准确、更全面的史料基础和学术借鉴。


为实现上述总体目标,着重将从以下三个方面展开工作:


其一是编纂 《清代自然灾害史料长编》。其体例,以年代为经,以省区为纬,按实录 ( 含通典、通志、东华录等) 、正史、方志、档案、文集、报刊、荒政专书以及其他文献等类别,依序排列史料,并按统一规范注明资料来源,以便查考。为改变以往史料汇编偏重灾情之不足,《长编》所收史料,将扩及与各该年次特定灾害事件有关的一应社会变动以及救灾备荒等各个方面。


其二是撰写 《清代灾荒纪年》。此系效仿李文海教授主撰 《近代中国灾荒纪年》的体例,在对后者进行较大规模扩充、修改的基础上,突破鸦片战争的界限,将有清一代作为一个整体纳入记述的范围,形成一部完整的清代灾荒编年体概述,以反映清朝自立国至覆亡绵延 260 余年之久全国各地的灾情总貌以及相应的社会变动与救灾备荒实践的演进历程。《纪年》的撰写,一方面须以 《长编》为基础,尽可能充分地占有史料,另一方面必须充分借鉴国内外现有研究成果,并对各类史料进行比勘、考证和综合,从而形成对于特定灾害,尤其是重大灾害事件的准确判断和客观认识,最终较为清晰地勾勒出各类重大灾害发生的状况及其在社会层面扩散的过程。因此,《纪年》既是借鉴、吸收以往所有研究成果的集大成之作,同时也是为清代自然灾害信息集成数据库奠定坚实的历史学基础,为后续的数字编码和信息转化创造条件。


其三是建设 “清代自然灾害信息集成数据库”: 作为一个完整的清代自然灾害信息集成系统,其最终建成之后,将是一个融资料的采集整理、存储更新、查询检索、校核比勘,以及数据统计分析、制表绘图、动态演示等信息处理功能为一体的巨大系统,依次包括原始文献库、原始记录库、专题数据库等三个部分或层级。


其中,原始文献库和原始记录库 68 55967 68 38124 0 0 15577 0 0:00:03 0:00:02 0:00:01 15573者合为原始数据库。前者主要存储包括图片、文档、网页、影像等各类型原始文献,且实现与原始记录库相互链接的功能。后者主要用于存储从各史料中摘录所得的所有有关灾害的信息,并实现检索查询、校核等功能。


原始记录库包括原始记录表和原始校核表,设立 ID1 ( 以年和序号编号) 、地点 ( 省、县) 、灾害类型、史料记录、资料来源、原始出处、奏报人与奏报时间等字段,能够实现按照年份、灾害发生地点、灾害类型、社会影响、救灾程序等进行检索查询的功能。在原始记录表之外,另设原始校核表,记录考证校核过程与相关证据,并将校核过的数据记录存储其中,同时在原始记录表中设立考证备注字段,并将每条校核过后的记录与对应的考证备注建立链接。


专题数据库是基于原始记录数据库而设立的不同类型 ( 依研究主题确定) 的数据库,由原始记录表、派生数据表和合成数据表三层组成,派生数据表分别与原始记录表、合成数据表建立链接。中间层为派生数据表,由原始记录表生成,目的是将该表中每条原始记录进行拆分,将文字信息转化为数量指标,以实现将不同类型信息分离成不同字段、使同一字段赋值唯一的功能。最顶层为合成数据表,由派生数据表生成,对于同一年同一 “发生地点”( 县) 的多条记录,从资料来源、资料分辨率、记述详略、对该地的针对性等方面进行比较、插补与剔除,并采用地理时空关联的分析方法进行校核,进而综合成一条记录,以建立属性数据与空间数据的链接,最终实现指标序列提取和空间制图分析以及动态演示等功能。


该数据库同样是以 《清代自然灾害史料长编》为基础而建立的,但是与 《清代灾荒纪年》不同的是,它将与 《长编》一起,构成一个动态的与时俱进的灾害信息累积式扩展系统。作为过往研究的集大成之作,《纪年》一经撰写完毕,即难以容纳后续新发现的史料或最新的研究成果,增补、修订,殊非易易,但是 《长编》与数据库却是一个蓄水池,而且应是一个现有技术条件完全可以支撑的具有无限容量的蓄水池。任何在史料和研究上的新发现、新进展以及本项目在有限时间内难以收罗的其他史料,均可随时输入其中。当然,这样一种 “灌水”的工作,需要有一个可持续运行的灾害研究团队来负责,但更需要国内外从事相关研究的学者共同的努力与合作。为此,整个数据库的建设,从最初的原始文献库,到之后的原始记录库,从原始记录表到原始校核表,再到最终的输出端专题数据库,都将设计为一种开放式的公共交流平台,供相关研究者使用,同时也希望相关研究者能够通过此一平台之各个环节、各个层级,为数据库建设作出反馈和回报,从而以一种互惠的方式推动数据库的建设、维护和发展。


中国人民大学 “近代中国灾害研究课题组”从一开始创立以来,就在李文海教授的引领下,将资料整理与建设放在头等重要的位置,并尽可能快速地将其成果向学界公布,以期推动中国灾害史研究的整体发展。另一方面,在整理编纂这些资料的过程中,也总是得到相关档案馆、图书馆以及学界诸多师友的鼎力支持。因而,不管是 《近代中国灾荒纪年》及其续编的出版,还是


《中国荒政全书》和 《中国荒政书集成》的付梓,都当之无愧地属于一种公共文化工程。此次数据库建设,实则希望继承老一辈学者的无私奉献精神,并试图将这种公共工程从静态、凝固的纸质载体推向动态的电子网络,在数据库建成之后,将所有环节均对外开放,使利用者登录数据库之后,既可查阅利用其中的资源,也可直接进行资料输入、文献校核和发表评论等工作,如此交互操作,势必推动数据库的容量以更快的速度增长,使其变成一个名副其实的公共学术交流平台,并与学界同仁一起,在清代乃至中国灾害史研究领域的学术理念、学科建设与资料利用等方面取得新的突破性进展,共同促进中国灾害史研究的可持续发展。


首先,在中国灾害史或灾害学的学术思想和研究理论方面,力图把中国历史学的考据传统与当代灾害、环境研究的最新技术手段、分析方法和研究理念充分结合起来,构建新的灾害研究模式。其中最核心的理念,就是运用人与非人类自然互动反馈的生态系统分析方法,推动人文社会科学与自然科学的有机融合,促进灾害研究范式的转换。具体而言,就是在资料整理的过程中,不仅将有关灾害的自然、社会各方面要素信息均囊括在内,还要从人与自然互动的视角分析史料记载本身的话语特征,尽可能从看似自然的变动中捕捉社会的影子,从看似社会的人文事件中寻找自然的力量,进而为更加准确、清晰地揭示灾害的生成、扩散与演化规律提供尽可能丰富的资料基础。


与此相应,在学科建设方面,则力图进一步推动灾害史研究领域自然科学与人文社会科学的交叉与融合,进一步培育和壮大中国灾害史研究的新生力量。近百年来,中国灾害史研究的每一次重大发展,都离不开对灾害史料的大规模发掘和整理,以至于我国著名灾害学专家高建国先生,将建国以后地震史料、气候史料、洪涝档案史料以及荒政史料的整理与出版,称之为中国灾害史研究的四大里程碑。新的灾害数据库建设,将一改以往以纸质媒介为主导的资料整合与传播途径,同时打破现有数据库各自为营的封闭式管理模式,以其可持续的累积式信息扩展系统为灾害史研究提供崭新的公共学术平台,尽力推动灾害史研究从资料基础到技术路径等多方面的重大变革。而在此过程中凝结而成的新的研究团队以及经过实践锻炼的大批博士研究生和硕士研究生,也很有可能会成为更具活力的灾害研究队伍,反过来又为数据库建设的可持续发展提供不竭的人才支持。


在文献发掘与利用方面,也力求借助于信息集成数据库的建设在诸多方面形成较大突破。这不仅体现在对灾害史资料基础的大规模扩展,也体现在对各类文献进行更加科学的辨析,更体现在通过 《长编》、《纪年》和数据库三个方面的建设,形成一种可持续的累积式灾害信息扩展机制,从而在节省大量人力、物力资源的基础上,为国内外清代或中国灾害史研究提供源源不绝的资料基础和强大的技术支撑。


鉴于这样的数据库是一个包括自然变动与社会响应等各方面信息在内的综合性的大型灾害信息集成系统,故在文献方面,首先要做的,就是进一步扩大资料范围,细化数据指标。最大限度地涵括档案、方志、文集、报刊、官书、正史以及其他各类相关文献中的灾害信息; 就灾害信息本身的收录而言,也要求进一步扩展灾害种类和相关环境因素,即从水、旱、地震等灾害,扩至蝗灾、雹、风、霜、沙、潮、疫、寒、热、山崩、滑坡、泥石流、雪、火等各类灾害,以及农作物异常丰收等特殊气候、物候现象; 对于每一种灾害,其收录的内容,则注重自然与社会的结合,不仅包括自然现象,也包括由此引起的社会变动和反应,以期有助于完整、系统地展示灾害的时空分布与演化特征,灾害的成因与影响,以及灾害救济等各方面情况。其目的在于突破以往以单一灾害、单一灾种为主要内容的资料汇编形式,力求将历年各省区各类自然灾害包容其中,便于揭示各灾种之间的关联,从整体上反映灾害演变大势。


与此同时,这一数据库将强化资料的甄别工作,即在资料库建设过程中,除了提供基本数据之外,还要预留空间,以便建立相应的原始文献链接,显示文献考证的过程,供用户查核,同时建立信息反馈系统,充分吸取学界研究成果,尽可能保证数据的完整性和准确性,亦可借学界同仁之众力,共同建立一个经得起时间考验的、符合学术标准的清代灾害历史资料库。相应地,通过将灾害资料的载体由纸本向电子平台转化,改变以往相对封闭、相对分散的资料整理传统,力求使其变成一个融开放性与累积性为一体的平等互惠、动态积聚的公共文化工程。此外,在充分借鉴国内外学术成果的基础上,通过数据制作的工作实践,尝试着建立一套新的灾害信息处理规范,建立更加合理的灾害评价体系,从而使灾害信息处理工作进入一个新的层次。


总而言之,作为中国灾害史研究中迄今规模最大的 “断代工程”,其最终成果,将第一次以编年体形式全面、完整、系统地描述清代 260 余年间中国自然灾害的总体状况及其变化趋势,揭示灾害对中国社会各层面的诸多影响,呈现近世中国在灾难面前采取的一系列对策及其因时因地而发生的变异与革新,进而从传统走向现代化的艰难历程,其对于推进清代灾害史乃至中国灾害史的研究,拓展对历史时期中国社会生活和环境变迁的了解与认识,理应具有重要的学术价值;而且这样的成果,尽管是以文献整理与数据库建设为主要内容,但在实际建设过程中必然离不开对灾害学理论的深入探讨,更会促进人文社会科学与自然科学之间更紧密的合作与融合,推进生态系统分析方法在灾害史研究中的贯彻和运用,尤其是在史料的搜集、解读过程中传统考据学方法与现代科学实证分析手段的碰撞与结合,势必促成一门新的灾害历史文献学的孕育或胎动,进而将中国灾害史研究推向一个新的阶段,并在国内外灾害史研究的话语体系中占有相当的位置。中国有句古话,叫 “秀才不怕衣裳破,就怕肚里没有货”。历史研究尤其如此,只有在文献资料的整理和传播方面始终占据主导性的优势,才有可能在学术界立于不败之地。

作者:夏明方(1964- )男,中国人民大学清史研究所教授。

文章来源:《清史研究》,2015年02期。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存