查看原文
其他

陈必佳、康文林||数字人文与清代官员仕途研究

史学月刊
2024-09-04
点击“史学月刊”即可关注我们



作者简介


1

陈必佳,社会科学博士,中国人民大学清史研究所博士后流动站研究人员。

2

康文林(Cameron Campbell),香港科技大学社会科学系讲席教授,华中师范大学历史文化学院特聘教授。




摘    要:

数字化时代的到来给史学研究者带来研究方法的变革,越来越多专题性历史数据库的涌现,对人文学者掌握和利用数据库的技术手段方面也带来新的挑战。在将清代缙绅录建设为史学量化数据库的过程中,利用人物姓名、籍贯等关键信息构建有效的内部连接是追踪官员仕途迁转的关键,而跨数据的外部连接能够进一步拓展数据分析维度,补充科考名次、出生年月、家族背景等影响仕途的重要因素。利用明经通谱中的拔贡名册和缙绅录连接比较,可以得到各科拔贡生员入仕的人数比例。在分析拔贡不同的入仕途径过程中,不能忽视履历、方志等史料中对官员捐纳等信息的搜集,同时在任职时间等方面,这些信息可与缙绅录数据库中的信息互补,勾勒出更完整的官员仕途路径。在团队跨学科合作方面,缙绅录就开发检索平台、互动式可视化界面都进行过尝试,但存在成果难以维护和共享利用等问题,为数字人文在史学领域的发展提供思考借鉴。


关键词:数字人文;跨数据连接;清代官员;缙绅录;拔贡仕途




      近年来,随着计算机技术和数据信息化的发展,各类史料、档案、报刊都逐渐被全国各图书馆、高校和科研团队利用并建立了相关的数据库,内容、形式不一而足,为学界提供便利的同时,也给利用和处理相关数据化的材料带来了新问题和新挑战。本文以自身参与其中的“中国历史官员数据库——清代缙绅录(CGED-QJSL)”项目和相关拓展研究为例,展示历史研究中如何借鉴社会科学研究方法,以系统性的历史数据库为核心,连接各类其他史料或数据集。系统性和结构化的史料通过数据连接和恰当的分析方式,在量化分析层面能够发掘问题、验证推论,最终服务于以发现、描述和解释为目的的历史研究。同时,以跨学科合作为基础进行的数据可视化也尝试在数字人文兴起的大背景下,给传统人文学科带来新的思考和挑战。



从计量统计分析到量化历史大数据

       按照中国史学传统,历史研究长期以来皆以政治史为核心展开叙述,因而作为政权运作执行者的历代官员,也是历史研究的重点对象。与清代官员群体相关的档案史料存世多而繁杂,有学者从具有代表性和传奇色彩的官员生平入手,根据目标人物宦海沉浮的经历勾画时事变化与仕途命运的关系,典型的代表作如罗威廉《救世——陈宏谋与十八世纪中国的精英意识》一书,对清代中叶著名政治人物陈宏谋超过半个世纪的为官经历进行解读,透过其思想与政治生涯反映18世纪的官僚政治思想和社会。随着计量史学的兴起,从20世纪七八十年代起,有一批以《清季职官表》、地方志为材料依托的学者,对清代官员中的几个代表性群体尝试过描述性的统计分析,以揭示群体特征,并将这些特征与中央地方权力分配和时局联系在一起。最早结合社会学理论,利用数量分析方法处理方志史料,讨论士绅社会来源的是张仲礼,他对19世纪地方志中5473名中国绅士传记进行了统计,分析其中既无家庭背景又出身异途的“新进者”和有家庭科举背景的“继进者”之间的数量关系。同时期的学者何炳棣在《明清社会史论》中,也多处利用缙绅录这种官员名册统计对清代官员出身进行研究分析。瞿同祖在《中国地方政府》一书的论述中,也曾借缙绅录为据分析知县等地方官的出身构成。

      除上述与士绅、官员的社会来源和社会流动分析密切相关的研究中利用到了大样本的数量统计和比较分析外,近年来,随着信息技术的发展和数字人文的兴起,在如何科学有效地利用史料中包含的数量信息开展研究方面,学界有了不少新尝试和新探索。数字人文的发展是以计算机技术引入人文领域为基础的,数字工具的应用和量化分析的方法是其主要特点,跨学科合作是其重要的开展模式。目前数字人文学科的发展已经从探索走向了应用领域,包括但不限于城市地图、知识图谱、文物3D模型和VR展示等,广义的数字人文在公共文化传播、文物保护和城市旅游开发等领域不断有开创性的应用。在数字人文与历史研究相结合的研究成果中,各领域的学者也呈现了不同的研究方法和路径,在此选取有代表性的一部分进行简单概述。第一,伴随大量检索型人文数据库的建设,利用词频统计等工具对文本进行的量化分析研究。这类研究方法在档案管理、图书情报等学科应用方面更为广泛,汉语言文学等学科也有学者利用语料库进行词频分析方法研究文体特征。这类分析的数据统计较为基础,只能得到一些概括性的推论,在深入研究和解释方面尚存在诸多不足。第二,沿袭资料卡模式的史料分析方法,将“大规模、系统性材料”进行结构化处理,把其中的专题类信息分门别类整理为表格式的大型数据库。围绕这类数据库可以进一步演化为知识库等更具有功能性的数据库形式,也可以由研究者独立进行描述性的统计分析,再以大样本、长时段的实证性分析结果为依据,辅以其他档案史料展开细化分析。梁晨和李中清指出,这种社会科学化的定量分析方法“在发现新史实或新规律上优势明显”,但也承认在观察到有趣的规律性现象时,“仅凭数据本身无法对结果做出合理的解释”,导致对部分现象的解说和阐释较为肤浅,因此不能忽视定量分析和定性分析方法的结合。第三,经济史方向的研究则结合社会科学、经济学领域计量模型的分析方法,利用从史料中提取和收集到的有效数据,应用数理模型进行带有因果假设推断的检验性分析。梁晨等学者在《量化数据库与历史研究》一文中,将以量化数据库展开定量研究推动“求是型学术”和传统计量史学和以经济学为代表的社会科学学科推动的“解释型学术”进行了比较和说明,并重点解说了量化数据库方法在应对大规模、长时段的整体史学和同类型的群体性记录的历史材料具有优势,不仅可以扩大史学研究应用的材料门类和范围,也能“为克服史料繁芜提供重要思路”。李伯重对经济史领域利用统计学特征的计量和量化方法进行了辩证的讨论,提出史学研究对量化方法应采取开放的心态,但不能忽视其适用性,也要注重对史料可靠性的考察。第四,历史学者在引入和应用量化分析方法时,更注重历史学的叙事性和史料的丰富性,因此经量化统计的数据分析结果作为研究过程中展开的论证依据之一。

      社会学和历史学者最初关注和利用缙绅录这一史料,便是用于统计分析特定官员群体的科举出身和来源比例。前辈学者的研究受到史料搜集的时空局限,基本都是援引个别身边易于获得的缙绅录版本,对其中对应季节反映的特定时间点的官员名册进行单独统计,大规模的追踪分析也因技术限制而难以实现。在历史大数据和分析技术的发展背景之下,缙绅录成为覆盖清代文官群体全样本的理想的时间序列型数据材料。据考,缙绅录源于宋代,也有学者提出唐代或许已有该类名册的雏形,现存最早的版本可追溯到明代,是记录所有官职和官员信息的名册。至清代,缙绅录体例逐渐成熟并形成了按季更新,官本、坊本流传并行的局面。起初其印制和发行是服务于皇帝和中央机构的,需要“进呈御览”,因而由吏部负责组织刊刻的缙绅录书名为《爵秩全览》。坊刻本通常名为《大清缙(搢)绅全书》《爵秩全函》,由京师琉璃厂的各大书坊发行,书坊互为商业竞争关系,各自有其搜集官员信息的渠道。坊刻本的商品属性使得各书坊力求官员任职信息来源的精确性和时效性,成为在京官员、候补官员和京外官员及家属争相求购参考的时报类工具书。

    “中国历史官员数据库——清代”的建设,最初就是以研究官员流动为目标,以发现和了解缙绅录这一官员名册为契机开展的,与图书馆和档案馆以资料整理为目的的历史文献数据库有所区别。上文已提及,缙绅录在清代按季发行,但有官刻、坊刻之分,而存世和可供查阅的缙绅录在时间连续和版本一致性上无法保持始终统一。实际的材料转录中也确实发现不同版本来源的缙绅录,相邻的季节在同一机构的人员顺序和格式上存在差异。随着转录材料的累积和追踪分析,项目组发现人员数量变化的原因主要在于官刻本和坊刻本对于“额外司员”这类候补官员的记录标准不同,因而及时做了分析策略的调整——将仅出现在坊刻本中的“额外司员”进行标记,在涉及时间变化和连续性的量化分析中,将所标记的官员记录排除。除此之外,按照时间顺序录入的缙绅录数据基本遵循清代文官系统的结构,满足追踪分析官员群体特征的需求。数据库开始转录工作以来,同步开展的分析工作大致分两个脉络进行,一是熟悉了解缙绅录数据库本身的特点,对所载官员在不同年份季节中的官职记录进行内部连接,二是搜集其他与清代职官有重合的人员名录和数据集,尝试跨数据匹配的“外连接”。



传统史料数据化后的内外连接:从科考到入仕的群体路径分析

      将缙绅录中的官员任职条目化信息转录为数据库具有重大意义,可以有效帮助我们从整体角度研究分析清代官员“从哪里来,到哪里去”的问题。清末仕途壅滞,捐例大开,科举士人难寻出路,但在具体的数量和比例层面,仅有时人笔记中的直觉性判断和学者的估算性统计作为参照,并无确切统计。缙绅录本身按季更新的特性和覆盖所有文官名录的属性,使得分析科举士人由科举到入仕并进入仕途,及在文官整体中的占比数量和动态变化成为可能。数据库在从录入到量化分析的过程中遇到了多方面的困难,开展研究的过程中,我们不断探索技术进步为人文学术问题带来的潜在新解法,并最终形成了较为成熟的方法体系。数据的“内连接”是我们开展量化分析的第一步,其目的是追踪已经成为文官系统正式成员的官员群体,在进入官场后的迁转路径是否有其内在规律。清代有成熟且不断发展变化的一套人事制度,一方面,我们可以利用数据库验证官员升迁路径是否整体上符合制度规定;另一方面,通过发现与制度背离的人事变动情况,可以快速锁定一些重大历史事件,以此为线索从“人事变动异常”的官员出发,搜集其他相关史料,开展研究分析。

      1.缙绅录内部连接的完善:构建追踪职官生涯的基础

      目前大部分数字人文方面的数据库,都是由数据库开发者对人名等进行专名识别,并建立关联,但这种基于自然语言处理技术的方法比较粗糙,且因数据库中的史料来源并不具有系统性,不可避免存在错漏。缙绅录数据库中一人对应数十甚至上百条任职记录的特点,决定了我们作为数据使用者,需要首先进行数据连接,同时在研究实践中发现并调整连接方法,保证分析结果的准确性。目前我们形成了较为有效的“两步走”处理方式:第一步是基于每条记录的姓、名、籍贯省、籍贯县四项内容,将其中内容完全一致的记录赋予一个编号,该步骤保证了大部分应该被关联的记录能够连接为同一名官员。第二步是通过Stata软件中的dtalink命令进行进一步的概率性数据连接(probabilistic data linking)。

       以缙绅录数据库的“内连接”为例,在最初的数据库分析预处理中,由于官员姓名中出现异体字,或因版本问题存在籍贯不一致(主要是县一级信息),部分属于同一名官员的记录在系统运行初期被赋予了两个或两个以上的编号,这样在量化分析中,会将一名官员的连续记录识别为两名或两名以上的官员,造成统计上的偏差。为解决上述问题,我们将官员记录中的姓名拆解,并忽略字形,转换为拼音,与籍贯信息排列组合,进行“模糊匹配”。最终形成的匹配分值达到程序运行者的预设时,可以认定该结果是第一步的连接中所遗漏的,将这些记录的编号替换为第一步中生成的编号。关于满蒙旗人的连接匹配,我们目前的连接结果尚无法保证统计学层面的准确性,因此基于“内连接”开展准确度较高的量化分析尚有待时日。

        2.外连接的探索与尝试:打通科举、捐纳与入仕途径的量化分析手段

       为探究官员仕途履历背后的因果关系,并分析制度变迁下官僚阶层的流动性,我们通过“外连接”来补充缙绅录没有涵盖的官员信息。缙绅录所载官员有相当一部分经历过科举并获得功名,这也使得我们最初尝试的分析从大量存世的科举录入手。晚清“官多缺少”几乎成为学界的共识,而作为候选官员中享有最高优先级的进士,仍要面临漫长的轮候,甚至终其一生没有机会任官。通过外连接到“清代进士题名录”并进行描述性统计分析,可以直观解答的问题有:进士轮候时间平均为多久,进入官场的进士比例如何,该比例是否因时变化。我们利用整理出版的《清代进士题名录》构建了清代进士数据库并进行连接,分析划分甲第和名次后,进士候缺时长和会试名次的直观关系。结果显示:三甲进士明显比一甲、二甲进士更难获得入仕任职的机会。在对三鼎甲及传胪和二甲、三甲进士的甲第名次划分后,通过累积比例图表的方式,展示会试年以后的二十年内陆续出现在缙绅录中——即获得实缺官职的进士人数和比例。从分析结果可见:一甲、二甲进士在考取功名十年以内,九成以上都获得了官职,而三甲进士则平均要在考中进士十五年后陆续获得官职,比例最终稳定在七成左右。

      上述环节描述性分析,缺失了可能影响进士官职任命的关键要素——年龄,通过“外连接”其他科举名录等史料,可以部分补充年龄信息。朱卷和同年录、同年齿录中进士、举人的出生年月信息提供了年龄线索,同时他们的家庭背景信息,如父亲、祖父、叔伯、堂兄弟等人的任官情况,都会成为影响官员进身的关系网络因素。缙绅录与上述材料构建的数据库连接后,扩展部分的信息即可增加研究问题的切入点。除了这种扩展缙绅录数据库中所包含官员的背景信息的思路,另一种“外连接”是与相似性质的名录进行人员比对,可以大规模追踪在特定时段内官员的去向。该研究路径的例证之一是缙绅录与民国职员录的连接。清末民初,在社会变革大背景下,原来服务于清政府的政治精英群体的去留是很多近代史学者关心的话题,但通过传统方法开展的分析往往只能追踪个案。通过民国职员录数据库和清末最后一季缙绅录的连接,我们共计发现4000多名清末官员供职于中华民国政府各部门,从分析结果推测,其中以新学人才为主。

       当然,数据库之间的连接并不是盲目的,而是以数据库的独特性为出发点提出研究问题,缙绅录相比于其他职官史料,最大的特点在于“全”,即可以将它理解为对清代官员的“全样本”收录。因此缙绅录适合数量基数较大的整体性研究,在一些情况下能够补充我们对于历史问题中的宏观层面认识。清代自咸同军兴以来,捐纳大行其道,已经成为官员进身不可绕过的问题,这一点通过近年来对清人笔记、奏疏、日记的分析整理能够知晓,但通过捐纳手段入仕的官员在全体官员中究竟占何比例,通过缙绅录和捐纳名册的连接,可从一定程度上窥见全貌。缙绅录与捐纳名册《川楚善后筹备事例》的连接,从数量上证明了嘉道年间,采用捐纳手段入仕的官员人数已经超过了同时期通过科举考取进士进而获得官职的人数。该分析的思路是通过缙绅录数据库与进士题名录和捐纳名册进行外连接,分别获得确切的由科考进士一途与捐纳途径得到官职的人数进行比较。

     《川楚善后筹备事例》的时间为嘉庆三年(1798年),通过与缙绅录数据连接的结果可知,该批捐纳官员在文官系统中任职的时间大致在1778—1834年,部分捐纳名册中的人员在此次捐纳之前就已经是文官系统中的一员了。为提高数据连接的准确性,我们将进士题名录中用于连接的数据限制在1795年、1796年、1799年、1801年、1802年、1805年、1809年的七科进士,将缙绅录数据的时间限定在1796—1834年间。上述七科进士题名录所包含的进士,约70%出现在对应时段的缙绅录数据库中,共计1028人。而共计包含将近11000人的捐纳名册,有1206人出现在缙绅录中,且所任官职在从七品及以上。

       我们第二份尝试连接的捐纳名册《豫工二卯事例满汉文员官生名次录》(道光二十五年)在时间上与缙绅录数据库更接近,因此我们也将其整理为数据库,以求获得更理想的统计分析结果。该名次录共计收录捐纳官生名单1239人,非旗人官员有1147人。经过与缙绅录的连接,其中186人有文官任职记录,约占16%,略高于嘉庆三年捐纳名册连接的成功率11%。对于时间跨度在47年的这两批捐纳人员实际获得实缺任职人员比例的解读,需要综合多方面因素。第一,最直观的判断是道光以降,通过捐纳获得实缺官职的比例上升,反映出原有的以科考为主的文官选任制度受到挤压。第二,充分考虑缙绅录在两个时段的时间覆盖和完整度方面的差异,由《川楚善后筹备事例》得出的11%的比例一定程度上低估了实际的数量。通过计算可知,连接成功的186人中有90%(169人)都在20年以内获得了实缺官职,而50%(83人)则在10年内即获得了官职。而186人中,绝大多数出身为监生(占103人),即由捐纳而得的国子监生功名;另有16人为异途贡生,14人为举人。对比考取进士后的候缺年限,捐纳大大缩短了等候时间,为较低功名的官生入仕提供了捷径。第三,在监生捐纳实缺官职的情况中,所捐多为九品或未入流的杂职末缺,并无多大晋升空间。

      3.拔贡任职比例:由“明经通谱”到“缙绅录”的追踪分析路径

      在搜罗整理同年齿录等科名录史料的过程中,我们关注到“明经通谱”这一专门汇集拔贡同年信息的名录,并由此通过与缙绅录进行“外连接”,展开针对拔贡群体的仕途追踪分析。将整理录入的五科明经通谱中包含拔贡和考官的信息都转录为数据库后,共计8370名拔贡的信息,并由此可以得知诸位拔贡的中试年龄——均值在30岁上下浮动,此外我们也录入了其父亲、祖父、曾祖父等直系亲属的科名、曾任官职等信息。将数据连接到缙绅录之后,可以通过拔贡科考年份,追踪到上述8370名拔贡出任实缺文官的数量和占比。通过连接成功的缙绅录职官记录中的出身分析,进而可以发现相当一部分连接到缙绅录数据库且来自明经通谱中的拔贡,都是继续科考之路,通过举人或者进士出身入仕的。

表1 各科拔贡任职比例一览——基于“缙绅录”与“明经通谱”连接匹配的结果

       晚清官员“官多缺少”的问题经常在围绕科举、士绅的讨论中提及,也因此诞生了由大量候缺官员组成的候补文官群体,而等候实授官缺的时间在不同时期究竟有多长,是通过个案分析较难得出结论的,跨数据连接的量化分析则能够通过不同时间节点的计算为官员由考取科名到获得实授官职的平均时长提供大致估算。在清代,贡生是在垂直关系的童试、乡试和会试三级考试之余开辟的另一入仕途径。正途贡生通常与举人并列被提及,称“举贡”,可以共同参加为举贡设置的考职并获取教职为主的官职。而贡生由于未通过乡试考试,地位略低于举人。正途的“五贡”,具体包括优贡、拔贡、副榜(副贡)、岁贡、恩贡五大类。其中优贡是在廪生和增生中通过会考选拔的。拔贡考试频次较低,每十二年举行一次。优贡和拔贡在正途五贡中又相对地位较高,有资格参加朝考,并授予相应官职。经整理录入的明经通谱数据库和缙绅录通过人名连接共得到60176条匹配成功的记录。在排除明经通谱数据库中包含的各省考官记录之后,剩余54724条记录。这五万余条数据记录对应2443名拔贡,即平均每名匹配成功的士人有大约22条连续的职官任职记录,时间跨度平均在5年以上。

       通过连接成功的缙绅录首条记录年份和拔贡年相减,得出间隔年份(见表1,“拔贡年与初次任职年间隔”列)。由于出现在明经通谱中的不少拔贡仍会继续通过乡会试考中举人、进士,再由此获得仕进机会,因此我们对连接成功的第一条职官记录所载“出身”进行了统计,其中出身仍为“拔贡”的有1355名。换言之,确定由“拔贡”出身入仕的只占到五科明经通谱中出任文官总人数的55.5%。而对于五科拔贡总人数而言,不到三成(29.19%)最后获得了文官任职,其中仅凭“拔贡”出身获得任职的只有16.19%。对比两组人员的平均获得任职的时长,则能看到1849年一科所需要等候的平均年份最长,在15年以上。

      成功匹配到缙绅录的2443名拔贡中,97%属于民籍,共计2374名,另有少量旗籍、军籍(9名)和商籍。从考取拔贡的生员类型分析,绝大多数匹配到缙绅录的拔贡都是以优贡生(930名,占38%)、廪膳生(701名,占28.7%)或廪生(517名,占21.16%)的生员身份考取的。这三类生员实际都可归为“廪生”,总计占到匹配成功的拔贡人数之九成。剩余的一成生员则包含附生、增生和小部分旗人。

表2 由拔贡而参加乡会试并由举人、进士入仕的官员任职时间间隔 

      表2列出了各科拔贡同年齿录中最终分别以举人出身和进士出身进身官场人数的情况。从考取拔贡至入仕时间来看,于1825年考取拔贡的“后进举人”有82人,平均经历的时间最长。1849年及以后的历科由拔贡至“后进举人”所经历的时间间隔呈递减趋势,且以1885年和1897年两科间的时间减少最为显著,由12年降至6年有余,将近减半。人数上则呈现不同的特点,1873年拔贡后来以举人进身的人数最多,为103人,而1897年仅有56人。

      明经通谱中的拔贡,必然也有在乡试、会试中接连中试,进而以进士身份进身官场的情况。从“后进举人”和“后进进士”的横向比较可以看出,对于有能力考取进士的拔贡来说,继续参与科举能够加速其进身仕途。但继续追求更高科名的优势随着历史进程在递减——道光五年(1825年)的拔贡在后续考取进士以后获得官缺的时间距离拔贡考试年的时间是12.91年,较由举人进身官场的士人缩短了6年多。而这一时间差到1849年拔贡中只有4年多,1873年、1885年、1897年的时间差更是缩短到2年左右,甚至仅一年有余。这在一个侧面间接印证了历届拔贡之整体素质还是较高的,并未因当时社会风气、官场积弊之变化而在数据上出现大的波动。有名可查的拔贡出身之举人,在后来的会试阶段位列鼎甲的就至少有三人,其策论试卷皆收录于中央民族大学图书馆所藏《历科状元策》,包括咸丰九年乙未科状元孙家鼐、同治四年乙丑科榜眼于建章、光绪二年丙子恩科状元曹鸿勋。

      拔贡历来受到清政府的重视,是科举乡会试制度的重要补充,除去由拔贡朝考而分发官职一途,各科拔贡中有不少人都在后续的乡试、会试中接连考取了举人、进士,数量相当可观。就本文研究对象中的8000余名拔贡中,有206名后来高中进士并出任实缺官职,具体分布情况和初次任职距离拔贡考试的时间见表2第4列。观察分析表2可知,各科拔贡在后来高中进士的人数在1849—1885年的三科之间比较稳定,都在50人上下;1825年人数相对较少,为34人;1897年最少,为24人,这与清末科举制度废除,后续再无会试得中进士的机会应当有密切关系。



量化数据库外史料的互证和补充:从结构化的数据库到个案叙事

       以数据连接为基础分析官员的仕途和流动,能够从全新的视角探究清代文官制度的实际运作与社会变化、国家治理之间的互动关系,同时详实的背景分析和故事叙事也是必不可少的。《清代官员履历档案全编》整理出版以来,不断有学者利用其展开研究,批量分析清代人事制度和运作特点无疑是较好的切入点之一。与个人微观材料的“连接”,因为可供结构化的内容较少,建立数据库会导致遗漏大量有价值的信息,所以目前的经验主要局限于利用履历档案、方志史料等材料,通过姓名检索追查官员的生平、仕宦信息,以补充缙绅录的不足。利用个案开展对照分析,对我们理解缙绅录材料本身所载信息的准确性也多有助益。以拔贡官员群体中不同仕途起点的官员系列个案为例,对照缙绅录和其他数据库之外史料,相互印证并勾勒官员仕途较为完整的路径。

       1.由拔贡捐纳入仕而至道员

       在分析拔贡出身的官员群体仕途特征时,通过数据连接追踪锁定一部分最终官至道员的拔贡官员,利用连接编号锁定具体的职官记录,再结合官员履历等档案,可以勾勒官员仕途较为完整的路线。如浙江归安的王观澄,拔贡出身,通过捐纳县丞入仕,捐纳究竟在其官至道府之路上起到什么样的作用,值得进一步探究。根据缙绅录,道光二十年夏起至二十五年秋,王观澄出任山东青州府益都县要缺知县,选任方式为补缺。道光二十六年夏起调任济南府长清县最要缺知县,道光三十年秋升任东昌府中缺知府,咸丰八年(1858年)冬起任山东分巡道。从制度角度考虑,拔贡出身在道光年间直接出任要缺知县的情况实属罕见,因此通过缙绅录追踪到的这些记录所反映的升迁路径很可能不完整。履历档案的内容补充了王观澄仕途的前半段:道光十六年至十九年丁忧返乡,其仕途的起点则能够追溯至道光元年(1820年),通过报捐县丞,先后在安徽凤阳府的宿县、怀远、舒城任县丞,在江苏仪徵署理知县,于道光八年捐运判,道光二十八年再次报捐。由此可见,由于数据库在1840年以前的时间覆盖较为分散,无法追踪到王观澄丁忧之前的仕宦经历,导致了单纯依靠缙绅录开展个案分析时内容的缺失,同时,履历档案对于一些频繁调任或者署理的任职经历,也并无详细的时间线叙述,对于履历档案生成以后该官员的任职情况,也有缺失。多种资料的交互补充,方能勾勒出王观澄个人仕宦生涯的全貌。

       2.由拔贡出任教职之官员仕途路径

       利用宏观大数据进行跨库连接,分析群体仕途特征确实能从整体层面把握特定群体在不同时段的趋势,但由于缙绅录本身的记录特点和数据的时间覆盖未必全面等原因,难免会出现一些“例外”的情况,此时就需要锁定官员编号,结合其他史料进行个案分析补充。在对拔贡官员仕途分析中,由拔贡出身出任官职的仕途起点,在缙绅录中最常见的有复设教谕、知县、训导、州判、复设训导、主事和七品小京官。通过缙绅录数据库中追踪到的上述各类拔贡仕途生涯终点任职规律可知:教职类官职的稳定性极高,而流动性极低。以“复设教谕”为例,382名从复设教谕开始仕途的拔贡中,将近八成(303名,占总数的79.3%)仍旧以复设教谕致仕。上述382名拔贡中,仍旧出任教职但官职有变化的超过10%,有7名官至教谕,30名官至教授,21名出任训导,6名为复设训导,4名出任学正。从“训导”开始的文官仕途的84名拔贡中,有63名在结束仕宦生涯时仍旧任训导,另有12名最后分别在复设教谕(3名)、复设训导(3名)、教授(3名)、学正(2名)任上致仕,仅有3名升任知县。75名复设训导中有62名仍旧任职复设训导,另有最终出任复设教谕、教授、教谕的各3名。有1名最终出任“日讲起居注官左春坊左庶子”。总而言之,八至九成以教职授职的拔贡官员,最终在官场都未经历太大流动。

       由拔贡而出任“左春坊左庶子”一职实属不寻常,通常詹事府该职由进士出身的翰林院官员升任,数据分析捕捉到该“例外”后,锁定该名官员的姓名、籍贯等信息,对其人和为官经历继续深入考查。该生为道光乙酉科(1825年)拔贡喻增高,1803年出生,江西省袁州府萍乡人,根据姓名籍贯连接到缙绅录的记录共14条,时间跨度自道光八年夏季起,至道光十九年冬季,共十一年六个月。从连接到进士题名录的信息综合来看,喻增高于道光十五年高中乙未科进士,在道光十五年夏季的缙绅录中他为翰林院庶吉士,道光十六年夏季起直至道光十八年春季的7条记录追踪中,任职翰林院编修,并同时任湖南正主考。后于道光十九年夏缙绅录中显示,他任詹事府右春坊右庶子一职,并于冬季任左春坊左庶子。追溯到喻增高在缙绅录中的出身改为进士之前有四条拔贡的记录,显示其于道光八年夏起任职江西南昌府丰城县训导长达五年,直至道光十三年夏。经与同治《丰城县志》比对,喻增高就任训导的确切时间是道光七年,其下一任训导到任时间为道光十二年,在任时间确为五年左右。可见尽管喻增高通过拔贡获得了担任本省教职的机会,但其仍追求科举一途,通过考取进士才进身翰林院庶吉士之列,进而由翰林院编修升任詹事府左右春坊庶子。

       本文查阅了相关方志文献,印证补充缙绅录中关于喻增高仕途记录的推测。据同治《袁州府志》载,“喻增高,字凤冈,性聪颖,读书有特见。十七入郡庠,益精研经籍。岁科试三冠军,乙酉膺拔萃,廷试二等,授丰城训导,课士有方,门下生某以事触县令檄,学申详高廉其诬,不允,令愬于郡守,复毅然为之申理,事乃寝。辛卯举于乡,乙未成进士,改庶常馆,课屡列前茅。散馆授编修,丁酉主湖南乡试,所取多名士,江忠烈出其门,己亥大考翰詹,上嘉其才,拔置一等二名。召见,特加奖异,擢左春坊左庶子,充日讲起居注官。”从地方志为喻增高所修传记来看,他天资聪颖,在科举一途各阶段的考试中都表现出色,以拔贡廷试二等的结果授职训导,后又考取辛卯科(道光十一年,1831年)举人。根据缙绅录和地方志中的时间线,乡试中举后,喻增高就不再出任训导一职,直至道光十五年以乙未科进士身份成为庶吉士,入翰林院庶常馆学习,期间表现出色。在己亥年(1839年)从翰林院选拔人才入詹事府的考试中,喻表现优异,擢升左春坊左庶子。可惜的是,喻增高英年早逝,道光二十年尚且不到四十岁,就在任上离世。

      由上文可知,由拔贡出身出任文官的官员中,大部分都以地方教职为仕宦生涯的起点。另一名由复设训导官至知县的拔贡夏成业,仕宦生涯就比较漫长,且其仕途生涯的终点因时代背景而带有一定的戏剧性和悲剧色彩。夏成业拔贡中试以后,在缙绅录连接到的任职记录多达21条,时间跨度从道光十年冬至同治二年春(1863年),说明其历官三十余年。根据缙绅录的记录,夏成业自道光十年至二十二年,历任湖北省襄阳府襄阳县复设训导,襄阳府南漳县复设教谕,再次追踪到夏成业的任职记录是十年后的咸丰二年(1852年)秋季,任贵州省镇远府天柱县知县,后调任贵阳府贵定县知县。缙绅录关于夏的任职记录在同治二年春季戛然而止,而据《贵州通志》记载,其又升任黔西州知州,并在任上因对抗地方盗匪而牺牲。《贵州通志》中有关其传记记载,“夏成业,湖北江夏人,拔贡生。同治初任黔西州知州时,贵州各属贼匪纵横,遍地糜烂,乡团往往顺贼保家,即与贼战,器械不良,毫不足恃。成业勉力支持,多方应付。三年十月,号匪潜至袭城,遂陷。成业死之,长女适丁氏者,及幕友王朝栋等皆被害。”咸同年间,西南地区的湖北、广西、贵州等地区确实出现大量盗匪流寇,并对地方政府的治理造成很大的冲击,地方官衙署内的正印官、佐贰及教官等都不乏有在冲突中死亡的记录。根据明经通谱中出生年月的记载,夏成业1805年出生,与前文所述喻增高大致为同龄人,而喻后续科举高中,因病死于京官任上,夏却在地方辗转,最终因盗匪战乱而亡。

      3.由拔贡出任知县之官员仕途路径

      相比之下,初次任职即能出任知县的拔贡在官场的流动性和升转机会似乎要更大。在213名初次任职为知县的拔贡中,最后终于知县的有169名,另有12名出任知州,10名出任同知,5名升至知府,官至巡抚和道员的各有1名。有机会留京任职的拔贡中,仅有的19名主事或主事行走基本仍旧任主事一职。从最终致仕的官职分布来看,能够出任“七品小京官”确实属于各项出路中最优——以该职入仕的207名拔贡中,最终仍旧任七品小京官的仅58名,占到总数的不到三成,其余部分升任主事(52名)、员外郎(12名)、郎中(5名)、监察御史(4名),另有相当一部分外转出任知县(5名)、知府(9名)乃至布政使、巡抚、道员等职。在分析过程中,我们分别随机选取由知县和七品小京官为仕途起点的两位拔贡,再结合方志、履历档案等其他史料,对照缙绅录勾勒其仕途迁转路径。

表3 缙绅录所见其他拔贡仕途路径类型  

       由知县升任知府之拔贡出身的官员,其仕途生涯则充分揭示出捐纳手段在其时的重要性。吕缉光,同治癸酉科(1873年)拔贡,十三年(1874年)七月拔贡朝考中名列二等,以知县分发各省试用。当时签分贵州。根据光绪三十年(1904年)广西巡抚奏请由吕缉光补授浔州府知府的折件内容,吕缉光尽管是拔贡正途出身,在抵达贵州后,至少三次通过捐纳手段助益自己的仕途晋升。第一次是“光绪元年三月二十日刘麟克复永从厅县各城,并剿平六硐贼巢案”“保加同知衔”,并在光绪五年题署镇远县知县。第二次是丁父忧起复后,先是捐银调离贵州省,前往广西,“奏调来桂差遣补用,遵例补缴离省分发银两”,后又“边防在事出力案内保,俟补缺后以同知直隶州尽先补用”。随后曾在怀集县、河池州署理,补授永福县知县后,因与原籍距离相近,在五百里以内,调任武宣县知县,委署富川县知县。光绪二十三年丁母忧。回籍守制服满后,在新海防例内“报捐知府指分江西”,户部核验后仍改指广西,最终通过试署浔州府知府,补到了实缺。

       综合缙绅录所见之仕途升迁路径,广西巡抚奏折中奏请以吕缉光补授浔州府知府,对其任官履历进行了详尽的回顾,补充了诸多细节和空缺的情节。其一,吕缉光频繁地利用捐纳银两获得保奏和调任的机会,最终才能升任知府。其二,吕先后因父母去世丁忧,起复后因原有的员缺早已有人补署,必须再次通过捐纳手段,获得署理、试用的机会,尽快补缺,才能回到原有的仕途路径上去。至光绪年间,保案繁多,捐纳的名目也花样频出,既有通过保举加衔,又有补足银两离省,可见地方上调任频繁,而地方治理的不稳定性,又导致各级官员通过各种名目敛财,形成恶性循环。清廷对于地方人事权的控制日渐丧失,由督抚提请的调任、委署等事项,基本都能得到肯定的答复。

       由拔贡出任小京官,继而外放任职的官员仕途则通常更为周折,其中小部分官员是先以拔贡出身出任七品小京官,后又通过乡试、会试,分别考中举人、进士,科考的顺利加速了其迁转升任的步伐。田步蟾的仕途则呈现全然不同的局面。在考取拔贡后,他与其余72人一起,“著以七品小京官分部学习”,由缙绅录的任职记录可知,田步蟾被分至兵部任职,同一年的顺天乡试中,即考取举人,五年后在癸卯科高中进士。田步蟾考中进士的时代背景比较特殊,伴随着清末科举制度改革到废除的历史进程,同时政治制度方面的变革也在进行。根据申报《进士馆期考出榜》的名单,田步蟾应当是在考取进士后进入进士馆学习,在期考外班中位于前列。考取进士出身的田步蟾,在出任“工部补用主事”中“能勤奋办公,深资得力”,“奏请留于本部”。继而由工部主事调任新设立的商部衙门任司务、主事,期间商部衙门合并改称农工商部衙门,田步蟾又先后升任员外郎、郎中。出任农工商部员外郎期间,田步蟾曾在“遴派监修崇陵工程”之列。根据清河地方志中关于仕迹篇记载,田步蟾就读于崇实书院,“漕督黎培敬巡抚山西后,士风日趋奔竞”,当时书院诸生“闭户潜修”“不屑与争”,而“昔之取士旧章亦淹然澌灭”,培养出一批“蜚声文苑”而淡泊官场名利的士人,田步蟾即为其中清河籍生员的代表。田步蟾在民国初期仍旧出任与“农工商部”相近的机构官职,历任山东、河南等地实业厅厅长、政务厅厅长等,1926年以后便不再活跃于政坛。

       以上梳理了由面至线再至点的拔贡仕途路径的部分思路过程,既有由“大数据”锁定惯例之外的“特例”进行追踪探查,又有根据仕途追踪到的群体路径的随机抽取个案,进行典型性分析。因篇幅限制,本文所展现之个案难免有其局限性,在进行综合性研究中还应深入结合不同历史时期的时代背景,选取更多个案,方能使论述更具说服力,得出适当的结论。

      宏观层面的“大数据”分析固然能够从全局的角度把控群体特征,利用数据库进行的分析结果,在解读和阐释的时候必然避不开从数字到更生动具体的个人。近年来随着越来越多晚清至民国时期士绅或者官员的日记整理出版,研究者得以从亲历者的角度更加真实地了解官场运作的细节,并将制度运作和众多的生活场景结合,这些都为深入解释数据分析的结果提供了绝佳的素材。不少现实主义讽刺小说等文学作品,也为看似冰冷的数据分析呈现了更多生动的画面,《官场现形记》中主人公利用科场同年关系夤援捐官的场景,就说明这样看似是“弱关系”的关系网络,在晚清官场成为攀附结交的重要手段和途径,有力证明了缙绅录作为官员名册与同年齿录横向连接的必要性。



机遇与挑战——跨学科融合背景下量化研究的前景展望

      数字人文的兴起和计算机技术引入人文研究领域,让年轻学者对数据可视化产生了浓厚的兴趣,计量史学、数字史学等概念重新进入我们的视野,跨学科合作的课题和科研项目不断涌现,新文科建设大背景下史学研究如何应对新方法和新趋势也引起广泛关注和讨论。近年来,国内数字人文发展迅猛,成为信息资源管理技术、计算机技术和文学、历史学等跨学科研究的桥梁和纽带,涌现出一批以数据可视化、交互性平台为呈现方式的成果,大大拓展了人文学科研究成果的展现形式和边界。这类数字人文可视化成果在博物馆等公共文化服务领域的应用和传播更广,枯燥的文字、图像类资料通过技术手段生动呈现,带来的沉浸式交互体验提升了受众的观感,对于文化普及和弘扬起到了显著的助益作用。与此同时,我们应当看到数字化手段的引进,在推进历史研究的社会科学化和跨学科合作方面都大有可为。我们利用与计算机科学专业的团队学者合作的机会,对缙绅录数据的可视化利用和探究官员仕途的群体性特征规律进行了尝试并取得了阶段性研究成果。

       以缙绅录数据库项目为例,其与香港科技大学计算机科学学院从事数据可视化研究的科研团队合作,对缙绅录的可视化和群体分析进行了多方面尝试。关于数据的可视化尝试,我们通过与计算机可视分析领域的团队和科研人员合作,首先构建了可提供官员姓名检索的平台并设立反馈机制。进一步的尝试,则是建立可以实现互动性筛选的可视化分析工具“Career Lens”,使用者在被告知简单的操作说明后,能够自主选择自己感兴趣的群体,例如设定条件为湖南籍的官员,选定目标人物群体后可以通过“流动模式”“群组流动特点”“个人仕途流动”可视化展现从目标群体、关系网络群体到个人的仕途流动脉络。在可视化的后台数据中,我们利用同年齿录等关系,尝试提供由科举建立的关系网络,而可视化的界面则通过流动图能显示出这些被串联的官员在不同层级的行政网络中的交集。

      数字化时代的到来,早已使越来越多的史料获得突破了时空限制,而计算机技术的引入,实现跨数据库连接,进行量化分析,给史学研究带来变革性的挑战。在大样本的史料数据库支持下,对统计数量、比例在时间趋势上的长时段分析,在呈现效果和可靠性上皆优于20世纪七八十年代人工对特定时间截面的统计。数据连接问题的技术突破,也能够成为群体性追踪官员仕途和家庭、家族背景的利器。当然,数据连接只是用于处理和分析资料的工具,恰当娴熟的运用工具是进行分析、探究趋势和规律的起点。如何深入历史场景解读和阐释数据分析结果,才是历史学者需要最终解决和面对的问题。近年来,经济史研究领域流行的“量化历史”研究路径,则更侧重于应用计量分析模型论证历史事件中的因果关系,推动了历史学和经济学的跨学科融合,但也遭到史学界针对这类研究的批判和辩论,从数据可靠度、史料分析的严谨性、人文观照等不同面向提出了质疑。我们应该以开放的态度面对不同学科背景的学者探索并利用新方法讨论和分析历史问题,同时鼓励在批评和辩论中相互学习,推动学科发展和学术进步。

      尽管越来越多的数字人文平台提供了资料分析工具,习得和掌握这些工具首先需要投入大量的时间,在不同数据库平台上搜集到的资料也受到诸如碎片化、难于查证等问题的质疑。清代缙绅录数据库项目在与计算机数据可视化研究团队的合作中,成功完成了将官员迁转历程和人际关系网络可视化的实践,成果也得以发表在可视化领域的顶级刊物,但合作诞生的可视化工具止步于此的结果令人扼腕。如何推进类似的跨领域合作并实现互利共赢,让可视化工具真正发挥史料分析功能,是需要思考和探索的问题。越来越多知识图谱、知识库等图像化展示的数字人文工具得到开发,如何将可视化的分析展示的结果转化为能够真正助益学术问题解决的工具仍面临难题。数据库的开发者往往偏重技术和呈现效果,而在调研工具平台用户的需求方面鲜有投入,造成供需端的信息不对称。

      学科评价和考评体系的搭建如何与数字人文方向的发展配套问题也对数据库项目的开展带来困扰。以缙绅录项目的开展为例,前期对数据的清理、数据处理方式的探索就需要大量时间和精力的投入,数据库的公开共享和维护也需要不断的投入,这类工作受制于科研经费管理制度等原因,很多都需要研究人员的亲自参与。利用数据库开展研究方面,获得不同形式的数字化分析结果呈现,需佐以更深入的史料搜集、考证和论述,才能逐渐形成完整度较高的历史研究成果,而当下的学术考评体系中,对于产出成果的时间跨度要求越来越严格,给人文学者深入主题、挖掘数据背后的历史真相,带来极大挑战。同时我们也注意到,许多数字人文平台呈现的可视化分析结果为多样的图像形式,而当下人文学科学术期刊对于图像化的分析结果接受度普遍较低,也给尝试探索新方法、利用新工具的年轻学者带来困扰。数字人文平台开发建设中仍以信息技术人员为主,人文学者参与度和积极性低,则会进一步导致数字人文工具难以在学术应用方面发挥最大价值。在历史学的实际研究推进中,如何利用数字人文技术并将所得转化为有深度的阐释和分析,与以往的历史研究经典问题形成对话和交流,也是我们亟待解决的问题,不应为了量化而对所有符合条件的材料进行量化,应当重视需要研究和讨论的问题本身。

      同时通过本文的呈现可以看到,无论是广义的数字人文,还是将史料系统性地转化为数据库进行量化分析的研究方法,在找到科学高效的研究路径后,能够在宏观层面补充以往历史问题认识的不足和缺憾。利用历史量化数据库的统计分析,从数量的角度发现有价值和规律性的线索,并从线索入手锁定符合认知的案例或者违反常规的案例,通过查找其他史料进行互证互补,更好地描绘数据观测到的历史规律之全貌。如明经通谱本身只是拔贡同年编写的记录家世背景和任官情况的同年录,在连接到同时期的职官记录缙绅录后,可以估算拔贡群体在对应时期进入官场的人数比例和候缺时长;而在厘清拔贡的不同入仕途径后,又能通过缙绅录追踪发现的官至道府或进入翰詹一途的“异常”情况,对这些个案锁定追踪后,能进一步发现拔贡群体中有人继续坚持科考,进士得中后,仕途路径发生了巨大改变;也有拔贡本就通过捐纳获得官缺进入官场,并频频通过捐纳才得以晋升。由训导开启仕途的拔贡和由知县开启仕途的拔贡官员,在政治才干、家族人脉和个人人生选择方面的影响和关系,本文未及展开和深入。正如有学者在近期的讨论中指出的,在新文科建设提倡跨界融合的背景下,我们不应计较方法论的有效性,而是落实到跨学科合作的课题在当今的学术评价机制下如何尽快形成配套的发表、传播、教学、评价等一系列机制,以此激励不同学科领域的学者投入到相关研究中来,从而推进历史学新文科建设的良性循环。

原文载《史学月刊》2023年第4期,注释从略。


END往期回顾

达昕、张桐||战后波德和解与华沙的角色

艾莉·哈罗尔、罗清云||考文垂的创伤修复与和解之旅

彭贺超||督练公所与清末军事改革中的风险应对

蔡梓||20世纪30年代初国民政府对西沙群岛问题的因应

继续滑动看下一个
史学月刊
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存