独家课程丨如何做一个数字历史学家
编者语:
本文系王涛老师“数字史学”课程教材《历史学家的新技艺》的首篇。本系列旨在为对数字人文感兴趣的人文学者和年轻学子提供数字人文研究入门指南,以助大家进入这片新天地。
读者将会在其中看到王涛老师对数字史学学科体系的思考,也能够读到基于数字史学方法的专题研究,甚至还可能包括某个软件按部就班的操作步骤。
历史学家的新技艺
大家好,我是历史学博士王涛。现为南京大学历史学院教授、数字史学研究中心主任。我的主要研究领域涉及教会史、德国史、数字史学等方向。
甫一发布,即显过气?
2016年,我开始在南京大学开设“数字史学”的课程。据称,这是中国内地高校之中第一个吃螃蟹者。当时,这门课并没有讲义,也没有出一部教材的打算。我曾经对自己说,如果真要写一部关于“数字史学”的教程,一定会在开篇写上“甫一发布,即显过气”这句话。
事实也确乎如此。2016年以来,我在课堂上演示的QGIS已经从2.X版升级到了3.X版;文本挖掘的工具Paper Machine,早已无人维护。新推出的工具更是应接不暇,比如2018年底刚刚上线的Wordless,据说功能非常强大……课程已经上了三轮,每次内容都有重大调整,剔除过时的内容,补充新鲜的叙述。现在,突然要将课程内容整理成教材,难道不担心遭遇被淘汰的命运吗?
让我犹豫的另外一个原因在于,数字史学的内容过于前卫,我自己也仅仅是半路出家、“自学成才”的爱好者,是否有能力和资格为历史学家的新技艺给出一份全面的梳理呢?假如我在某些问题的理解上存在偏差,仍然诉诸文字,岂不正应了奥古斯丁驳斥他在宗教纠纷中的对手,这些文字成为了呈堂证供吗?
缘起
然而,在最近两三年,我做了大量与数字史学相关的讲座,我从听众的回应那里看到了需求和迷茫。许多年轻的学生,包括我的同行,都预感到数字技术的发展对人文学者的工作状态会带来冲击。2019年初,中国社会科学报还将“大数据下的数字人文”评为2018年度的十大学术热点之一。这波技术的潮流涌动波诡云谲。许多人文学者和年轻的学子们都想拥抱这个未来,他们兴致勃勃,对各种工作坊、学术会议参与度极高,数字人文的主题像明星一样受到追捧。但在另一方面,同样是这群人,他们常常感觉迷茫,不知道如何进入到这个看似有一些门槛的新天地。他们听了很多讲座,学了很多新技能,却不知道拿着这些真本事做什么样的研究。
听到了各种吁求,看到了人们的徘徊,我觉得哪怕一本并不完整的指南也是有必要的。所以,我重新掂量了一下编写教材这项工作的难度。毫无疑问,数字史学需要非常强烈的技术背景支撑,而升级换代也是不可逆转的潮流。在多年的教学过程中,我虽然努力做一个赶潮人,却依然发现有些内核是无法改变的:这就是数字史学为研究者打开的世界观。我把书名确定为《历史学家的新技艺》,当然是在蹭马克·布洛克的热度,也是在向这位前辈学者致敬。
马克·布洛克(1886年 -1944年),
法国著名历史学家,年鉴学派创始人之一。
布洛克在他的专著中讲授的是传统史学研究的必杀技,但他身体力行的“年鉴学派”这个响当当的学术共同体,却很早就提出长时段、空间、量化等概念,现如今数字人文所推崇的理念已经在其中酝酿。
因此,就做起来吧。
Just do it!
这是我在一次会议上喊出的口号。
为什么我愿意大言不惭地来做这样一件事呢?
因为我是会编程的历史学家。历史学家可能有千千万,但同时还能够编程的历史学家或许就比较稀缺了。
这并不是一个自我褒扬的恭维。我首先是一位历史学者,我在世界史领域有若干传统的研究成果,深刻地了解历史学者的工作状态、需求和期望。与此同时,我也会写一点代码,知道数据分析的工作流,因此也能够清醒认识到计算的优势和限度。当我把这两项技能结合在一起的时候,我既能感受到数字史学的有效,也能明了其有限之处。由我来跟我的人文学者同行讲述数据的故事,可以正中下怀,又不必使用太多恼人的专业术语。
从积极的方面说,我扮演着桥梁的作用,尝试打通人文与技术之间的专业壁垒。但从另一个角度说,这也是在为我可能会犯的错开脱责任。当我在技术领域跟工程师讲历史,在历史学界给人文学者讲技术的时候,两个圈子的人都会把我当成局外人,讲了错话也会被原谅。然而,多年的教学体验让我愈发觉得犯错误是很珍贵的经历。只有在你进行表达时,你才有机会暴露自己在某些问题认知上的缺陷,被明白人挑明后,你就能获得改过自新的机会,从而成全了自己的进步。在很多情况下,知识层面的辨析,并不是拳击比赛,找到对手的破绽给予致命一击;而是各种挑刺,最终却促成认知水平的更新,是救人一命的善事。
作为一个跨界人来完成新技艺的推广,出错或许在所难免。我毕竟不是技术专家,对技术发展脉络的把握难免滞后。
说不定还会出现都9012年了,还在写《玩转Office2003》这样的教程。
但是,我并不忧虑教材在内容上可能出现的瑕疵。我要通过写作显露认知上的偏差,在同行评议的舆论中得到检阅,不再出现以讹传讹的窘境,避免误人子弟的后果。所以,数字人文学术共同体的专家们,热切地期盼你们对这个教程进行审阅,这将成为促成学术进步的佳话。
另外,由我来承担这项工作具有极大的励志示范效应。在我的学术背景中,并没有任何特殊的数理天赋,不过是纯文科的训练一路走入史学圈。
连我这个高考文科数学才130分的文科生都可以学习数字史学的技术,为什么你不行?
我来现身说法就是要打消大家以为技术很难掌握的心理障碍。
我不仅是桥梁,还是一块铺路石。通过多年的摸索,我感觉自己慢慢修炼了历史学家的新技艺,越来越靠近数字史学的核心领域。
我虽然不是巨人,但是大家站在我的肩膀上,还是能够少走一些弯路,相对容易地掌握新的技能。
内容简介
由于数字史学这个主题的特殊性,这个系列教程的内容编排也会有独特的风格。读者会在这里看到我对数字史学学科体系的思考,也能够读到基于数字史学方法的专题研究,甚至还可能包括某个软件按部就班的操作步骤。混搭或许是最好的标签,也印证着数字史学跨界融合的特质。不过,随着数字人文的概念在学界变得炙手可热,涌现了大量就这个主题侃侃而谈的文章。但在读完这些看似深刻的反思与展望后,读者依然不清楚数字史学何为。所以,我们的宗旨是致力于授之以渔,但要从授之以鱼起步:只有在经历了技术和工具的打磨后,历史学家才能在真实的学术海洋里游刃有余。
实际上,我也看过很多工具软件的用户手册。这些由专业人士汇编的指南,往往遵循技术学习的路线,从ABC开始,慢慢加入更多的命令,更复杂的功能演示。人文学者往往满怀希望地开了头,却总是无法坚持学完。因为我们不是要成为精通某个技能的工程师,而仅仅是想解决一个非常具体的问题。我们甚至会马上就介绍某个软件的高级用法,而不会去解释其算法的逻辑。
我希望本教程的读者能够从任何一个单元开始,不去理会课程的体系,不去遵循由浅入深的惯性。
我坚信,读者在看完教程之后,能够明白三件事情:
第一:数字史学是什么,如何在研究中引入数字史学
第二:如何评价数字史学的研究成果
第三:如何去判断哪些研究属于蹭热点,哪些解决了真问题
第三件事情或许最为重要。数字人文成为学术热点当然值得庆贺,但也许并非是件好事,突然涌现出一大波相关研究成果,我们如何去判断哪些研究属于蹭热点,哪些解决了真问题,都需要冷静判断。
以上三件事情都看明白了,我们就能够云淡风轻地直面数字史学以及未来的学术环境。我们还能够与一个计算专家侃侃而谈不会怯场,也可以对研究成果的种种质疑应付自如。
如果你是下面几类人中的一个:
历史研究爱好者
历史学专业各层级的学生,想拓宽研究视野的学者
我的在读研究生以及潜在研究生
王涛老师的死忠粉丝
那么,请开启你的阅读之旅~
展望
最后,我想致谢。不过,需要致谢的人太多,名单甚至可以单独成为一章,所以我会在文末独立写一篇。在这里,我只想感谢一个人:
互联网
在我孜孜不倦地学习历史学家的新技艺过程中,如果没有互联网提供的免费资源,我很难进入数字史学的新天地。共享、免费、合作,都是数字史学的应有之义,我受益良多。既然我是互联网共享精神的受益者,我也愿意将这种精神传递下去。所以,本教程所有内容开源免费,涉及到的数据、代码等,也会提供下载链接供大家分享。
我还把本教程的首发权献给了网络。这不是简单地为了发表优先,而是试图树立一种发布学术成果的新标准。
作为面向未来的史学研究,也要开拓研究发布的新尝试。实际上,我们希望通过这种试验,提升在线成果发布的权威性,从而让学术成果获得多样性的展示。
我们不必多言,在线发布的形态,能够及时获得与读者的互动,更加有利于内容的改进与完善。当然,我也并不排斥传统发布渠道:如果有出版社对本书内容感兴趣,愿意资助出版,那我也乐见其成。我可以向出版社保证,即便是传统书籍出版,我也构想了一个具有挑战性的方式。
我一直以为,数字史学的未来是天下再无数字史学。
现代的学术环境下,我们推广的技艺还属于“新”的范畴的话,那么一两代人之后,不论是理念还是方法都不必“出新制胜”。在不久之将来的某次德国史年会上,我就一篇运用了数字史学方法的研究论文做了公开报告之后,有同行专家指出我在文本挖掘工具中某个参数的瑕疵,对这样的质疑,我不仅不会有丝毫不爽,反而会欣慰地感叹:
这事儿,成了。
温馨
预告
《历史学家的新技艺》系列今后将继续在本公众号(零壹Lab)不定期更新,敬请持续关注。
END
主编 / 陈静、徐力恒
责编 / 刘双双
美编 / 刘双双