查看原文
其他

对撞机 | 数字人文知识生产转型过程中的困境与突围(上)

陈静 零壹Lab 2022-10-08


作者简介

陈静,博士,南京大学艺术学院副教授,主要研究领域:文化与媒介研究,数字人文。邮箱:cjchen@nju.edu.cn



数字人文一直都很具有争议性,不断地被批判。最近一次颇有影响力的论争是由提摩太·布伦南(Timothy Brennan)在《高等教育纪事报》(The Chronicle Of Higher Education)网站上发表的文章引起的。他旗帜鲜明地对数字人文提出了批评,认为数字人文研究中对算法的依赖,使得数字人文学者在面对文本时只看到了通过算法所呈现出的文本的特点,比如词频,却无法触及文本中有价值的内容部分。他还针对内容的量化分析、文学批评中的“远读”策略和“文学模式识别”等指出,由于数字人文学者们只是看到了表层的数字和数据,不能像使用大脑那样使用计算机去进行深入的思考,所以计算机只能回答其所能回答的问题,而无法开展真正深入的批判性反思;同时还因为数字人文学者将“更多信息混淆为更多知识”,所以使得数字人文无法在其所施用的方法之外进行反思,获得认识论或者方法论上的价值;因此,数字人文不过是占有少量资源或者长期处于学界边缘的年轻学者的手段,借此在已经划定格局的学术场域内争取更多的文化资本,获取地位提升。布伦南指出,“与其说数字人文是一场革命,不如说数字人文为了反对主流形式,从而强行将人文从其存在原因中剥离出来的那个楔子”[1]。可见,在布伦南这里,数字人文是全面破产的状态,非但没有从方法上与传统人文研究一样有效(数字人文研究的效果取决于算法的有效性),更因为计算机无法做当像人脑一样有智慧,而无法从数字人文之外对其自身进行认识论上的反思,也就无法生产知识。

 

这种强调数字人文政治意义高于其研究价值的观点是过去十多年间不断出现的老调重弹。比如,2012年,美国著名教授斯坦利·费什(Stanley Fish)也曾在《纽约时报》(The New York Times)的博客上发表名为《数字人文及其不朽》(“The Digital Humanities and the Transcending of Mortality”)的文章[2]。他指出数字人文所讨论的“作者”和“文本”不过是一种神学表述,提供的是一种关于新技术、新媒体可以改变印刷时代的线性思维困境的美好承诺。与布伦南观点类似,费什也认为数字人文不过是年轻学者试图在体制内部寻找更多可能性的政治性借口。然除了教授学生一些就业技能外,数字人文是否为人文学科提供了真正的学术价值还值得怀疑。


对于数字人文的批判同样来自数字学者阵营内部。比如在信息文化研究方面享有盛誉的加州大学圣巴巴拉大学教授阿兰·刘(Alan Liu)就指出,在1960年代已经有大量关于关于信息技术革命的社会、经济、政治和文化批评,而当时的数字人文(“人文计算“)却处于失语状态。刘强调,缺乏文化批评的数字人文是无法成为真正的人文研究的。数字人文必须超越“工具角色”,通过创造、改造和发展处新的工具和方法,重建人文和公众之间的联系,才有可能对人文研究做出真正的贡献。与布伦南对数字人文“技术/工具”持有否定态度不同,刘对于数字人文中的“数字”更为复杂。他认为,数字人文学者处于矛盾的心态之中,既担心数字人文被化约为工具后会降低其在方法论和认知论上的学术价值,又担心数字人文不够工具化从而不符合其“创新”(innovation)和“建造”(building)的名号。   

 

那么数字人文到底是否真的如这些批评者所言的那样仅仅是在政治上和技术上具有工具意义?数字人文学者自己怎么看待“数字/工具”问题?他们又如何看待自己的身份?

 

应该说,数字人文在过去二十多年间,经由早期的文本批评(textual critics),尤其是电子编辑(electronic editing)与“人文计算”(humanities computing)所开辟的路径,逐渐形成了一个具有丰富、多元且复杂的开放谱系格局,领域日渐扩大,研究队伍的日益壮大、教学和科研机构的迅速增多以及出版成果的井喷式出现,为其发展提供了机遇和条件,也形成了一系列具有影响力的成果。但与此同时,由于其内涵与外延的开放性,使得数字人文一直处在一个不断地被定义、被争论、被批判从而再被定义的过程中,始终没有形成一个公认的明晰定义,亦或是特定的某些群体性特征;相反地,“数字人文”更多的被认为是一种一定群体内的、具有共识性的、自我身份认知。而数字人文学者对数字人文中的“数字/工具”的看法也随着数字技术的发展脉络和复杂的实践路径经历了一系列变化,并不是一个简单的价值判断就能定论的。无论是布伦南还是刘都没有进入到数字人文的“数字/工具”的内部去讨论其内在的合法性问题,更多的是将数字人文中的“数字/工具”黑箱化,变成了一个无需展开、毋庸讨论、不言自明的中间过程,而究竟这个实现是如何进行的,通过什么样的方式进行的,在他们的讨论中却是不需要讨论的。比如布伦南在其文中将数字人文简化为了关于数字的“量化”,而抹杀掉了数字人文中学科、研究问题和领域多样性。而阿兰讨论工具化的时候,也并没有具体说明工具化发生的条件以及内部的过程。


 


然而,对数字人文中的“数字”进行讨论是非常有必要的。数字人文之所以不同于传统人文研究之处,正在于“数字”的背后代表的是一批学者试图以科学方法介入人文研究从而建立新的认知方式、新的研究范式的自觉意识和实践。正如苏珊•霍基(Susan Hockey)在《人文计算的历史》(History of Humanities Computing)中就说到,“人文计算不得不包含‘两种文化’,即将科学的严格、系统、明确、程序的方法特征带到人文学科中,来解决那些迄今为止大多以偶然的方式被处理的人文学科问题”[3]。然而,正如前面的争论所揭示的,这样的一个过程并非一帆风顺,水到渠成。一方面,数字与人文的结合并非仅仅是一种新的工具或者方法对人文研究中的施用:数字技术对人文研究的变化所起的作用是不可逆的,数字技术已经构成了目前人文研究的基础条件和环境,数字技术为信息社会中的知识生产转型提供了全新的维度和组织介入方式。另一方面,在过去几年间,数字人文中对方法、工具的强调已逐渐将数字带向了更为模型化的“算法”模式。可以说,数字人文在试图以数字的工具、技术和媒介来实现学术话语的结构性调整,改变已有的知识系统、生产与传播方式的同时,忽略了数字工具、技术和媒介本身所具有的差异性和意识形态,以及学术话语系统的社会语境,以及知识生产系统中的权力关系。

 

作为对此困境的回应,本文采取从“数字/计算/工具”这一焦点问题为切入口,指出数字人文需警惕“算法驱动”依赖和“工具化”认识,需要突破在乐观和悲观意义上同时有效的“技术黑箱”,事实上,将“计算”问题视为单纯的算法、工具和方法,都无法解决数字人文的“计算”困境;因此,数字人文需要从知识谱系上进行拓展,尤其需要重建包括媒介研究在内的其它思想谱系的关系,将数字人文放置到“数字文化”的大语境中,突破数字人文的工具化悖论。


数字人文:不可逆的数字知识生产路径


数字技术为信息社会中的知识生产转型提供了全新的维度和组织介入方式。如同印刷术之于西方文艺复兴、启蒙运动以及宗教改革等,基于印刷的书籍是信息革命之前最重要的知识存储、展示和传播的媒介和载体,信息与通信技术(Informaiton and Communication Technoloies, 简称ICTs)也在成为了20世纪中期以来的“网络社会”(Network Society)中基础性因素,同时推动着知识生产系统从基于印刷向基于数字媒介(digital media)的转变。在这个曼纽•卡斯特(Maule Castells)成为的”网络社会”中,新的信息模式改变了传统的社会空间及时间关系,消除了时空距离,而数字技术的瞬时性使得在不同地点和不同时间的人们可以同时处于一个信息网络中。与此同时,信息从其具体化的对象中被抽象出来,得以在不同环境、媒介中自由流动,而基于信息与通信技术的数字媒介也成为了最主要也是最重要的信息传输、存储和展示方式,改变了人们获取、理解和生产信息的方式,改变了包括学校、图书馆、博物馆等在内的文化、教育机构及学术共同体的生产、组织和传播知识的方式。

 

借用N•凯瑟琳•海尔斯(N. Katherine Halyes)的观点,这个过程可以总结为一种处于从基于印刷(print-based)向基于数字(digital-based)的知识生产转型期。在这个转型过程中,知识生产方式发生了变化。随着个人计算机的普及、互联网的发展、搜索引擎和数据库的迭代升级,无论是在日常还是在工作中,越来越多人文学者适应了并习惯于每日通过谷歌(Google)、必应(Bing)、百度这样的搜索引擎、或在JSTOR、Project Muse、CNKI这样的学术数据库中查找资料,为研究进行基础性的准备。与此同时,慕课(Massive Open Online Courses,简称“MOOC”)等在线开放式教学方式也进入了国内外高校的教学体系中,吸引了学生与教师们的大量参与。再者,搜索引擎及其背后的算法也已经参与到了学术生产过程中。在国外,谷歌学术(Google Scholar)已经成为了重要的学术信息搜索引擎与平台,而脸书(Facebook)、Academia.edu等类社交网站也逐渐取代了过去的邮件列表服务(mailing list services),成为了新的学术社群聚集地;在国内,百度、必应等搜索引擎虽然在学术搜索方面表现不佳,但像中国知网(CNKI)这样的学术数据库也已经开始提供“文献分析”及可视化效果,为学者提供一定的数据分析。此外,豆瓣和微信公众号这样的社交网络平台开始深入学术社群营造及学术传播过程中,在译介、传播、评价、讨论等方面发挥着越来越重要的作用。

 

人文学者在这个过程中的参与程度不同,有的人仅仅使用数字媒介来进行邮件交流、网络搜索和使用电子程度进行写作;而有的人则更多使用网络搜索和在线网站来获取学术资源,使用数字技术作为研究过程中的一部分,比如发表论文到网上以期扩大读者群和影响范围;还有人些人,比如数字人文学者,其从一开始,就使用数字媒介来概念化(conceptualizing)和实施(implementing)研究项目。但无论是何种程度,基于印刷的学者亦或是基于数字的学者都已经卷入了这一场数字知识生产的变革中。更根本性的是,正如海尔斯所指出的,已有研究证明,与网络的互动,哪怕是点击鼠标这样的小型微,都会对人的神经系统产生影响。而我们对数字介入的越深,我们对具有联网和编程功能的机器所具有的执行复杂认知能力就了解的越多。学者研究项目在研究和教学中的介入也对物理的教学和研究空间、方式提出了新的要求,因此,“在这一点上,很难说这场转型究竟在哪里结束,几乎人文研究工作的方方面面都需要被考虑,这包括了研究和出版、教学和指导、评价和同行评议以及学术界与更大的社会之间的关系等”[4]。数字人文可以说是这样的一个学术生产的社会语境及场域中出现的具有一定必然性的选择。

 

纵观数字人文的历史,从布萨神父(Roberto Busa)与IBM在1949年的合作开始,到1980-90年代的语料库语言学、计算语言学再到1990年代中期之后的人文数据库、档案库和量化分析研究等等,数字技术与人文研究的弥合、交融已经形成了一个清晰的发展脉络和路径[5]。自1949年以来,数字工具、方法与认知方式就在不断地改变着人文研究的走向,在传统人文研究内部和外部都开拓出了新的路径:无论是倡导以数据库重构基于印刷文本和电子文本互文性内构性的文本批评(text critics),亦或是通过数字化、数据化建立一种可量化的、可计算的、基于模型建构的“人文计算” (humanities computing),数字人文内部也已经形成了尽管宽泛但依然有迹可循的、有理可依的理论与方法,也积累了一大批在理论和研究方法上均具有一定原创性的学术成果[6]。例如在英语世界中,就有以弗吉尼亚大学杰罗米•麦根(Jerome McGann)的“理性超文本”(Rationale of Hyepertext)开创的“文本批评”、以芝加哥大学莫莱蒂(Franco Moretti)及其在2008-2013年间完善形成的“远读” (Distant Reading)模式、让-巴蒂斯特•米歇尔(Jean-Baptiste Michel)团队基于谷歌图书的“文化测量”(culturomics)模式、以列维•曼诺维奇(Lev Manovich)和马克西米利安·席希(Maximilian Schich)为代表的“文化分析学”(Cultural Analytics)等等。这些研究项目无论是在方法论革新性或者是研究成果原创性上都可谓典范。以莫莱蒂的“远读”模式为例。由于其具有的“显而易见”地针对性(与西方传统人文研究近百年的“细读”的区别)、行而有效的示例解释性(达到了传统研究的标准,并有新的“发现”)以及超尺度的分析范围(大尺度的文本量)使得“远读”成为数字人文领域中最具传播力并最具认可度的概念之一,也被公认为在理论和实践意义上都有一定原创性的数字人文的“范式”[7]。其后又有苏真(Richard Jean So)和霍伊特·朗(Hoyt Long)在“远读”概念的基础上提出关于日本俳句的“文学模式识别”(Literary Pattern Recognition)研究,在检验一个已知结果的正确性之外,还以一种新的计算方式挑战及改变以往对于俳句的认知及研究思考[8]。莫莱蒂及其拥趸所进行的相关研究已经难以用原有的文学研究的模式来讨论,更重要的是,他们依据新的研究方法不仅实现了传统人文研究的结论,而且发现并回答了以证据、经验和阐释为主的传统人文研究所无法发现或回答的问题。

 


汉语世界的数字人文尽管起步略晚,但在过去的十多年间也取得了长足的进展,其中执牛耳者就有哈佛大学包弼德团队基于“中国历代人物传记数据库”(China Biographical Database Projec,简称“CBDB”)开展的“群体传记学”(Prosopography)、以台湾大学项洁(Jieh Hsiang)团队开展的以数据库带动文本间脉络的大图景研究、以曾在香港中文大学和台湾政治大学任教的金观涛、刘青峰带领开展的“观念史图像中的事件”研究等等。尽管发展路径不同,方法各异,但这些研究也针对中文语言和文本的特殊性,形成了一系列具有各自特点、路径和模式的研究成果。比如项洁团队以唐宋两部官修大型类书《艺文类聚》和《太平预览》为例建立起的全文资料库及其查询、分析和观察功能为研究者提供了从一个宏观视野观察唐宋士人知识结构中渐进而深刻的变化轨迹。这种研究提供的对历史文献的分类结构、比重和条目内容上的差异的观察和分析,非人力能及,恰恰是通过数据库系统和相关的后台计算功能才得以实现的[9]。无论何种语言,我们可以看到数字人文学者对于这种以科学方法介入人文研究从而建立新的认知方式、新的研究范式有着非常清晰的自觉认识。莫莱蒂研究中就强调量化数据对于理论的证伪性意义。而金观涛则提出,数据库和数字人文学使得人文研究成为可检验的,而且这种可检验性与社会科学中广泛使用的量化分析不同。而更为激进的斯蒂夫·拉姆齐(Stephen Ramsay)则高举起了“算法批评”(Algorithm criticism)的大旗,呼吁一场变革,这场变革关心的并非仅仅是方法或者程序上的改变,更是希望能寻找到对于文本研究特定研究效果更为关注的读者[10]。

 

由此,我们可以看到数字人文不仅是信息社会的知识生产的可能性之一,也同时成为了知识生产转型的驱动方式之一。这是信息技术、数字技术在当代社会和发展中所带来的知识生产的必然呈现,无论是不是被叫做“数字人文”,我们都必须要面对这样一个数字知识生产的转型。与此同时,也可以看从宽泛意义上的数字、工具、量化方法到更为具体的“算法批评”,数字人文中“数字”的含义变得越来越依赖于算法,这既带来了机遇也带来了风险。


注:

[1]Timothy Brennan, “The Digital-Humanities Bust”, The Chronicle Of Higher Education, 2017-10-15, https://www.chronicle.com/article/The-Digital-Humanities-Bust/241424, 最新访问时间,2018-5-27;中文翻译参见顾佳蕙,《数字人文的幻灭》,”零壹Lab”(lingyilab),2017-12-13。

 

[2]参见斯坦利·费什著,王斌译:《数字人文及其不朽》,《文化研究》(第16辑),2013年9月,第199-205页。

 

[3]参见苏珊•霍基著,葛剑钢译,《人文计算的历史》,《文化研究》(第16辑),2013年9月,第173-193页。

 

[4]N. Katherine Hayles, How we think: digital media and contemporary technogenesis, Duke University Press, 2012. p. 5.

 

[5]参见苏珊•霍基,《人文计算的历史》,《文化研究》(第16辑),2013年9月,第173-193页。

 

[6]参见高瑾,《数字人文学科结构研究的回顾与探索》,《图书馆论坛》,2017年第1期。

 

[7]参见美国现代语言协会的会刊《PMLA》2017年第三期中十位学者对莫莱蒂的《远读》一书的专题讨论。特别是在安德鲁•哥德斯通(Andrew Goldstone)的《阅读的常识》(The Doxa of Reading)一文讨论到了在2008年莫莱蒂发表了最早关于“远读”的文章后,该概念是如何被接受和传播的。另参见本专辑但汉松的文章《朝向“数字人文”的文学批评实践:进路与反思》。

 

[8]参见美国现代语言协会的会刊《PMLA》2017年第三期中十位学者对莫莱蒂的《远读》一书的专题讨论。特别是在安德鲁•哥德斯通(Andrew Goldstone)的《阅读的常识》(The Doxa of Reading)一文讨论到了在2008年莫莱蒂发表了最早关于“远读”的文章后,该概念是如何被接受和传播的。另参见本专辑但汉松的文章《朝向“数字人文”的文学批评实践:进路与反思》。

 

[9]参见项洁、陈丽华、杜协昌、钟嘉轩,《数位人文视野下的知识分类研究——两部官修类书的比较分析》,《东亚观念史集刊》(第九期),2015年12月,第229-286页。

 

[10]Stephen Ramsay, Reading machines: Toward an Algorithmic Criticism, the University of Illinois Press, 2011, p 17.

END


主编 / 陈静

责编 / 顾佳蕙

美编 / 张家伟

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存