王贺 | 从数字人文到机器人人文,我们将失去什么?
从数字人文到机器人人文,我们将失去什么?
王 贺
(上海师范大学数字人文研究中心)
现在也许是时候来讨论数字人文可能面临的问题了。但一般理解的数字人文究竟是什么?事实上,在笔者近年关于晚清至当代文献的研究之外,一直试探数字人文与现代文学研究结合的可能,因此陆续写过一些相关文章,参与了多个数字人文研究基础设施项目的建设,但从一个门外汉到稍稍得窥门径,谈何容易?是故迟至2018年3月,第一个数字人文作品《曹禺西北之行图》才由浙江大学、哈佛大学共建“学术地图发布平台”网站发布。不过,也因此,许多相熟或素未谋面的朋友,便认定数字人文乃是纸质文献的数字化或关于数字文献史料的研究,其实这是一种误会。
王贺:《曹禺西北之行图》| 来源:https://amap.zju.edu.cn/maps
如果我们可以将自1949起罗伯托·布萨神父(Fr Roberto Busa)与IBM公司合作为托马斯·阿奎那的《神学大全》编制拉丁文词汇索引、视为数字人文的起源之一的话,那么数字人文的历史至今已有半个多世纪了。其间,数字人文的发展大致经历了三个阶段。第一阶段是纸质文献的数字化;第二阶段是配合相应的平台、工具等,将已经数字化了的文献资料作更进一步的处理,特别是量化分析和可视化技术的运用更加深了这一印象;第三阶段则无疑是人文学术与计算科学、数据科学的深度融合(参见D.M.Berry:《Understanding Digital Humanities》,Palgrave Macmillan,2012)。当然,在第一阶段中已潜藏着一种人文学术“计算转向”(computational turn)的趋势,数字人文早期的术语“人文计算”(humanities computing)便强调了计算机技术在人文研究中的运用。
D.M.Berry: 《Understanding Digital Humanities》 | 来源:https://www.palgrave.com
但随着互联网和信息技术、科学的迅猛发展,数字文献、数据代替纸质文献,成为人文学术生产中最重要的资料,同时越来越多的人文学者意识到使用数字技术、方法仍是为了更好地理解人文学术,数字人文、数据人文等概念相继也被提出(如2014年英国著名的布莱克威尔出版公司将其定期出版的《人文计算年鉴》更名为《数据人文》),特别是“Digital Humanities”一语,不胫而走,风靡全球,无论从哪个角度看,数字人文现已成为一个最具活力的前沿学术领域。迄今相关的科系、研究中心已在哈佛大学、斯坦福大学、伦敦大学国王学院等欧美知名高校建立,除了推进学术研究,它们还提供从本科生到博士生的一整套完整的人才培养方案。也正如包弼德教授(Peter K. Bol)在数字人文国际高峰论坛暨上海师范大学数字人文研究中心成立大会上的致辞所言,数字人文中心不仅是一个研究中心,一个学术交流、协作中心,同时也是一个教学中心。
尽管数字人文在中国的发展,早在十余年前已经开始,但直至近一二年才真正成为一种中国大陆的学术潮流、时尚,既作为图书馆学、情报学、档案学等学科的“学术热点”频频出现,也在文学、史学、文献学、语言学、艺术史研究等不同领域不断引起人们探讨的热情。当然,就其一般性的学术水平而言,中国的数字人文目前可能还处于上述所谈第一、第二阶段,但不出意外,在广阔的数字人文场域中,数字文学、数字史学、数字哲学、数字文献学、计算档案学、计算语言学(语料库语言学)、数字艺术史……等新的分支领域未来都将取得一定的发展。
最近人工智能技术的发展及其在全球范围内社会生活各场景(医学、电子游戏、电子商务、机器翻译、工程科学及社会治理)中的广泛应用,也激发了批评家们的关注。在一般的数字人文研究之外,检讨技术、算法带给文学、艺术与日常生活的宰制性和技术霸权,追问机器人是否可以被视作人、是否具有人性及其话语权等重要议题也相继被提出,“机器人人文”由此成为另一个引人关注的场域,一个似乎可以取代数字人文、也显得更加炙手可热的概念。事实上,从卡雷尔·恰佩克(Karel Capek)的剧作《罗素姆万能机器人》首度展开对机器人的文学想象,到2014、2016年斯坦福大学相继启动“AI100”“AIIndex”项目,试图更加及时地追踪全球范围内人工智能在产学研、社会经济、法律与道德伦理各方面的进展,尤其2016年仿生机器人索菲亚(Sophia)获得沙特阿拉伯公民身份这一特殊事件及其传递出的象征意义,在在使得人和机器人、人工智能的关系成为科学家与人文学者都难以绕开的重要话题。大规模机器人群体的诞生,机器人社会的出现,游走于现实与网络之间的“赛博人”“后人类”社会俨然已不再是天方夜谭,而是我们相去不远的未来。的确,还有什么比丧失人之为人的主体性的“后人类”处境更让我们感到焦虑、惶恐不安、忧心忡忡?
AI100 | 来源:https://ai100.stanford.edu
AIIndex | 来源:https://hai.stanford.edu/research/ai-index
对于人文学者来说,在人工智能技术的刺激下,诸多新的问题扑面而来。诸如微软机器人小冰出版的诗集,是否可以被视作和人一样的作品?清华“九歌—人工智能诗歌写作系统”自动生产出的诗作,容或不是传统意义上的一首好诗,但仅就其能够完全根据我们的需要进行批量生产这一方面而言,是否已经可以说明传统诗歌的能量、魅力在今天仍能够被我们再一次激活,抑或已消耗殆尽、沦落为一种“装饰艺术”?又如,面对机器人新闻写作和由机器人深度参与的部分网络文学文本时,其独创性、文学性又该被如何界定……所有这些问题,正不断地拷问着我们传统的文学、写作、阅读观念及由其建构的庞大的文化体系,乃至人文学术赖以维系的、独特的、个性化的知识经验和知识表达。
另一方面,人工智能技术也与数字人文的关系极为密切,在很大程度上已经介入了数字人文的发展。中华书局、书同文等企业开发的在线古籍整理系统,就使用了人工智能的核心技术——机器学习,而自然语言处理、语义网分析、知识图谱、神经网络等分支技术在历史人文大数据环境中的成功应用,也已是目前数字人文领域最为关心的理论与实践。这一切似乎都向我们表明,包括人工智能这一前沿技术在内的数字技术、方法,已经成为人文学者必须掌握的工具或至少是辅助研究工具,且将不断改变我们的学术习惯、生态。在此意义上,我们也就不难理解有学者提出的数字人文是一场新的学术革命这样的观点。
但事实是否如此?在笔者看来,不仅传统学术仍具有强大的生命力和创新发展的可能(参见拙文《“数字人文”与传统学术》),而且数字人文和机器人人文尽管都是数字时代人文学术回应时代、社会重大关切而做出的某种适应和改变,固然可以帮助我们在某些方面理解旧的问题、验证旧的结论、提出新的问题、重启我们对主体、身体、人性、心灵、权利等一系列重要命题的思考,但就其长远发展而言,或许也有将人文学术带向“计算批评”,从而愈益科学化、丧失“人文性”的危险。
虽然“人文性”是一个难以准确定义的概念,但我们至少应该都承认:与自然科学相比,人文学术的结论可能很难是唯一的、固定的、放之四海而皆准的,许多很难经得起重复验证,也根本没有什么技术操作方案、程序可供验证;人文学者的研究成果,往往因学者个体的性格、禀赋、学术训练和特定的审美旨趣、意识形态偏向等,呈现出千差万别的特点。但是,假如我们对于所有问题,使用同一个数据库(语料库),同一套计算机程序和分析工具,经过同样的数据挖掘、分析作业之后,得出了相同的结论,那么这样的人文学术研究还是我们需要的吗?它是否会窄化人文学术的诠释和想象空间?是否会将原本与博学、审思、明辨结合在一起的充满个性的人文学术,降格为一种纯粹的技术、实验操作,危害“人文性”本身的发展?是否会导向对技术和算法的崇拜(这正是科学主义、信息资本主义意图召唤的意识形态)?这不能不引起我们的忧思。
Dan Schiller: 《Digital Capitalism》| 来源:https://mitpress.mit.edu
更不必提,可能“还有很多学人,仍切盼着一个时常可以关闭电脑、远离网络的世界,无数个可以潜心研读、圈点、勾画、校阅,与书籍及作者思接千载、心游万仞的时刻,而非深陷于‘论文机器’‘学院动物’状态不能自拔。这种阅读、思考的状态,有时呈现为‘按照目录的方式,将某一主题的文献逐一阅读’,有时则纯粹代表了第三种阅读方式——漫无目的的阅读(desultory reading),而后者的存在在提醒我们,不妨享受‘非职业阅读’、沉思、奇思妙想的乐趣。按照亚里士多德、培根、夏目漱石、鲁迅等人的理论,学术研究也好,艺文创作也罢,本来就是闲暇、余裕的结果,而闲暇‘是一种精神的现象’‘一种灵魂的状态’‘强调一种内在的无所忧虑,一种平静,一种沉默,一种顺其自然的无为状态。’”(见拙文《“数字人文”视野中的目录之学》)但数字时代的降临,不仅杀死了我们的闲暇时光,将劳动和监控的触角植入我们的毛细血管,让每个人都有可能成为“信息劳工”(knowledge workers)和不知疲倦、不知懒惰为何物的“信息超载者”(information overload),更重要的是,对人文学术工作也带来了一定的消极影响:不仅传统的阅读、写作、思考的技艺在走向衰落,我们平衡深度、专注的阅读和泛读、略读、搜索特定信息的能力也并未增加;学术成果的衰减期由原来的数年、数十年激变为今天的数天,越来越多的最新发表的论文(而非经典文献和那些仅从题目无法判定其是否与研究相关的论文)组成了一个人文学术研究的绝大多数脚注,在某种程度上导致了詹姆斯·埃文斯(James Evans)所谓的“科学和学问的日趋狭窄”的现象。此外,窃以为,有一个关键问题我们还必须提出,此即当我们熟练地使用着数据库、数字技术、算法输出一套所谓的人文学术研究成果时,可以在多大程度上慰藉我们原本或已开始干枯的心灵世界、救赎现代人原本动荡不安的灵魂?
也正因此,在笔者看来,数字人文也好,机器人人文也罢,不仅它们的重心、基座是人文,而且它的航向也应该是人文,是面向人文的一种可能的(最终也并不一定成功的)研究取向、路径,而不是相反,将其研究路径、程序变成纯粹的技术操作或有“脚本”的演出,研究结果则变成数字学术以至数字经济的一个个精致的、制式化的产品(抑或是“草率的学术快餐”)。如果明知我们要付出的代价可能是牺牲其固有的、丰富的“人文性”,那么一旦开始选择这样的研究取向、路径,也就注定了我们的感觉是半信半疑的,脚步是蹒跚的,眼神是游弋、闪烁的,说话的腔调是不那么掷地有声的。
当然,试验新的学术取向,或创造可能的新学术,虽然并不一定比葆守传统更高明,但总归是一种新的、面向未来的尝试。与中国历史上诸多新学术的滥觞一样,数字人文的征途虽然是星辰大海,但行进途中,一定也将遭逢无数的挑战和艰难险阻,不妨借用鲁迅先生的话作为回应,“希望是本无所谓有,无所谓无的。这正如地上的路;其实地上本没有路,走的人多了,也便成了路。”
(原载《中国社会科学报》2020年12月21日第6版,发表时有删改)
编辑:刘婷