“数字人文的学术评价体系:定义与规范建构”研讨会发言汇编（上篇）

Original 王涛陈静等 DH数字人文 2022-07-17

收录于合集 #《数字人文》2021年第1期 13个

数字人文与评价

王涛陈静等

吴雪映/整理

------------------------------------

编者按:

2020年9月12日，“数字人文的学术评价体系:定义与规范建构”研讨会在南京大学举行。本次研讨会由南京大学人文社会科学高级研究院数字人文创研中心主办、南京大学数字史学研究中心和南京大学数字人文与超媒体GIS工作室协办，来自历史学、文学、地理学、计算机科学、信息管理学、艺术学、空间科学、图书馆、期刊界等学科领域二十余位专家与会。为相对完整地呈现本次会议的交流成果，本刊以“汇编”的形式刊登与会学者发言稿的主要内容，本公众号以上、下两编推送，以飨读者。

------------------------------------

引言人

王涛(南京大学历史学院):

数字人文的学术、技术与价值评价

现场的各位老师、同学以及线上的朋友们，很高兴用这样一种方式召开一次跟数字人文相关的会议。处于疫情状态之中我们用了这样的技术方式，让我深刻体会到了所谓“不在场的在场”状态，这在很大程度上一方面是在兑现数字人文的一种理念，另一方面也说明技术确实在改变我们做学问和交流的方式。

今天会议的主题看上去很有雄心大志，实际上这只是其发展到某一阶段必然的事情。从学术的意义上来讲，学术评价有两个层面的含义。一是学术工作价值怎么样，好不好，相当于给学术工作打分。二是跟人挂钩的，高校老师的劳动要体现价值，你的工作能给你挣多少工分，你可以通过这项工作拿到多少得分点。

今天我们要讨论的评价，或者说我自己比较关注的评价是第一种。这跟我的个人经历有关，这几年在数字人文领域中遇到的一些事情引起了我的思考。因为我也忝列在所谓数字人文专家行列中，基于这个身份就经常受到邀请去评价一些稿件，包括学位论文，还有一些对数字人文友好的学术期刊杂志，经常给我发审稿邀请。开始我还挺高兴的，因为这是一种标志，是所谓的同行评议，同行评议是很重要也很有用的一种形式。但是我经过这几年的审稿，突然发现同行在哪里?我算不算真正意义上的同行?因为现在收到的越来越多稿件让我不敢评价，有很多是我并不了解的，比如《左传》《四库全书》，或者某一个很具体的技术领域。我何德何能去做这样的评价?同行评议本身是很传统的学术所采取的一种方式，传统的学术同行评议在专业变得越来越精细化、每个人擅长的领域变得越来越窄的情况下，已经出现问题了，何况是在数字人文这样一个本身是以“跨界融合”为导向的领域。我是不是有资格去给别人辛辛苦苦做的研究品头论足，甚至决定它的生死?这是不是合理的?这让我意识到，在数字人文研究中，同行到底是谁，有没有资格，是一个问题。

还有一个故事，在我们某个群里，前段时间发生了一场激烈争论，这个争论是围绕着可视化而来的。清华大学向帆老师基于CBDB(中国历代人物传记资料库)的人物家谱可视化作品拿到了他们专业领域一个很重要的奖项，但是这样的工作在一些人看来没有价值。这就引起了我的思考。我们有一句俗语“敝帚自珍”，你认为很好的东西在别人看来可能是很一般的东西，这样一种状态在数字人文领域更加突出。这个故事其实让“同行不存在”的状态变得更加极端。向老师的作品得到了传统意义上同行的高度评价，但是在另外一个圈子中被觉得不过如此。那怎么办?

第二个故事其实让我触动挺大，所以才会有今天这样一个议题，就是怎么去评价，特别是进行这种其实非常专业化的学术评价。我觉得至少可以有一些方案。有两种方式的评价，第一种是进行很简单、安全的技术评价。技术的评价是对研究进行一个规范的定义，规范的定义可以基于三个层面。第一个是去看他的资料来源，这是很传统的方式，看这套资料是不是完整可靠，这是第一个前提。因为所有研究，不管你用多么高科技的方法，如果基础不稳，那后面的东西都是有问题的。第二个是方法，我们要去讨论你运用的方法，不管是文本挖掘、社会网络还是各种统计，这个方法是不是很好地回答了你的问题;以及你的方法是不是可以还原，像做实验一样，我们拿到你的材料，用你的方法，可不可以得到你的结果?第三个是看你通过数据和方法得到的解释是不是合理。因为所有的数字人文研究，用了方法和数据之后，最终会有一个结果，这个结果具有什么样的价值是要经过学者解释的，那么，这个解释是不是合理的?

这三个层面很重要。如果我们认同这样的一种技术评价体系，那么它会非常直接地影响到数字人文学术成果的呈现方式。今天特别邀请了《南京大学学报》主编王浩斌老师，因为我在他那儿做了一个数字人文相关的专栏。我们想兑现这样的方式:数字人文研究相关的成果，除了提交一篇论文之外，还要把你的数据和方法一并提交，而且必须要让读者能够下载接触到，以检验你的过程是否合理。我们的专栏现在还没有正式发表，我请他来开会相当于督促一下。我们在网上也进行了呼吁，希望能加快编稿速度，让我们在学术规范的建构上有一个《南京大学学报》的标准。我觉得这个标准可以推而广之，对学术共同体构建有很大价值。

第二种评价是价值的评价。数字人文产品或者成果是多元化的，不单纯是一篇论文。不同的成果有不同的评价体系或者评价方法。传统意义上，数据库可能不算正式的研究成果，但是从价值的体系来看，数据库是一个非常重要的事情。比如，CBDB成了数字人文的一个标志性产品或者成果，我们对它的评价其实是基于它的价值。价值的评价为什么显得更加重要?用喝酒的例子来说，我不喝酒，所以我没办法评判酒的好坏。虽然他们都说某个酒好，但是在我看来不过如此，哪怕是茅台。这说明我是一个外行，没办法去评价茅台的价值，如果你去掉茅台的包装给人喝，他也许并不会说这个酒是好酒，在茅台标签上附加有很多其他的价值。

这就让我们意识到，对于数字人文的学术评价需要把一些额外的价值附加到数字人文产品或者成果身上，这是一个增值的过程。当然我们不是要增加虚伪价值，茅台还是有实实在在的价值的，并不是因为喝的人多了才受追捧。从这个意义上来讲，我们做数字人文成果的价值评判，对于整个数字人文的学术发展有很大的帮助。

致辞人

姚远(南京大学社科处、南京大学政府管理学院)

从一个文科的研究者，或者从代表我们学校的人文社科管理部门的角度而言，我觉得这个会恰逢其时，也非常重要。我关注到会议材料上其实写了南京大学两方面的资助，一个是南京大学人文社会科学高级研究院，另一个是南京大学的国际战略合作伙伴计划，而这两个方面恰恰显示了数字人文的两个特点:跨学科性、高度的国际性。

因为在疫情之中我们看到了对数字人文资源的使用，不仅是国内的，也可能是国际上普遍的。从我自己的学术经历上看，我对两个机构的数字资源有很深的感受:一个是东京大学的东洋文化研究所，从汉籍到艺术史相关资源非常丰富;另一个是哈佛燕京图书馆的资料。今天来之前，我也看了一些相关学校的研究和教学工作，我看到像在哈佛的Peter Bol——著名的中国史专家，面向哈佛的学生开设数字人文的课程，东京大学也开了好几年关于数字人文的课程，而日语中用了另外一个词来表达这个概念:人文情报学，翻译成中文叫做人文信息学，和信息管理有很大联系。所以这样看我们今天的讨论，其实在国际上有很深的研究基础。这对南京大学乃至更广泛的中国人文社科发展有几个方面的意义:

第一是新文科的建设。教育部提出新理科、新工科、新农科、新文科的建设，今天国家的大数据发展战略，对于文科在文化传承、治国理政中的新作用有更高的要求，数字人文将是一个重要的新着力点。第二是在中华文化保护传承中的重要意义。各位老师做的工作都和我们文化传承有着直接的关联。第三是它在文明交流互鉴中所起的作用会日益突出，就像之前提到的东京大学和哈佛大学等国外研究机构在研究东亚时，或者说汉学研究中的数字化的努力，中国也应当发挥更大的作用。我们和同行交流，展现中国文化，同其他文明进行对话，数字人文是一个很重要的平台和渠道。

今天讨论的主题是学术评价体系。在高等教育深化改革、破四唯(破除唯论文、唯项目、唯帽子、唯学历)等大背景下，我们对数字人文学术共同体的贡献和人文社科发展的意义应当会有一个新的评价，今天的讨论应当对今后的学术评价工作会有新的推动。从2017年起，南京大学就开始推进关于人文社科成果分类评价制度的试点，我想数字人文今后如何进入到分类评价的探讨或者说认定的范围，应该需要我们学术共同体去共同努力，希望早日把新的探索、新的贡献融入到人文社科的综合评价体系之中来。

刘炜(上海图书馆)：

机器时代的人文主义:谁有资格来评价？

一外在与本质

2017年10月25日，在沙特首都利雅得举行的“未来投资倡议”峰会上，由香港汉森机器人技术公司(Hanson Robotics)制造的机器人索菲娅(Sophia)被沙特政府授予了公民身份，成为世界上第一个受到政府认可的机器公民。这个看似作秀的举动其实蕴涵了一个巨大的跨越，标志着人与机器之间的界限正在被打破。这是否意味着源自启蒙运动的“人类中心主义”价值观受到了冲击?人类主体的范围是否应该重新界定?这些问题虽然还有待观察，但已经提上议事日程。

对数字人文而言，将其定义为数字技术在人文研究中的应用，或者是一个交叉领域，似乎已经远远不够了，人文学科的数字化发展只是其表象，人类数字活动的学科化研究才是其本质。循此方向发展下去，它不仅在颠覆传统人文，而且在创新传统人文。我们现在按传统学科划分的数字人文，难道就是未来数字人文的最终形式?当一个异形的种子刚刚被注入人类体内的时候，建立怎样的检验标准(即评价体系)都是荒谬和无济于事的。

二载体与内容

当我们谈论数字人文的时候，通常谈论的是数字方法应用于人文研究，很少谈论人文研究对象本身的数字化形态，印刷时代的研究给我们造成一种错觉:似乎文本或文献就是所有人文科学的研究对象。例如，哲学研究的应该是思想观念，而不是概念文本;历史学研究的是历史事实，而不是历史文献;文学可以算是内容与形式统一的范例，但它并不是语言学;语言学，也不只是文本，而是音形义的交互作用。这就造成一个奇特的现象:所有的人文学科在外人看来都是研究文本或文献的，而不是其所宣称的真实的研究对象。人文学者在研究时，需要把文本抽象还原成其研究对象本来的状态，这是在人文学者大脑中进行的动作，人脑就是他们的反应器，人脑的记忆衰减、任意联想以及不确定的多巴胺造成人文学者极端的浪漫性，而比较缺乏的就是科学性。这可以看成是印刷技术的局限。要知道传统的自然科学家除了看书之外，不进行实验研究是不可能得到同行承认的，这也是爱因斯坦并没有因为其最伟大的发现——相对论理论而获得诺贝尔奖的原因。而人文学者完全不必有此顾虑，这是所有人文学科、中国传统理论都享受到的好处。

而当数字技术参与其中之时，情况就完全不同了。数字技术是可以把研究对象及其现象还原为真实对象甚至真实场景的，是可以基于数据进行实验的。这类似于人类发明了火之后，食物的种类大大增加，因为烧煮过程减轻了人类消化系统的负担，等于体外消化了大部分材料，于是人能够一举跃上食物链的顶端。对于数字人文来说，不同学科的研究材料产生了很大的不同，大家不仅烧煮的食物不同，连锅碗瓢盆、过程方法都是不同的，你一看就知道哲学家可以用一种叫N-Gram操作的“蒸锅”进行观念史研究，而历史学家在调试各种“佐料”的刺激程度以获得不同的中心度指标，来取得人物之间的聚类关系等，从一开始他们的装备和本领就是不同的，因此到了数字人文时代，可以给不同学科的研究者设计不同的装备，当然这些激动人心的丰富性也会给评价带来难以估量的困难。

三模型与镜像

数字技术可以让我们在虚拟世界再造一个人文环境，跨越时空，以不同角度和粒度进行观察、模拟甚至操控。这其实是眼下最时髦的一项技术——“数字孪生”，我觉得它在数字人文领域具有广阔的应用前景，一定能大有作为。

“数字孪生”能够给人文研究带来极大的好处，它并不只是让我们能够通过操控和实验，获得细致入微的因果规律，利用机器的“显宏”能力写出史景迁《王氏之死》这类史学小说，或者黄仁宇《万历十五年》这类远读的历史切片，或者帮胡适续完《中国哲学史大纲》;它同时也带来了很大的困惑，究竟怎样的模型(粒度与视角)才能满足不同学科的实验要求?同样的素材可以提取多种对象，每个对象也可以有不同的形态和版本。

这里正好有个例子。昨天有个会议正在举行——“用方法表达思想，历史书写的可能性”，我们就来分析一下用什么方法能够表达思想?可以说当今的时代正在发展各种方法，不仅仅是印刷文本，数字文本可以表达，数字图像可以表达，各种对象关系模型及其系统实现可以表达，任何信息媒体只要受信端能正确(或故意正确)地解码，都算是从认识论层面或多或少表达了思想，书写历史也是一种表达，不同粒度、不同角度、不同分面，尽管认识的模糊性必然导致表达或书写的模糊性，但这不属于我的讨论范围。

我不知道历史学家或人文学者意识到当今数字技术所具有的能力没有。我们现在当然还没有做到大规模建模，为人文学者创造一个可以赖以实验的数字孪生出来，我们偶尔会受到指责，说我们的模型根本不是那么回事;我们也会指责回去，认为他们根本没有弄清楚自己在做什么，以及是怎么做的，这是无法建立一个清晰的模型的。当然，是不是机器学习可以不必打开人文学者研究过程的黑箱，而直接模拟得出结论，有待于计算机技术的进一步突破。对于评价来说，这种情况下我们如何评价?成果的取得是由于模型的精准、人文学者的顿悟还是机器算法的高超?现在都不知道。

四现状与未来

我们可以做一个思想实验:当机器时代最终到来，所有的研究素材、对象、方法、过程、工具，都数字化了，我们的人文研究，还有必要冠以“数字”人文吗?我们正处在大数据和人工智能时代，当所有的人文活动、素材和方法都依赖于计算机和网络之后，其实就无所谓数字人文了。就像纸媒时代我们不会说纸张人文一样，人文就是人文，它可能会改变形态，但本质永远是人性。我们可以借助纸本文献研究传统人文，也可以借助数字媒体研究数字人文，或者用数字方法研究传统人文，这些都是数字人文作为学科的表现形态。

五定义与规范

什么是人文，什么是人文主义、人文精神、人文科学、人文学科?这些概念其实都没有得到清晰的解释，也没有形成共同的理解。我们曾对这些概念进行过一些简单的探讨，请参考文章《数字人文的理论化趋势前瞻》^[1]。关于什么是数字人文学科，人民大学在申报数字人文硕士学位授予点时，曾下过一个迄今为止最大胆和最清晰的定义，也是我最推崇的:数字人文是计算机学科和人文学科交叉研究所衍生的一个新领域，它以涉及针对计算工具与所有文化产品的交叉领域为研究对象，系统地研究数字与人文相结合的普遍规律和应用方法。具体来说，数字人文学科以人文科学的基本问题为研究对象，以不断发展进步的信息技术和数字技术等为主要工具，以数字资源构建、信息资源管理等数据基础设施建设为基础，以计算分析和案例分析方法等为主要研究手段，通过建立描述学术活动理论、方法和功能的框架以及各种类型的项目实践，探讨数字技术与人文科学跨学科对话中的方法、过程、特征和相互关系，以及数字人文作为一个整体与社会环境之间的互动与关联，并从中探索、归纳和总结出获得成效、提高效率的一般理论、方法和规律，以推动知识创新和服务。

六当下与终极

虽然我不认为当下有必要甚至有可能建立一个数字人文的学术评价体系，并为其建立学术研究规范，因为现在还为时尚早，理论体系尚无踪影，领域边界也未形成，学术团体此起彼伏，对话还不充分，学术共同体也在飘摇之中;评价对象、评价方法、评价目的都不确定，过早的评价可能限制其发展，而不能达到我们促进领域发展的目的——但我并不反对这样的探索，更不反对这样的会议能够开诚布公地把问题提出来，进行争鸣。

讨论“什么不是数字人文”以及“什么是好的数字人文”都是有积极意义的，能够起到引导作用，而且在寻求评价方法的同时，自身就应该重视指标的可度量性。当然学术评价的终极目的是促进学术发展，最终还是一个定性的事情，同行评议可能是不好的方法当中最好的方法。人文社会科学的任何定量模型，其最初量化数值的获取，都是模拟的、定性的。

七启蒙与赋权

数字人文可能而且应该成为又一次人文启蒙运动，以数字工具的兴起为契机，以机器语言为共同语言，引导人们走出模拟时代。数字时代应该进一步研究何为人性、何为人文，在面临数字技术的冲击下，哪些是解放人类并促进全面发展的必然趋势，哪些又是别有用心的政客用来奴役和控制别人的主张的，其实评价本身也是一种特权。

数字人文研究，必然带来后人文时代即数字主义的兴起。我们当下所有评价的宗旨，是发展数字人文。而数字人文的最终目的，是赋予数字以人性，并因此而保障平等的数字权利。未来我们不仅生产数字，消费数字，因数字而喜乐，用数字获得财富，而且也会困于数字、累于数字，甚至被数字毁灭。无论如何，现在已到了这样一个新的时代，我们可以喊出这样的口号——“天赋数权”。

冯惠玲(中国人民大学信息资源管理学院):

数字人文项目的团队合作(线上）

数字人文引起知识生产方式的改变，像是在学术圈相对平静的湖水当中扔进去一块石子，它泛起的涟漪会波及很多学术领域，或远或近。我们今天探讨学术评价问题，将来它的意义一定是超出数字人文领域的。长期以来那种以刊评文、以量胜出的规则在数字人文出现之后就立不住了，甚至在相当程度上要出局。新的评价规则和方式将是颠覆和创建并举，而且不会是单线和线性的，而是多维和复合的。

这次会议有可能是我们创建新的学术规则和学术秩序的一个重要早期节点。没有科学规范和具有共识的学术评价，数字人文就会缺少正当性，缺少生存和健康发展的条件，在制度性的认可等方面的条件支持都会不充分。而数字人文项目，特别是要做大型长线的项目需要这样的支持和认可。

所以科学周密的评价是急需的。另一方面，评价又需要以实际项目样本作为对象，这样才能对项目的优劣形成实质性的认识。所以现在的数字人文做事情出成果和做评价是互为条件的，这两个条件都不充分是数字人文早期的循环性难题，需要两条线一起推进。我想在我们获得制度性的认可之前，重要的是要在这时候把事情做起来，要做出不同类型的成果，获得一定数量的用户和评价，使它形成一定的效果和价值。人们针对他的成果和生产过程，评价才更有针对性，也才更能够找到它的特性所在。在做的过程中获得成败得失的真实体验，这样有助于我们形成对评价点的思考和需求以及对评价方式的构想。所以今天我想讲的是在数字人文这样一个以合作为特征的项目当中的团队合作问题。绝大多数的数字人文项目需要合作，越是大型的、长线的项目，越是需要在不同领域学者的合作中开展，良性的合作将成为数字人文重要的学术规范之一，也会涉及到合作中的数字人文成果归属区分的认定和保障方法。

去年在敦煌数字人文研习营上，英国伦敦大学学院数字人文中心西蒙·马奥尼(Simon Mahony)教授的讲座就是关于跨界合作的。他讲完之后现场有人提问，说合作其实很困难，如果合作不好怎么办?他回答得非常快，说合作不好就不和他合作。我认为这是一条路，但是把问题简单化了，因为在合作当中，合作者总会有不同的性格、不同的态度、不同的诉求，特别是长时期经历不同的学术训练，通常会有不同的认知思维和行为习惯。如果说两口子实在合不来，那可以分家，可以恢复单身，但是数字人文项目不是那么简单，分了还要找，因为它离不开跨界学者，离不开团队，也离不开差异性的接触。所以合作需要有合作之道，需要有经营合作的办法，数字人文有可能引发学术生产方式的改变，合作就是其中重要的改变之一。

我讲讲自己的一点实践经历，我们这个团队主要在做数字记忆项目，“北京记忆”和“古村落的记忆”已经做了六年多。数字记忆是比较复合性的数字人文产品，综合运用数据库、可视化、数字重建、数字出版、电子文学、电子创意等方法，所以遇到的合作问题比较多。到目前为止，我们大约完成了14个专题，还有六七个专题在建设中，另外还有资源库、嵌入式的专项数字产品等。在这个项目中，参与者大概有一百四五十人，来自不同学科、不同背景、不同身份，还有不同领域的若干家公司，分别承担不同的任务。怎样维系这样一个多元构成团队的运行?怎样让项目能够一直做下去，还能保证尽量提升它的质量?我想到以下三点。

第一，共同的价值认同十分重要，因为我们的数字人文项目是弱功利性的，在这种情况下就需要注重参与人对项目的意义追求，或者叫情怀支撑，探索的乐趣。在数字人文的早期阶段，参与者获得实际利益的可能性比较小，但是工作难度却一点都不小，具有相当的研究性和挑战性。这些参与人做好做差、做快做慢，项目组并没有什么刚性的约束办法。在这种情况下，非常重要的一条就是凝聚志同道合的人，获得参与者对项目意义的认可。我们和每一位研究人员都认真商讨承担数字专题的意愿，请他们做有兴趣、有研究基础的工作，这个兴趣可能来自两个方面:一个是来自人文，对内容的兴趣;一个是技术应用，希望数字技术能够在人文领域中一展身手。有了这样的兴趣和探索愿望，就有可能把其他的功利需求降低。

比如我们做的冰嬉大典专题网站，是关于清代冬季接近百届的大型冰上活动的一个项目，主持人的研究方向是皇家园林及其活动。她对冰嬉做了好多年研究，能把成果转换数字形式呈现，她非常开心。又如我们的清代陆军衙署项目，一位老师因某种机缘开始研究段祺瑞执政府旧址(也是人大老校区)后，对其中丰富的历史文化产生了浓厚的兴趣，她说愿意为我们的老校舍“铁一号”做任何事情。类似这样的例子，把人文研究的内容转换成数字产品的过程虽然麻烦，但如果看成是自己研究内容或对象在数字平台的一种精彩延伸和扩展，研究者往往就会兴奋不已，甘于投入其中。事实上，在参与者当中认同度高的人，项目就做得比较好，而认同度相对低的人，推动得挺吃力。

第二个是规范运作，特别是充分的事先约定，让大家对项目有规则上的认同，明白责权。和传统的学术项目不太一样，承担数字人文项目的每一个人只是这个项目的一部分，他需要知道自己在项目整体当中的角色、任务、条件和预期的收获。因为只是一部分，那么在最终成果中，知识产权的归属也需要明确，这样可以在比较大的程度上避免责任和利益上的错位冲突，也有利于增强合作的稳定性。为了解决这样的问题，我们在制定了若干基本项目规则的基础上，大部分的合作关系都是以文本的协议或者合同的方式来明确各自的责权利。项目组与每一位子课题的主持人，与合作企业以及所有资源授权人都签订了书面合同。对于某些知识产权有多种解决方案的情况，会经过专业人员和核心团队反复讨论，获得共识之后，才去选择一个方案。我们也请了专门的法律顾问，就知识产权归属等问题做出合规的判断，让每个参与者都认同。我们的数字人文项目至今已经和不同的乙方签订了多达六七十份合同，兼顾平台和参与人的利益诉求，用这种方式解决参与者的责权利问题，不仅支持了项目的运行，而且一定程度上也可以避免日后的误解和纠纷。

第三，明确的贡献认可，尊重参与，激励创新，提升参与人的项目归属感。数字人文项目做起来很难，有很大的创新成分。从提出点子到实施，要凝聚很多创造性的劳动，包括智力和体力的付出，最终汇聚到整个项目当中。参与者没有多少来自学校官方的认可，也没多少收益，但还是希望自己的努力和贡献清清楚楚，得到认可。他们尤其不能接受自己的贡献稀里糊涂地融在一个大锅里，甚至被别人占有。所以我们除了合同中明确规定的责权利之外，还会在项目上进行完全的标注，明明白白地予以公开，无论你的身份是什么，承担了哪一部分工作，都如实标出。我举个例子，我们做的比较大的一个古村落的网站，一共有16项任务，16种角色参与，我们标注了27位参与人和5家公司，其中包括我们的教师、学生以及当地的干部村民等。

学术标注和成果标注也是传统学术规范的一部分，以表明成果的贡献者。但是传统学术标注比较简单，一些作者和主要编辑之外的人可能都被省略了。我们看到的电影一直以来都标注特别多，在片尾有长长的参与人的名单，包括各种杂务人员，甚至是司机，我和一位研究电影的老师讨论过，他说在电影制作中大家不认为人员重要程度不同，国际通用惯例就是都标注。我也看到了国际上的一些讨论，比如我们已经翻译过来的安妮·博迪克(Anne Burdick)的书中专门讨论了数字人文项目的署名问题，认为可以采取类似理工实验室或者表演艺术当中的合作署名方式。因为数字人文成果中，作者概念已经和传统的成果不一样。全署名的好处，第一是尊重和明确每个人的贡献，和知识产权有关。第二是激励责任人创新，精益求精，因为你的名字、工作质量、声望都在这里，一直挂在网上让大家去评价，参与公司也想为自己打一个漂亮的广告，署名有这样的激励效果。

当然大项目、大团队的合作靠这三条是远远不够的，总会遇到各种各样的碰撞，很多差异需要沟通，需要通盘思考，需要换位思考，需要做最优选择，需要有合作的意愿和智慧。我们既然进入了合作的领域，走向跨界合作、团队作战，就要力争把合作这篇文章做好。

姚远(南京大学社科处、南京大学政府管理学院):

数字人文与文化遗产保护

我其实不是数字人文方面专门的研究者，而是在做中国文化遗产保护公共政策方面的研究。我想从这个角度探讨一下如何发挥数字人文的作用。

第一，数字人文与文化遗产保护。不知道各位老师有没有在微信中使用过一个叫做“斯飞坐标”的小程序，它包括全国重点文物保护单位的地理位置和基本信息，是一个探访古迹非常有用的工具。它把5,000多处全国重点文物保护单位都做了标识，效果很好，而且这些都是靠民间的志愿者团队维护的。他们还做了一个叫“斯飞日历”的产品，包括了他们所探访的中国的文物古迹和国外历史遗迹，效果非常好。这给我们带来很大的启发，文化遗产资源如果以数字人文的形式呈现会焕发出非常大的生机。

我们有怎样的文化遗产资源，需要从两方面说起。一方面是不可移动文物。新中国成立以来进行过三次全国文物普查。1956年开始普查，形成了国家级和省级的第一批文物保护单位，全国一共7,000多处。第二次从1986年开始，我们现存的大多数文物保护单位是从那时候开始设立的，从1986年到2008年，经过20多年的时间，中国编纂了《中国文物地图集》，那时候还没有广泛使用GIS系统，所有的地理位置和基本情况等文物信息是通过地图形式呈现的，耗费了大量人力物力，有些信息并不完全准确，但是一次重要的探索，如果以它为基础进行数字化有非常大的空间。第三次从2007年开始，历时五年，新发现文物古迹达53万处，文物总数达到76万处。这个数量远远高于其他国家和地区的规模，是人类文明历史上最大规模的文化资源遗产的资料收集工程。

另一方面是建设部门进行的历史建筑和街区登记划定工作。从2005年开始，建设部制定城市紫线管理办法，对城市的历史建筑和历史街区进行了划定，它要在地理信息系统上直接划清范围，不是文字上的一个点，而是直接落到了地图上，落到了具体的管理系统中去。2008年国务院颁布《历史文化名城名镇名村保护条例》，各地进行普查监控。南京市就全市的文化资源做了一次大规模的普查建库工作，初步的数字化已经完成，全市记录了数千处。在这样的基础之上，我们对文物保护点、历史建筑、历史文化街区、历史文化名城，已经有从点到面到片的GIS各项信息收集工作，这个数据库极为巨大。

在这两方面的基础之上，我们至少可以做两个方向的工作。第一是依托GIS系统，融入大量已有的研究，比如说地方志中的文物志，全国每一个县都有这样的基础性工作。从历史的、考古的、博物馆的、艺术史的、地理学的，特别是历史地理学的、人文地理的大量研究资料进行连接，基础非常深厚。第二是通过这样的新的数字人文工程，从已有的相关数据库充分对接。比如东洋文化研究所的中国早期资料档案中，大量的对华北的石窟寺古建筑的调查可以匹配起来。建设全国性文化遗产的数字人文工程，其意义非常重大。第一，从研究上讲，比如在数据库建立之后通过关键词的检索，回答学术史上的很多问题，如石窟寺、古城址的变迁，都有巨大意义，因为文物是历史上真实的存在，是最真切记载历史的信息。第二，推动了社会力量参与文化遗产保护工作，公众可以参与监督和日常巡查，这个系统是按图索骥的依据，靠传统地图集是不可能实现的，因为地图集没有电子地图的标识，也没有导航服务。第三，对于政府执法而言，它是一个清晰可查的公开的执法依据，所以对于文化遗产保护本身有很大的现实意义。

再比如从研究上讲，我们之前和北大的历史地理方面专家李孝聪老师谈过，他还关注一个题目——旧县城、旧县治、废弃的县城城址，这些信息在文物普查过程中被发现，如果有这个系统，就可以有助于了解这个城市的变迁以及为什么会被废弃，给研究城市发展提供线索。

之前我们讨论过做文学地图，对于全国的76万处文物及几十万处历史建筑的巨大规模，如果做全国的文化遗产数字地图等，一开始难度肯定极其巨大。如果先从那些重要的历史名城古都开始试点，我觉得可行。把地图赋予更多文化信息，使它成为历史文化的地图，我觉得可以做到。在这个过程中形成工作标准，在地方政府支持下，更可能在全国进行推广。如果把数字人文工作的个案经验，结合以城市为基础的文化遗产资源的数字化工程，进行更大规模的国家性工程建设，可能使人文研究或者文化遗产保护有重大的突破，因为这个数据库实在是太重要了，它一定是一个国家工程，需要全国性的人力物力投入，应该会得到国家文化文物等有关部门的支持。

朱剑(《南京大学学报》编辑部):

旧瓶与新酒:数字人文评价问题献疑

近年来，数字人文在学界已有了一定的影响，有些成果也引起了广泛关注。虽然如此，但数字人文却尚未被纳入到现行的评价体系里，给从事人文研究的学者特别是青年学者带来了一定的困惑。那么，原因何在?在这里，仅从技术和操作的角度简单地谈些个人看法，或者说，提出一些问题供大家思考。

一“旧瓶”:现行体制下科研、媒体、评价三者的关系

评价从来不是一个孤立的问题，而是与多方面因素纠缠在一起的。为了讨论的方便，我们先要说清一些关系，然后再来看看数字人文在这些关系中处在一种什么样的位置。

首先是科研与学术评价之间的关系。今天的学术评价，跟学术批评已经没什么关系，主要是为权力部门服务，是权力部门分配学术资源的依据。学术评价之所以为大家重视，正是因为它直接关系到甚至决定了学术资源和利益的分配。它已成为一种组织行为，注重的不是过程而是结果，强调的不是个性而是共性，基本上是关起门来的暗箱操作和一次性的结果。尤其在我们这样一个集中资源办大事的科研体制之下，要成为重点，先得成为评价对象。数字人文学者之所以感到委屈，就是因为连评价对象的身份都不具备，没有被纳入评价体系，就得不到资源和利益，怎能不备感委屈。因此，我们要自问一下:数字人文为什么难成评价对象?

其次是评价改革与回归同行评议的关系。评价如此重要，但评价的现状却难令人满意，评价必须改革已成各界共识。眼下的评价改革有三个动向:第一强调分类评价，第二强调同行评议，第三强调代表作评价。这三者实质上都是回归同行评议。但是要真正回归同行评议，前提是同行评议必须具备公信力和权威性。可是在现实中，同行评议又是如何?同行评议的结果远比定量评价荒唐的事并不鲜见。所以同行评议的真正回归会有一个非常困难的过程。数字人文评价的建构当然也离不开同行评议，且不说同行评议回归之难，还有一个更大的困难拦在我们面前:权威的同行在哪里?

再次是学术媒体与学术评价的关系。媒体在评价中起到的其实是桥梁和平台的作用。无论是对于学术研究，还是对于学术评价来说，学术媒体都是不可或缺的重要成分。抽离了媒体，也就无所谓评价。如果没有媒体，今天做定量评价的机构连基本的数据都没有。共同体评价虽然不会完全依赖数据，但媒体在其中有一个非常重要且不可替代的作用，就是成果展示和民意表达(学术批评)的平台，共同体成员的意志要通过媒体来表达。只要是成果评价或以成果为基础的评价，就离不开发表和评论成果的媒体，至少在目前看，数字人文也不会例外。那么，属于数字人文的媒体又在哪里呢?

今天我们来看科研、媒体和评价三者之间的关系，其实是非常明确的:科研负责生产产品，媒体提供平台，评价给它贴标签。在理论上，这三者之间的关系，不管是媒体还是评价，都应该为学者们的研究服务，而研究什么、如何研究以及最终产品都应该是学者们说了算的事。可是在现实中，这个关系正好颠倒过来。只要科研体制不改变，学术研究也好，学术媒体也好，学术管理也好，离开了评价都是寸步难行。分析了三者关系以后，就可以明白今天的数字人文这个“新酒”面对“旧瓶”——现行评价体制时的尴尬处境了。

二“新酒”:数字人文何以陷入评价困境

数字人文在现行评价体制中为何会陷入尴尬困境?本次会议手册里对此有一个解释，就是主流学术界对数字人文没有深入的了解，数字人文并没有得到他们的认可。这确实是个直接的原因，但却不是根本的原因。因为我们可以接着追问，主流学术界为什么不感兴趣?我倒觉得手册中的另一段话可能更接近问题的真相:“所谓‘学术评价体系’，不正是强调专业壁垒的传统学术，为了巩固学术阵地而生造出来的外在物吗?数字人文以此为参照系，再造就一个新体系出来，是不是画地为牢?这是否与强调学科跨界与融合的数字人文精神背道而驰?”这段话指出了两点要害:第一，从学术研究的角度来看，专业壁垒与跨学科研究之间关系的紧张;第二，从学术评价的角度来看，现行的分学科评价体系与跨学科研究的关系的紧张。除此以外，我还想强调，其实还有一个同样很关键问题，那就是传统学术研究成果的形式和传播路径(学术论文、期刊、专著等)的有限性、稳定性，与数字人文成果形式的丰富性、传播平台的多样性之间的紧张，这个特别重要的点，却往往被忽视。

由此我们可以看到，在今天的科研和评价体制下，数字人文陷入评价困境不外乎内外两方面的原因。

首先是数字人文本身的原因，即数字人文的不确定性。数字人文是什么?数字人文是方法，因为有独特的方法进而在未来能形成一种范式。这应该已是共识了。但数字人文是一个新的学科吗?我们大多不认为它是学科，至少在目前它还不是。前面很多专家的发言都强调数字人文的跨学科性，跨学科一定是在至少两个学科的交叉地带产生，是一种不稳定的过渡状态，跨学科的最终走向还是新的学科的产生。新学科是怎么产生的?新学科的建立其实就是一个在交叉地带划界的过程。划界最重要的有两点:第一，独特的研究方法体系的建构，这在数字人文领域似乎没有问题。第二，独特的研究对象的确立，这就存在问题。所以很难说数字人文已经是一个新的学科，它目前还有诸多不确定性。除了方法体系和研究对象外，还有一个在其他交叉学科学科化时并不存在，但却十分重要的一个不确定，就是数字人文的成果形式是什么?我们现在公认的学术成果形式就是论文和专著，可是凭借新技术而生的数字人文所强调的恰恰是对论文和专著形式的突破，但突破后形成的新形式是什么?还不确定。而成果形式的不确定性还必然导致另一个重要的不确定——媒体形式的不确定。传统的媒体形式就是著作和学术期刊。可是数字人文呢?是数字期刊、博客、网站，还是APP、数据库?似乎都是，似乎都不完全是，至少到目前为止，这一切都是不确定的。数字人文的不确定性这一点倒是很确定。

其次是现行评价体制的原因，数字人文这样一种新生事物，对于今天的评价体系来说，评价它的确是个难题。我们不妨看一看评价的现实情况。先看量化评价。评价机构对评价对象有如下明确的要求:一是公开发表，亦即成果已被固定;二是形式的确定性，因为不确定就无法生成可资比对的数据。所以，从数字人文的特点来看，对其进行量化评价非常困难。那么，引入同行评议可行吗?同行评议同样是需要条件的，至少需要满足的有两个:一是要有自律的和专业的学术共同体，二是要有评价的权力，这需要行政权力部门赋权。在学科正式生成前，这两点得到同时满足都很困难。

由此我们不难明白数字人文评价的困境到底从何而来。

三从“旧瓶”到“新瓶”:是否需要及如何打造

在这种情况之下，要对数字人文评价的前景做一个预测是很困难的，在这里，我只能提供一点思路。

我们首先需要就是否建构数字人文评价体系达成基本共识。这是一个值得思考的问题，因为这样的建构是要冒一定风险的，在一定概率上会出现新建的评价体系“与强调学科跨界与融合的数字人文精神背道而驰”这个我们不愿看到的前景，对于一切都远未定型的数字人文来说，暂时不做评价体系建构，似乎是个明智的选择。但是，事情又不是如此简单。在现行科研体制下，没有评价就没有资源，数字人文又特能“烧钱”，没有丰足的资源，恐怕连安身立命的本钱都没有。可见，我们面临的是一个两难选择。

面对两难选择，我们很难择其一而行之，只能选取兼顾两者的办法。一方面，还是应该建构起数字人文的评价体系，以获取必要的资源;另一方面，我们同时还要设法让这个体系有着足够的弹性，能够包容数字人文可能的成果形式和可能的媒体形式。因此，这必定是一个充满个性或特殊性而有别于传统的评价体系。这样的评价体系建构可以说没有先例可循，它的建构将有待于三方面的共同努力，积极地创造条件。

一是数字人文从成果形式到媒体形式完成迭代，走向相对稳定，并被学术界和管理部门承认和接受。数字人文是跟新技术相关的，没有数字技术，没有互联网技术，就不会有数字人文。从历史上看，每一次堪称革命性的技术变革一定都会带来研究成果形式和媒体形式的变革。今天的学术期刊和以学术论文为主的成果形式都跟现代印刷技术相关。如果数字人文是一种革命性新技术的产物，我们要证明它的革命性，要让别人承认它的革命性，就必须有新的成果形式和新的媒体形式的产生，并逐步走向稳定。这既是衡量今天的数字人文是否成熟的一个重要标志，也是独立的数字人文评价得以建构的前提条件。

二是学术界对学科特征尚不清晰的数字人文的宽容和接纳。无论是宽容还是接纳，都是要有具体对象的，数字人文作为一种新的研究范式或者一个独立的新学科，其存在并得到承认，最重要的是要拿出足以让学术界震惊的颠覆性成果。尽管数字人文在不长的时间里已有相当丰富的成果问世，但成果从形式到性质还比较模糊，大量成果还是工具性的或中间性的，离“颠覆性”尚有不小的距离。而一旦颠覆性成果出现，数字人文作为一个新学科的成立也就水到渠成了。

三是评价体系的设计者对数字人文的认同，并建构起相应的评价理论和可供操作的评价方法。这里的设计者，可以是评价机构，但更应该是数字人文学术共同体。对于数字人文这样一个变动不拘的新生事物的评价，同行评议可能比量化评价的意义更大，可能性也更大。没有先例可循的数字人文评价更应该要强调评价主体的统一。无论是定性还是定量，都应该由统一的主体——数字人文学术共同体来完成。也就是说，如果要进行量化评价，主体应该是学术共同体，在数据挖掘的方向、数据的解释、算法的确定等方面，学术共同体应该更具有决定权，评价机构能够提供必要的数据就可以了。

显然，以上三方面，无论哪一方面的达成都必定是一个艰难而长期的过程，不可能一蹴而就。而在此之前，数字人文都将处在一个没有独立评价甚至难以纳入评价体系的尴尬境地之中。要结束这一尴尬处境，固然需要多方共同努力，但最有效的途径还在于数字人文学者拿出具有颠覆性的成果来，让学界刮目相看。

张耀铭(《新华文摘》杂志社):

亟待建构数字人文研究成果的评价体系

2020年2月18日，教育部和科技部出台了《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》。这个《意见》列出了五项负面清单。一是审慎选用SCI论文量化指标使用评估。二是职称职务评审评定，不把SCI论文相关指标作为直接依据或者聘用的前提条件。第三是解除SCI论文相关指标与资源配置和绩效奖励挂钩的使用。第四是不宜将发表SCI论文数量等指标作为毕业、学位授予的限制性条件。第五是在舆论宣传上不采信、不发布以SCI相关指标为核心编制的排行榜。

《意见》提出的举措与思考，虽然主要是针对的自然科学和工程技术，但是对人文社会科学，包括数字人文，具有重要的参考价值，也将产生重大的影响。我想提五点:第一，政策导向不是完全否定SCI和学术评价，更不是反对发表论文，而是破除SCI至上，鼓励发表高水平、高质量、有创新价值、体现服务贡献的学术研究成果。这对纠正评价异化和急功近利的学术风气、营造良好的学术生态是很有利的。第二，现行的学术评价制度，无论是北京大学的核心期刊，还是南京大学的CSSCI，都是依刊评文，就是根据论文发表在什么级别的刊物上，来确定论文的内容质量。核心期刊的评价体系的许多指标，比如被载量、被引量、影响因子、被重要检索系统收录基金论文比等，是为依刊评文量身定做的，不是为论文的内容质量定做的。

这样的评价指标基本不适合作为评价人文学术和数字技术结合的数字人文的评价。比如数字人文现在围绕人文社会科学领域特定研究所进行的数据库、虚拟仿真模型、程序、代码设计、数据可视化、数字期刊、数字博客等，这些非传统学术活动及成果，还不能被认定或者转化为现有学术评价体系内可以接受的学术成果。现在认定的成果还是以论文和专著形式呈现的。这对于数字人文研究和科研评价是挑战，也是机遇。挑战在于数字人文的科研成果，不被主流的专业学术评价机构认可，也不被管理层认可。这不仅影响年轻学者的职称职位的晋升，更制约数字人文的可持续发展。机遇在于数字人文同行可积极推进学术共同体建设。数字人文可以先走一步，推进我们的学术共同体建设，另起炉灶，与时俱进，探讨建构数字人文研究成果的评价体系。

第三，数字人文研究以项目为单位，以跨学科为特点，以团队为主体，以数据为基础，以技术为手段，以平台为支撑，与传统的人文社会科学研究的对象、范式和成果性质都有显著的不同，因此应该加强学术评价理论的研究。数字人文界、学术期刊界和文献计量学界暂时可以依托数字人文基础设施建设比较好的高校和图书馆，通力合作，共同攻关，研制出针对数字人文科研的评价指标体系，将有利于数字人文逐渐规范化、科学化，从而获得更好的发展。

第四，根据数字人文具有的特定属性和特征，实施分类评价的标准和方法，明确不同学科的不同性质和学术评价的不同维度，完善定性与定量相结合的评价体系，特别要高度关注项目制评价，比如项目是否能够在数据收集、内容生成、标准运用、文档记录方面遵循领域内的最佳实践，项目内容的范围、深度形式、呈现方式与出版过程的性质特点，项目迭代更新将会以何种形式持续生存，并实现长期的利用等。

第五，推动数字人文学术共同体建设，完善学术同行评价学术共同体、学术期刊和学术会议三位一体，构成数字人文研究与科研评价的坚强基石。对新的学术模式和组织形式的评价，不仅仅在于专业评价机构的评价，更在于“小同行”对科研学术水平的认可。因此数字人文研究成果的评价应该贯穿于学术会议的评价，专业期刊发表的双向匿名评审，成果发表之后的书评评价与学术评价，让数字人文学术评价回归学术本性，依靠、相信、尊重同行专家的专业判断，充分发挥同行专家在学术标准制定和学术评价过程中的主体性作用。建立评审专家的遴选回避、民主表决、专家信誉和监督制度，维护学者和学术尊严，增强学术同行专家的自律，保障学术同行评议制度的公平正义。

赵思渊(上海交通大学历史系):

数字人文需要独立的评价体系吗?(线上)

中国大学中学术评价都有比较成熟的评价机制，如论文、专著、项目基金，甚至包括艺术领域的一些展览，都有比较成熟的评价方法。我们今天在座的这些人曾经都多多少少发表过一些数字人文相关的研究成果，或者拿过相关的项目，也就意味着其实我们正在进行的这些工作是可以纳入到机制里面的。我可以写篇数字人文题目的论文，我也可以做一个数据库，在此基础上申请项目，甚至包括专著或者是教材，看起来好像挑战不是很大。

在当代中国大学的行政逻辑里进行学术评价的时候，我们这些做数字人文研究的人，都可以把自己的研究在某种形式上放到这个框架里面，而并不需要另起炉灶，这是我最开始想这个问题时的想法。不过在这里我想谈一个在中国人文社科研究评价中公认非常重要的指标。我以自己的经验来看，大概2010年之后，数字人文这个概念在中文学术界就已经变得越来越活跃，相关的论文也越来越多，但是如果看国家社科的中标项目的话，题目中包含了数字人文这个概念的国家社科项目，其实比我们预想得少很多，每年都是个位数，而且非常集中在图情学科。论文题目当中包含数字人文这个概念且有国家社科基金资助的，也是要到2017年之后才大幅度增加。但是我相信，在座各位接触数字人文概念远远早于这个时间。如果以基金项目作为观察切入点，数字人文的概念得到认可很晚。而且，它的总量没有我们想象得多，也没那么活跃。

所以我可能跟前面的几位前辈的想法有一点不一样，我觉得在现有的评价机制里，数字人文的研究成果作为一个独立的成果放入这些框架里面是有可能的，但问题是数字人文作为一种话语，获得认可非常困难。我觉得这是一个我自己不能解答的问题。我希望数字人文方法论能够嵌入很多不同学科本来的话语体系中，在不同的学科体系中都能够有办法论证数字人文方法的贡献与价值。

另外，数字人文一定是跨学科的，有不同的人参与，才有可能推进下去。在这种意义上，最好来自不同学科背景的每一个参与者，都能够对各自的学科有所推进，都能有所得，这可能是将数字人文用到更多学科、让更多的领域接受其方法论的一个重要前提。

还有一点比较理想但不容易做到的是，我们看到了非常多的数据库建设项目，或者是广义的动态的概念上的数字人文项目建设，但问题是最后它的成果在哪里?项目在哪里?我们看到了论文或者专著，但是没有看到最后的数据库，或者其他形式的数字人文项目，这些东西是不是有可能以一种更好的形式呈现给学术界和学术共同体，来评价和使用，可以使数字人文作为一个概念，作为一个方法论，得到更好的评价。比如在英文学界每年会有数字人文的奖项，会有来自学会或者是第三方机构的评价，但是在中文学界好像还不太有。也许可以在目前已有的成熟评价体系之外，再生长出一个更适应数字人文本身特性的辅助评价支撑系统。

赵宇翔(南京理工大学经济管理学院):

跨界合作的数字人文成果评价思考

我想讨论三个问题。第一，跨界合作过程中对数字人文成果评价，到底是对成果的评价，还是对学者的评价，或者这两种都会有。我在思考，数字人文是否有必要，且是否可能建立一个所谓的学术共同体。这几年大家都在推动数字人文的发展，从评价角度来说，事实上很多时候要考虑开展评价的主体，它是否具有合法的效力。我个人感觉，“大同行中的小同行”这个概念比较靠谱。从我们每个人各自学科领域的角度来说，是不是能把数字人文先立起来，是一个比较有意思的问题。比如2017年武汉大学信息管理学院王晓光教授在中国社会科学情报学会下成立了一个数字人文专委会，这事实上是大圈子里面的一个小圈子。再比如近几年图书情报领域的数字人文社科项目数量在增长，评审论文时我们也遇到好多困扰，很多时候文章完全看不懂，没有办法做出评价。这些文章只能退回去，因为我们没有承担审稿工作的能力。我们在思考一个问题，就是学术共同体能否担任起评价的使命和职能。

在这个过程中我们到底是对于研究作评价，还是对于项目作评价，这是两个不同的事。对于数字人文项目来说，很多大型的项目从管理学角度可以称之为矩阵式的模式。所谓矩阵式模式就是大家为了一个共同目标，从不同地方拉人来干活，很多时候干完活就解散了。矩阵式的这种结构一定程度上适合数字人文的项目管理，但矩阵式是基于功利主义的一种模式，不完全适合于研究的评价。对于研究的评价，刚才王涛老师提出了一个比较好的模板，其实更泛地来说，作为数字研究，我们需要考虑两个主要的问题，一个是严谨性，一个是与实践的相关性。数字人文发展很多时候跟图书馆、博物馆、档案馆等这些拥有文化遗产的机构有密不可分的关系。他们是偏重于实践的，理论跟实践之间的对接和桥梁是一个很重要的问题。

第二个问题是对于数字人文认识的进阶和嬗变是否会影响到数字人文成果的评价。不同学科数字人文的发展进度是不一样的，不同选题上的数字人文的发展也不一样，有些选题已经走得比较快了，而有些还是刚刚起步的阶段。我们经常会面临一个问题，到底是“借船出海”，还是“造船出海”?对于很多传统人文学科来说，一开始接触数字人文时更多是“借船出海”，它需要一些技术力量去帮助推动研究。但是这个过程中，不同个性和学习能力的人往往对技术的采纳会产生不同的影响。有些学者有非常强烈的自发学习意识和较强的学习能力，他就会非常快地上手一些新的技术和工具，也慢慢尝试“造船出海”，自己去做这个事情。在这个过程中又会有两个不同的概念:一个叫“轻舟缓行”，一个叫“乘风破浪”。很多时候，尤其数字人文在学科应用的早期，会去采用一些轻量级的工具和方法去做一些尝试。但也有比较有影响力的项目，我们称之为“乘风破浪”。不同的人群、不同的学科流派对于数字人文的接受也有所不同。

第三个问题是数字人文的合作动机和策略，是否会影响成果的评价。跨学科、跨领域合作有许多不同的动机和目的，在早期有一些非常明确的需求，比如历史学者需要做一个工作，可能采用的策略就是缺啥补啥，需要文本挖掘的工具，那就去学这个东西，或者去跟别人合作。也有一些另辟蹊径型的，比如说图书情报领域，大家可能发现这两年这个方向非常热门，是一个发文章和申课题的契机，所以大家会去找机会。也有一些范式转移，可称之为开疆扩土型，事实上它是在做一些比较大的破冰式探索，甚至希望对整个学科的结构都会有一些重新思考。

所以我们不得不去思考一些问题，数字人文合作，尤其是人文学者跟技术学者对接的过程中，是一种约等于外包的概念，比如说人文学者现在外包一个技术的难题给技术的学者，事实上学科位置是不对等的，不对等的情况下学术成果的评价又会如何?所以在这里我们不得不去深入到另外一个问题:数字人文的这种行动者网络如何去调动?这是个开放的问题，现在没有答案。还有一些细节问题，比如技术流派学者到底在什么时间介入，介入的深度广度到底有多少，这对于成果的评价，也会产生一定的影响。

我们借鉴组织行为学中的一些理论，参与合作有两个不同的视角，第一个是工具人视角，第二个是责任人视角。这两种不同的视角在数字人文开展过程当中意义是不一样的。所以从自身角度来说，我一直在做公众科学。刚才姚老师也提到了，他们正在做的文化遗产领域也经常利用大众力量去做一些事情。其实我们现在也在尝试用这种公众科学就是众包的模式去开展相关的数字人文研究，我们想了解大家各自开展的数字人文项目和团队合作，去做一些案例研究，从而探索合作模式中出现的障碍和通行点，找到一些比较可行的方案或者策略去做这样的工作。

徐力恒(香港城市大学中文及历史学系):

数字人文研究之余的“数字”和“人文”(线上)

我着眼的主要是高校老师和研究者面对考核评估的实际操作。这只是学术评价体系中的一个方面，是比较世俗的一个问题。

数字人文研究还没有得到充分的制度性认可，属于新兴的跨学科领域，还处于一种尴尬的境地。有几个方面是数字人文学者需要努力去开发建设的，比如学术社群、学术数据、基础设施、学术期刊以及学术传播的机制，这些方面都要草创的情况下，学者面对和参与了很多不直接和数字人文研究挂钩的工作。但是这些工作都是和数字人文相关的，而且也都是学术事务，我把它叫做DH Work。这些都是大家做过的工作，但是这些工作又不必然能直接成为各个单位考核里面比较便于计算的输出成果，我把它叫做DH Output。我们可以换一种思路，把对成果的理解拓宽，看看怎么把DH Work和DH Output联系起来理解。

首先是数字人文的研究数据，没有数据就没有办法做DH研究。我们研究数字人文的时候，会参与到不少数字人文数据的生成，或者是校订、利用的工作，但是我们所处的人文学科框架下，很多同行普遍对数据的引用或者标注不规范。比如引用数据和原始文献上的区分，还不是特别明确。其实其他学科在这方面已经做得比较成熟，他们确立的一些规范和标准是值得参考的。数据引注的一些原则性共识，也不限于自然科学，其实社会科学在这个方面也比人文学科走得更前。使用数据的规范还需要数字人文学者的推动和建立。那么疑问就来了，谁来做?从我这边的情况来说，会有项目或者出版机构要求的规范来牵动这方面的发展。香港官方的研究基金机构在项目申请里要求明确说明数据的储存是什么样的情况，数据是不是公开，它是不是生成出来的数据，会不会跟其他的学者去共享，等等，也包括使用数据写出来的这些论文和学术成果是不是会公开或者是出版，会不会采用open access等。这方面的标准和规范慢慢会建立起来，真正要影响整个人文学界的使用还需要很长时间。

第二个方面是项目团队的合作。有的项目维持了很长时间，很多学者做了很多工作。但是从这些项目直接产出，转化为可计算的成果往往只是项目工作的一部分，就算发了研究论文，也往往是多人共同署名。摊分到每个人的工分只是几分之一，不会很多。

第三是基础设施建设，这方面还处于进行式。理论上基础建设做得好会便利所有学者，但是在那个愿景实现之前，学者还要投入很多精力去参与基础建设的讨论、协调它的标准等。我和以前CBDB的一些同事甚至会觉得，这样的工作其实要有专业人士去做才会比较有效率，这方面也需要数字人文学者投入很多精力。

第四个方面是学术社群，培养新一代数字人文学者。如果没有这种社群，大家单打独斗就会很累，也很不容易，所以社群需要我们参与经营。但是数字人文和其他比较成熟的学科领域相比，没有那么多正式的学会或者委员会。一些培训活动或者教大家怎么使用数字人文工具和方法的教学，往往不是正式的大学课程，或者常规化的活动。它也是有意义的，可是在正式的框架里不容易获得承认。

第五个是学术传播。刚才朱剑老师也谈了学术媒体的重要性和数字人文新型成果的一些形式，我自己参与得比较多的是“零壹Lab”微信公众号的工作。2016年以来，我和公众号的同仁开始征集数字人文相关的内容去编辑发布，起到学术传播的效果，也得到一个数字人文奖项(DH Awards 2019)，但是像这样的工作在单位不太容易得到承认，它是不是能算入成果呢?比如说香港一些大学有一项要求，大学老师要做一些知识转移(knowledge transfer)的工作。这方面我自己也在摸索。

第六个是新的发表园地的创立。一些新的期刊最近创立了，比如清华大学的《数字人文》、中国人民大学的《数字人文研究》，我想这些期刊的主事者肯定会有更深的体会。创办这些期刊需要投入很多精力，才能走到今天。

我提到的这六个方面的DH Work，在学术单位里面怎么能得到考核?我没有简单的答案，也不参与制定标准。我可以分享一些自己的应对方式，就是把这些工作转化为可以算数的研究成果。比如最直接的方法就是写成论文，写的论文尽量在各个不同领域发，写给不同对象看，让大家看到数字人文学者已经做了这样的工作，也就是尽量嵌入到各个学科和领域之中。这些工作如果没有带着意识转化为成果的话，可能做完就过去了。它可能起到一些实际的建设作用，但是对于自己本身的考核没起作用就很可惜了，而且从正面角度看，如果当下都能写出论文的话，也是介入学术界的方式，尤其作为一个新兴的领域，这种介入是亟待进行的。

当然，从个人在各个学校单位里实际的角度看，这也是增加一点工分的办法，做过的这些DH Work不至于变成无用之功，我想还是很必须的。最后我想给大家介绍一下，2020年7月出版的英文期刊《中国历史学刊》(Journal of Chinese History)的数字人文专号，它包括这几个方面的内容:导言、数字人文综述、研究论文，以及多篇数字人文基本工具的介绍。这个专辑的内容很前沿，参与专题写作的也都是比较重要的学者，但期刊还比较新，所以还没有进入SSCI名单。从机构的考核方面来看，在SSCI至上的风气下，在上面发文章其实只算很少的业绩。总而言之，我今天谈到的DH Work在个人的考核里能够被承认，或者能够转化为DH Output的，到目前为止还是非常少。要把数字人文工作一一转化为可被计算的工分“数字”，挑战仍然很大。

姜文涛(浙江大学国际联合学院人文社会科学研究中心):

什么是好的数字人文?

今天讨论“什么是好的数字人文?”我自己从事比较文学和文艺理论研究，从2016年开始与美国威斯康星大学麦迪逊校区从事现代中国文学研究的戴安德(Anatoly Detwyler)一起在《山东社会科学》杂志上组织“数字人文:观其大较”专栏，有七期了，刊发了不少国内外较为前沿的数字人文文学文化研究方面的文章。

我想从数字人文文学文化研究的学术组织经验，以及文学研究的学科史和属性方面，针对“什么是好的数字人文”这个问题提出七方面的意见，仅供参考^[2]。

第一是人文学术意识。我们需要继承人文阐释的悠久传统，才能继往开来，才有可能创造出新的知识生产形式和社会文化形式。我们相信数字人文会提出有价值的人文问题，会以自己的方式推动人文科学的发展。但这些问题并不会凭空产生，基础仍然是人文学的阐释传统。增强人文研究，需要具备人文学科的学术训练和数字人文基本方法训练这两方面的准备工作。这是开展好的数字人文研究需要具备的前提。

第二是社会科学的素养。数字人文研究的许多方面与社会科学密不可分，比如统计学、心理学、社会学等。这些学科中量化研究与质性研究之间的关系的讨论、方法和实践已经有很多了。好的数字人文研究者应该具备一定的社会科学研究素养，有意识地从这些学科汲取方法论上的能量，以防止停留于数字炫技或者过度人文阐释的层面。当然这并不意味着人文研究要成为社会科学方法的附庸或者殖民地。相反，好的数字人文研究，应该对所研究的问题及所使用的研究方法在本学科的学科史意义上有充分的了解。

第三是学术史和学科史的视野。有价值的学术问题的组织和提出，一定是具有学术史和学科史视野的，是建立在学术史对该问题或相关问题已有讨论的基础之上的，数字人文具有天然的跨学科和学科融合潜质。然而我们需要注意到，所有成功的跨学科研究无不建立在对本学科严谨的学术训练基础之上。从学者学术生涯生存策略上来讲，对学术史、学科史的重视也是很重要的。就文学研究而言，前两年发生的一场有关数字人文文学研究的学术争论中，美国圣母大学的笪章难(Nan Z. Da)教授重提语言修辞和阐释的复杂性，以基本的统计学的原则，从实证层面讨论了所谓的计算文学研究中较为典型的学术研究成果，通过指出其中许多的技术问题、逻辑错误和概念的缺陷，论证了计算文学研究的方法和理论前提并不适合用来分析文学史和语言学的复杂性。这场反对和捍卫数字人文文学研究的辩论还在进行中，希望能对数字人文文学研究的发展起到推动作用。需要强调的是，如果没有人文学科研究方法和学科史方面系统的训练，而只通过统计方法和计算技术进行炫技般的学术表演，那也许并不符合基本的学术研究标准，更遑论好的数字人文学术研究。

第四是数字方法和技能。数字人文对于从事数字人文研究的学者提出了新的技能要求，包括掌握一些编程或者统计学的知识。所以在理想的情况下，数字人文研究者应该学会编程语言，这是一种脚本编写语言的素养。在脚本编写的时候，某个概念也会逐渐成型，这个过程是思索数字人文研究问题很重要的一个侧面。

第五是数据意识。如果认为数字人文就是做数据库，这肯定是对二者都不了解的错误看法。实际上文本与数据都是需要讨论的理论问题，并非不证自明。正如在文学研究中，并不存在原始的文献学意义上的文本一样，也不存在所谓的原始数据。最近清华大学《数字人文》第二期刊登的一篇文章《什么是数字化?——一项考古学研究》作者邦妮·麦(Bonnie Mak)以著名的早期英文图书在线数据库(Early English Books Online, EEBO)为例，来理清数字化信息与底本之间的关系，阐明数字化信息在哪些方面见证了当前对过去的认识，并被应用到相应的学术研究之中。这是一项很有意思的针对数据库问题展开的知识考古学研究，希望能对思考相关的问题有所推动。

第六是反思性。任何一项研究都有局限性，并不存在任何解决了所有问题、具备了上帝视角的研究，并没有无中生有的重大科学研究理论发现。在《数字人文》第三期所刊登的另一篇文章《机器学习与人文视角》中，特德·安德伍德(Ted Underwood)认为机器学习提供的眼光并不具有经验的客观性，也并非机器计算出的东西。相反，是人类建立了算法，算法发现的一切都反映了人类的视角，都反映了算法的创造者的视角。机器只是简单地帮助我们看得更远更广，以一种新的、令人惊讶的方式扩大我们观察文学的视角。知识的生产是一种渐进的不断修正的过程。所以数字人文研究应该坦言本身研究的数据基础设施前提、采用的方法和步骤，以及这些所带来的局限性，或者说未来研究可以修正的空间。

第七是开放性与协作性。好的数字人文研究应该具备反思性、技能性和数据的公开性，敞开整个研究过程和步骤，展示可重复的人文研究成果，是一种民主化的知识劳动。同时因其规模庞大，一项数字任务研究常常需要多个研究者合作完成，这就需要各个成员放弃自己的文化偏见，具备开放与协作的特性，这也是新的学术人格与知识伦理产生的过程。

以上所罗列的七点，从我本人所属学科等方面出发，只是抛砖引玉，未必全都合宜。期待更多学者积极参与相关讨论与实践，共同审慎而乐观地推动健康的数字人文研究，同时也促进人文学术整体的良性发展。

桑海(澳门理工学院):

数字人文与学术生态重构

数字人文犹如一种被投进池塘的新鱼，它能否活下去，能否活得好，能对这个池塘的生态产生怎样的影响，都是值得关心的问题。对当前学术生态不满意，甚至认为存在某种程度的生态危机，是许多学术界人士的共同感受。从系统的角度看，反馈是一个关键因素，而学术系统的反馈枢纽集中在评价环节，评价会直接影响到学术生产、学术出版、学术资源分配等。因而如果学术生态失调，很可能是评价出了问题。

讨论数字人文与评价的关系，至少包含这样两个层面:

一是对于数字人文研究成果如何评价。

(一)数字人文的发展对评价提出了新要求

数字人文是一种新的研究形态，呈现与一些现有学术评价体系不相兼容的新特点(比如观念和研究范式与传统研究差异较大，在论文评审、发表、摘引、评论等环节处于不利位置;甚至成果形式未必以论文形态呈现，而可能是某种数据库、可视化网站、软件或算法等)，因此有改良现有评价标准的诉求，甚至呼唤一种新标准或体系。

从数字人文内部视角看，需要讨论“什么不是数字人文”“什么是好的数字人文”(《澳门理工学报》2019年第4期“笔谈”)，将似是而非的伪劣数字人文研究识别出来(建立门槛和规范)，并努力建立数字人文研究的基本标准(所谓评价体系)，为数字人文争得一席之地，证明研究的学术价值。在评价问题的背后，其实是数字人文作为一种新兴的研究范式或准学科，自我定位和获得承认的渴望和焦虑。

(二)数字人文评价不可能外在于人文学术评价

尽管数字人文有一些明显不同于传统研究的新特点，但数字人文并非“法外之地”，其研究成果一定要得到人文学术界特别是传统学科的接受和认可。这种接受和认可是双向的:一方面是数字人文需要自我调适，对接传统学科自身的学术脉络，真正解决推动学科发展的疑难问题;另一方面是数字人文需要影响传统学科，给人文学术带来新的理念和活力。

二是数字人文对现有学术评价体系可能发生怎样的影响。

(一)现有的学术评价的问题所在一言以蔽之，评价的现状存在着种种颠倒的状况，至少可从以下几个方面来看:

一是重论文(专著)评价而轻其他。当前学术界存在严重的“唯论文”倾向，不但轻视教学和人才培养，轻视在线发表等，更无法涵盖数据库建设、工具开发等新学术方式，这不但与数字人文枘凿难容，也与人文学科的发展方向——新文科不相适应。

二是在论文评价中，重所发期刊而轻论文本身。于是乎，学术评价与学术期刊评价之间几乎画上了等号。这种“以刊评文”的方式存在严重的逻辑错位，并带来一系列的焦虑。

三是在期刊评价中，重量化评价而轻同行评议。目前的量化评价体系并不完善，还不能取代同行评议。同行评议虽然也存在诸多令人不满意之处，但仍是论文评价和期刊评价不可替代的基础。学术研究的趋势一方面是不断细化，另一方面是不断跨学科，不同学科之间评价标准的差异，以及同行概念的日益模糊，使得同行评价也面临很多新的问题。同行评议若想真正复兴，必须与量化评价实现有效的结合。

四是在量化评价内部，重影响因子而轻其他指标。在Web2.0时代，以引用行为为基础的影响因子，应当拓展到社交行为中“被获取、传播和利用”的多元化增值目标，因此计量学者在大约十年前提出了替代/补充计量学(Altmetrics)。

五是在影响因子内部，重引用数据数量而轻学科间差异和引用动机。近年来CSSCI开始重视“分类评价”，引用行为背后隐含的不同动机也越来越被关注。

(二)数字人文对评价的可能影响

1.数字人文作为理念

数字人文对新技术的吸纳和涵容，或许会在某种程度上改变人文学术的一些基本观念，学术评价的内涵和方法都会趋于丰富多元。比如在成果形式上，除了论文之外，数据库、软件工具、研究过程等的价值，也开始被慢慢意识到，从而有可能以某种方式进入评价的视野。我倾向于认为，数字人文不是学科，而是一种人文学术的范式转变，或许有一天数字人文的内涵会与人文学术的概念趋于一致。

2.数字人文作为方法或工具

在数字人文学者因评价体系的不友好而感到委屈时，往往忽略了一个事实，即学术评价的主流方法是量化评价，这与高举量化大旗的数字人文有异曲同工之妙。如果数字人文所倡导的“远读”、数据分析、文本挖掘、深度学习等间接阅读和分析是有效的，对量化评价又为何不能有新的期待呢?在弥漫着后人类情绪的学术前景中，与其把赌注押在通过人的改变来恢复同行评议的公信力，也许还不如期待量化评价与同行评议的更好结合。

先说同行评价。从乐观的角度看，数字人文的学术共同体或许正在形成之中，当下国内主要的数字人文从业者，其优势是有新锐的气息，有比较紧密的联系和较好的合作基础。最主要的是，由于这个领域比较新且未学科化，壁垒和包袱比较少，还处在抱团取暖的阶段。当然困难也是很明显的，除了同行评议常被诟病的主观性、人情因素等外，典型的困境还包括:面对包罗万象、涵盖多个学科甚至溢出学科的数字人文成果，评价者往往力不从心;再有就是数字人文方法论与学科传统之间的某种冲突，造成评价差异过大;等等。基于上述困境，我认为解决评价问题，归根到底还要靠新技术。

再说量化评价。在量化评价领域，虽然很多人认为影响因子是“虽不完美但不可替代的评价指标”，但以引文统计为核心的影响因子毕竟太单一了，或许还需要更多的算法来支持，建立更加立体、全面和有效的评价体系。在这个意义上，对影响因子理论和方法的优化，特别是替代/补充计量学(Altmetrics)仍可抱有一定期待。

评价也体现在媒体对学术成果的发表上面。从媒介变革角度看，随着文献储存和出版的数字化，对于学术资源的稀缺性和可获得性的忧虑，逐渐被信息过载带来的烦恼所代替。应对信息过载的策略本质上可归为两类:搜索和过滤。期刊数据库已使搜索变得轻而易举;学术出版则需承担起过滤功能。在学术期刊网络化潮流中，特别值得注意的是“中国高校系列专业期刊”或“域出版”，这是一种将期刊论文筛选后按专业或专题在网络平台发布的模式。目前其正酝酿向“平台型媒体”(Platisher)转型，成为既是有“过滤器”的媒体，也是可以孕育新学术生态的互动开放平台。

学术出版将从传统出版延伸到数字出版、语义出版、数据出版、增强出版等新出版形态;自觉地将出版与科研相融合，支持数字人文等学术新范式;运用大数据分析、深度学习和自然语言处理等新技术，提供知识和信息的解决方案和个性化服务。

未完，请阅读下篇：““数字人文的学术评价体系:定义与规范建构”研讨会发言汇编（下篇）”

编辑 | 王波

注释：

[1]王丽华、刘炜、刘圣婴:《数字人文的理论化趋势前瞻》，《中国图书馆学报》2020年第3期。

[2]参见姜文涛:《什么是好的数字人文》，《澳门理工学报》2019年第4期。此文被《人大复印资料·社会科学总论》全文转载，可在刊物网页或知网上下载。service@tizikeji.com

原刊《数字人文》2021年第1期，转载请联系授权。

“镇冀之间，自为一秦”:中晚唐河北藩镇人员外流的量化分析