【对撞机】独家专访:如果你习惯待在某个固定领域做研究,那最好别选数字人文
编者按:
10月21日,爱尔兰国立梅努斯大学数字人文研究所苏珊·施赖布曼教授(Susan Schreibman)和同事一行三人应邀前来北京大学图书馆进行学术交流,并就“数字人文:新方法、新机遇和新受众”(Digital Humanities: New Methodologies, New Opportunities, New Audiences)这一主题作了学术讲座。
作为数字人文领域内的顶尖学者,施赖布曼教授不仅两度负责主编《数字人文指南》(A Companion to Digital Humanities),同时还主持着多个数字人文研究项目,并已形成丰厚学术成果。零壹Lab有幸在讲座后对施赖布曼教授进行了专访。
请问基于你目前在数字人文已有的经验,假如你能重来一次,你会在哪些方面做出调整?或者说,如果有人打算启动新的数字人文项目,你会给出哪些建议?
我想我应该会从两方面来谈这个话题。一个方面主要涉及到项目对大众的潜在教育和培训功能,另一方面主要是关于如何去做“1916信件”这样的项目。
不管人多还是人少的项目,合作都是非常重要的,所以我打算先谈谈项目。对于项目这个话题,最困难也是最重要的问题就在于:我到底想要做什么样的内容?像我自己是选择了一个非常重要的时期,并与第一手资源打交道。我想我并不建议在一开始就选择非常大型的项目——这样的项目要么太大,难以管理,要么需要很多年才能完成,要么是太困难,在技术上难以实现。在今天的北大讲座上,我没有来得及展示另外的一些小项目。我通常会在我的课堂上设计一些小的数字人文项目,由我和我的学生一起去运作。他们有的负责网页设计,有的负责架构开发,有些负责内容,有些负责元数据(metadata)——所以,如果你有一个现成的小团队的话,我建议是从一个小项目做起。
因此,在某种程度上,对于数字人文项目而言,项目管理是非常重要的:你需要一个什么样的团队,你如何规划、限定项目的规模。你需要决定:为什么是这样资料和数据,为什么人们会对这样的数据有兴趣。你要做的也不仅仅是把它们数字化,呈现给大众,而要考虑在数字化过程中,你究竟能在此基础上带来怎样的增益,人们将会如何使用数字化后的内容,他们为什么有兴趣来使用。所以,如何选择一个项目和选择一个团队,是非常重要的。
对于那些从零开始的人,我的建议确实就是从一个小项目开始。但在很多项目里,你会看到,高校里的学者往往选择直接跟图书馆这样的机构合作。因为它们有现成的数据库,很多现成的基础设施,如服务器工作站。这也就意味着你暂时不需要招募技术人员去搭建新的数据库,同时省去不少数字化的工作。这时候,学者需要做的也就是做他们本身擅长的事情——做研究。
像我在本科和研究生课程中设立的小项目,学生们能在当中学到很多非常实际的技能:比如如何管理运营一个项目,相互之间如何合作,一些基本的编程等等。在我看来,学生能在那些项目里获得参与感和署名很重要。这在提升他们能力的同时,对他们今后找工作也都很有帮助。
归根结底,回到最开始的问题:对于一个数字人文项目而言,为什么选择这个数据集(data set),你想在此基础上做些什么,是最为重要的问题。一个数字人文项目绝不仅仅是把文献数字化后放到网上而已!
2
我留意到在你的讲座和谈话中都强调了数字人文项目教育方面的功能,就比如你刚刚也提到有跟学生在硕士课上设立一些小的项目。那么,请问这些项目后来有没有发展壮大成为一些更大更持久的项目?
其实,这些在学校里进行的项目往往不需要我们去做太多数字化的工作,这也就使得前面那个问题显得更为突出:我们到底要对这样的数据做什么?就拿我之前在梅努斯大学的一个项目来说吧。这个项目叫 “Woodman Diary”,Woodman是人名。这是由一位女士所提供的她爷爷的信件,她爷爷曾参加一战。在对这些信件的数字化过程中,我们需要决定究竟哪些词句是需要特别处理的,因为有些词句的用法现在已经很少见。那么,最终我们想要呈现的网页应该如何设计,需要增加怎样的语境备注来帮助大众理解这些近乎百年前的信件,这都需要通过一定的研究工作才能最后决定。在此过程中,我除了教给他们如何运营一个项目之外,也教给他们最基本的数字人文技能,譬如用XML编程。当时这个团队里有人本来就懂软件开发,有人主动负责网页设计。如果没有这样的人,就得从团队里找人来学习做这样的工作。但到最后,你会发现,可能你遇到的问题往往不是技术层面的,反而是关于怎样进行协作,怎样进行集体讨论、决策的。因此,某种意义上,数字人文项目有着很强的社交属性。
这样说来,我们正在做的公众号“零壹Lab”也是需要当成一个项目来运营吧?
当然!
(Woodman Diary)
3
提到社交这个话题,我记得在你的讲座上特别展现了一幅对于数据转录员(transcriber)进行视觉化处理后的图像。我能据此认为在这些人也在你搭建的网页上形成了一个网络社群么?
他们应该算是一种非典型的网络社群吧。他们并不十分确切的知道对方的信息——最直接的体现就在于我们并没有为他们设置ID,所以即便是注册了的转录员也不知道究竟是谁在做推进和修改,更不用说匿名转录员了。事实上,如果我们不看后台记录,也不知道究竟是谁进行了修改。
前面你曾经问我如果能重来一次,会在哪些方面做出改变。首先,我会问那些向我们捐赠信件的人,问他们打算在怎样的程度上授予我们处理这些信件的权利——譬如有报纸想要刊登,或是其他的数字人文项目也需要,那么我们是否有权直接给予,还是说我们需要征得他们的同意。其次是,我会问那些义务参与数字化工作的人,愿不愿意看到自己的名字作为贡献者出现在项目网页上。有些人也许觉得不用,但我想应该有人会想要看到自己的名字。
4
我的一位同事想要知道,像那种由大家族所搭建的收集家族文献的网站是否也算是对众包(crowdsourcing)的运用?如果是的话,那这种众包跟数字人文项目里的众包有没有什么不同?
当然,这也是众包,但重点在于目前的数字人文项目中,运用众包的并不算多,尤其是成功的案例偏少。众包早就被图书馆广泛使用,可就像我前面指出的那样:数字人文的关键还是在于,你要知道你究竟想要呈现什么,究竟是什么让大众愿意花时间在你的项目上,不论是参与还是使用它?
5
所以这就是你为什么选择了1916这个年份吧?因为那一年的复活节起义对于爱尔兰共和国的成立来说太重要了。
是的,就是因为这个项目,爱尔兰的许多文献机构都为我们提供了相当大的便利,最终我们也得以将世界上现存的这个时期的绝大部分信件汇聚到了一起,无论它们此前是被公立或私人机构收藏。当然,这也是为什么至今已三年了,项目仍在持续地推进中。
6
接下来,我想问一些关于1916项目的具体问题。比如,你曾在讲座中提到一个叫做“临终信件”的支线项目。在该项目中,你们发现了出自同一个人手笔的不同版本的临终信件,以及他人对信件的修改。在你看来,这样的修改意味着什么呢?
由于这是个还在进行中的项目,所以有些结论需要等到今年12月才能揭晓。但是目前我们能够看到的是:有些不同版本的产生是由于传抄的笔误——你知道尤其是那些出自被处决的起义领导人的临终信,是会被人们四处传抄的,当时也没有复印机,所以很容易出现笔误。但同时我们也发现,有些不同的版本是人为刻意造就的。比如当时的一份教会通讯就刊登了这样的临终信,他们删去了信中相对世俗化的部分,而仅仅呈现出有利于宣传宗教虔诚的部分。不过,对我们而言,最有价值的工作还是在于去发现那些由不同个体造就的不同版本,而不是出自教会的刻意修改行为。
(Letters of 1916)
7
在你的Letters of 1916(“1916年的书信”)项目里,数字化的对象主要是信件,也即文字。我个人其实更在意要如何去实施对图片和图像的数字化来更加便捷地实现对它们的搜索和建模。坦白讲,目前我是毫无头绪的,尤其考虑到现在的大量图片本就是数字化的格式,就好像我们依然需要去做一个再数字化(re-digitalize)的工作。
是的,这确实是一块巨大且重要的领域,我有一个合作伙伴的主要兴趣就在于图像的数字化。他会很关注信件的不同版本:手写的,印在报纸上的,翻拍的。事实上,你知道,一旦图像的上下文(context)变了之后,图像的含义也就变了。一幅图像一旦配上标题文字,放上了报纸,传达的就可能是截然不同的含义。这有点像是文学理论里面的受众理论,一个作品会因受众的不同而得到不同的解读,进而变成像是不同的作品。回到图像,我如果在档案馆里很随机地看到一幅图像,那就意味着我几乎没有任何可参照的上下文。因此,反过来看,对以图像为核心内容的数字人文项目而言,一个重要的课题可能在于如何植入语境,如何把图像嵌回它被生产制造出来时候的语境。这样的操作可能会有相当强的主观性。另一个路径也可以是去追溯图像在不同时空轴线上的变化……这样说来,图像的数字化工作实在是非常具有挑战性的。
值得一提的是,在我的1916项目里,我们不仅仅提供了信件的文字内容,还以并置的方式呈现了信件的手写图片。这也就意味着大众可以在网上浏览信件内容的同时,也有机会仔细观察信件的笔迹。尤其是那些临终信,你会看到他们明明知道自己会被处决,但写信的时候下笔依然很稳,并不颤抖。这时你就能推定,他们是真的处于一种坦然赴死的状态。也是在这个意义上,图像元素与文字、语意的元素同等重要。当然,这恰恰是数字技术所带来的便利,一旦换成纸质,就会变得非常昂贵。
8
之前我在网上看到有人做了一个叫作Selfiecity的项目,就是去到不同的城市递出手机让人用这部专用的手机自拍,然后再把这些自拍的相片拼凑到一起,看哪个城市的笑容最多。
是的,这其实正是我要谈到的另一种数字人文。之前我们一直在聊的,其实都是数字化的模拟仿真(analog)。对于这些本来就以数字化格式存在的数据和材料,我们尚在探寻一种恰当的保存它们的方式,尽管目前已经有了相当多的理论探讨和实践操作,可总体而言,现有的方式都是非常昂贵的。那么,我们究竟该如何对这些数据进行分析呢?就譬如你刚刚提起的那个项目,我们究竟在其中寻找什么呢?我能使用图像识别软件和设备么?假如是我面对5,000张这样的城市自拍,我显然不可能挨个看一遍,那么图像识别技术的引入能让我发现什么样的问题呢?假设我能使用某个图像识别软件,并在此基础上展开分析,我可能会首先关注出现在我眼前的会是怎样的人机交互界面。
这有点像是我在讲座中提到的主题建模(topic-modelling),当电脑以某种方式渗入数据之后,我们非常需要知道自己还能发挥怎样的主动性。有时我觉得,我们刚好处于某个时代的节点。在这个节点上,旧有的人文学科的问题依然跟过去一样有其价值,但新数据,以及新数据属性层面的变化却让我们不得不针对这种变化提出新问题。
(Selfiecity)
9
你在梅努斯大学主持一些数字人文专业的学位课程。请问你个人倾向于如何搭建数字人文与其他学科的桥梁,尤其是在设置你自己的学位课程时?
事实上,这是很简单的事情。因为我们的学位课程设置本来就非常地具有“跨学科性”。正如你知道的,数字人文所涵盖的范围非常广,有些学校的数字人文专业是限定在某个具体研究方向之内的,可是在我所管理的数字人文课程里,我们决定不要将自己限定在某个具体研究方向。所以你会看到,我聘请的第二个同事的专业方向就跟我差很远——他是做数字文化遗产的,并且是用3D和VR工具去处理。目前我们已经有了深度的合作,也就是今天没有提起的另一个项目——Battle of Mount Street Bridge项目。
坦白说,我最喜欢数字人文的一点在于:需要为此开设跨学科的课程,而跨学科的课程又将带来非同寻常的合作——你在刚认识某个人时,是完全不会想到会和他展开合作的。又比如我今年的第三个合作者,他就是专门研究图像的。
说回课程设置,在我看来,让学生有机会体验不同的工作环境是很重要的。为此,出于技术层面和方法论的需要,我们也开设了电脑课程,教授传统编程。同时,在我设计的课程里也会有一门导论性质的必修课,学生在修完这门课程后需要参加实习。这样他们才可能真正地学以致用,而我认为这同样十分重要。
10
之前你曾提到VR技术在你项目中的应用。据我所知,VR技术现在在中国是一个非常火爆的话题,请问你是怎么看VR技术的呢?
我对VR技术了解不多,因此我只能从项目的实际应用来谈。简单来说就是,VR技术所提供的仿真环境,让我们有机会去检验:在当时的历史场景之下,究竟哪些事情(的发生)是可能的,哪些情境是不可能的。尽管,类似的交叉验证同样可以通过文献层面的考证来获得,但这样的考证工作量会非常巨大,且不一定有结果。另一方面来看,VR作为一项新技术也在实际操作中提出了很多新问题,最直接的表现就在于,当我们完成了最初设定的研究目标时,却发现(在VR环境下)这一目标的完成引出了更多新的值得研究的课题。换句话说,新技术的诞生会激发出新的研究课题。
11
12年前你参与主编了《数字人文指南》(A Companion to Digital Humanities),12年后这本书同样在你的主编下推出了修订版。请问在你看来,前后12年间,数字人文领域内发生了怎样的变化?
这是个非常有意思的问题。实际上,我已经写了一篇论文来讨论这个问题,文章已发布在网上。在2001年刚开始做这个指南编写的项目时,我们心里非常笃定:如果条件允许,我们是能够很好地描述出数字人文究竟是什么的。可是,眼下编辑新版时,这已经变成了不可能完成的任务——因为已涌现出如此之多的学术群体,宣称他们在某个方向上进行数字人文研究。所以,那条分界线究竟该划在哪里,究竟什么才是数字人文,而不是数字文化遗产、数字媒体研究、系统工程开发、数字图书馆……?要知道,就连我之前所在大学的社科系主任也想让系里的老师去开展数字人文的项目研究。
简而言之,数字人文已经变成了一个可以容纳各种学科的空间。这也是为什么我在讲座开始播放的视频里不再试图给出关于数字人文的单一描述,而选择让在不同领域不同方支上进行研究的人通过视频来告诉大众,他们到底在怎样的学科背景和方法论指导下进行哪些数字人文研究和实践。
(A Companion to Digital Humanities)
12
能否请你谈谈在数字人文项目中与其他院系的合作经验,尤其是合作中遇到的问题?
与其他院系的同事合作,正如我前面所提到的,大多时候能带来丰厚的收获,但也有可能会让你感到某种挫败感。怎么说呢?有不少打算设立数字人文项目的人,自身所掌握的数字技术却非常有限。我倒也不是说自己在各方面都全能,但在常用的几个领域,我算是都掌握了基本的技能——至少我很熟悉电脑是怎么运作的,知道如何对数据建模。当你需要跟那些对电脑和数据建模毫无概念的人就数字人文项目进行合作时,就会很容易产生挫败感——他们甚至无法判断某个目标在技术上是否无法实现的。因此,我个人很希望看到我的同事们在电脑技术方面拥有越多积淀越好,这样也将有利于他们跟学生一起进行项目上的合作。
总之,对我来说,数字人文是一个非常好的研究领域,它能让你有空间去选择你所喜欢的研究方向,去尝试一些在新技术发明前原本无法成为可能的研究方法。它总是在变化。所以我会对我的学生说:如果你习惯待在某个固定领域做研究的话,那最好还是别选择数字人文。
相关链接:
苏珊·施赖布曼教授的大学网页:https://www.maynoothuniversity.ie/foras-feasa/our-people/susan-schreibman
北大讲座报道:http://news.pku.edu.cn/xwzh/2016-10/26/content_295508.htm
Woodman Diary项目:http://dhprojects.maynoothuniversity.ie/woodman/
Letters of 1916项目:http://letters1916.maynoothuniversity.ie/
Selfiecity项目:http://www.selfiecity.net/
Battle of Mount Street Bridge项目:http://mountstreet1916.ie/
《数字人文指南》线上版:http://www.digitalhumanities.org/companion/
《数字人文指南》初版十年后的反思文章“Digital Humanities: Centres and Peripheries”:http://www.ssoar.info/ssoar/handle/document/37837 (请点击PDF标识右面的链接)
END
主编 / 付梅溪
责编 / 徐力恒
美编 / 卢言乐
(图片来源:网络)
零壹Lab
记录数字媒介之日常
反思科技与人文精神
长按关注