数字基础设施的维护及其人文意义
主持人语
本期专栏主题为“数字人文与基础设施研究”。在2016—2018年这3年的时间里,这个专栏已出版了4期,分别以“文学文类与模式辨认”“阅读、正典/ 档案:文学场域大型动力学”“数字人文与中国研究”“数字人文与社会多元”为主题,发表了十几篇文章,这其中既包括译自英文的代表性论文、对其中某些作者的独家学术访谈,也包括国内外原创性学术文章。在这3年时间里,国内的数字人文研究发展迅速,对它的理论认知越来越清晰,在某些学科领域出现了使用数字人文方法而产生的重要学术成果和代表人物,多个数字人文研究机构得以建立,数字人文方面的大学课程建设进展迅猛,中国自己的数字人文研究期刊(不止一家)也正在酝酿之中。除此之外,需要特别指出的是国内的数字人文基础设施建设成就辉煌。这不仅体现在图书馆、博物馆的数据库基础设施建设方面,也体现在由国家社科基金等诸多项目带动的各种类型的数据库建设之中。
事实上,正如詹姆斯·史密西斯(James Smithies)指出的,基础设施在数字化时代之前早已存在,包括修道院图书馆、手稿本抄写员、古代及现代的图书馆,等等。私人的、公共的、政府支持的以及商业化的基础设施互相分享数据和信息。这些基础设施对特定的人群开放或者封闭使用权,进行资源建设以及传播,使得全球范围的知识空间成为可能。[1]数字化时代的基础设施具有自身的特点,会以不同的方式对知识的生产和流传产生影响。因为基础设施对知识形成、社会发展等的重要意义,最近在北美学术界诞生了一个新的学术研究领域,即“基础设施研究”(Infrastructure Studies),跨越了人类学、科学与技术的人文社会学研究(Science Technology Studies, STS)、城市规划、风景设计、建筑学、物流与废物研究(Logistics and Waste Studies)、环境研究、媒体与信息研究等多个研究范围。[2]有鉴于此,我们组织了这一期栏目,希望能进一步推动国内数字人文(尤其文学研究方面)与基础设施研究的相关讨论。
《数字基础设施的维护及其人文意义》摘自香农·麦腾( Shannon Mattern)教授的长文《维护与照顾:城市、家庭和社会关系中的锈迹、尘埃、裂缝及受损代码修理工作手册》(“Maintenance and Care: A working guide to the repair of rest, dust, cracks, and corrupted code in our cities, our homes, and our social relations”)。麦腾教授是美国纽约社会研究新学院(The New School for Social Research)媒体研究学院的教授,她的研究集中在档案馆、图书馆及其他媒介空间、媒体基础设施、空间知识学等方面,是基础设施研究方面冉冉上升的一颗学术明星。这篇长文从四个侧面讨论了基础设施维护所涉及的人文社会意义。基于栏目主题等方面的考虑,我们主要摘选了其中涉及数字基础设施的部分章节。
[美]香农·麦腾 撰 汪 蘅 译
[ 摘要 ] 后工业社会中,对基础设施的维护、照顾和修理充满了日常生活之中。在诸多学术领域和职业实践中,作为理论框架、道德观和方法论的“维护”,包含了许多的标准、工具、实践和智慧,已经具有新的反响。数据资源加速了数字物品、联网建筑和智能城市的运转,是后工业社会基础设施很重要的一个部分。本文讨论了关于数据基础设施维护的人文意义,试图重新界定人和数据在特定的文化地理位置中的意义。
[ 关键词 ] 数据;基础设施;维护;数据管理者
本文并非关于世界正如何分崩离析。当然,我们全都看到了:大坝和桥梁突然垮塌;电网和下水道系统缓慢恶化;数据被黑、条约中断、选举被操纵。基础设施(Infrastructures)到处失灵,不分日夜。甚至有人告诉你即使卡内基—罗斯福时代的美国基础瓦解也没事。我们不去修理现有系统,倒是呆在一边等自主车辆和区块链为基础的服务上线(再让亚马逊接管公共图书馆)。[4] 创新和新颖这种价值观吸引了大量注意力——或者至少直到紊乱(disruption)变成获胜的竞选平台和正常化(normalization)。如今,故障(breakdown)是我们认知和体验的现实。
真正需要研究的是世界怎么才能拼回去。我说的不是选举新官员或发布新技术,而是每天的维护、照顾和修理工作。史蒂文·杰克逊(Steven J. Jackson)老早前写的论文《反思修理》(“Rethinking Repair”)要追溯到2014年了,——如今已是经典,文章建议我们在考虑社会和技术的关系时,“将腐蚀、故障、衰退而非新奇、增长和进步当作起点”。他对“残破世界思维方式”(broken world thinking)的冷静运用配以“深切的惊叹与欣赏:进行中的活动让稳定得以维持、精细的修理艺术维持丰富强健的生活,对抗离心或然率(centrifugal odds)的重量。”[5]
在诸多学术领域和职业实践中——建筑、城市研究、劳动史、发展经济学和信息科学,仅以这些为例——维护作为理论框架、道德观(ethos)、方法论和政治事业,已经具有新的反响。这一探索领域令人兴奋,正是因为学术和实践的界线模糊了。对维护的研究本身就是维护行为。填补文献缺口、将不同研究领域连接起来,这就是修理行为,或者简单说,就是照顾行为——连线、补洞、放大轻微的声音。
这必然是集体努力。2016年,技术史学家安德鲁·拉塞尔(Andrew Russell)和李·文塞尔(Lee Vinsel)发起了名为“维护者”(Maintainers)的研究网络。维护者采用幽默的口号与沃尔特·艾萨克森的著作《创新者:一群黑客、天才和极客如何开创数字革命》(Innovators: How a Group of Hackers, Geniuses and Geek Created the Digital Revolutions)互动:“一群官僚、标准工程师和内向的人如何让数字基础设施大部分时间变成这种工作”。他们举办了两场颇受瞩目的会议,并在《万古杂志》(Aeon)和《纽约时报》刊发论文,反过来又激励了数十种期刊文章、会议小组、展览、论文和专题研讨的出现。不久前在伦敦举办的第一届维护节(Festival of Maintenance)上,发言人讨论了许多议题,如社会福利住房、设备管理、自我照护、工具图书馆和志愿工作的情感劳动。[6]
维护也许是适时的主题,但并不算新。古人必须修理渡槽和泥砖搭建的住处。卡尔·马克思提到作为资本主义条件的“工人阶级的维持和繁殖”。[7] 拉塞尔和文塞尔将“维护”定义为“19世纪70年代和20世纪20年代期间围绕新技术兴起的规范性文献 (prescriptive literature)中几乎永恒的话题”,包含从电话到道路。[8] 我们提起这个主题时不得不认识到,维护和修理一直由技术(以及更广泛的技艺和手艺)的政治、社会、文化和生态环境所塑造。不止于此:我们还要了解我们面临的事物的历史。拉塞尔和文塞尔追溯了被恋物化的创新(fetishized innovation)的谱系,从19世纪的工业化到发明时代、战后的消费技术、冷战时期的研发实验室和20世纪80年代的拜度法案(Bahy—Dole Act)——该法案让联邦资助的研究者为自己的发明取得专利权——直到如今的硅谷。[9]
在维护挑战作为优势范式的创新之前,我们需要建起更大的公共舞台。目前,话语向经济学家、工程师和政策制定者倾斜——而他们在人口统计上是颇为同质的一群人。[10] 考虑到破损世界的破损程度(以及维修费用),我们需要所有维护者将各自不同领域的方法和实践技巧应用于维修的集体项目上。杰克逊提出将维修思维看作独特的认知论。他说,修理工(fixer)“相对于更为人所知的‘设计师’和‘用户’形象,了解和看到的是不同的事物——其实也是不同的世界。”故障具有“展现世界的特性”。[11] 类似的,史蒂芬·格拉厄姆(Stephen Graham)和奈杰尔·思里夫特(Nigel Thrift)认为故障和失灵(failure)是“社会用以学习再生产的方式”,因为维修破损的系统总会有“适应和即兴发挥”的因素。[12]
关于这些概念如何被不同领域接受,我们能了解些什么?科学和技术学者如何同建筑师、图书馆员和其他从事组织工作的专业人员建立更多联系?我会说,如果我们想要更好地理解并应用作为矫正框架(corrective framework)的维修,就需要承认女性的工作、家务劳动和再生产劳动、以及所有保存(preservation)和保护(conservation)行动的传统。同时要避免将维护和修理浪漫化。我们可以从对照顾的政治(politics of care)的女权主义批判中学习(尤其是对低薪移民和有色人种的依赖)并注意西方世界之外的维护实践。
许多生产商的目标是让自己的商品远离维修和混合经济(remix economies),他们小心控制产品的进化周期。智能手机和笔记本电脑尤其如此,温迪·秦(Wendy Chun)说它们的“生死取决于更新”。[13] 但对于响应式建筑(responsive architectures)和联网城市的运行,代码的作用越来越关键。维护建筑物和公共基础设施现在包括照管背后的软件。在所谓智慧城市里,这会变得昂贵。历史学家内森·恩斯门格(Nathan Ensmenger)报道说“从20世纪60年代早期到现在,软件维护占软件开发总费用的50%到70%。”[14] 不管怎么谈论技术产业的创新和紊乱,大部分程序员其实都在忙着修东西。
研究计算机的历史学家已经表明,硬件维护和社会基础设施维护往往彼此交织。布拉德利·费德勒(Bradley Fidler)和安德鲁·拉塞尔论证说计算机网(Arpanet)已经超越了最初的“试样”(demo)功能,这要归功于“赞助人、联系人和官僚们”的维护工作,“他们辛苦维持并连接……各种组织和技术。”伊丽莎白·洛希(Elizabeth Losh)着重介绍了米娜·瑞斯(Mina Rees)的工作,后者是海军研究办公室的运算基础设施的规划师,在20世纪40年代和50年代主导了大学和研究中心的“房屋评估”(home evaluation),好决定哪些房屋恰当地结合了“资金、人事、设备、供应链、政策和社会动力”,可以作为大型资讯整合中心(major computing hubs)。“虽然[瑞斯]常认为自己发挥的是支持性作用,”洛希写道,“但是很清楚,她对行政方面细微差别的意识对于基础设施的照顾和修理极为重要。”[15]
保罗·爱德华兹(Paul Edwards)更全面地将软件纳入其运算系统的开拓性分析中,包括气候建模和军事指挥控制项目。他的工作启发了大卫·里布斯(David Ribes)和托马斯·芬霍尔(Thomas Finhold),他们调查了大型信息技术基础设施项目以及与其维护有关的关注和声望的匮乏。里布斯和芬霍尔认为这些系统的设计者现在应该为“长期现在”(long now)做出规划。他们需要提问:“面对变化中的技术、新出现的标准和不确定的机构发展轨迹,如何确保基础设施项目的持久?如何保证参与者持续投入?”换句话说,我们怎么才能维护技术系统和操作群体以及他们为之服务的大规模研发企业?[16]
多数软件应用和平台及门户网站就像建筑物和城市一样,如果没有维护工保持运行秩序良好,都会很快出故障。有系统管理员,加布里埃拉·科尔曼(Gabriella Coleman)描述为“部分是管道工,部分是场地管理员,部分是忍者,解决问题、维护系统、抵御攻击。”还有内容管理员,筛查网站非法或不当内容。莎拉·T·罗伯茨(Sarah T. Roberts)说这个工作“几乎总是由地位相对较低的工人拿着低薪暗中从事,必须日复一日审查可能色情、暴力、令人不安或恶心的数字内容。”这些工人很大比例会过度劳累,因此大多数公司雇佣合同工,这批劳动力中很大一部分住在菲律宾,技术公司能在那里找到了解互联网、熟悉西方文化而且说英语的承包商。他们和阿塞多一样,牺牲自己的福利让互联网成为“清洁”、健康、“适于工作”的环境。[17]
另外还有开源社区。许多软件依赖于志愿开发人员维护的免费公共代码。克里斯托夫·凯尔蒂(Christopher Kelty)写道,“开放”承担着责任,“不仅意味着分享‘源代码’……还要设计各种方法确保这些内容永久开放,也就是说要创建循环的群体投身于它借以沟通的媒介或基础设施的维护和可修改性。”然而可以预计,此项工作资金极少,志愿者群体则消耗得渐少。纳蒂亚·埃格巴尔(Nadia Eghbal)调查维护开源项目技术工人和志愿者时发现“压力和疲劳”普遍存在。[18]
过去两年左右,一群自称“维护者”的人为了在往往看不见的劳作中彼此支持、开发推荐系统让社区更强大,已经在线下(IRL)碰头了两次,他们“担忧频繁使用且影响深远的开源项目的脆弱状态和未来。”[19] 之前介绍过的首届维护节在物理层面和数字领域都赞扬了“修理、管理、组织工作、照料和照顾”,承认维护开源软件、在线社区、合作组织和数据集和维护自然环境、基础设施、工业、文化遗产及物质资源并无二致。[20]
此外,我们应该认可人类“数据处理员”和“管理者”(curators),他们“清扫”了结构问题,重新格式化了研究或营销中用到的数据集。让·克里斯托夫·普兰廷(Jean Christophe Plantin)在他关于社会科学数据档案的民族志著作中认识到,数据集“必须在处理结束时看起来也是清洁的”。这种内部维护工作并不打算让终端用户看到,用户更愿意认为自己在和“原始”数据打交道。不过“数据从来没那么原始”,普兰廷评论道。“数据能再利用之前总是需要多种介入。”[21]
数据档案保管员希勒尔·阿诺德(Hillel Arnold) 哀叹行业的“隐身问题”。档案保管员总是被描绘为“保存者”(save-iors),“抹去[自己的]劳动”,让使用档案的研究者能“发现”“失落的”宝物。同时,“职业敬畏感”促使档案保管员以更少条件做更多工作;例如依赖临时劳务和无薪酬的实习工作而非受薪人员。阿诺德被维护者的兴起所启发,呼吁档案管理人提出对必要劳动条件和资源的要求,以便恰当地照顾收藏品、自己和同事、还有资助者。[22] 有些资助者都开始过来拜访了。NEH数字人文促进奖金(NEH Digital Humanities Advancement Grants)现在覆盖“现存数字复兴和/或恢复项目”,斯隆基金和福特基金会为维持数字基础设施提供了一个新资助项目。
图书馆的数字资源也要求维护。丹尼尔·勒温(Daniel Lovins)和戴安·希尔曼(Dianne Hillmann)在一篇关于“破损世界词汇”(Broken-World Vocabularies)的论文里描述了随着技术进步遇到的改装和调节元数据的挑战。包括维护图书管理员用来描述收藏品的目录学词汇表:“任何参加过图书馆标准委员会的人都知道,要MARC(维护机器可读目录)、 RDA(资源描述与检索)和LCSH(美国国会图书馆标题表)保持稳定状态需要多少努力。这种情况部分源于妥协导致的内部不一致,部分因为描述性词汇周围的世界本身就持续破裂和变化。”科学发展、新学科出现,对人类身份的理解也在进化。图书管理员无法“维修”外部世界——他们无法令其稳定,也不应想要这么做——但他们维护着信息系统,帮助资助者更好地理解它。[23]
数据维护在医学领域后果特别明显,因此照管医学网站、物品、社区和数据被认为是照顾病人的重要部分。里布斯解释过,临床试验涉及的维护活动包括校准仪器、清洁数据、保存标本和数据、维持参与者、管理数据采集网站和社区(也叫“生物群系”)等等。研究的参与者,尤其是慢性病病人,有时候会采取劳拉·佛拉诺(Laura Forlano)所说的“破损身体思维”(broken body thinking),“积极参与、维护、修理、照料各种各样的医学技术”:泵、感应器、监视器、针头、小药瓶。[24] 如果这些东西没人照顾会发生什么?布列塔尼·菲奥雷—加兰(Brittany Fiore-Gardtland)提到NGO经常在发展中国家资助启动野心勃勃的数字健康项目,接着又抛弃“未达标”项目或让它们“在资金循环末端耗尽”。但参与试点研究的人往往已经依赖于项目提供的工具和服务。资源撤出时,提供照料的人临时发挥填补空缺。菲奥雷—加兰发现,围绕被抛弃的技术出现的“组织结构”“必须修补并被重新表达。”[25]
这是反应式(reactive)照顾、响应性(responsive)照顾。本杰明·西姆斯(Benjamin Sims)提倡来源于“建模和模拟、用户研究、测试、检测和其他方法”的更主动的“先行修理”(anticipatory repair)模式,“这些方法的目标是在技术广泛应用前就启动受控场景中的故障,在影响终端用户之前提供机会解决问题”。工程师正在用人工智能预测和预防基础设施的混乱,扫描高性能运算系统、电厂或金融市场内的特异表现,先发制人、阻止灾难。精心管理的数据对于预防保健和建筑维护等领域至关重要。杰斯·埃拉科特(Jes Ellacott)在维护者日志上特别提到最新科技能改进维护,强调维修的创新潜力能够“改变我们如何看待、珍惜和回报”我们的维护者。[26]
也许如此。但就算我们建起一支修理用机器人(长期以来的科幻梦想)和用于维护的AI军队,其硬件软件还是需要保养。它们仍然依靠维护良好、可互操作的技术基础设施;仍然需要清洁人员、也就是“工业卫生学家”为其生产维持清洁环境。[27] 我们需要管理者清洁数据,需要机器人清洁团队主管。劳动对维护不可或缺。
杰伊·欧文斯(Jay Owens)提醒我们:
就是如此,不管我们谈论的是挖沟、建坝还是数据潜水。任何特定场地上或任何特定身体或物品的维护都要求对整个生态的维护:照管供应链、工具、协议、社会基础设施和环境条件。
在这个问题的许多尺度和维度中,我们从未远离三个持久的真相:(1)维护者需要照顾;(2)照顾需要维护;(3)这些实践之间的区别由种族、性别、阶级和其他政治、经济和文化力量所塑造。谁来组织基础设施的维护?谁该执行这项工作?谁在家里得到照料,谁来照料、缝补?关于哪些事物值得修理、“好的修理”涉及什么等内容的协议总是要看条件根据情况而定。如果我们想要更好地支持由这世界的维护者从事的重要工作,就必须认识到维护包含无数的标准、工具、实践和智慧。有时要利用机器学习;有时,一只拖把。
责任编辑 | 陆晓芳
姜文涛
姜文涛,美国纽约州立大学哲学博士,现任职于浙江大学国际联合学院人文与社会科学研究中心,主要研究方向为英国十八世纪印刷文化及情感研究、文艺理论和比较文学、数字人文。
戴安德
戴安德(Anatoly Detwyler),美国哥伦比亚大学哲学博士,美国威斯康星大学麦迪逊校区亚洲语言与文化系助理教授,研究方向为中国现代文学和数字人文。
作者简介
Mattern
香农·麦腾(Shannon Mattern),美国纽约社会研究新学院(The New School for Social Research)人类学教授,研究方向为档案馆、图书馆及其他媒介空间、媒体基础设施、空间知识学等。专著包括《编码与泥土,数据与尘埃:城市媒介五千年史》(Code and Clay, Data and Dirt: 5000 Years of Urban Media, 2017)、《媒体城市深度描绘》(Deep Mapping the Media City, 2015)及《新型市中心图书馆:以社区为中心的设计》(The New Downtown Library: Designing with Communities, 2007)。
译者简介
汪 蘅
汪蘅,毕业于北京大学英文系,自由译者。
转载请联系授权。
古文字学界“数字人文”研究的最新探索—评刘志基《古文字研究论稿》
比较文学研究与数字基础设施建设:以“民国时期期刊语料库(1918-1949),基于PhiloLogic4”为例的探索
欢迎投稿,稿件请发至
dh2020@tsinghua.edu.cn
长 按 关 注