你死后,你在互联网上留下的痕迹将由谁来继承?
原文作者:Sedeer el-Showk
越来越多的全球文化只存在于网络上,这对那些记录世界历史的人来说是一大挑战。
2017年8月,飓风哈维横扫加勒比海,之后在德克萨斯州和路易斯安那州南部登陆。这场飓风导致100多人死亡,仅在美国就造成了约1250亿美元的损失。
随着灾后恢复工作的启动,休斯顿莱斯大学的研究人员和档案保管员联合休斯顿公共图书馆、休斯敦哈里斯郡公共图书馆和休斯顿大学图书馆,开始着手制作此次飓风的电子数据库。
谷歌等企业会储存海量数据。
来源:Google Cloud
来自受灾社区的大量照片、视频、音频以及灾难回忆被发到了社交媒体上,但我们并不能保证后世的人也能看到它们。参与上述计划的莱斯大学的历史学家Caleb McDaniel 说:“不愿意看到这些信息丢失,也不愿意使用未来的人无法获取或无法读取的方式储存它们。”
哈维记忆计划(Harvey Memories Project)旨在将这些信息分门别类,永久地记录下来,以便保存受灾民众对飓风的记忆,为后来的历史学家和其他研究者所用。该计划于7月启动,目前已记录了数百份资料,但是该团队希望可以增加到数万份。
哈维记忆计划凸显了一个日益严峻的问题:我们的文化体验大多记载在转瞬即逝的技术中。每天,数以亿计的照片被上传到社交媒体上,而在我们的文化输出(如模因、猫咪图片、推特、播客和教育视频)中,越来越多的内容只存在于网络上。
想要记录这些电子材料,则面临着技术、法律和社会方面的挑战。而其中大多数信息掌控在私有企业,如脸书和谷歌手里,这就让问题愈发严重了。对那些想要保存文化遗产的人来说,这些问题相当棘手。
牛津大学互联网学院数字伦理实验室的研究者Carl Öhman说: “我们必须探讨一下,应该采用什么样的价值观和准则来指导历史记录,是代际公平,科学,宗教,还是商业准则?”
真实还原
一群来自不同学科的专家正在商讨解决这些问题的方法。本月早些时候,国际互联网保存联盟(International Internet Preservation Consortium)在新西兰召开了年度网站存档会议(Web Archiving Conference)。与会者来自各种各样的学科背景,他们共同商议保存世界在线遗产所面临的社会和技术障碍。议题包括研发用于收集在线媒体数据的新工具,以及处理跨国平台时遇到的困难。
档案保管员遇到的一大技术难点就是选择能够经得住时间考验的储存介质。正如软盘会消失,光碟也越来越少见,记忆卡和U盘一类的现代储存介质也可能被更新的技术取代。磁盘和硬盘最终也会由于理化性质老化而报废。
为了保障介质损坏或技术过时情况下的数据获取,档案保管员需要定期将数据转移到新的储存媒介中。但是每次数据转移都可能发生错误。为了找到这些错误,档案保管员会在拷贝原始文件之前生成一种“数字指纹”(digital finger-print),也叫哈希值。
数字指纹这种字符串对原始文件来说是独一无二的,因此可被用于校验拷贝是否和源文件相同。如果文件在拷贝的过程中发生了变化,那么哈希值就不再匹配,档案保管员就会被提示重新再复制一次。
有时候,为了保存数字对象,需要故意对其进行修改。比如,去掉音频录音文件里的噪声。即便如此,档案保管员也需要尽可能地保存原始主文件。
新西兰国家图书馆的数字保存团队主管Steve Knight说:“维护数字原版的一个原因是,二三十年后,可能会出现某种新技术,让我们能够以现在无法想象的方式读取原版文件。”档案保管员采用各种各样的设备和技术来保护原版文件,比如防写装置就可以防止计算机在连接的硬盘上写入数据。
由于软件和文件格式变化速度快,这些硬件问题愈发告急。在现代设备上通过复制已过时的软件来读取特定格式的文件不是不可能,但是如果对源文件格式或软件所知不多,那就需要耗费大量的搜索查证工作。
2013年,卡耐基梅隆大学的计算机俱乐部花了几个月的时间做逆向工程,终于从流行艺术家安迪·沃霍尔(Andy Warhol)的Amiga软盘中恢复了一些隐藏的图片文件,得以复制沃霍尔著名的汤罐和其他数字实验作品。修复后,这些文件可以被转换为现代格式或标准格式,但是源文件的一些属性或其中包含的信息可能会丢失,比如照片拍摄地点的元数据。
最终的技术挑战在于,要确保未来的学者能够调用数据来源。和传统人工制品相比,数字对象更容易被篡改。不过,拷贝文件时所采用的检验和保护工具让档案保管员可以防止或侦测恶意篡改。Knight表示说:“数字对象的完整性和真实性是数字保存工作的核心。”
联通各处
如果国家图书馆的目的是保存一个国家的记忆,是提供Knight口中的“和未来联通的通讯线路”,那么就必须有一种机制让图书馆可以获取资料。许多国家针对书籍和期刊等纸媒出台了法律条款,要求出版商为国家图书馆提供副本。
2003年,新西兰成为首个要求数字对象也必须遵从呈缴制度 (Legal Deposit) 的国家。因此,新西兰国家图书馆有权对新西兰境内的网站以及在该国境内创造出来的其它数字材料归档。此外,只要受版权法保护的数据不在未经允许的情况下使用,那么该国图书馆就能够绕过版权保护协议保存数据。
但是,仍有许多数字材料不在此类法律的涵盖范围之内。最重要的是,档案管理员想要保存的信息大多掌握在大型跨国企业的手里,它们恐怕没有兴趣配合图书馆。
哈维记忆计划旨在保存来自公众的关于飓风哈维的图像、视频和个人故事。
来源:Arun Chaudhary/哈维记忆计划
Knight举例说,大多数由新西兰人制作的音乐储存在Bandcamp等在线平台上,这些平台没有动力把音频文件呈缴到国家图书馆里。社交媒体以及其他在线服务的跨国性质意味着“许多行为实际上发生在境外,涉及国家机构应该如何建造和维护本国的数字历史记录时,不免出现各种法律、社会和文化问题”。
不同国家的图书馆本可以通过合作,跨越国境障碍。但是法律差异使得这种方法也行不通。比如,不同的国家对呈缴制度所涵盖的材料有不同的规定;有关诽谤、淫秽和渎神的法律规定也不尽相同。
如果人们在国外旅游的时候在线发布图片和文字,这对国家图书馆来说就是另一个呈缴难题了。不同国家的呈缴制度不同,它们并不总是允许搜集本国国民在国外发布的数字材料。因此,国家图书馆有时候可能需要确定所涉数字材料是在国内发布的还是在国外发布的,这就让材料收集过程变得极为繁杂。Knight建议,档案保管员应该大胆行动,先斩后奏。
公司和个人所发布的数字信息的体量也加大了收集工作的难度。2010年,美国国会图书馆和推特达成了一项协议,美国国会图书馆可以将该公司于2006年成立之日起的所有推特内容归档。
2013年,美国国会图书馆宣布收集了2006-2010年间的所有推特,并且建立了一套管理后续推特流的程序。当时每天都会产生近5亿条推特。但是美国国会图书馆最近修改了它的收集政策:从2018年初开始,它将有选择性地收集推特信息,因为推文、照片和视频的数量持续攀升。在找到低成本的检索方法之前,目前该图书馆较为有限的推特档案是禁止公开的。
美国国会图书馆按照该馆的一般馆藏指南,挑选要归档的推特信息,也就是着重保存和国家利益相关事件的材料。但是,这种做法就引发了一些疑问,如哪些资料应当作为国家记忆被保存。数字技术应当更关注少数群体或是边缘群体的呼声,但是这种多样性并没有一直得到维护。国家图书馆并不是完全中立的数据库。无论是有意还是无意,对于馆藏信息的筛选反映了社会的不平等和偏见。
私人问题
国家图书馆被迫要做出艰难的选择,而社交媒体公司有能力在它们的数据中心里储存我们的海量私人数字信息。但是,这些公司并不是为了公共图书馆才储存这些海量信息,而是因为保存用户的信息有利可图,即使用户亡故也一样。
只要死者的账户还能引起亲友的注意,让他们有所行动,那么死者依然有商业价值。关于该如何处理用户死后的账户,脸书和谷歌各自有相应的政策,用户可以自行选择。死者账户可以保存图书馆不保存的信息,但是它们能存留多久取决于它们的商业价值。
数字遗产的管理还催生了一系列新的法律问题。英国阿斯顿大学的媒体和隐私法高级讲师 Edina Harbinja说:“现行的解决方案并不完整,有时会引发问题。”比如,它们可能会和遗嘱或遗产法发生冲突。她说:“某个朋友可能是谷歌或脸书服务的遗产受益人,但是他们不是能够继承死者财产版权的继承人或近亲。”如果死者账户里包含受版权保护的内容,那么就会产生混乱。
不同国家的隐私法和继承法也各有不同,这可能进一步使相关政策的解释和执行变得复杂。Harbinja认为这些问题将推动形成一个更完善的“社交媒体遗嘱”系统,因为数字遗产相关法律会不断发展,在理想的情况下,不同国家之间的法律差异能得到调和。
尽管做出了诸多努力,我们的数字遗产依旧命运多舛。2012年,一名15岁的德国女孩被地铁撞击身亡。她的父母想要取得她的脸书账户的完整访问权,因为这样可以寄托他们的哀思。不仅如此,他们也希望可以从中找到线索,以了解女儿是不是因为遭遇网络霸凌而自杀。2015年的一审判决把账户判给了他们,但是对方上诉,2017年一审判决被推翻。这场争议的核心是,女孩和脸书的协议是否像书信日记那样可由其父母继承,另外这种继承是否违反隐私法。
2018年7月,德国联邦最高法院判定这对父母可以拥有女儿的账户,即社交媒体账户的继承应遵循和书信相同的原则。但Harbinja对这个判决表示不服,她认为德国联邦最高法院忽视了一些基本的伦理问题。她认为不管在什么条件下,和脸书签订的协议纯粹是私人的,而隐私权在本人身故之后依然有效。
此外,授予继承人访问账户的权利使他们能够查看死者生前与其联系人私下分享的信息,这就触犯了隐私法。Harbinja 告诉澳大利亚广播公司,“网络上的自我和身份代表远比信件和照片复杂。”她认为处理方式应该因人而异,不应该一刀切。
除了法律问题,数字遗产的商业化管理意味着,死者数字遗产的使用将受到利益的驱使。这可能导致数字遗产被当成商品销售,死者亲属的悲痛被人利用(见“数字永生”)。
牛津大学数字伦理实验室的Öhman 和 Luciano Floridi倡导将数字遗产视为物理遗产的延伸,“数据不仅仅是我们拥有的物品,比如一辆车,还是我们身体的一部分,如同我们的胳膊一样。如果有人侵犯我们的隐私,那么我们失去的不是一件物品,而是对我们身份的控制,是尊严。因此,如果说我们的隐私权能在我们不知情的情况下被侵犯,在我们死后它也同样可能被侵犯。”
数字永生
当你死后,对你的数字遗产的处理将不可避免地引发尊严和商业开发相关的问题。传统的社交媒体公司至多把死者的个人页面变成缅怀页面,但类似于Eternime 和 Eter9 的“数字来世”初创公司则提供更加大胆的服务。
在被授权访问你的社交媒体账户后,它们的算法会分析你的照片、链接、发布的文字和人际互动数据,然后据此创造你的“虚拟人”——可以和你的亲友互动的数字分身。虽然这些服务尚未上线,但是已有数万人订购,这说明数字永生极具吸引力。
伦理学家对这些数字分身可能引发的伦理困境发出了警告。牛津大学数字伦理实验室的Carl Öhman认为,“如果公司之间争相‘消费’死者,那么左右我们对死者的记忆的就只会是利益,而不是公正、历史价值、情感价值等,除非后面这些伦理原则正好合消费者的心意。”
这些网站的聊天机器人也可能逐渐偏离本人的真实样貌。经济利益可能驱使这些公司根据商业目标控制聊天机器人,他们可能无意真实地还原死者。例如,由于参与度在社交媒体上是一种极为重要的商业指标,因此聊天机器人可能会比本人更加外向健谈。
因为这些担忧,Öhman认为数字来世公司应该确保做到以下几点:第一,消费者清楚在自己百年后,自己的数据将被如何呈现出来;第二,聊天机器人的人设不会和本人相差太大;第三,用户只能上传自己的数据,而不能上传亲友的数据用于制造数字分身。
随着我们的生活和数字通讯关系越来越紧密,我们选择保留什么材料以及如何管理这些材料,将在我们的文化遗产形成中发挥越来越大的作用。飓风来袭后,记录社交媒体帖子似乎无关紧要,但是这背后的动机和一百年前的图书馆收集制作剪报和一手情报的活动是一样的,它们都可以增加我们对灾害的认识。新技术带来了新挑战,但是鲜有人会质疑保留可能转瞬即逝的记录的重要性。
原文以Saving the digital world为标题
发布在2018年11月28日的Nature Outlook上
ⓝ
Nature|doi:10.1038/d41586-018-07505-8
点击“阅读原文”阅读英文原文
热门文章
点击图片阅读:电脑没了软驱,要怎样从软盘上提取有用的旧数据?
点击图片阅读:让美国人人自危的心理因素营销,真的有科学依据吗?
点击图片阅读:你的下一个转型,会是成为数据科学家吗?
版权声明:
本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件Chinapress@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。
© 2019 Springer Nature Limited. All Rights Reserved