杨庆峰:“码”时代人类深度数据化及遗忘伦理的建构
The following article is from 探索与争鸣杂志 Author 杨庆峰
“码”时代人类深度数据化及遗忘伦理的建构
杨庆峰 | 复旦大学生命医学伦理学研究中心教授、复旦发展研究院研究员
本文将刊发于《探索与争鸣》2020年第9期,具体内容以正刊为准
标题系编者所加,为方便阅读,有删减
非经注明,文中图片均来自网络
健康码是与物质身体有关的二维码,不同于支付码,健康码的开发源于此次新冠肺炎疫情,从本质上看健康码是数字对象。有两位技术哲学家对数字对象的哲学分析对接下来的工作是有价值的:一位是美国技术哲学家唐·伊德(Don Ihde),他从同构与异构的角度对条形码做过分析。在他看来,条形码与对象之间已经不是表征关系了,其中有了很明显的技术转换层次。他的分析是在后现象学框架之下展开,重点在于揭示技术与人类行为之间的关系;另一位是英国学者弗洛里迪,他从知识论出发,对数据、信息等的分析提出了特定的伦理维度,尤其是对数据的四种解释给人印象深刻。他强调伦理学的分析,重在展示数据、信息和算法的伦理体系。由于本文预备讨论健康码的伦理问题,故选取弗洛里迪作为出发点,健康码伦理问题分析主要从“数据即记录”这样的一个维度出发,并试图展示其中暴露出来的伦理问题。
记录:数据的奠基性规定
弗洛里迪2008年提出了数据的四种解释:知识解释(The epistemic interpretation)、信息解释(The informational interpretation)、计算解释(the computational interpretation)和差异解释(the diaphoric interpretation)。这四种解释之间存在着克服各自解释局限的逻辑关系。从这个意义上看,知识解释是源头。知识解释强调数据是事实或自我确认事实的表征/再现。数据是现实世界之物的表征,这种观点在经济、社会等领域比较流行。因为数据是依托计算机技术发展起来,以0和1为基本单元构成的对象也就是表现为虚拟对象,这些虚拟对象组成的是虚拟世界,二者之间存在着平行对应关系,比如实体空间与虚拟空间、实体经济与虚拟经济的对应就属于此列。数据是自我确认事实的表征,这种观点在信息和媒介领域较为常见,有助于我们理解信息闭环。弗洛里迪对数据的理解也表现在这样一个不断发展的批判逻辑上。但是他的批判还是忽略了表征内在的规定性。
弗洛里迪
表征(representation),又可以翻译为再现、代现,是一个非常复杂的哲学概念,有着一种外化的规定。康德、叔本华以及胡塞尔都从不同意义上使用这个概念,如康德的物自体显现、叔本华的意志显现和胡塞尔的不同于知觉的意向活动。此外,表征物与被表征物之间存在着平行关联。在表征过程中,表征物同时也是对被表征物的另类保持。比如,一张苹果的普通照片表征了某个苹果。而在数字照片中,情况则有些不同。数字照片是二进制数位的构成,一张苹果的数字照片和真实苹果之间是看上去像的关系。我们试想这样一个体验:在一个数字照片清晰显示之前是模糊的,数位的集合让我们无法辨认对象。这是一个隐藏在记录之中的过程。在大多数人看来,记录(record)是简单的、纯粹经验性的概念,在日常生活中大量地被使用。然而,这一概念却隐含着的与记忆有关的维度。在古希腊-拉丁语词典中,记录有两种表达:其共同的意义是“一种回想的能力,拉回到心灵的活动。”“强调回想”是记忆的根本特性,这不仅是胡塞尔,也是利科在回忆问题阐述中强调的本质规定。这一考察让我们获得了一个结论:记录不仅仅是保持,还有回想的一个规定。只是在技术层面,由于这一概念在演变中“保持”的特性被保留和强调遮蔽了内在的回想维度。“数据即记录”恰恰突出了技术介质的存在,即对事实状态的另一种形式的保留。为什么会发生这种转变?一种可能的情况是这个概念被用于信息记录、保存等技术装置,而技术装置的非人化使得与人有关的回想维度被消除,而保持的维度却得到了格外的强化。
因此,数据即记录是表征论中内藏的维度,弗洛里迪对其进行发展的时候忽略了记录本身的记忆哲学的维度,而只从这种原始的规定中看到基本的一面,缺乏了回想和保持,也就没有了虚拟与现实世界的对应,算法也就完全脱离了经验世界。因此,数据即记录也是奠基性的维度,关系论在这一规定之上逐步构建起自身。此外,数据的知识性并不是根本的规定性,科学家从其中进行推理而获得的知识只是其次,更为重要的是通过对数据相关关系的挖掘,重新建构出新的对象。
大数据的闭环式记录
大数据、人工智能的发展极大推进了人类“深度数据化”进程。人类深度数据化从三个维度形成了特定的闭环:最基础的是物质维度,物质身体的生物信息、生命指标、活动轨迹都已经被数字化,呈现在终端和云端,此次疫情期间的健康码和行程卡就是最为典型的代表。物质维度之上是精神维度,人类的认知、情绪和同理心等都被可计算化,这一方向开始从人工意识和人工情绪的名义下被研究。还有一个既不属于物质也不属于精神的信息维度,一切错误的、正确的、虚假的、真实的信息,我们愿意接受的信息和不愿意接受的信息,完全被算法化,因此,一个尖锐的问题就出现了:是否会出现马克斯·韦伯担忧的铁笼效应?那么如何实现如何破解呢?
在物质维度,数据化的进程已经在快速推进了。笔者曾经指出,随着网络技术、虚拟现实技术、智能技术等现代技术的发展,城市空间生产的虚拟化特征越加明显。在现代城市中,各种信息监测设备在收集着每个人的数据、生命特征指标,将采集到的数据会聚到某个数据计算中心,然后分类存储,用于开放和使用,也为了未来的交易。
在日常生活背后有两套运行机制在有效运行着:一套是技术流程机制,数据被收集、存储、加工和开放起来;另外,使用微信进行支付成为一种常态,被拒绝使用现金也似乎正在成为一种常态;出行更是借助了各种App,以便快速获取到性价比最高的信息,如机票、住宿和餐饮。社交、消费、出行等人类活动成为日常状态中最为常见的数据采集领域;疫情紧急状态下,人们的物质身体状态、活动轨迹成为最重要的信息采集领域。在紧急状态下,人们的底层生命特征也被批量收集。这些数据被汇总,最终生成了健康码和行程卡的可见页面。行程卡是通过维信内嵌的App生成行程卡(只需在小程序上填写手机号和验证码),反映行动轨迹(是否出入疫区、疫情国)。健康码是通过手机终端生成个人健康码(需要人脸识别开通),反映身体状况(如体温)。身体状态与行动轨迹一起组合构成物质层面的“数据化闭环”。
在精神维度,数据化的程度弱于物质维度,从日益发展的神经科学、人工智能进展可以窥探到其中的可能性。从人工智能角度看,人类的心理活动逐步开始可计算化,比如认知计算、情绪计算。如果按照哲学一般的心灵分类,还有意志欲望领域,可以设想,意志与欲望计算也将成为下一个目标。目前这是一个哲学猜想,但是可以确定的是,同理心计算正在成为一个可能的点。从神经科学领域,科学家已经将目标转向了揭示同理心的神经机制,根据中国神经科学家蒲慕明的观点,神经科学会已自我、非我与同理心等问题作为下一个研究目标。如果这一点取得突破,那么人工智能的同理心实现就不再是哲学设想,而会成为科学的实践。此外,“读心术”的发展更是推动了这个过程,“读心术”通过fMRI等技术将语词与大脑神经元活动关联做起来。我们可以通过读取神经元活动区域转化为可识别的语言文字。相比物质层面的数据化,精神层面的数据化进展更加缓慢,但是其后果更加令人担忧,也会引发争议性的问题。比如是否要设计具有同理心的机器人?如何防止产生会怨恨、具有报复心的机器人?
信息维度的数据化主要表现为媒介信息的获取。我们认知世界和展示自我更多是通过自媒体来进行。信息是我们认识世界的通道,同时也是产生误解的根源。信息闭环的形成很容易让人想到“信息茧房”,“茧房”概念是对信息认知的一个后果比喻,也有利于说明信息闭环,但是从本体论角度看,物质、精神和信息属于不同的本体论区域,所以其数据化的展开维度也存在极大区别。物质和精神领域数据化行为的本质是表征,采集设备忠实地将物质与精神的状态记录下来;而信息层面数据化行为的本质是调节,各类信息调节引导着人类的认知,影响着人类的行为。
以上是从本体论维度分析的数据闭环,那么,数据化闭环的经验形式有哪些呢?经分析,至少可以概括出四种形式:
第一,数据化闭环的技术形式,其主要问题是怎样数据化?数据科学、可视化、手机终端与终端管理机构成为数据化的技术支持;第二,数据化闭环的人文形式,其主要问题是什么被数据化?正如上文分析指出,人类身体与精神、身体与行动的数据化已经基本实现;第三,数据化闭环的空间形式,其主要问题是哪里的对象被数据化?地理空间,如城市、乡村等数据化程度存在极大差异;第四,数据化闭环的时间形式,其主要问题是什么时段的对象被数据化?历史对象、当下对象与未来对象都已经借助数据被展现出来。深度数据化的本质是形成数据化闭环的过程。基于数据化闭环的技术形式和人文形式,数据化闭环导致的结果是理解人类行为;基于数据化闭环的空间形式和时间形式,数据化闭环会改变人类行为。那么,数据化闭环的本质是什么呢?借助上文的分析,数据化有一个记录这样基本的规定性,它是一个内涵更为丰富的概念,在记录之上,有预测行为和筹划未来的这一特性。从技术哲学的角度看,数据化也是此在的前结构向未来进行筹划的存在方式。但“向未来进行筹划”活动并非是理解活动,而是改变和行动。
数据闭环的伦理问题通过分析,本文确立了两个基本的前提:健康码属于物质层面的人类数据化的产物,健康码是数据记忆的呈现。接下来要从这一前提出发探讨其中的伦理问题。如果说,健康码是数据化的产物,数据活动被分为六个环节:收集、存储、加工、使用、提供、交易和公开。如此,相关的问题可数据活动的六个环节展开分析。
第一,与收集、存储、加工和使用有关的数据来源中的伦理问题体现为边缘性利用与透明性。本文要强调的是各App采集用户数据中隐含的边缘性利用导致的安全问题,所谓“边缘性利用是游走在合法与非法的边缘地带的数据利用”。健康码的推广和使用完全是因为抗击疫情紧急形式的需要,在某地取得胜利后被迅速推广到全国,而背后的合法性却因为紧急状态而未来的加以反思。我们很容易想起心理测试App的案例。另外一个伦理上的困惑是透明性问题。手机号如何与行动轨迹关联?这里面经过了怎样的技术过程?没有任何人给予解释说明,在同意授权书上也没有明确标记指出相关采集数据在未来会用于哪些App使用,整个过程都变成为黑箱。所以,在这一采集阶段,不透明性不仅仅表现为技术原理上,还表现在技术未来的应用上。但是,更多人只是关注技术本身的不透明,而对边缘性利用缺乏足够的关注。
第二,数字码公开推广的适用性问题。一个行为的合理性通常可以找寻到两种根据:自然合理性、事件合理性。自然合理性是指借助人们对于技术的自然依赖性而建立的合理性。人们使用一项技术之后,如果好用并且解决问题,那么会产生依赖性,而这种依赖性就会成为技术合理性的一个根据。但是很多技术在进入人们的生活之前会遭遇到各种抵制,人脸识别就是一个非常典型的例子。此时,我们就会看到第二种合理性的形式事件合理性:特殊事件为受抵制的技术的使用提供了合理性基础。自然灾害、战争和病毒都会成为事件爆发点。此次疫情就是一个典型事件。在疫情紧急状态下,人们被隔离在私人空间中,无法进入公共空间;疫情好转的情况下,绿码是确证自身能够进入、参与公共空间构建的合法性根据。比如进出游泳馆、篮球场、体育馆都需要出示您的健康码;而红码是绝对被禁止入内的。在卡、码生成的过程中,我们的健康与行程数据已经在云端,等待着被挖掘和使用。
第三,健康码、行程卡的数字信任问题。经过此次事件,健康数字码已经具有了一种公认的权力,被推广到全国,成为企业复工、出入公共场所、乘坐公共交通工具的重要依据。这形成了某种意义上的数字信任。这种数字信任的基础主要表现为三个方面:其一、国家公信力赋予健康码以可信度,这是数字信任的价值基础。其二、数字技术的可靠性(即时表达、数字痕迹)成为数字信任的技术基础,数据与身体健康、行为轨迹之间存在着表征关系,数据是这些活动的记录,是一种可采信的痕迹,这是数字信任的技术基础;其三,人们自身的技术依赖也成为数字信任的心理基础。但是,在数字信任上也会存在一些误差,还有数字偏见也成为数字信任的重要障碍。当人们看到红色健康码,不由自主地产生恐惧感,而这种恐惧感导致了不信任的出现。所以,我们会看到在健康码的地区互认上存在一些问题,偏见问题也不容忽视。
第四,数字治理的自我转变。目前,在数字治理方面一定要实现一个转变:从管理到治理。为了抗击疫情,政府加强了对人的管理,尤其是做到单位负责制。每个人要向单位每天报备健康状况,公共场合,如机场、火车站、医院、学校、餐厅等通过行程卡、健康码的状态对人进行动态管控。管理模式的哲学根基是表征模式和调节模式。这种模式的应用弊端是强调了疾病状态之下的人员控制,数据治理是事后诸葛亮。而最优的方式应该属于预见式的。大数据的一个本质特征是预测性的数据,那么完全有可能实现对疾病疫情及其发展做出预测。如果按照这种思路,数据治理需要利用AI的深度学习,从大数据中挖掘到人类的行为模式,为未来做出前瞻性的分析,其哲学根据是驱动模式。
第五,随着数据深度化的加快,数据化闭环会成为一个逐渐合拢的趋势。如果按照新基建发展的趋势,整个城市会成为智慧城市。人们处在智慧体之中,自身生产的数据包围自己和他人。那么这是否会出现韦伯式的担忧呢?
第六,心理健康码的可能性。在上文笔者已经提出,目前人类面对的大数据闭环在物质和信息维度上已经被充分地感受出来,但是在精神维度上呈现较少。但是,与物质身体健康对应的心理健康码是否会成为一种可能,这一问题也必然会涌现和被面对。人们已经将智力和情感数量化测定,那么离判断某一范围的心理状态是否属于健康也没有多远,况且这方面技术实现已经不是问题。所以,推出变色龙式的健康码纯属于无聊之作,但是心理健康码的推出却会带来极大的伦理争议。
以上所列出的六个方面的伦理问题属于健康码带出来的伦理思考。这种思考是作为与健康码的隐私和信息安全问题的重要并列维度。在讨论信息安全的时候,不能忽视更为普遍的问题。
数据伦理问题的破解可能性
我们已经呈现了数字化生存的本质:我们被数据化,我们自身以及行动被记录下来,数据调节和塑造我们的行为。数字化生存背后的关键问题是:数据即记忆。在数字时代,记忆是一种美德,这种数据记忆的伦理观念演化到极致形态,一切都可以被记录,这是技术上的可能性;一切都应该被记录下来,这是记忆伦理的极致,记忆伦理也获得了最好的实践契机。但是这样一种形态和伦理存在极大问题:是否有一种智能体能够永恒地拥有这些数据,必须要为这样的智能体划定一个界限,使其从技术上和制度上无法永恒地拥有和管理这些数据。从理论上看,破解的一个可能性就是要重构数字时代的遗忘伦理,强调遗忘意味着数据本身是可删除的,数据的删除是合乎善的。在重构过程中,我们会碰到两种路径。
第一种路径是强调“遗忘是美德”的观点。舍恩伯格在《删除:数字时代的遗忘美德》中指出数字时代遗忘是一种美德。 在他看来,传统强调记忆是美德,遗忘是恶德,而颠倒的结果是遗忘是美德。这是在颠倒过程中存在着的不对称性现象。在伦理上,去挑战“记忆是美德”的观点其命运必然是失败的。此外,在知识论领域,遗忘的美德性有了更多的论述,米歇连(Kourken Michaelian)提出了这一点。不同于一般性技术,数字伦理导致的数字记忆的问题,可以通过数据技术本身来克服。
舍恩伯格
删除可以通过两种方式实现:其一是类似于数据的自动擦除。当数据超出期限,可以执行类似的删除数据的程序。其二是依法删除,当数据超出期限,数据拥有企业需要对相应的数据依法作出删除处理。二者都必须依据特定的自动执行程序。如果是这样,我们会发现数据铁笼会在一定期限内实行自我删除,铁笼会自我消解。而这在传统的技术时代是不可想象的,我们无法想象能够自我删除的技术。如此,数据遗忘就需要作为一个重要伦理概念被确立起来。“数字遗忘是一种美德”是被确立起来的第一阶段。这种说法尽管在理论层面具有吸引力,但是在实践层面却容易碰到障碍。数字删除对于数字活动主体来说是难以接受的。如果数据是一种企业拥有的资产,那么这种资产怎么可能被轻易放弃呢,更不要指望企业从美德角度去实现。
第二种路径是强调“遗忘的主动作用”的观点。如果说,作为美德的数据遗忘失去了实践的根据,那么我们从何种角度去论证遗忘的伦理地位呢?“遗忘的主动作用”是遗忘伦理的第二个可能性出路。无论是在哲学界还是科学界,主动遗忘已经作为一个积极的概念开始被论证出来。遗忘的主动作用强调的是遗忘行为产生的良好结果,这能够作为一个很好的数据主体遗忘伦理的根据。这种观点是要扭转“遗忘是被动的”,也是对传统记忆观念的一个批判。在传统的记忆观念中,记忆是主动的,而遗忘是被动的现象。但是其关于遗忘的预设还是遗忘的衍生性。
我们要寻求的是第三种路径,这种路径就是强调“遗忘的原初性”。在哲学传统中,记忆总是对象化的记忆,回忆行为建构回忆对象,记忆行为保留知觉对象。而遗忘在通常被看作是对象的消失。即便是在康德的人类学那里,记忆是注意力的集中,而遗忘也是注意力的消散。但是遗忘的一个非常重要的特征是让我们重新回到了对象被建构起来的前阶段,一种既是绵延的,也是离散的前对象状态。这恰恰是数据对象的原初状态,出于数据又回归数据。我们会发现数字物恰恰是把我们从数据原初状态拔离的过程。大数据恰恰是在不断建构数据对象,一种在数据相关关系中建构对象的过程。而这种建构会随着算法的变化发生极大变化。所以数据遗忘伦理的根据需要从遗忘的原初性获得,而并非遗忘的美德或者遗忘的主动性。
事实上,健康码的伦理问题最终让追问者走向数据本身以及遗忘伦理的建构。导致健康码开发的是特殊的紧急状态,支撑健康码前行的是技术与制度。健康码是与物质身体有关的数字对象,在走向合法化的过程中,会产生和面对不少伦理争议。比如健康码常态化应用合理性、渐变色的健康码是否必要。有学者提出“要防止健康码结果视为绝对标准” 这一点很必要,红码并意味着绝对不健康,要防止技术原因导致的被红。如果走向精神健康或者心灵健康的呈现,推出精神健康码尤其是格外需要警惕的。从数据本身看,数据活动的宏大主体希望的是强调保留的数据伦理,因为是作为资产,这些数据希望永久的被保留。相应伦理问题更多集中在如何符合伦理地收集、如何符合理性地的处理数据;但是,从数据活动的指向对象来说,必然会遭遇到数据记忆的伦理困境。数据编码让我们不断被记录,对象化算法让我们不断被记起,从数据遗忘的原初状态中建构数据对象。这二者之间的矛盾难以消除。
所以,在特定情况下,删除成为可能性的选择,我们更渴望回复到被遗忘的状态,一种处于前数字对象的生存状态。我们通过分析要展示的是:除了关注被数据隐私、安全等经验伦理问题遮蔽的深层次生存论问题,还需要重思数据遗忘伦理的建构问题。数据遗忘伦理不似传统的记忆伦理极度批判遗忘,而是在肯定遗忘的地位同时更是在数据记忆与数据遗忘之间找到一条中间路径。
来源 | 探索与争鸣 微信公众号
往期精选