数据化,数据主义和数据监控:科学范式与意识形态之间的大数据
Datafication, Dataism and Dataveillance: Big Data Between Scientific Paradigm and Ideology作者:何塞·范戴克(José van Dijck,乌德勒支大学媒介与文化研究系)引用:van Dijck, José. 2014(标题中的年份是笔误). Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology. Surveillance & Society 12(2): 197-208.
2013年6月10日,爱德华·斯诺登(Edward Snowden)向新闻媒体举报了美国国家安全局(NSA)的常规监控工作。他详细描述了所谓“压迫的架构”(architecture of oppression),该架构使他和其他美国国家安全局合约商截获30亿个电话的元数据(metadata),也能截获Facebook、谷歌、苹果及其他科技公司的交互记录。
在一次录像采访中,这位前中情局分析员表示,他不能再忍受自己不得不代表情报界侵犯隐私和法律。他还想让人们意识到,许多特工完全可以接触到各种通信数据,因此他希望能引发一场公众辩论。斯诺登披露的事给公民敲响了警钟。人们通过社交网站或应用程序“分享”个人信息——从婚姻状况到感冒,从饮食习惯到喜爱的音乐,一切都成为新的规范(norm)。平台所有者经常与第三方分享用户的汇总元数据,用定制化的营销换取免费的服务。很多人可能没有意识到,直到斯诺登的泄密事件为止,企业的社交网络也在自愿或不自愿地与情报机构分享他们的信息。奥巴马为政府的大规模监控政策辩护时说,“棱镜计划”(PRISM)“不涉及内容,只是元数据”,并说公民不能期望百分之百的安全和百分之百的隐私,不然一定会造成不便。总统的解释呼应了社交媒体公司的论点,即用户必须放弃部分隐私以换取免费的便利平台服务。换句话说,元数据似乎已经成为公民为其通信服务和安全付费的常规等价物。这种交易依附于大多数人的舒适区。是什么容忍了“老大哥”和“大企业”经常获取公民个人信息(也称为大数据)?部分原因可能在于数据化(datafication)逐渐成为一种科学和社会的新范式(paradigm)。梅尔-勋伯格(Mayer-Schoenberger)和库克耶(Cukier)认为,数据化将社会行动转变为在线量化的数据,从而允许实时跟踪和预测分析。企业和政府机构通过社交媒体和通信平台,如Facebook、Twitter、LinkedIn、Tumblr、iTunes、Skype、WhatsApp、YouTube,以及gmail和hotmail等免费电子邮件服务,挖掘成倍增长的元数据,以追踪人类行为信息:“从电话披露的关系到推特表露的情感,今时今日的我们可以收集以前无法收集的信息。”数据化是获取、理解和监控人们行为的合法手段,它不仅在技术专家中成为最主要的原则,在那些将数据化视为研究人类行为的革命性研究机会的学者中也是如此。在这篇文章中,我想解构梅尔-勋伯格和库克耶定义的数据化的意识形态基础,这个意识形态基础获得许多该新科学范式支持者的响应。我认为,在许多方面,数据化植根于值得商榷的本体论和认识论。得到这一新科学范式的许多支持者的响应。我将论证,在许多方面,数据化植根于值得商榷的本体论和认识论。无论一些大数据应用研究的例子多么引人注目,数据主义的意识形态都显示出一种普遍的信念,即相信通过网络媒体技术可以对各种人类行为和社交行为进行客观量化和潜在跟踪。此外,数据主义还涉及对制度性机构(agents)的信任,这些机构从社交媒体、互联网平台和其他通信技术中摘取(元)数据,以供收集、阐释和分享。
艺术家Mario Klingemann的装置作品Circuit Training邀请参观者参与一个神经网络训练程序来创造一件艺术品。参观者帮助创建数据集,让人工智能捕捉他们的图像,然后从网络产生的视觉效果中选择人们认为有趣的东西。机器将在这个过程中完成与人类的互动,并从人类这里学习以完善自己的网络。(来源:伦敦巴比肯艺术中心)在理解数据监控时,“信任”(trust)和“信念”(belief)的概念尤其相关。数据监控是一种使用(元)数据来维持的监控形式。正如斯诺登的文件所表明的那样,人们对处理他们(元)数据的机构有信心,因为这些机构被假定遵守了由公共问责机构制定的规则。然而,记者发现,美国国家安全局经常藐视法院对数据使用的裁决,就像企业不断挑战侵犯隐私的法律限制一样。更深刻的是,斯诺登文件进一步让人们看到政府情报部门、企业和学术界在适应数据主义意识形态前提下的裙带做法。因此,我们需要研究整个连接性媒体的生态系统的可信度。政府、企业和学术界在处理我们的数据方面有哪些独特的作用?而面对这个复杂的网络信息流系统,需要什么样的批判态度?在过去的十年里,数据化已经发展为公认的理解社会性(sociality)、社会行为(social behavior)的新范式。随着Web 2.0的出现及社交网站的激增,社会生活的许多方面被编码(coded)。友谊、兴趣、闲聊、信息搜索、品味的表达、情绪反应等等这些从未被量化的东西被量化了。
Bernd Lintermann和Peter Weibel的装置作品YOU:R:CODE。参观者刚进入时在镜子上看到自己熟悉的身影,后来镜子中的形象逐渐转变为数字,直到最后,参观者沦为一个工业上可读的代码。(来源:ZKM_Hertz-Lab)随着科技公司开始专注于在线交流的一个或几个方面,他们说服了许多人将他们的部分社会互动转移到网络环境中。Facebook把“加好友”和“点赞”等社交活动变成了算法关系(algorithmic relations)。Twitter通过创造“关注”和“转发”功能,让人们普遍以在线角色推广了各种想法。LinkedIn把雇员和求职者的职业网络转化为数字界面。YouTube则把视听内容的随意交流数据化。量化的社会互动随后被提供给第三方,不管是同伴、公司、政府机构,还是其他平台。社交的数字化转型催生了一个产业,该产业以数据和元数据的价值为基础,自动记录显示谁与谁交流,在哪个地点,以及交流了多长时间。元数据不久前还被认为是平台中介服务的无价值副产品,现如今已经逐渐变成了宝贵的资源,可以被挖掘、丰富和重新利用为珍贵的产品。行业驱动的数据化观点不仅在企业家红红火火的淘金热中引起共鸣,研究人员也将大数据誉为行为知识的圣杯。谷歌、脸书和推特上获取的数据和元数据通常被认为是人们实际行为或情绪的印记或症状,而这些平台本身仅仅被认为是中立的促进者。Twitter可以将人们的情绪、想法和直觉数据化,因为该平台记录了“自发的”反应。用户会无意识地留下痕迹,所以数据可以“被动地收集,而不需要太多努力,甚至不需要被记录者意识到”。分析师们经常把对推文的大规模计算描述为使用温度计来测量人群对社会或自然事件的“热度”。这种假设的前提是网络社交流量通过中立技术渠道流动。在这种推理中,Twitter通过标签(hashtags)、转发、算法和协议进行的技术调解,以及它的商业模式似乎都无关紧要了。赞同数据化范式的研究者响应这些主张,认为社交媒体数据是自然痕迹,平台是中立的促进者。信息科学家在处理人们关于地震或其他灾难的推文时,将Twitter称为实时事件的“传感器”(sensor),Twitter也被称为人们政治倾向的“情绪探测器”(sentiment detector),Twitter用户对特定视频片段的反应也能用来理解用户“情绪的动态”(dynamics of sentiment)。评估通过社交媒体平台收集的大数据集越来越多地被认为是衡量日常互动的最严格、最全面的方法,优于抽样(“N=all”),也比采访或民意调查更可靠。大量“乱七八糟”的数据取代了少量的抽样数据。支持者断言,数据集的巨大规模弥补了它们的混乱。一些信息科学家认为,Twitter实际上是一个巨大的实时民调工具,随时准备成为“传统民调的替代品和补充”。民意调查和推特数据之间有重要的相似之处,推特结果中发现的相关性显然是有意义的。然而,关于Twitter所谓的代表性和(技术和商业)偏见却没有得到很好的解决。数据通信的狂热者还经常假设数据和人之间存在不言而喻的关系,然后用数据集来预测个人行为。例如,凯西亚(Quercia)等人分析了个性(personality)与不同类型推特用户之间的关系,发现受欢迎和有影响力的用户既有想象力又有条理。在这些模式的基础上,他们推测哪些用户可能会成功推荐产品或帮助提升营销策略。在这种情况下,Facebook“点赞”被用来“自动和准确地预测一系列高度敏感的个人属性,包括:性取向、种族、宗教和政治观点、人格特征、智力、幸福感、成瘾物质的使用、父母分离、年龄和性别”。作者的结论是,这些私人信息可能被用来优化个性化的平台服务,并为社会心理学家提供大量的数据,否则他们永远不会获得这些数据。从社交网站上无意识留下的(元)数据中识别行为或活动的模式,越来越有助于预测未来行为。信息科学家维尔坎普(Weerkamp)和德里克(De Rijke)说得很清楚:“我们对人们当前或过去的活动不感兴趣,而是对他们的未来计划感兴趣。预测他们的活动是我们的任务。”从社交网站上无意识留下的(元)数据中识别行为或活动的模式,越来越有助于预测未来行为。信息科学家维尔坎普(Weerkamp)和德里克(De Rijke)说得很清楚:“我们对人们当前或过去的活动不感兴趣,而是对他们的未来计划感兴趣。预测他们的活动是我们的任务。”信息科学家将活动预测定位为“生活挖掘”(life mining)的特例,这个概念的定义是“从那些在网上生活了相当长一段时间的人留下的综合数字轨迹中提取有用的知识”。“有用的知识 ”(useful knowledge)这个术语引出了一个问题:对谁有用?根据维尔坎普和德里克的说法,社交媒体监测为警察和情报部门预测新的恐怖活动或计算人群控制提供了有意义的信息,也为营销人员预测未来的股票市场价格或潜在的票房收入提供了有意义的信息。从监控和营销的角度来看,预测性分析将(元)数据模式与个人实际或潜在行为联系起来,反之亦然。预测性分析产生了“我们是谁”和“我们做什么”的强大信息。“大数据思维”似乎也倾向于一个自相矛盾的前提,即社交媒体平台同时测量、操纵在线人类行为,并拿它来赚钱(“货币化”,monetize)。尽管从社交媒体平台获取的元数据为人类行为提供了证据,但谷歌、Twitter和其他网站使用的算法本质上还是选择性和操纵性的。例如,当迪亚科波洛斯(Diakopoulos)和沙马(Shamma)通过分析推文来预测政治偏好时,他们似乎忽略了引导舆论的政客或有党派的推文作者可能实时影响着推文的辩论。在营销界,对未来消费者需求的预测类似于对欲望的操纵。它检测消费者习惯中的特定模式,同时尝试创造需求。这一营销策略通过亚马逊著名的推荐算法成功地实现了货币化。社交媒体内容和互联网搜索一样,受到个性化和定制化的影响,针对特定的受众或个人定制信息。支持把元数据视作人类行为痕迹,并把平台视作中立促进者的人,似乎与众所周知的、出于商业或其他原因而进行数据过滤和算法操纵的实际做法相悖。数据化和“生活挖掘”以意识形态的假设为基础,而这些假设又植根于普遍的社会规范。如前所述,用户向公司提供个人信息并获得服务作为回报是一种“易货交易”(barter)形式。用元数据换取通信服务已经成为常态,似乎很少有人愿意为更多的隐私付费。用于支付在线服务和安全的等价物已经将元数据变成了一种无形的资产,它大多脱离了原来的环境,不在人们的意识之中。社交媒体公司通过将元数据重新打包并出售给广告商或数据公司来实现货币化。信息科学家经常不加批判地采纳社交网站和数据公司提出的假设和思想观点。因此,数据通信范式在社会性、研究和商业的交叉点上发挥着深刻的意识形态作用。尽管这是一个难以解开的结,但显然也没有得到充分的研究。数据挖掘的隐喻基于一种奇特的理由,它指导企业家、学者和国家机构追求一种新的社会科学范式。首先,数据主义背叛了对量化的客观性以及对通过在线数据追踪各种人类行为和社会性潜力的信念。其次,(元)数据被视为“原材料”(raw material),可以被分析和处理成关于未来人类行为的预测算法——这就是采矿业的宝贵资产。我将在本节仔细探讨这些本体论和认识论上的断言,这些断言维持着一种信念,让人们笃信数据主义所支撑的人类行为知识的新黄金准则。首当其冲的批判性研究针对数据的所谓客观性(objective nature)。在一篇发人深省的文章中,社会科学家博伊德(boyd)和克劳福德(Crawford)解构了普遍存在的神话,即“大型数据集提供了更高形式的智能和知识,可以产生以前不可能的洞察力,具有真实性、客观性和准确性的光环。”成堆的(元)数据是通过一些不同的在线平台、为不同的目的而生产出来,但这些平台不是客观的。元数据与人类行为的关系,就像核磁共振与身体内部的关系一样,疾病的迹象从来不会简单地出现在屏幕上,而是在成像过程中仔细阐释和干预的结果。医学技术人员花了几十年的时间来学习特定器官的正确成像,他们必须完善定位身体的协议,并调整机器的性能以提高工具的实用性。Facebook和Twitter就是那不断调整的仪器,将友谊或人气转化为算法,同时将这些计算作为社会价值来推广。“点赞”和“热搜”通常被视为自发的在线社交标记,但这些按钮背后的算法都被系统性地微调,以引导用户的反应。
全美推文中提及“啤酒”和/或“教堂”的次数(来源:2012年6月29日Twitter数据)(元)数据是有待处理的“原始”资源,这一想法完全符合流行的“生活—挖掘”隐喻。梅尔-勋伯格和库克耶认为,每个单一的数据集都可能有一些内在的、隐藏的、尚未被挖掘出来的价值,而公司正在参与一场竞赛,以发现如何捕捉和评价这种价值。但正如丽莎·吉特尔曼(Lisa Gitelman)所言,“原始数据”是一个矛盾的说法:“数据不是事实,它们是‘为了提供修辞基础而在论证前给定的东西’。数据有好有坏,有更好有更坏,有不完整也有不充分。”自动提取社交媒体平台生成的大量元数据并不会获得更多关于特定人类行为的信息,这就像你要从无尽的海水中找到特定的污染信息一样困难,除非,你能使用特定分析方法来引导、阐释这些数据。有一个例子可以说明这一点。一个信息科学家团队收集了六个月的搜索结果,这些搜索结果是定期从首次在搜索引擎中输入关键词“住房抵押贷款”的用户中筛选出来的,目的是为了找到相关性(correlations)如何随时间变化。这些数据“显示”了抵押贷款寻求者在最初查询的六周后,从搜索抵押贷款的基础知识转向搜索保险和税收。三个月后,他们搜索家具,六个月后,他们对游泳池和庭院配件感兴趣。然而,像这样的关联性并不是简单“浮出水面”的。它们隐含着一个问题——新房主在购房后的前六个月需要购买什么?对这个问题的阐释表明,一个阐释框架总是预示着数据分析。按照吉特尔曼的思路,数据为新房主在某些时刻“需要”某些东西的论点提供了修辞基础,这是对广告商有价值的模式预测(pattern prediction)。因此,我们需要批判性地质询模式的意义。为什么我们要在成堆的元数据中寻找某些模式,为了谁的利益,为了什么目的?根据从网络平台上获取的数据来识别有意义的模式,本质上是一种阐释行为。数以百万计的25至35岁的Facebook女性用户在他们的时间轴上张贴婴儿照片的信息,这会让平台无休止的审查这些照片,以明确用户的行为、医疗或消费主义模式。研究人员是否想了解年轻母亲的节食习惯,以便提出改变生活方式的建议?或者他们想发现消费需求的模式,以便公司在适当的时候销售婴儿产品?或者——也许很牵强,政府机构是否有兴趣解释这些数据,以发现产后抑郁症或未来潜在的虐待儿童的迹象?定量的方法需要定性的质询,以推翻数据模式是“自然”现象的说法。换句话说,大数据研究总是和一个显而易见的“棱镜计划”有关(没有双关的意思)。原始数据不会像梅尔-勋伯格和库克耶所说的那样,从谷歌或Facebook管理的数字流水线的一端进入,从另一端出来,出来后就是经过处理的信息。元数据是充满价值的代码堆,是多价值的,应该被当作多重解读的文本来对待。美国学者约翰·切尼-利波尔德(John Cheney-Lippold)认为,数据是“嵌入并整合在一个社会系统中的文化对象,其逻辑、规则和明确的功能决定了用户生活的新的可能性条件”。大数据被配置为一种修辞文本,它是为特定目的而产生的,可以由不同的人群进行探究,这为普遍存在的“挖掘/采矿”隐喻提供了一种替代性视角。从社会科学或人文学科的角度研究数据集的学者可能会提出与信息科学家非常不同的问题,医生也可能会看出与犯罪学家不同的模式。研究新领域的言辞助长了这种数据主义令人信服的逻辑。大量以前从未出现过的无意识数据集打开了新的视野。数据主义兴起于这样的假设,即收集数据发生在任何预设的框架之外,就好像Twitter提供便利只是为了产生“生活”数据,数据分析也好像没什么预设的目的。识别在什么情况下产生的(元)数据以及出于什么目的处理这些数据可能并不总是那么简单。然而,如果研究者想要保持用户对数据化范式的信任,那么将隐藏的特权明确化是至关重要的。信任在一定程度上建立在主流范式的信服逻辑之上,但在另一个方面,信念由承载大数据信仰的机构来实现。第二个要批判的是支撑大数据思维的制度结构。数据公司、政府机构和研究人员都强调了用户在社会中信任的重要性,在这个社会中,从申请程序到医疗记录和金融交易,平民生活越来越被转移到了网络平台上。建立和维护制度的完整性往往成了“国家”(the state)的任务,而“平台”(the platforms)则必须遵守政府机构制定的规则。当梅尔-勋伯格和库克耶谈到元数据无处不在的危险时,这个“危险”指的是基于刻板印象的分析、基于倾向性的惩罚、基于关联的监视以及被削弱的隐私权。两人认为,政府有责任采取措施避免这些潜在的风险。《大数据》(Big Data)一书的作者呼吁建立一个新的“大数据审计师的排他性团体(caste)——算法师(algorithmists)”,以“确保在大数据时代对信息的公平治理”。学术界也指望国家政府来监管数据化可能带来的不利影响。但是,当他们呼吁企业表现出“信任和善意”,并要求他们给予用户“信息透明度和控制权”时,这些学者却和数据公司站在了一起。在争取信任和信誉的过程中,公共机构、企业和国家机构被假定为独立的机构,它们各自与用户(无论是消费者还是公民)保持着单独的关系。毋宁说,“国家”和“数据公司”都不是单一的类别。首先,除了美国国家安全局这种政府机构,大部分政府机构都代表着与用户的一种特殊关系,需要在维护信任方面发挥特定作用。联邦贸易委员会(FTC)和美国国家标准技术研究所(NIST)这样的机构有法律手段和政治义务来确保公民免受数据化范式侵犯隐私和剥削的风险。用户对数据政策的信任可能是单个公司竞争优势的一部分——然而,由于这一领域的伙伴关系比比皆是,用户不可能跟踪谁与谁共享数据。然而,斯诺登的档案告诉我们,收集和处理大数据的机构并没有脱离通过政治授权来监管它们的制度性组织。事实上,所有这三种机构(apparatuses)——公司、学术界和国家,都带着很大的利害关系去支持不受限制的元数据获取,也带着这些利害关系去推动公众把数据化接受为一种主导范式。出于不同的原因,科学家、政府机构和公司,在数据化的关系、允许预测和操纵行为的方法中都可以有利可图。所有机构对了解、预测和控制人类行为的愿望在某种程度上是重叠的,但在其他方面则有所不同。数据公司希望他们的平台被认为是客观的、标准化的元数据聚合器,比政府机构或学术界用来衡量消费者情绪、公共卫生或社会运动的工具更好、更精确。当政府机构和学术界采用商业社交媒体平台作为衡量社会流量的黄金准则时,他们实际上是将数据收集和阐释的权力从公众手中转移到企业部门。正如博伊德和克劳福德所言:“政府和业界都在大力收集和发掘数据的最大价值,不管是能导致更有针对性的广告、产品设计、交通规划或刑事治安的信息。”
大数据显示,2020年北京堵车天数较2019年下降13%,排名世界最堵城市第117名。(来源:TOMTOM)
政府、学术界和数据公司这三方力量结合在一起,他们在人员层面结合,在技术创新层面相互交流,共同开发数据挖掘项目。在为《纽约时报》撰写的一篇关于斯诺登事件的文章中,记者理森(Risen)和温菲尔德(Wingfield)揭示了硅谷和美国国家安全局之间的密切联系:“两者都在寻找收集、分析和利用数百万美国人大数据的方法。唯一的区别是,美国国家安全局是为了获取情报,而硅谷是为了赚钱。”数据公司和国家情报机构之间的联系显示出,技术专家在学术界和健康产业之间轮换工作,从数据公司转移到金融服务或情报机构。企业、学术界和国家机构的利益以各种方式汇聚在一起。例如,Skype及其所有者微软很乐意与中情局(CIA)合作开展“象棋计划”(Project CHESS),旨在使执法官员能够使用Skype电话。正如蒂莫西·加顿-阿什(Timothy Garton-Ash)在《卫报》的一篇专栏文章中所说:“‘老大哥’将以公私合营的方式回来。”这里的问题不仅仅是把数据主义作为一种认识社会行动的技术,即人类行为在大量元数据的基础上被测量、分析和预测,问题还在于,人们信任高科技公司和政府机构保护用户数据不被利用的意图。数据主义假定了对量化方法客观性的信任,假定人们信任部署这些方法的机构(包括公司平台、政府机构和学术研究人员)的独立性和完整性。然而,在一个连接性的生态系统中,信任和独立是一个陷阱概念——无论在基础设施层面还是在操作逻辑层面,所有在线平台都不可避免地相互连接。当所有的东西和每个人都通过相同的基础设施连接,并通过相同的逻辑运作时,就印证了福柯早在网络技术出现之前就提出的观点。例如,预测性分析的逻辑似乎得到了政府、研究人员和企业的证实。谷歌声称他们在预测失业统计或流感大流行方面比国家机构要好得多,因为他们的网络爬虫可以确定一个人何时开始寻找新工作或何时开始寻求有关流感的信息。Facebook上的“点赞”功能有可能预测哪些年轻母亲可能会自己的孩子营养不良,州卫生机构可以根据这些信息采取行动。美国国家安全局宣称,由于“棱镜计划”,他们至少防止了50起恐怖袭击,这些都是基于从社交媒体平台和电子邮件服务中获取的数据。在这些制度性形式的数据主义中,有问题的地方不仅在于,我们缺乏算法标准来定义什么是求职、不正常的母性或恐怖主义,而且更值得怀疑的是,无论通过商业平台还是公共机构,数据产生和处理的背景似乎都是可以互换的。这里的关键不仅仅是我们对特定政府机构或单个公司的“信任”,而是对整个生态系统的可信度——一个由数十亿电子邮件、视频、文本、声音、元数据构成的生态系统。对数据流的监管似乎陷入了对领土的模糊划分之中。对数据的访问和限制在公众面前和人们的知识领域之外进行着争夺。自从斯诺登事件以来,公民越来越多地质疑美国高科技公司与政府的亲密关系,作为回应,一些公司已向法庭投诉他们所谓的国家安全局欺凌策略。这场关于用户数据信任谁的公开斗争可能有助于增强每个机构独立性形象,但很明显,像谷歌和 Facebook 这样的数据公司并不是在真空中运作的。生态系统通常是一个基础设施,没有任何一个机构处于指挥地位。把数据主义说成是建立在机构信任基础上的共同信念,似乎比对数据化前提的质疑同样重要。当把数据监控(dataveillance)作为一种越来越受欢迎的、基于社交媒体和在线通信技术监控公民的手段时,“信任”和“信念”的概念就显得尤为重要。政府、企业和学术界在处理我们的数据时有哪些独特的利益?“数据监控”的概念提出了更多关于整个在线信息流系统的可信度的问题。数据监控指根据公民的在线数据对其进行监控,但至少在一个重要的方面与监控(surveillance)不同。监控是为了特定的目的而进行的监控,但数据监控是为了不明确的预设目的而对(元)数据进行持续追踪。因此,数据监控远远超出了审查个人的主张,因为它渗透到了社会结构的每一根纤维。因此,数据监控是一个意义深远的命题,对企业平台和政府机构与公民—消费者之间的社会契约有着深刻的影响。让我们更仔细地看看每个行为者在这场信誉和信任之战中的独特作用。从一开始,谷歌用“不作恶”的口号稳定用户对它的信任,Facebook也说“让世界透明和互联”。对科技公司来说,与消费者的社会契约建立在线上社交可见和可追踪的基础上。这种对透明度的呼吁要求他们的注册客户提供真实且可核实的个人信息。然而,平台几乎没有提供透明的回报。从2007年到今天,像Facebook这样的公司一直在与联邦贸易委员会和法院进行斗争,以捍卫其不断变化的使用条款,这些条款不断伸长隐私政策的触手。在过去几年中,支持用户的人将Facebook和其他平台告上法庭,因为它们非法保存用户数据记录。消费者权益团体不懈地呼吁解释免费在线服务的交换条件,以帮助恢复公众对单一平台以及整个生态系统的信任。搜索和通信的替代平台(例如Lavabit、DuckDuckGo、Path、Leaf和Silentcircle)都试图用可靠的服务来平衡用户的数据保护。然而,事实证明,要想摆脱制度主导者制定的规则和做法是非常困难的。然而,平台所有者对行政机构的态度往往是矛盾的。他们呼吁政府弥补法律和政策方面的差距,但这些公司警告政府不要过度监管,并建议放开手,让技术部门自己来监管。从政府方面也可以看到类似的矛盾心理。显然,情报机构与政府监管机构有着不同的利益。安全和隐私问题往往构成矛盾的要求,导致矛盾的法律定义,如奥巴马将元数据说成数据监控的合法手段:“我们不会监听你的电话谈话内容。”公民团体呼吁制定明确的政策来保护隐私,并在安全方面加以平衡。不过,使法律定义与先进的技术设备保持一致,这只是重建信任的关键一步。正如我们在2008年开始的银行业危机中所看到的那样,许多复杂的金融计划和基于高科技的衍生品逻辑导致人们不再信任金融业。经过20年的自我监管,对银行系统的信任已经达到了历史最低点。学术界也有维护整个生态系统的可信度的责任。许多科研人员肆无忌惮地支持数据化中立范式的观点,信任数据化能客观量化社会。但这种信念应该受到更严格的审视。从长远来看,不加批判地接受数据化的意识形态和商业前提很可能会破坏学术研究的完整性。为了保持和维持信任度,大数据科研人员不应该坚持中立的主张,而应该考虑生成数据集的背景,并用定性研究方法配合定量研究方法。此外,预测分析值得更多跨学科研究的介入,例如结合计算、人种学和统计方法。此外,学术界是建立社会信任的重要行动者。同时,斯诺登事件揭示的那些肆无忌惮的事件中,有一个重要的行为者常被忽视——用户/公民。当斯诺登选择公开他关于美国国家安全局数据监控行为的内部信息时,他不仅展示了一个雇员个人的力量,揭开了一个复杂的国家—工业—学术综合力量的面纱并使之动摇。他还依靠许多公民(研究人员、有影响力的博主、记者、律师和活动家)的警惕性,将他对生态系统中的结构性缺陷公之于众。在过去的十年中,用户/公民相对于企业平台和国家的实际权力引发了大量的辩论。一些人发现,用户抵制平台的隐私政策和监控策略的能力相当有限。个人被平台的技术和单一平台的商业模式所引导,但要深入了解系统的相互依赖性和复杂性还是非常困难的。