数据政治缘何兴起,影响几何?
The following article is from 澎湃研究所 Author 刘立之
作者 | 刘立之/美国乔治城大学麦克多诺商学院助理教授
来源 | 澎湃研究所(ID:ppyjs1905)
2017 年,《经济学人》杂志在一篇文章中断言:“世上最宝贵的资源不再是石油,而是数据。” 此后,多国领导人均表达了类似观点,这体现了对数据重要性的共识在迅速加深。
数据之重要,不仅在于其经济价值,还在于数据对政治的影响愈发明显。比如,总部设在伦敦的 “剑桥分析” 公司(Cambridge Analytica)通过非法获取脸书(Facebook)数据、改变用户的政治选择,一定程度上影响了 2016 年的英国脱欧公投及美国总统大选。又如,默克尔、马克龙等欧洲领导人近年多次强调欧洲 “数据主权” 的重要性,并发起了 Gaia-X 项目,旨在提升欧洲自身的云服务和数据能力,降低对美国科技巨头的“数据依赖”。在中国科技企业出海的过程中,数据亦频频引发政治争端。譬如,特朗普政府即以美国用户数据安全为由对华为和 TikTok(抖音海外版)实施禁令。近年来数据与政治的互动与交融,不一而足。
尽管数据正在深刻重塑全球经济及国家间政治关系,“数据政治”(data politics)之深层逻辑却还少人涉猎。有鉴于此,本文提出了一个研究 “数据政治” 的基本框架。
本文首先从经济特性上说明数据为什么与传统战略资产(如土地和石油)不同,以及这种区别如何产生数据政治的独特基础。之后,本文将展开说明数据政治的三重维度:数据的外部性问题和各国加强 “数据主权” 的举措,数据使用中的承诺问题以及科技企业 “深耕与广拓” 的两难困境,数据的估值问题以及对国家经济实力的可能误判。
数据的经济特性和数据政治的独特基础
“数据是新时代的石油” 这一说法其实并不准确。虽然数据的战略价值堪比石油,两者的经济特性却截然不同。
非竞争性是数据的核心特征,而石油是一种竞争性物品。一桶石油一旦被一个人消费,其他人就无法再消费这桶石油。许多常见的生产要素都是竞争性的,譬如资本、劳动力、钢铁,一旦被使用,可用数量就会减少。而数据是非竞争性的:同一组数据可以被无限次使用,且可以被多方同时使用。比如,消费者可以把个人数据(如生日、位置信息)同时提供给多个科技公司换取服务,但提供数据过后,消费者依然拥有这些数据。
非竞争性即数据能被无限次使用,意味着假如数据被大量用于生产,能推动整体经济的规模收益递增。还意味着,如果数据能在企业、国家间广泛共享、多次使用,将产生显著的经济效应。假如数据没有得到广泛共享,数据量就能形成竞争优势;掌握更多数据的企业、国家在数字时代生产力更高,强者愈强的 “马太效应” 也很可能更为显著。比如,拥有更多数据的大科技公司能进一步优化算法、服务,从而吸引更多用户,收集更多数据,这种 “数据正反馈循环” 将推动市场更集中在头部企业。
数据的另一特点是部分排他性。有无排他性,指的是否可以阻止不付费用户消费该商品。不同性质的数据有着不同的排他性:有些数据是公开的,也即非排他的;也有些数据是专有的,具有一定的排他性。所以,就数据这个大类总体而言,数据是部分排他的。数据之所以具有部分排他性,还因为数据的复制、长距离传输成本极低,这导致未经授权的出售、使用、及窃取数据的风险较高,即使公司对专有数据加密,也很难免于这些风险。近年来,用户数据泄露的事件不时见诸媒体。
数据不同于石油等传统战略物资的经济特性使得 “数据政治” 有其独特基础。本文将数据政治定义为国家与国家、国家与企业之间,围绕数据的收集、处理、传输、出售或使用而展开的战略互动。以下,本文将探讨数据政治的三个维度:数据的外部性问题、承诺问题、估值问题及相关战略互动。
数据的外部性问题及各国加强 “数据主权” 的举措
数据政治的第一个基础来自数据的外部性。
由于数据是一种非竞争性、部分排他的产品,所以它是一种准公共物品。这也意味着数据具有一定的经济外部性:一个人分享数据的行为会让他人获利(正外部性)或受损(负外部性),分享数据的人却不会因此得到补偿或者付出成本。
数据的正外部性能带来广泛的社会福利。比如,人们分享的数据可以优化机器学习的算法,提升服务质量,促进经济发展,即使那些没有分享数据的人也可受益。
但数据分享也具有负外部性,会让他人受损,比如隐私。一个人分享的数据可能暴露他人隐私,即使他人没有主动分享。比如,研究发现,只需要目标群体中 2% 的成年人的基因数据,就可以建模识别该群体中几乎每一个人,包括那些从来没有做过基因检测的人。美国麻省理工学院学生的一个著名项目也警告,仅仅依据一个人脸书好友的公开性取向,就很容易推断此人是否为同性恋者,造成非自愿 “出柜”。除了隐私,数据分享还伴随着其他的负外部性。比如,假数据、谣言和极端观点可以通过社交媒体的“回音壁” 效应得以放大,引发社会动荡和政治极化;算法歧视会将人类社会中已经存在的偏见进一步扩大、深化。
外部性的存在意味着对数据的分享、流动需要规制,尤其在数据跨境的情况下。数据的跨国交流可以带来巨大福利,但也会使公民的隐私蒙受外国政府监控、黑客攻击和数据泄露的威胁。虽然科技公司也会采取措施保护用户数据,但企业的自我规制往往不足以解决外部性问题。研究显示,如果科技公司拥有充分的数据产权,它们会倾向于囤积数据,限制数据分享,使得社会福利低于最优状态。同时,“隐私悖论” 的存在意味着消费者大多态度上重视隐私,行为上却颇为懈怠(不愿花费很小的成本改变隐私设置,或者停止使用相关的数据服务),也使得企业缺乏动力提供最严格的数据保护。
由于市场失灵,加之数据的战略价值,各国政府近年来争相订立数据隐私方面的法律法规,其中重要一环就是确立 “数据主权”。“数据主权” 是指在一国疆域内产生的数据应该受到该国法律和规章的约束。
比如,中国 “数据主权” 的核心制度是 “本地存储、出境评估”。2017 年开始实施的《网络安全法》规定,所有在华企业须将运营收集、产生的个人数据及重要数据存储在中国境内的服务器上(此即 “数据本地化”)。如果需要将本地数据转移海外,政府将进行出境安全评估。政府也可对关键信息基础设施的安全风险进行抽查。
中国对数据的监管是以国家为中心的,近年来政府开始加大监管,避免企业收集不必要的用户信息。比如,2020 年 5 月,江苏省宿迁市公安部门处罚了一家非法收集用户面部图像的健身中心。《个人信息保护法》也即将出台。
中国这种 “以国家为中心” 的模式不同于欧美模式。欧盟的数据法规 “以消费者为中心”。由于欧洲流行的科技平台多为“美国制造” 的舶来品(如脸书、谷歌、亚马逊),欧盟通过《通用数据保护条例》(GDPR)等法规赋予消费者对其数据的权利,从而对(非欧洲的)科技巨头形成制约和监管。此外,欧洲数据法规更聚焦公民隐私,而中国的数据法规更侧重保护国家安全。
相较中国和欧洲,美国的数据制度更倾向 “以市场为中心”,企业的自我规制依然是很重要的一部分。美国拥有不少全球性的互联网巨头,且互联网行业有着悠久的 “自我管理” 的传统,政府不管或少管能降低这些企业的合规成本,有助于它们在全球扩张,进一步提升竞争力。尽管 2018 年加州通过了 《加州消费者隐私法案》(CCPA,2020 年起生效),但还没有出现联邦一级的隐私法案。在制定数据治理法规上,中国中央政府比美国联邦政府要积极许多。
各国争相建立数据法规,确立数据主权,可能导致一系列政治后果。
首先,各国数据法规之间缺乏协调甚至不兼容,可能引发国家间冲突。比如,中国的 “数据本地化” 要求可能与美国政府的域外数据管辖权相冲突。2018 年,美国国会通过了《海外数据使用权明确法》(CLOUD Act)。该法赋权于美国执法机构,使其能要求美国通信服务商提交存储在境外的数据,比如电子邮件和个人信息,从而超越他国的隐私保护制度。
其次,各国数字疆界(digital border)的兴起,将增加数据跨境流动的难度,形成一种新型的非关税贸易壁垒。这将对跨国科技企业带来较大的合规成本,数据监管也将成为跨国企业的政治风险之一。
比如,苹果公司因用户数据安全问题受到中国政府批评,其后将中国内地用户的 iCloud 数据以及密钥从美国转移到中国,将 iCloud 服务转由 “云上贵州” 负责运营。而摩拜单车在拓展欧洲市场的过程中,曾被报道因涉嫌违反欧洲《通用数据保护条例》,可能面临德国监管机构调查。这两个案例分别展示了,数据法规如何影响在中国运营的跨国企业,以及如何影响中国企业在海外的运营。
数据的承诺问题和科技企业 “深耕与广拓” 的两难困境
数据本身的非竞争性和部分排他性,造成了数据使用的未来不确定性。
数据可以被无限次复制、使用;且如果保护不力,有泄露和滥用的风险。因此,消费者一旦将个人数据交给科技公司,就很难控制这些数据将来会被如何处置。尽管消费者通常会签署数据使用条款,但这些条款往往宽泛且冗长,且消费者很难监督条款是否会被充分执行。如果一家科技公司源自境外,涉及的数据安全问题就更为复杂。由于数据并非实物商品,其传输和复制的成本很低,跨境传输难于监测,数据的滥用很难觉察。
由于用户数据的敏感性,数据使用的未来不确定,以及数据跨境流动不易监管,数据问题和国家安全问题的捆绑日渐紧密,一系列政商问题由此衍生。各国政府、民众愈发担忧外国政府会利用跨国科技公司进行数据监控,尽管跨国科技公司的数据收集往往是纯商业行为。因此,跨国科技公司的海外运营中时常面临一个 “可信承诺”(credible commitment)问题:如何说服外国执法者,该公司不会将外国公民的数据与母国政府共享。
比如,2021 年初,特斯拉汽车在华遭遇了 “间谍车” 的指控,被质疑帮助美国政府窃取敏感用户信息。其 CEO 马斯克 回应 称,特斯拉绝不会向美国政府提供其在中国或他国的任何个人与车辆数据,因为一旦这么做,将 “被关闭” 而失去海外市场。
中国科技企业在海外市场同样饱受这一承诺问题困扰。由于数据是科技企业运营的核心,它们必须收集外国用户的数据,但许多外国政府担忧本国的用户数据安全,且数据跨境不易监管,这也使得中国科技企业在海外容易遭遇国家安全方面的调查。这种对中国科技企业的不信任不仅仅与反华情绪有关,还有一重深层逻辑:国家间数据政治的兴起。这层逻辑超越某家公司、某个国家,而是未来国际关系中的一个新领域。
因为数据政治的特性,跨国科技企业将越来越面临 “深耕与广拓” 的两难困境(Deep versus Broad Dilemma),也即在本土市场越成功、政府关系越深耕,越容易在国际市场引发他国政府的调查,一定程度上影响其海外市场的拓展。
这一 “深耕与广拓” 的两难困境不易解决、比如,当 TikTok 面临美国政府的国安调查和禁令时,其母公司字节跳动试图切割其本土和海外市场,并释放一系列 “昂贵的信号”(costly signals) 以期解决 “可信承诺” 问题。这一策略是否成功,还有待观察。
数据的估值问题以及对国家经济实力的可能误判
数据政治的第三重维度来自数据的估值问题。
数据的经济价值较难测度。首先,数据可以被多次使用,且作为一种虚拟商品,不会像实体商品那样消耗和磨损。其次,数据不一定随时间贬值。将不同的独立数据库重新组合,往往能使旧数据焕发新的价值。这些因素都增加了数据估值的难度。
正因为如此,随着数字经济的兴起,如何准确衡量各国的经济实力成为一个难题。传统的衡量指标是国内生产总值(GDP)。但 GDP 在数字经济时代存在两大局限。
首先,GDP 低估了免费商品和服务的价值。GDP 的核算方式基于市场价格,但大多数科技产品(比如邮箱、搜索引擎、社交媒体)是免费的,或者价格极低。当然,人们之所以可以免费使用科技产品,是因为用个人数据换取了科技公司的服务,而科技公司通过定向广告或者转卖数据盈利。尽管这部分利润能进入 GDP 的核算,但它们仅占数据价值的一小部分。总之,尽管林林总总的数字服务产生了极大福利,但 GDP 却低估了其影响。
GDP 的第二大局限为,它涵盖的是市场性生产的价值,但不包含非市场性生产,比如无偿工作。然而自愿贡献(voluntary contribution)是数字经济的一个主要特征。人们在社交媒体上发表文章、短视频,很多并未因此获利,却创造了极大价值。维基百科、百度百科及其他免费开源软件亦对生产力有很大贡献,但 GDP 不能很好地加以核算。
因此,单纯依赖 GDP 衡量各国经济实力与前景会导致一定的误判,尤其在数字经济时代。过去几年,中国 GDP 的增长率有所下滑,但并未如一些人预判的那样造成了社会动荡。一个可能的原因是,数字经济释放了大量消费者福利,有助于社会稳定,而 GDP 指标低估了这部分生产力的福利增益。
与此同时,美国的经济增长率也是被低估的。美国斯坦福大学教授 Erik Brynjolfsson 与其合作者改进了 GDP 的核算方式(GDP-B),加入免费数字服务的贡献。他们发现,美国在 2004 到 2017 年的实际 GDP 年均增长 1.83 个百分点,仅加入脸书一项数字服务,就能在此基础上年均增加 0.11 个百分点的增长。
结语
数字技术极大改变了人与人之间的互动,同样也开始影响国与国之间的互动。随着全球经济日益数字化,数据已成为一种战略资源,也将成为地缘政治的热点。
数据政治之所以兴起,是因为数据在深层次上改变了权力的基础。如今,一个国家的实力不仅在于军事或贸易,还在于其收集、提炼和运用数据的能力。数据政治的大戏已经上演,未来其重要性会与日俱增。
*本文原题 “The Rise of Data Politics: Digital China and the World”,发表于《Studies in Comparative International Development》第 56 卷第 1 期(2021 年 3 月号)。原文以英文撰写,由鲁力编译,作者刘立之改定。具体技术细节请参阅原文。