其他
包晓丽:二阶序列式数据确权规则
大数据时代早期,数据活动与购买商品、餐馆消费并无二致,表现为“服务商在一端、顾客在另一端”的管道式(pipeline)合同关系。用户在数据活动中的参与度低,仅仅扮演消费者角色,其对个人数据通常不享有财产性权益。然而,随着用户在平台活动中互动参与度的提高,平台和用户间表现出共同投入、深度合作的双向动态结构特点。双方在开放平台中,共同交换、创造了有价值的数据财产。此时,数据要素在经济运行中的价值日益重要,双方的交易基础和利益期待发生了变化,我们不得不重新反思大数据时代早期默认规则的合理性。以证券行情数据为例,在20年前交易所建立初期,交易所付出了大量成本建立了行情数据仓库。交易所作为发挥公共职能的主体,可谓“倒贴”提供了数据服务,市场参与者“免费”享受了由此带来的便利。然而,数据挖掘技术的飞跃发展带来了数据红利,交易所从“倒贴”的数据服务者转变为溢出收益的受益者。上证所信息网络有限公司在继续向社会免费提供基本行情数据(Level-1)的同时,通过开发和出售增值行情数据(Level-2)获得额外收益。此时,用户、证券公司和交易所对两类数据的权益边界如何划定,其权利范围和权利内容都是需要重新进行价值衡量的问题。
对前述问题的准确回答,需要我们深度透视数据价值的产生基础。数据活动中,个人作为数据要素的重要供给者,企业作为资本、技术提供方和数据整合者,均具有主张数据利益的法律基础。不同利益相关者往往基于他们的角色/贡献而对数据行使不同权力。既有学术研究和规范性文件普遍承认用户的个人信息利益与企业数据的财产性价值,但缺乏对个人用户可否主张数据财产利益、用户与企业权利边界之划定与利益冲突之协调策略的正面回应。于此,本文的目的即在于观察和总结数字经济时代我国对数据权益分配形成的价值共识,从而抽象出协调各方权益冲突的一般规则。
一、从两类数据纠纷谈起
随着微信朋友圈的兴起,曾经活跃一时的人人网逐渐淡出了我们的视野。直到2018年底,人人网在时隔多年之后宣布将其社交平台业务和相关资产出售给北京多牛传媒,一篇人人网的青春回忆贴唤起了九零后的集体共鸣。有的用户担心曾经的黑历史再被重提,有的用户却希望重温青春的足迹,并产生了这样一个集体困惑:人人网上的青春数据到底属于谁?用户是否有权请求人人网平台(或北京多牛传媒)履行协助导出个人数据的义务?用户和人人网的权利边界如何界分?关于“人人网”数据重现与消失的担忧,主要表现为用户与企业间就数据权属产生的争议。该类争议涉及两方面的法律问题:一是用户积极利用权能的行使,如特斯拉车主与车企就导出行车数据产生的争议,再如微信用户与微信就其可否行使可携带权并在抖音上重建好友关系网产生的争议。二是用户消极防御权能的行使,典型的如微信读书案和小凌诉抖音案中,用户以企业的数据处理行为侵犯隐私或个人信息权益为由提起诉讼。 另一类与数据有关的纠纷,表现为企业与企业间的争议,主要是原数据企业以不正当竞争为由对第三方数据企业提起诉讼,包括聚客群控软件案、微博诉脉脉案、大众点评诉百度案、腾讯诉抖音案等。在新近的聚客群控软件案中,微信与第三方数据服务商就微信数据到底属于用户所有还是平台所有,何者有权许可第三方对数据进行处理产生了认识分歧。法院在裁判中表示,微信数据可以被区分为单一数据个体和数据资源整体两种形态。就单一数据个体而言,微信平台只能依其与用户的约定,对微信用户账号、好友关系链数据、用户操作数据享有有限使用权,并不享有专有权。就数据资源整体而言,它是微信平台投入了大量人力、物力,经过长期经营积累聚集而成的,微信平台对于微信产品数据资源应当享有商业利益和竞争权益。据此,法院认为第三方平台利用群控软件处理微信用户数据的行为,构成对腾讯数据资源竞争权益的实际损害。腾讯可以据此要求赔偿损失,但无权就被告收集、存储单一微信用户数据的行为主张损害赔偿。 无论是司法裁判还是学术研究,对数据纠纷问题的回答都是从人格权和财产权区分这一民法基石的基础上展开,涉及两个维度的问题。第一个维度是从人格权的角度出发,讨论数字时代的个人信息保护,并已累积了较为丰富的研究成果。第二个维度是从财产权的角度出发,探索数据的财产化路径。但对于企业数据权益与用户个人信息保护的关系、数据财产权益归谁享有等问题的回答尚显薄弱。本文的重点即在于回答第二个维度——数据财产权益的分配问题,特别是对数据包含的各种利益进行权衡和调整,这明显属于民法问题中的价值判断问题。而价值判断问题即马克思·韦伯(Max Weber)所说的,“立法者将其主观认定的社会公认的实体价值固定于法律规范之中,并在司法当中根据主观的社会正义价值标准来解决纠纷”的实质理性。因此,本文将聚焦于对数据纠纷基本共识的观察和凝聚。具体表现为:描述和总结数据产业实践,包括观察数据资源的价值产生过程,并厘清蕴藏在一宗数据中的各种利益关系类型。随后,根据法益位阶理论和公平原则,为数据场景下的权利配置与利益冲突协调提供可能的策略和价值判断结论。
二、数据资源的价值产生过程
(一)用户——平台合作生产 “人人共享”已经逐渐成为新的时代精神,人们通过过剩产能+共享平台+人人参与的方式,逐渐将本地化、专业化和定制化的个人优势,与规模化和资源化的组织优势相结合,从而在一个稀缺的世界里创造出富足。以导航数据为例,用户在使用导航功能的时候,一方面是该数据产品的消费者,另一方面其路径选择行为和由此产生的行程数据可以助力企业对交通情况进行预判,从而提供最佳路径规划。再如用户在知乎和大众点评上的内容分享行为,既能满足自己的评价诉求、赢取积分,也能使其他用户受益、平台扩增。在此背景下,“顾客就是上帝”开始转变为“顾客也是服务者”,顾客也提供服务。用户与企业之间的关系从单纯的消费行为转变为合作生产关系。 此外,产业组织也将发生平台化生态的转变。工业时代,价值的创造呈线性形态。生产企业为从上游供应商处购买原材料,通过投入劳动力加工获得商品,然后再向下游分销商出售货物,并从竞争差价中获利。数字经济时代,平台的价值创造不再强调剥削和竞争,而是通过整合既有资源,促成各方的协同合作与良性竞争以共同创造新的价值。例如,腾讯通过开放平台的策略,吸引了500万开发者入驻,不仅为众多中小开发者提供了交易机会,而且也极大提升了平台的生命力。至于这些数据财产上的多元开发和利用机会,应当在各方主体之间进行如何分配?各方当事人常常无法在合同订立之初进行充分预测和安排,合同的不完全性注定会成为常态。随着数据财产价值的增加,数据已经成为了新的生产力来源和企业资产,各方主体将花费资源来获取它们并将数据从公共领域变为私有财产。 可见,在数据生产与使用过程中,往往涉及用户、原始数据企业、第三方数据企业等多方利害关系人,我们很难界定到底哪方主体是数据生产者,进而赋予其权利人的地位。例如,智能网联汽车的车辆所有人和汽车制造商都可能成为数据的权利人。一方面,车辆所有人是事实上的操作者,且为车辆日常维护支出了成本,他基于车辆所有权而对相应的行车数据享有权利基础。另一方面,数据的产生、存储和进一步利用离不开汽车制造商的开发与维护,特别是在它的竞争者面前,车企对智能网联汽车数据同样享有重大利益期待。正是基于数据在事实上的非消耗性与一定程度的非排他性特征,以及权利观念由所有权向权利束理论的转变,决定了数据产权的多元共享转型。 (二)消费行为的正外部性溢出 对于封闭式数据产品,个人的数据活动并非生产行为,而是消费行为。用户往往只是平台服务的消费者,数据的产生不过是消费行为的副产品。典型的如用户阅读新闻和公众号文章的行为,其真实目的在于了解相关资讯,但与此同时,企业可以根据用户的阅读习惯和搜索历史对用户进行画像,从而有针对性地向其推荐相关的文章或者广告产品。再如“花呗”可以根据申请人既有消费数据、资产数据和信用数据,并依靠人工智能算法做出信贷决策,大大降低了传统调查所需要的人力成本。在上述例子中,用户往往扮演消费者的角色,其交易行为本身并非有意服务于生产力的提升,但在结果上确如劳动和资本一样发挥了提高社会生产力的作用。并且,数据市场具有网络效应。随着用户数量的增长,数据产品及其对每个用户的价值都将增加。此时,将数据作为用户消费行为的正外部性溢出更具解释力。 就用户并没有完全享受其行为产生的潜在收益而言,规制的难点在于如何对新增利益进行合理分配,以避免“搭便车”和“牺牲者”行为导致的参与动力不足、阻碍变革进程等现象的发生。尽管庇古提出,可以通过对带来正外部性的主体补贴的方式实现资源配置效率、最大化社会收益。但这种将由于甲增益了乙,所以应当鼓励甲的直觉性观点,实际上忽略了外部性问题的相互性(此时甲将遭受损害)和整体性(对社会其他方面的影响),而问题的实质在于谁有权做什么。 在一项合同并未明晰界定某些权利而这些权利的价值又有上升时,就可能出现冲突。清晰的产权规则不仅是用户与企业就数据增值部分达成一致意思、实现资源有效配置的逻辑前提,也是法院确定损害赔偿责任,限制权利行使的制度基础。因此,无论将用户的数据投入定性为生产活动,还是消费行为的正外部性溢出,对数据产权的界定对于明晰各方权利义务、建立健康有序的数据市场都是必须且必要的。二者的差异仅体现在数据定价上,用户投入到底是作为成本直接计价,还是作为征税与补贴的核算基础。一个理想的数据产权分配规则不仅需要尽量满足平台和用户之所以参与数据合作创设活动的重大利益期待(包括尚难以有效预估的未来利益期待),而且还需要慎重考虑分配规则对各方继续合作的激励效应。因此,在对数据生产过程展开细致观察之后,我们还需回答另一重要的问题,即生成的数据在法律上将被如何定性?各利益相关方对数据有何权益主张及其优先顺位如何确定?
三、数据上的开放权利束
在数据权利体系的构建过程中,人们不免受工业时代“物的实体化”与物债二分法学传统的影响,希望将数据归入物权或者债权的一种。然而,努力的结果却差强人意。通过对数据价值产生过程和应用场景展开细致观察便能发现:在生产端,数据是用户和平台持续合作、共同投入和维系的结果;在产出端,数据是包含了公共利益、人格利益和财产利益的开放权益集合。 (一)关于财产权的新思维:从所有权理论到权利束理论 “财产”(bona)是使人幸福的东西,使人幸福即有用。那么,什么是财产权?有广泛影响力的罗马式所有权模式认为,财产权是自然人基于生存的最基本需求而主张“此物是我的”(banc rem meam esse aio)的观念,获得了来自社会的广泛认可,由此产生了某物属于某人并由权利人对其享有的完整的、排他的、自由处分的权利。这种以“对物性”为基点,并衍生出“对世性”特征的财产权观念长期占据了法学界与经济学界的主流认识,其根本功能在于增进权利人利用和享受资源的预期安全。但自20世纪初,得益于生产技术与反思能力的飞跃发展,自然主义或言直觉主义的财产权观念开始改写,法律实用主义学派得以发展。霍费尔德教授(Wesley Newcomb Hohfeld)将财产权解构为不同类型的一束权利(a bundle of rights),奥若雷教授(A. M. Honore)同样将财产权视作一束权利的集合。由此发展出的权利束理论认为,一个财产上存在一组权利,这些权利可以被比喻成一束轻轻绑在一起的权利束,权利束中的每个条块(stick)都可以独立被抽出并分配给不同的人。 当观察的对象由农业时代的土地和工业时代的有体物转变为数字时代的数据时,我们对权利概念的理解也会随之发生变化。价值目标由归属向利用转变。财富的产生不再局限于土地等自然资源价值的释放,转而依赖于技术的进步和组织结构的优化。并且,在现代法律体系和经济体系建立以后,秩序问题已基本解决,学者们更加关注如何实现社会福利最大化的问题。此时,财产权理论不再局限于保护权利所有者的安全,转而关注资源使用之许可或禁止的权利束顺位序列,最终实现社会资源的最优配置。所有权只是财产权谱系中的一个类型。从公共物到权利最圆满的所有权,财产权的形态表现出由简及繁的特征。在数轴上,形象地表现为从0到1的数谱。而数据权利恰恰处于该频谱的中间部分,表现出合作性和有限共享性的特征。正如用所有权说或者债权说解释股权性质显得有些捉襟见肘,用所有权模型解决数据场景中的权益冲突,也可谓规则错配。 当各方当事人的利益期待存在冲突时,有两类不同的解决路径。简化说认为我们应当构建一套明确的理论、价值体系、决策程序或者规范框架从而在利益冲突时作出裁判。复合说认为我们能做的是清晰描述冲突的类型,并深入分析冲突产生的原因和不同规则设计将产生的社会效果,最终由司法者结合这些不同的考量因素在具体场景中做出裁判。所有权模型即为简化说的典型代表,但在数据场景下表现出强烈的缺陷。第一,尽管通过观察和总结既有交易实践,我们可以发现当事人间的法律关系往往表现出相对固定的模式,但是这种法律关系也是在不断变化和重新安排的。随着数据开发能力的提升,我们无法预测数据在未来还可能承载什么样的利益期待。第二,财产权并不等同于所有,其并不能被单一的效率或者个人利益理论决定,因为单一的理论既是扭曲的也是同义反复的。单一的考量因素是支撑某种利益的依据,但却不能成为利益取舍的标准。第三,所有权模型是以权利对象具有时间或空间上的独占性为基础的,但是数据表现出强烈的共享性特征。各方主体对数据的期待由“独享、确权”的思维模式,变为“不求所有,但求所用”。 我们应当分析数据权属规则的行为激励效应和社会经济后果,贴近社会生活实践地去观测人们的行为选择逻辑。由于完全去结构化的财产权理论既无法对现实社会中存在的大量财产权结构化现象给出有说服力的解释,也容易忽视财产权形式化和结构化的实用价值(降低信息成本)。随着时间的推移和交易习惯的积累,历史上的财产权总是以一种标准化的模块形式(in the form of standardized modurality),辅之以弹性的方式出现。后文将以模块化的权利束理论作为理论基础,描述数据作为权益集合的特征,总结既有产业实践和司法裁判的观点,为建构数据上的权利块体系提供参考图景。需要强调的是,本文以“数据确权”为题并不代表肯定了一个单方的、排他的、绝对的数据权利归属,而是遵循了既有法律制度用“确权”这个概念描述权益安排和分配方案的表达习惯。 (二)数据的法律属性:利益集合体 《民法典》和《个人信息保护法》编纂过程中,学界对个人信息保护的法益是个人信息本身还是其他利益产生了较大争议。不可否认,随着数据渗透生活的程度越来越深,数据能够满足主体的多重利益期待。它不仅承载了个人隐私等人格利益,还具有一定的经济利益。尽管法律尚未正面回应数据权利问题,但是数据之上的隐私权、企业竞争利益已经是法定权利类型,且数据复制权、数据信用利益等新型权益的内涵和外延也在不断清晰和明确。 数据有时发挥维护主体人格尊严的价值或功能,有时发挥维护主体财产利益的价值或功能,还有的场景下发挥打击犯罪、疾病防控等公共价值或功能。国家与个人间可能就数据的使用权限产生摩擦,典型的如新冠疫情期间,国家出于疫情防控的目的要求个人披露健康数据、行程数据。在企业与个人之间,用户的重大利益期待一般包括:以私生活秘密不被公开、私生活安宁不被打扰为内容的隐私期待,以信息记载准确为内容的信用期待和名誉期待,以数据被妥善保存与使用的安全期待,等等。平台企业的重大利益期待一般表现为:向免费用户推送广告获利的期待,通过用户数据进行技术优化和产品创新的期待,保护既有市场竞争地位免于被不合理地替代的期待,等等。 可见,数据并非独立的民事法律关系客体,数据上承载的不同类型的利益才是。我们不能简单地说数据是财产权或者人格权的客体,而应当厘清数据上承载的不同利益类型以完善数据产权性质,而非当然地创设新类型的权利。所有的认知都是感知的结果,在明晰了数据的价值产生过程及其利益类型多样性后,下文将正面回答同一宗数据上,不同主体的利益期待相互冲突(或言谁的权利主张应当得到保护)的协调策略问题。
四、数据权益的二阶序列式分配规则
所谓有得必有失,法律能够提供的始终只是对部分预期(合法预期,legitimate expectations)而非全部预期的保护。法益位阶原则通常被作为解决预期冲突的有益思路和有效方法。由于学术研究和现实案例,都普遍承认数据既具有人格权属性,又具有财产权属性,甚至还包括国家主权等公共属性。因此,数据权益配置首当其冲应当考量的是,同一宗数据之上相互冲突的利益类型的位阶先后。其次,对于特定类别的利益(如财产利益),在无明确合意的情况下,结合数据价值产生过程,按贡献度确定各方的收益份额。 (一)公共利益和人格利益一般优先 社会的数智化转型发展出一种超大规模、超复杂的经济关系,我们对数据的控制也从“所有、占有、支配”向“共建、共享、共有”转型。面对日益复杂的关系类型和不断增长的当事人数量,我们可以通过明确“位阶价值”解决当事人间的权益冲突。法益位阶原则又被细化为以下两个子原则:一是公共利益一般优先。国家的目的就是最大程度地促进公共利益,实现社会最大多数人的幸福。并且,私人利益的维护也依赖于良好、有序的社会公共环境。公共利益的实现是法律追求的重要目的,它可以构成有权机关在合理限度内“入侵”个人人格权益和企业财产利益的正当理由。一般地,敏感信息一般不得成为数据分析和数据挖掘的对象,但国家安全、公共卫生安全等事由,构成处理敏感个人信息的正当原因。典型实例包括:疾控部门通过收集和分析感染者与密切接触者信息实现传染病的预防和救治、征信部门根据用户在网购和支付平台上的行为对其信用进行判断、部分人民法院通过用户的网购数据进行司法送法。个人数据和企业数据可被用于不同的与公共利益有关的领域。 二是人格利益优先于财产利益。人不应该被当作手段,而应始终被当作目的。人格尊严及其形象的社会评价,对人的生存和发展具有根本性的意义。正是在这样的认识前提下,以人为本是法治的灵魂,人本要素是智能社会法律秩序的终极关怀,人格权优先于财产权已经成为广泛分享的社会共识。因此,无论是欧盟《一般数据保护条例》、美国《加州消费者隐私权法案》,还是我国的《网络安全法》和《个人信息保护法》均将个人数据和非个人数据的区分作为最基本的数据分类标准。由于能够识别到个人的数据往往表现为用户人格利益的载体,对于此类数据,我们首先应当判断数据承载的人格利益的重要程度,而后才是回答何者的利益诉求优先以及是否支付了足额对价的问题。 具体而言,当用户和平台的利益期待相互冲突时,如果双方在数据服务合同中就数据权利内容和收益分配作出明确约定的,理应尊重当事人对私权利的自由约定。因为自由是每个人由于他的人性而具有的独一无二的、原生的、与生俱来的权利。但是,该类约定并非一律有效。法律是否肯定平台服务协议关于个人预先放弃部分数据权利的约定,关键还在于此类对自由的限制是否符合社会一般观念的评价。在民法上,最终要落脚于公序良俗的考量,即密尔主张的个人没有放弃自由的自由。此外,当双方没有约定或者约定无效的,用户的重大利益期待应当得到优先满足。同时,为了尽量不或尽量小地影响平台的投资积极性,法律有必要让用户通过适当的方式向数据平台支付对价。而用户重大人格利益的内涵,主要由《民法典》人格权编、《网络安全法》、《个人信息保护法》和《数据安全法》等法律法规加以明确,一般包括:数据收集过程中的知情同意、敏感信息禁止处理、隐私利益强化保护、数据安全得以保障、数据内容正确以及其他人格利益如名誉保护等利益期待。 此外,公共利益和人格利益优先于财产利益的标准也并不绝对。当公共利益和人格利益之间产生冲突的时候,如“棱镜门”事件、美国政府诉苹果公司协助解锁苹果手机案,何者利益优先应该是个案评判的问题。问题的答案可能因不同国家和地区对国家安全与隐私保护的态度,以及个案中呈现的利益重要性和紧急程度而有差异。例如,美国和伊朗对此问题的答案极有可能是不同的;又如,手机解锁案中如果请求解锁手机的目的并非为了收集罪证,而是为了预防和打击现实急迫的大规模恐怖袭击,人们的态度也极有可能发生变化。 (二)财产利益按贡献度分配 数据除了是一个多元共享的利益集合以外,它还作为新型生产资料参与到数据生产过程之中。以淘宝推出的生意参谋数据为例,它既可以帮助商家获得更精确、更有针对性的市场行情、用户偏好与趋势预测,从而以数据赋能商家的决策能力;又可以为阿里内部的其他部门,如广告推荐、金融服务、搜索开发等提供优化条件,为管理人员、产品经理和运营人员的决策和开发提供科学依据。从前文关于数据价值产生过程的描述来看,数据的增值与用户和企业的参与密切相关。当用户财产利益和平台财产利益相互冲突时,如Keep向京东共享匿名后的用户运动习惯数据,并获得可观收入时,用户可否要求Keep分享部分收益? 1.财产利益分配的两个目标:公平与效率 任何产权规则的设计都服务于一定的分配目标,数据也不例外。因此,在我们讨论数据权益分配规则之前,应当明确数据产业追求的目标到底是最大化数据这种生产资料的价值,还是强调人格权的保护。欧盟以保护用户人格尊严和人格自由为出发点,而美国则设定了保护隐私和数据商业化利用并重的目标,同时对于隐私的理解也经历了从“作为秘密的隐私”到“作为控制的隐私”的转变。基于我国数据产业体量大、国际化程度较高的特点,立法者在《个人信息保护法》和《数据安全法》中表达了与美国类似的立场,坚持保护个人信息安全与促进数据利用并重的方案。因此,数据财产利益的分配规则应当在确保各参与方数据安全等优先权益得到满足,前期投入得到公平补偿的基础上,尽可能提高数据产值。 随着社会“合作”不断加强,财产权的控制性和绝对性逐渐减少,转而表现为一定的社会性。法律的根本任务即在于维持个人的利己本能与合作本能之间的平衡。对此,效率理论表示,权益分配的规则设计是基于社会福利最大化的考虑,并且仅就如何分配该权属做出回应(当然必须符合正义原则)。功利主义哲学以人类“趋利避害”的特征作为理论基础,指出权利分配的目标应当是最大程度地提高人们的满意度或者福利。有基于此,理查德·波斯纳提出,财产权应当分配给对其更高价值的一方,应当被赋予那些最珍视它们的人。再以证券行情数据为例,虽然即时行情数据既承载了个人投资者合理使用的利益期待,又承载了量化投资者批量分析的利益期待,还承载了交易所掌握行情趋势、向会员单位提供行情服务的利益期待,但是交易所对即时行情数据的贡献度和重视程度明显高于前两者,这也是修订后的《证券法》明确将即时行情数据的权益分配给交易所的原因。 尽管将数据权属分配给企业能在一定程度上鼓励企业在数据分析、数据挖掘上的投入,有利于提高社会生产力。但是,社会福利不仅包括企业创造的经济收益,还包括每个社会成员的公平感和正义感。制度设计的另一项重要目标即在于提升社会的公平与正义感。分配正义与公正思想,是“解决每一个现代人所面对的生存和发展等最为重要事情的必须”。分配公平是实现社会福利的前提性条件,社会福利也包括了精神上正义感等抽象需求的满足,两者具有内在统一性。随着互联网巨头们争夺数据的游戏已经开始,“注意力商人”(attention merchant)的模式助其取得了大量用户数据。如果以后大家的行为偏好都建立在数据分析基础上,而控制数据的公司享有所有权,那可能会出现更严重的两极分化。除了经济效率以外,自由和个人自治也是衡量社会总福利的重要方面。因此,同样是从提高社会整体福利(包括经济的和非经济的福利)出发,有学者得出相反的结论,主张将数据权利分配给数据主体。 可见,数据财产权益的分配结论不是确定不变的,而应当将公平和效率这两个目标作为分配时的重要考量因素,并结合数据类型、数据承载的利益期待类型以及数据生产过程中各方贡献的比例加以判断。一般而言,在交易双方都能够影响结果的时候,决定权利最优配置的总原则是:对资产评价收入影响更大的一方,得到的产权份额也应该更大。由于企业具有比用户更强的数据增值动力,因此在企业满足向用户提供对价服务、妥善保护用户隐私等人格利益、维护数据安全的条件下,应当将数据的剩余索取权分配给企业。但按贡献分配的准则应当与纯粹程序正义的观念相契合,即社会和经济的不平等应当依系于在机会公平平等的条件下地位向所有人开放。具体表现为,当用户不同意或者撤回对个人信息处理的同意时,用户的贡献减少,但平台服务商也不得拒绝提供相应的产品或者服务,这是机会正义的基本要求。 2.按贡献度分配的法哲学基础 梭伦将正义阐释为“给一个人以其应得(desert)”。亚里士多德提出,分配的公正强调成比例,即各人按其贡献得其应得,一个人做了什么就得什么回报。在这样的指导思想下,我们可以得出如下结论:由于数据可能承载用户名誉、商家商誉,它还是数据企业财产利益的直接来源,因此数据的分配事关具体的公正。根据合比例的分配原则,各方分配的多少取决于其贡献程度,按贡献度分配是公平原则在分配领域的具体体现。 如前文对数据活动的过程描述展现的那样,若用户数据活动构成生产行为的,如自动驾驶数据和点评数据的生产,可以说用户的行为具有类似劳动或者资本一样的属性。用户的数据活动是数据生产过程的原材料,与企业技术人员的劳动一同产出数据产品这一结果。用户据此应当获得相应的“工资”或“利润”补偿,否则将丧失持续参与的动力。而对于使用微信等广泛存在的个人消费行为,其并无生产的目的,数据的产生是用户消费行为的正外部性结果。用户是否有权主张数据权益,取决于对此外部性调整的制度选择。而此时制度设计的基点不在于探求各方对数据这一宗财产的自然权利,而在于发现和固定数据生产、使用过程中各利益相关方的合理预期。 人们对资产的权利不是永久不变的,而是一系列变量的函数。传统地,每种要素所得到的报酬量取决于该要素的供给与需求,需求又取决于某种要素的边际生产率。在均衡时,每种要素赚到了它在物品与服务生产中的边际贡献的价值。但是,在算法和数据驱动经济中,要素投入和收益产出之间往往不再表现为单项线性增长关系,而呈现指数增长或非连续性增长的特征(如激活函数,sigmoid function),且多个要素之间存在交叉关系。在测量某要素贡献度时,我们应当充分考量数字经济赢家通吃、规模化(包括资本规模化和数据体量规模化)和非线性增长的特征,合理平衡数据产品短期收益与长期收益的分配比例。 3.按贡献度分配的内容纲要 要素的所有权仅仅是各利益相关方参与价值分配的法律基础,但各要素的贡献度才是各方参与分配的经济基础。当各要素的报酬与其贡献度相一致的情况下,按生产要素贡献分配符合亚里士多德所谓的分配正义。可见,数据要素按贡献分配不仅有利于激励数据产业的可持续生产,是效率原则的体现,也符合公平正义的价值标准。 具体而言,按贡献度分配的第一层含义可以被陈述为:谁投入,谁获益。贡献度作为需要算定的一项重要指标,需考虑多项因素。①首当其冲的是企业为发明所负担的费用,包括研究费、材料费、人员工资、管理人酬金、股东资本投入,等等。专利保护的实践经验表明,在测算各方对于技术成果的贡献程度时,不仅要考虑前期投入的成本,还要酌情考虑权利取得过程中、产业化过程中的投入。②其次是用户的贡献,包括个人隐私泄露成本、联网费用支出、用户在内容创造过程中付出的时间和精力成本,等等。③最后还要考虑前述要素间的组合效应。在大多数情况下,生产要素以某种方式组合在一起使用,改变任何一种生产要素供给的事件会改变所有要素的收入。对于多个要素的投入产出效率,我们可以通过Shapley值法和数据包络分析方法(DEA, Data Envelopment Analysis)进行测算。 按贡献度分配的第二层含义可以被陈述为:数据可分的情况下,分别控制;数据不可分的情况下,可携带权和补偿机制可以同时满足各方合理期待。一方面,若数据价值独立的,各方当事人对数据应当放弃共同控制(joint control)。典型的如云数据的控制,虽然该数据存储在企业的服务器上,但是账户和数据的实质控制权应当属于用户,企业在未得到用户许可的情况下不可访问其“家门”。 另一方面,如果数据之间是互补关系并且不止一个主体在其中发挥必不可少的作用,产权规则应当实现有效激励各方投资,最大化包括经济效率、行为自由和分配公平为内容的社会总福利的分配目标。在微信通讯录数据的场景下,表现为用户提供和产生的数据与微信平台数据存在互补关系,并且两者在微信产品的创建过程中都发挥了必不可少的作用。用户可以通过复制该宗数据的方式避免平台“敲竹杠”。数据复制权与可携带权这一“转化者”可以提高数据资源的可利用性,有效解决数据互补且对双方都必不可少的情况下数据的分配问题。实定法上,《加州消费者隐私权法案》第1条、《一般数据保护条例》第20条和我国《个人信息保护法》第45条均规定了类似的可携带权规则。 尽管目前尚无明确法律条文就数据权利作出规定,但各方当事人通过长期交易习惯与合同条款的约定,已经在事实上对数据经济权利的归属与内容达成了合意。然而,在各方合意不明的情况下,数据权益分配的两个原则应当以词典式次序排列,只有在充分满足了前一原则的情况下才考虑后一情况。它可以被陈述为:公共利益和人格利益一般优先;财产利益按贡献度分配。那么回答前面提到的Keep用户数据的例子,如果Keep拟向京东等第三方平台分享已经收集获取的用户数据,首先应当保障用户的数据安全以及个人信息不被非法利用。其次,对于由此获取的财产性收益,应当与用户共享。但此类补偿往往并不直接通过现金补偿的形式,而是通过向用户持续地提供免费、优质服务为隐性对价。 (三)二阶序列式分配规则的中国图景 数据权属的二阶序列式分配规则是在权利束理论基础上,以数据价值产生过程和数据上承载的利益类型为观察对象,建构的数据权益冲突的基本协调策略。由于任何有生命力的理论都应当服务于具体纠纷之解决,下文将以我国关于数据纠纷的真实案例为例,描绘二阶序列式分配规则的应用图景。 1.与人格利益有关的数据纠纷 正如前文所述,目前诉讼到法院的数据争议主要包括两类,一是企业与个人之间就数据权益产生的隐私权纠纷,二是企业与企业之间围绕大数据集合权属产生的不正当竞争纠纷。对于第一类纠纷而言,我们首先应当判断数据承载的人格利益的重要程度。如果数据涉及用户重大人格利益,法院便可根据“人格利益一般优先”的规则径直得出优先保护用户诉讼请求的结论,随后才需回答用户是否需要向企业支付对价以及支付多少对价的问题。 具体而言,如果用户和平台在数据服务合同中就数据权属作出明确约定的,该种约定应当是公平的、符合当事人真意的,且其内容具有一定程度的不可让渡性。由于用户通常没有耐心仔细阅读冗长的用户协议或者隐私条款,双方也无协商的空间。对于数据权属所作的本身不公平的格式条款,法院需要加以调整。此外,为保障用户的基本权益,避免第三人因用户协议频繁更新而产生的较高外部识别成本,标准合同中关于数据权属的约定还应符合最低程度的法律要求,不得自由处分不可让渡的权利。若标准合同的约定侵犯了用户隐私等不可让渡的权利,该格式条款的约定也因此而无效。 在用户和企业就数据权属没有约定或者约定无效的情况下,法院通常根据涉案数据与人格利益的关联程度,判断用户利益还是企业利益优先。典型的如小凌诉抖音案,法院认为用户姓名、电话和好友关系数据与个人密切相关,抖音通过读取前述数据的方式向其推荐可能认识的人,侵犯了用户的个人信息权益。相反,如果数据与人格利益关联性不大,而主要涉及财产利益的,在企业充分保护用户法定优先权益的情况下,企业的财产权益应当得到保护。例如,某导航平台与明星约定,明星仅需提供几句必要的导航播报,平台就可以通过AI自主学习的方式生成完整的导航语音数据包。此时,尽管明星依照《民法典》第1023条的规定对其声音享有人格利益,但导航语音包的开发系基于平台的大量技术和资金投入,且平台已向该明星支付了声音权的财产对价。因此,导航语音包的权益应当分配给企业,同时该企业有义务保护明星的声音按照合同的约定使用,而不对其人格尊严造成不良影响。 2.与人格利益无关的数据纠纷 第二类数据纠纷表现为与人格利益无关的争议,既包括用户与企业间因财产利益产生的冲突,又包括企业与企业之间因竞争利益产生的冲突。开篇提到的会员单位可否主张免费使用Level-1和Level-2数据即为前者,用户财产利益往往不是通过获取直接经济回报的方式实现,而是为了换取更好的对价服务。根据财产利益按贡献度分配的原则,结合长期形成的交易习惯,我们至少可以得出如下结论:由于投资者和券商对于Level-1数据的产生具有重要且不可替代的贡献,因此其可以免费使用Level-1数据,这符合各得其所的精神要义。但是,Level-2数据的价值主要基于证券交易所的挖掘和分析产生,投资者和券商在使用此类数据时应当支付合理对价。对于其他类型的数据财产利益,同样奉行根据贡献度分配的基本原则,这也是“普遍免费+个别付费”的制度实践。 对于企业与企业之间竞争利益冲突协调的问题,即如何在保护企业数据财产权与维护数据市场自由竞争之间进行平衡,实际上也离不开对各方贡献度的判断。在百度诉大众点评网不正当竞争纠纷中,二审上海知识产权法院的法官表示,百度地图抓取大众点评数据的行为不符合公认的商业道德,破坏了正常的竞争秩序,判决百度的行为构成不正当竞争。但在属于同一类型的hiQ诉LinkedIn案件中,美国第九巡回法院的法官却表示,LinkedIn平台上的数据是基于用户的贡献产生,用户而不是LinkedIn享有这些数据的所有权。从用户将其数据公开的行为本身并不能解释出用户禁止第三方收集数据的意思表示。因此,法院通过诉前禁令(preliminary injunction)的方式要求LinkedIn移除对hiQ的技术屏蔽。 两案裁判结果的差异看似源于两国关于数据市场开放和竞争程度所秉持的态度不同,实际上也是因为法官对于原数据企业在公开数据集中的贡献度判断存在差异。我国司法裁判一般认为原数据企业对于其投入资金和技术加工形成的、与人格无关的数据集享有数据财产权,实际上表达了这样一种价值判断结论:大众点评数据集主要依赖于企业而非个人的贡献产生。与此相对,美国法院则认为,用户对于LinkedIn这类以汇集、而非挖掘计算形成的数据集的产生具有主要贡献,因此用户而非原数据企业对于此类数据享有权利。前述案例向我们展现了二阶序列式分配规则的中国应用。对于各方贡献度的衡量本就是一个价值判断问题,无对错之分,一个更好的价值判断结论应当是符合我国数据产业发展和公平正义观的结论。
五、结语:数据确权中的动态平衡
数据作为信息时代除劳动、资本以外的又一重要生产要素,必将成为多方争抢和博弈的对象。为避免理论研究的碎片化和“自说自话”现象,本文试图在广泛观察和总结社交数据、电商数据和行情数据的生产过程和利益类型的基础上,为数据确权问题抽象出一套统一的分析框架和原则,从而为场景化的研究提供交流和对话的空间。数据财产是在数据主体(自然人)与数据企业(数据加工者)双向动态合作的过程中产生的。它既包含了国家打击犯罪等公共利益,也承载了用户隐私保护等人格利益,还有用户拓展社交关系网、企业以数据作为营利工具等财产利益。并且,数据的体量及其利益期待的数量也会随着数据生产过程的深入和数据挖掘能力的提高而不断扩展。面对数据权益集合中不同利益期待之间的冲突,本文提出两个基本的协调原则:一是根据权利位阶理论,公共利益和人格利益的保护一般优先;二是同位阶的财产利益的分配以各方贡献度为标准。 回到开篇的“人人网”数据之问,对于个人资料、用户照片等数据,由于该数据与自然人人格尊严密切相关的,且数据产生的主要原因是依赖于用户的智力“劳动”,因此用户有权行使导出该宗数据的权利。而平台上的足迹数据、点名数据等用户和平台共同创设的数据,其权属划分首先依据平台协议的约定,如果没有约定或者约定显失公平的,法院应当根据各自的贡献大小确定其权利范围。法律保护的并非数据本身,而是数据上承载的不同法益。对数据权属问题的回答可以依据一个统一的判断标准,但绝无一个一成不变的标准答案。正如前文所述,数据体量和利用方式在不断增长,各方的利益期待也在不断变化。依赖于私权的静态保护范式,在客观上加大了数据流动的制度成本。因此,数据确权法律问题的答案是立足于具体应用场景和具体行为诉求的产物,可谓在技术更迭中寻求分配正义的动态平衡。