数据要素治理 | 数据所有权:问题盘点与总结(上)
The following article is from 数据信任与治理 Author 数治君
编者按:
一直关注数据安全,公号君决定新开一个系列的研究笔记,关注数据要素治理。此前,本公号发表过的关于数据要素治理的相关文章包括:
近日公号君学习了另一篇很不错的学术文章——《数据科学前沿》(Frontiers in Data Science)第四章Data ownership: Taking stock and mapping the issues,并对此摘译与大家分享。摘译首发于公号君参与运营的另外一个公众号:数据信任与治理。【数据所有权:问题盘点与总结(上)】本篇为摘译的上篇。
1. 简介
是否应确立数据所有权是近来的法律和公众辩论都在讨论的问题。本文将盘点和总结与数据所有权相关的问题,旨在为未来的研究打下坚实基础。
本文涵盖了数据所有权的核心内容,分为互相联系和相互影响的三个部分:数据所有权的理由、特征和实施。本文总结数据所有权相关问题的出发点是,目前瑞士以及所有其他欧洲司法辖区的法律并没有对数据本身授予所有权。本文对数据所有权的分析主要基于瑞士法律,并在必要时考虑欧盟法律。
虽然数据所有权常被用来表示关于数据的排他性和对世的权利,但本文既不想过度限制本章的范围,也不想将数据所有权本身局限于某些特征,因此本文在尽可能广泛的意义上理解数据所有权的涵义。
虽然数据所有权最近才引起了广泛关注,但这个概念并不新鲜。美国在20世纪90年代初就开始倡导数据所有权,但当时的讨论没有在瑞士或其他欧洲国家引起共鸣。今天的情况与彼时不同。数据所有权给那些希望释放数据经济潜力的人和那些试图重新赋予失去数据控制权的个人权利的人带来了希望。
数据所有权的讨论涉及不同类型的数据(个人数据和非个人数据)以及不同的利益相关者(个人和公司实体)。这就产生了数据所有权是否必须分别对不同类型的数据和利益相关者进行特殊处理的问题。本文认为,有充分的理由从整体出发探讨数据所有权问题。原因是:(a)个人和非个人数据之间的区别是模糊的(通过数据分析,非个人数据往往可以重新回溯于个人)在探讨数据所有权时,不可能不考虑其与数据保护法的相互作用;(b)只要不决定谁最初有权获得数据所有权,评估就不能局限于个人或公司。
本文承认,法律不能回答所有关于数据所有权的问题,技术和经济也非常重要,可能需要跨学科的研究。尽管如此,法律研究依然可以提供一个有说服力的总体框架,应该在这个总法律框架内考虑其他学科。
2. 理论依据
本文将从两个角度讨论是否需要引入数据所有权:一是可以在理论层面上寻求答案;二是可以通过观察实践中的真实问题很好地说明是否有必要采取行动。本文还将简要探讨在理论和实践中都很重要的法律确定性。
2.1 理论上的考虑
本文将从现有文献中梳理支持数据所有权的论点,并评估各论点的说服力。
首先,有学者仅声称有必要建立数据所有权,却没有说明理由,这是不合理的。引入数据所有权可能对权利人有利,但对于没有取得该权利的个人(甚至社会)而言显然是不利的。数据所有权将改变社会中的利益平衡,因此该权利必须被证明具有合理性。
其次,有学者指出数据是有价值的,因此要用所有权保护。这不能说明根本问题:数据的固有价值是否很容易被盗用,从而产生不必要的或不公正的影响。
最后,其他学者提出了功利主义的论点:引入数据所有权是为了防止或纠正市场失灵。该论点符合正统法律理论,特别适用于知识产权的合理化,也可扩展到一般的产权。本文建议区分狭义的市场失灵和广义的市场失灵,但有两点需要注意。
第一,本文没有忽视所有权可能存在非功利性的理由。比如:(a)(个人)数据是人格的体现,因此属于这个人(人格权论);(b)个人(企业)应有权享受他/她/它的劳动成果,因此对其产生的数据拥有权利;(c)公平的概念。本文将在市场失灵的背景下尽可能讨论这些理由。
第二,本文承认目前还没有统一的市场失灵的概念。但是,本文还是用这个词作为分析工具,来构建潜在数据所有权的不同理由。
2.2 狭义的市场失灵
狭义的市场失灵发生在所有权保护的对象(数据)没有被有效地创造或使用的情况下。该观点认为,数据这种可无限复制的非竞争品往往不会因为消费而被过度使用。因此,数据生产者只有在能够收回投资的前提下,才会有动力对创建数据投资。
几乎没有学者支持上述观点。虽然有观点认为数据所有权会增加对数据收集的激励:数据受制于披露悖论:卖方必须在转让或许可时一定程度上披露数据以便买方评估其价值,但数据一经披露就失去了价值,也就没必要再转让数据,从而导致市场失灵。然而,该观点忽视大数据集不需要在交易前充分披露的事实。而且,分析处理数据需要实际接触到数据集,所以仅披露数据集的内容一般没有价值。因此,数据需要保护才能够被转让或许可的观点站不住脚。
此外,经验性证据表明,披露悖论并不会对数据的生产和/或收集造成负面影响。欧盟委员会称,大数据市场的增长约为整个ICT市场增长的七倍。实践中广泛存在的数据转让和许可协议也表明,即使不存在排他性权利,也可以进行数据交易。显然,事实上的排他性就足够了。数据的生产不需要额外激励这一点已成共识,人们不会因为有产权就创造更多关于自己的数据。而且,数据收集成本正在下降,这降低了为激励数据的收集而引入产权的必要性。
综上,不需要通过引入产权对数据生产和投资进行激励这一点已成共识。虽然否认狭义上的市场失灵的论点占据上风,但公平起见,也不能轻易地否定数据所有权可能激励更多交易产生的观点。
2.1.2 广泛意义上的市场失灵
可从更广泛的意义上理解市场失灵。现有文献认为,数据所有权可通过以下方式纠正广义市场失灵:(a)降低数据合同的交易成本;(b)纠正成本和收益的错误分配。这两者都可能导致市场分配不公,从而对数据的交易市场产生负面影响。
2.1.2.1 交易成本
市场失灵可能由过高的交易成本引起。交易成本可以分为搜索成本和谈判成本。如果没有标准化的财产制度,缔约方就必须进行昂贵的搜索。在谈判成本方面也可做相同推理。在目前的操作方式下,通过合同授予数据有关权利往往很复杂,起草、理解和遵守合同条款也会产生成本。
因此,作为一种财产形式,数据所有权可进行标准化,从而减少搜索和谈判成本。从理论上讲,分配所有权也与提高数据的可销售性有关。
要想了解全局,还必须考虑新的产权引起的交易成本。一方面,人们对引入新产权和增加法律确定性以及降低交易成本之间的因果关系持怀疑态度。另一方面,引入产权后,数据使用者要单独确定数据所有者并与其谈判许可条款,这也会产生极大的搜索和谈判成本。
综上,关于交易成本的论点可能站得住脚,但仍需进一步的实证研究进行评估。也必须考虑到,现行制度的任何改变都可能导致大量新交易成本。
2.1.2.2 成本和收益的错误分配
有学者提出,收集数据的公司通过事实上的排他性保护将收益内部化,而将损失外部化,这导致了市场失灵。虽然该论点最初是在20世纪90年代的直销背景下提出的,但在大数据和互联网平台时代同样适用。
与彼时一样,用户将个人数据传输给公司,失去了对其数据的控制。因为私人信息的披露而遭受损失的是用户而非公司;因此,损失是外部化的。
与彼时不同的是,公司如今可声称他们提供了有价值的免费服务以换取数据。但从纯粹的财务角度来看,公司仍将交易的大部分利益内部化。
数据所有权的支持者据此指出,数据所有权将有助于加强个人对其信息的控制。目前,个人在向公司提供数据时几乎没有议价能力。那么赋予个人对其数据的所有权是否可以改善现状,即外部性是否真的会被内部化?数据所有权并不能改变数据主体和数据处理者之间的不公平事实:仅通过使用转让协议,就可以尽可能地把所有权利分配给公司。然而,部分文献不愿意承认这种悲观的观点。
有学者认为,行为经济学中的禀赋效应可促进公平竞争:产权拥有者往往比其他人更看重一件物品。如果个人被授予其数据的产权,他们会更重视自己的数据。然而,当个人与Facebook等公司谈判服务条款时,不能确定个人对数据的所有权能够在其中发挥作用。即使在数据所有权的支持者中,也有人怀疑仅存在这种权利是否足以达到预期的效果(有学者提出还需要建设使数据所有权有效运作的基础设施)。
据此,已有观点认为应当采取制度性的措施。将个人数据集中起来,以取得相对于大公司的一些杠杆作用,这种模式在不久的将来会得到市场的检验。但应当认识到,数据所有权在为协同行动而汇集数据并不是必须的。
2.2 实际考虑
现有法律在数据方面存在缺陷。那么新的法律工具(数据所有权)是否可以弥补这些缺陷?
最明显的一个缺陷是:最初向提供数据的人不能从破产的公司中收回数据。比如云服务提供商破产的情形中,如果提供商没有破产,当提供商删除了用户提供的数据时,用户可对提供商提出合同索赔。但在B2C关系中,提供数据的一方可能已接受了对其不利的格式条款并放弃了其收回数据或获得损害赔偿的权利。
另一个缺陷是,如果存储介质上的数据被拥有该存储介质的人删除,那么该数据的丢失通常无法补救。
虽然以上两个实践问题并不详尽,但是可以确定的是,实践中尚未出现系统性的法律缺陷。为了解决特定问题而全面引入数据所有权也没有必要,反而可能会造成许多甚至无法预见的新问题(如税收问题)。
2.3 法律的不确定性
数据所有权的支持者认为,明确的数据法律归属是合同谈判的起点,也确保了没有合同的情况下默认的利益分配,从而减少法律的不确定性。但如前文所述,所有权的默认分配可能是个相当艰巨的任务。反对者则认为,引入数据所有权会增加法律的不确定性。引入产权会引起谁是所收集数据的所有者的问题,且随之而来的所有权诉讼将是昂贵的且低效的。
2.4 后果
根据上述对理论观点的分析可得出两个结论:首先,没有明确证据证明存在狭义的市场失灵。因此,增加或激励数据生产的论点不能证明数据所有权的合理性。其次,新的数据所有权可能会纠正广义的市场失灵。数据所有权可能降低交易成本。但该论点仍缺乏量化基础(目前制度下的交易成本如何,这些成本是否会因引入所有权而降低,以及是否会有新成本),需要进一步的经济分析。
本文考虑了实际问题并提出了相应意见。仅因目前的已知问题而全面引入数据所有权很可能事与愿违。
3.特征
数据所有权的特征是由其保护客体、权利持有人、保护范围和公开性决定的。
3.1 保护客体
数据所有权的客体是数据,但数据的概念并不简单明了。与大多数文章一样,本文将数据、信息和知识这些术语分别归属于语法、语义和语用层面。
3.1.1 数据、信息和知识
数据可在三个不同层面得到保护:语法层、语义层和语用层。语法层代表了数据的结构,即以特定顺序排列的一串0和1。这些数据可以单独或与其他数据一起也构成语义层面的信息。语义层包括数据背后的意义(即信息)。从语法到语义的转变需要机器来阅读和翻译数据以提取信息。信息是有意义的,因此信息需要接收者(人类的认知能力)。最后,如果信息是有意义的,它可单独或与其他信息一起构成语用层面的知识。因此,语用层面指的是有用的知识。除此之外,还有学者提到了被定义为信息的物理体现的结构性信息的概念。该定义的结论是:数据在语法层面代表一串0和1,但语义层面的信息和语用层面的知识也由数据组成。
目前有两种关于保护客体的立场,主要集中在数据是应该在语法层面还是语义层面受到保护。大多数学者仅赞成保护语法层面,并认为对保护语义层面将导致对信息的垄断。第二种观点认为,保护语法层面至少会间接地导致对语义和语用层面的保护,进而导致数据垄断。这两种观点的核心区分在于是否可以真的将语法和语义层面分开。
3.1.2 其他分类法
以往的文献还提出了其他分类法,这虽然与确定保护对象没有直接关系, 但可以间接地影响数据所有权的特征。
3.1.2.1 自愿、观察和推断的数据
世界经济论坛(WEF)在2011年提出了一个数据分类法。WEF关注“数据是如何产生的”而非“有哪些类型的数据”,区分了自愿提供的数据、观察的数据和推断的数据。
自愿提供的数据是由个人明确分享的。由于个人往往与其提供的数据有强烈情感联系,此类数据的量最少。
观察数据是指不是由个人提供的,而是关于个人的数据。观察数据涉及个人行为的记录,个人对于此类数据的收集或后续使用和价值没有意识。广义的观察数据还包括机器或个人收集的所有类型的数据。
推断的数据是指来自不同来源的不同数据类型,主要用于预测目的。对于此类数据,个人不仅缺乏意识,也失去了对使用的控制。WEF认为,此类数据对创新和经济增长的潜力最大。
WEF的分类法说明:数据的创造(即使是机器创造)需要人类一定程度的参与,但个人很少意识到。
3.1.2.2 数据作为公共、私人或俱乐部物品
数据常被称为公共物品,但这有待详细评估。公共产品是非竞争性和非排他性的。数据是非竞争性的,但数据本身并不非不可排他,他人可通过事实上的(保密或加密)或法律手段来防止访问和使用数据。如此一来, 数据就被认为是一种俱乐部物品。
3.1.2.3 数据作为单方面或商品式的资产
数据(信息)既可被描述为单方面(unitary)资产,也可以被描述为商品资产,这对数据所有权的保护范围至关重要。
单方面的方法不考虑他人如何获得数据或其中的信息,拥有数据或数据中某一的信息的其他人被视为拥有同一数据。
商品式的路径对权利的界定不仅涉及数据本身,还涉及持有数据中所体现的信息的人(或公司)。若两家公司分别获得了特定的信息,他们对这些信息产权的权利是彼此独立。因此,一公司没有阻止另一公司使用独立获得的数据的法律手段。
可选任一方法设计规范性结构。大多数现代财产法都遵循商品式方法处理信息问题,版权法就是典型例子。
3.2 权利的持有人
确定数据所有权的初始归属(分配问题)相当困难。首先必须确定归属的标准,然后必须解决数据所有权是否应该或可以有多个所有者的问题。
3.2.1 可能的归属标准
尽管仍未形成共识,但学者们已经制定了一些数据所有权归属的标准:(a)数据的书写;(b)对数据生成或存储的投资;(c)合同安排;(d)数据主体。
3.2.1.1 书写
有学者认为,书写数据的行为是识别权利人的决定性因素。书写可以确定数据被记录和/或存储的确切时刻,数据因此可归属于产生它的人。如果同时涉及几个人,通过书写确定权利人可能很复杂。如在医疗咨询中,数据可由医生、助手、电子设备、专门的实验室等记录。对此,一些学者认为,应将重点放在对书写的影响上,但该标准反而将确定归属变得更加困难。
3.2.1.2 投资
一些学者从组织或经济角度出发,建议将谁造成了数据的产生或储存作为确定标准。但这也不可能明确权利的归属。比如,医生、医疗设备制造商和医疗实验室都进行了大量的投资。
3.2.1.3 合同
虽然发起人一般应是数据的所有者,但合同安排(如雇佣或代理合同)会导致原始所有权在另一个人身上产生。合同不能为所有情况提供默认的归属。
3.2.1.4 数据主体
有学者将数据所有权理解为帮助个人重新获得对其个人信息的控制权,因而将数据所有权归属于数据主体。但这种推理方式仅限于个人数据,而且忽略了存储数据或投资于生产个人数据的个人或公司的利益。
3.2.2 集体所有权
前文提到的各标准都不太能明确数据所有权的归属,个人数据则导致该问题更加地复杂化。本文提出为新的数据所有权制定具体的集体所有制规则的假设。
集体所有权规则依权利特点而有所不同:如果数据所有权类似于实物的财产权,则可借鉴共同所有权;但如果数据所有权仅是针对特定行为和禁止的规定而不是基于物权,那么集体所有权就既不可能也没有必要。
本文下篇将讨论数据所有权的保护范围及其实施,敬请期待。
域外数据安全和个人信息保护领域的权威文件,DPO社群的全文翻译:
DPO线下沙龙的实录见:
个人数据与域外国家安全审查系列文章
围绕着TIKTOK和WECHAT的总统令,本公号发表了以下文章:
第29条工作组/EDPB关于GDPR的指导意见的翻译:
关于美国出口管制制度,本公号发表过系列文章:
供应链安全文章:
传染病疫情防控与个人信息保护系列文章
关于数据与竞争政策的翻译和分析:
健康医疗大数据系列文章:
网联汽车数据和自动驾驶的系列文章:
网络空间的国际法适用问题系列文章:
人脸识别系列文章:
关于欧盟技术主权相关举措的翻译和分析:
关于保护网络和信息系统安全的相关文章包括:
中国个人信息保护立法的相关文章包括:
《网络数据安全管理条例(征求意见稿)》系列文章:
个性化广告系列文章包括:
业务场景中的数据跨境流动文章如下:
《数据安全法》的相关文章包括:
关于数据执法跨境调取的相关文章:
赴美上市的中国公司在网络、数据安全的文章如下:
关于健康医疗数据方面的文章有:
关于人工智能安全和监管,本公号发布过以下文章:
数字贸易协定系列文章:
关于中美与国家安全相关的审查机制,本公号发布过以下文章:
美国电信行业涉及外国参与的安全审查(一):基本制度介绍
美国电信行业涉及外国参与的安全审查(二):国际性的第214节授权
美国电信行业涉及外国参与的安全审查(三):建立外国参与安全审查的行政令
美国电信行业涉及外国参与的安全审查(四):FCC对中国企业的陈述理由令
数据的安全、个人信息保护、不正当竞争等方面的重大案例: