查看原文
其他

申卫星 | 论数据产权制度的层级性:“三三制”数据确权法

申卫星 中国法学 2024-01-09

编者按:

为落实中共中央宣传部 教育部 科技部印发《关于推动学术期刊繁荣发展的意见》精神,顺应媒体融合发展趋势,积极适应移动化、智能化发展方向,《中国法学》推出网络优先出版等新型出版模式。目前,已于“中国知网”上线2023年第4期《中国法学》知网首发文章,并于微信公众平台同步推出,敬请关注!




论数据产权制度的层级性:“三三制”数据确权法

申卫星

清华大学法学院教授


本文发表于《中国法学》2023年第4期,因篇幅限制,注释省略。作者身份信息为发文时信息。


内容提要

数据确权问题已成为阻碍我国数字经济快速发展的最大制度障碍。数据确权之所以难,缘于现有的讨论存在概念混杂纠缠和平面化思维。数据产权制度设计应采取秩序概念基础上的层级性思维,通过横向分层和纵向分阶实现从原始数据到数据应用的解耦。即从客体、主体、内容三层横向对数据与信息、数据的来源者与处理者、来源者所有权与处理者用益权进行分离;纵向按照数据生成的周期,将数据生成区分为数据资源采集、数据集合加工利用和数据产品经营三个不同阶段;在尊重数据来源者初始数据所有权的同时,以企业数据用益权为基础权利,为数据采集、数据加工利用、数据产品交易构建数据资源持有权、数据加工使用权、数据产品经营权三阶段分层确权格局。

关键词

层级性思维  数据资源持有权  数据加工使用权  数据产品经营权

目  次

一、引言

二、数据确权思维转型:从平面化到层级性

三、横向分层:数据产权要素的三层分离

四、纵向分级:数据三阶段确权及其实现路径

五、结语

一、引 言

随着现代社会发展,生产要素已不仅限于最初的土地、劳动和资本,尤其对如今数字经济而言,数据才是核心的生产要素。2019年10月,党的十九届四中全会提出:“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,首次明确将数据列为生产要素。作为生产要素,数据所扮演的角色更为重要,数据确权也因此成为当下的重要议题。中央层面已就此作出了建构数据产权的前瞻性部署。2020年4月,中共中央、国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》这一纲领性文件,提出了“根据数据性质完善产权性质”的政策目标。此后,中央先后在多部重要文件中重申并完善了这一目标:2022年2月,中共中央、国务院发布了《关于新时代加快完善社会主义市场经济体制的意见》,重申构建数据产权制度、完善数据权属界定这一重要目标;2022年6月22日,中央全面深化改革委员会第26次会议审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》),习近平总书记在主持会议时强调,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系;2022年12月2日,中共中央、国务院正式对外发布了《数据二十条》,其中提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。可见,构建结构性分置的数据产权制度、完善数据权属分配规则已经在中央层面形成高度共识,成为整个数据基础制度体系构建的逻辑起点。

但从学术界现有研究来看,对于数据是否应当确权、应当确立何种产权以及产权应当如何配置等问题,至今众说纷纭,司法判决亦尚无定论。可以说,数据确权问题已经成为当今数字经济发展最大的难点和堵点。之所以出现这种困难,是因为学界在讨论数据确权问题时,既未把握好数据、信息及隐私之间的差序格局,也未认识到数据内部复杂的层级结构,从而陷入了平面化确权的思维定式。具体表现之一是人们谈论数据时将数据与隐私、个人信息混同,从而得出数据无法交易的激进结论,为数据确权造成认知困扰。事实上,数据的形成是一个诸多主体多重参与的链条,在“数据资源—数据集合—数据产品”的生成过程中,包含了数据的收集者、存储者、传输者、加工者、分析者、使用者等众多参与者,这些参与者在数据生成的不同阶段所扮演的角色和所贡献的程度不尽相同,若将上揭过程压缩成一个点来讨论产权配置问题,自然就很难准确反映出不同参与者的贡献,产权分配结果也难称公平。故此,数据特有的层级性架构和数据形成主体多元化的特点,要求数据确权思维应当发生转变——不宜再套用传统的平面化思维来思考,而应树立立体化的数据确权层级思维。


二、数据确权思维转型:从平面化到层级性

构建一套逻辑严谨、层次分明的数据层级体系,是数据确权的重要前提。笔者认为,在这一体系中,横向上需要将数据与信息、隐私进行区分和解耦,在数据与其周边概念之间建立一套流动过渡的差序层级格局;纵向上,需要根据数据价值创造的线性特点,就生成过程搭建起一条三级递进的逻辑链条:“数据资源—数据集合—数据产品”。数据确权问题需嵌套在这一层级体系中讨论。

从法学发展史上看,自利益法学派巨擘赫克(Heck)提出了法学的三类概念,即应然概念(Sollenbegriff)、实然概念(Seinsbegriff)、秩序概念(Ordungsbegriff)之后,拉德布鲁赫(Radbruch)进一步跟进,基于秩序概念提出了类型思维层级性。1938年,拉德布鲁赫发表了《法律思维中的归类概念与秩序概念》(Klassenbegriffe und Ordnungsbegriffe im Rechtsdenken),首次将层级思维引入法学领域。该文分别对归类概念与秩序概念进行了研究:归类概念(Klassensbegriff, 逻辑学意义上的传统概念)采用的是根据特征而归类的概念思维,系一种区分此物与彼物的分离式思维,不同概念之间界限明确而相互分离。此种思维模式“瓦解和破坏了生活的整体关联性”,忽略了生活中万物万象的边界是模糊不清而具有流动性的。而秩序概念(Ordungsbegriff)采用的是类型层级思维,即类型具有层级性特征,同一类型的范围可以由数个不同的层级构成,不同层级间可以相互流动过渡,并呈现出一种次序排列的状态。

秩序概念的核心特点在于其层级性且不同层级之间可以流动过渡,正如拉伦茨指出的:“一类型相较于其他可比较的类型,并非界限固定的;相反,它仿佛是流动的:经由不同的强调重点的移动及特征的变化,它便转向另一类型”。基于层级思维,可以在隐私、信息、数据之间构建一套流动过渡的秩序概念体系。具体而言,个人数据作为个人信息的载体,位于符号层;而广义上数据可以分为符号层和内容层,其中,内容层的数据进入个人信息的范畴;若个人信息涉及对隐私事实的信息化描述,构成私密信息则进入位于事实层的个人隐私的范畴。由此可见,个人信息与隐私有别,同时借助私密信息与事实层的隐私进行了向上的流动;同时,作为内容层向下与作为符号层的数据进行了对接。如此,隐私、个人信息和数据就构成了一个秩序概念的体系。唯有基于以上对权利客体的隐私、个人信息和数据三者之间关系的厘清,方可进一步考察数据权利本身,构建起数字时代数字权利体系的差序格局。

秩序概念注重同一类型内部存在的不同层级关系,适用到产权界定上,便是针对同一类型产权的不同层级形态进行分层确权。例如,自然资源蕴含着全民、国家或集体以及个体等多种利益关系,但学界围绕自然资源国家(集体)所有权的定性展开的诸多论证也大多限于一种平面化定性逻辑,将其界定为单纯的公权力、私权利等。但自然资源之上的权利关系纵横交错,意味着很难对自然资源国家(集体)所有权进行平面化定性,而是应将其置于自然资源的权利层次性中予以科学解读。在整个自然资源权利链条中,自然资源所有权可以分为四个层级的权利:宪法上的自然资源国家(集体)所有权、民法上的自然资源国家(集体)所有权、民法中的自然资源用益物权以及自然资源产品所有权。

数据之上的权利亦深具层级性,不同层级之上承载不同主体的利益关系也各不相同,故针对数据产权的权利性质及归属问题,需嵌入到“数据资源—数据集合—数据产品”这一链条中讨论,不宜孤立地对数据进行平面化确权。数据和数据要素是两个不同的概念。只有把数据和数据的采集、存储、处理、分析、应用等一系列劳动相结合,数据才真正具有价值并发挥作用,此时数据才能被称为生产要素。在数据要素化的过程中,数据经历了从最初数据资源的采集;到经过清洗、入库变成标品,汇聚成数据集合;再到最后提供数据产品或服务。在这一过程中,数据的形态不断变化,价值得以倍增,呈现出了一条复杂的流程线。如果将该流程压缩成一个点进行平面化确权,将不可避免造成“以点带面”的困扰——只有分层级讨论数据权属问题,才能使得数据确权具有逻辑与事实相统一的扎实基础。

为此,有必要构建数据产权层级理论体系,以切实解决数据确权难题,补强数据确权方案的理论逻辑性和实践指导性。数据产权层级理论体系可以从横向和纵向两个维度展开。

从横向上看,每一层广义上的数据虽然问题侧重点不同,但均存在共通性问题:其一,人们在谈论数据时,往往会联想到数据所承载的信息,进而延伸想到隐私,如此将不同客体混为一谈地进行赋权,必然会出现逻辑上的纠缠;其二,在数据形成生命周期的不同阶段往往是由众多数据参与者共同作用,面对众多数据参与方,应基于何种逻辑来确定产权的归属以及各方相应的法律地位,进而构建满足各方合理诉求的产权配置方案,成为考验我们的一个时代难题。因此,在横向上需要将数据与信息、隐私进行区分和解耦,在数据与其周边概念之间建立一套流动过渡的差序层级格局。同时,在数据生成过程中,针对所涉众多参与者,应根据不同主体的贡献来源和程度对数据产权进行结构性分置,实现数据持有权、加工使用权等权利的合理分配,从而由单一产权向分割产权过渡。

从纵向上看,在数据要素化过程中,数据形态发生了三次变化:从最初数据资源的采集,产生原始数据资源;到经过清洗、入库变成标品,汇聚成数据集合;再到最后开发、衍生出数据产品,从而在数据内部形成了“数据资源—数据集合—数据产品”三级递进的价值链条。在各个环节,每当数据要素发生形态转换时,数据产权的客体、主体、内容均发生变化,故需要对其权属进行分别界定。《数据二十条》提出的“数据资源持有权、数据加工使用权、数据产品经营权”实际上暗含着一种分层确权的思路:在数据采集阶段,基于知情同意的授权行为,实现作为数据来源者用户的数据所有权与作为数据处理者企业的数据用益权的分离,企业凭借数据用益权享有对其采集的他人数据资源享有持有权;在数据汇集后,数据企业基于其先前取得的数据用益权享有对其持有数据的加工使用权,从而可将原始数据资源加工成为数据集合等数据标品,并实现标准化基础上的定价和交易;数据企业基于其享有的数据用益权,在数据标品的基础上还可以研发出各种数据产品,进而对其数据产品享有经营权。


三、横向分层:数据产权要素的三层分离

在“数据资源—数据集合—数据产品”三个层次中,无论是哪一层次的数据,在确权过程中均面临权利客体容易混淆、单一产权结构难以适用的难题。为此,有必要借助权利分割思想,对数据产权的客体、主体及内容进行层层分离,剥离掉与数据确权无关的干扰要素,同时通过数据产权结构性分置的方式,实现数据产权在多元主体之间的合理配置。

早在古罗马时期,权利分割思想便已萌芽。罗马法将物权分为自物权和他物权,自物权人可根据需要在一定范围和期间内出让部分权能,为他人设立他物权。由于他物权派生于自物权,且权利内容受特定目的限制,故又被称为派生物权或限定物权。现代所有权理论关于其本质要素的讨论也表明,所有权的权能是可以分割的。德国学界基于权利分割思想(Abspaltungsgedanke),提出了源权利(Quellrecht)和限制权利(beschränktes Recht)两组概念,源权利人可以从源权利中分离出有限权利,并将其授予其他人。以所有权为例,源权利人可以将所有权的使用权能与变价权能分离,创设出用益物权与担保物权,以实现物的使用价值与交换价值,达到物尽其用。此种权利分割模式也被我国学者称为“母权—子权”结构理论。

权利分割思想对数据产权制度建构具有重要启示意义。数据产权建构首先需要在权利客体层面严格区分信息与数据,并分别为个人创设个人信息人格权和个人数据所有权,进而基于权利分割思想从后者分离出企业数据用益权。

(一)数据产权客体:数据和信息的分离

对数据产权进行私法构造时,数据产权的客体尤为重要,其不仅是数据产权设立的基础,而且是数据产权的构成要素。在既有研究中,“权利的客体是权利设立的基础”的认知已经成为基本共识。可以说,“客体是私权的构成要素和载体”。因此,在私法视野下构造数据产权必须以确定其客体范畴为基础。然而,数据和个人信息在制度规范、司法裁判与学术研究中常被模糊性通用,这不仅会对法院保护数据产权、进行法律论证造成困扰,还会引发权利设定偏差。为此,在建构数据产权之前,必须对数据和个人信息进行区分,阐明其具有不同的法律特征、归属为不同的权利客体。

就数据和个人信息的关系,欧盟《通用数据保护条例》并未予以区分,该法第4条第1项将“个人数据”界定为“与已识别或者可识别之自然人(‘数据主体’)有关的信息”。这种对信息和数据不加区分的做法对我国学界产生了很大影响,我国许多学者在讨论问题时,很多时候也将信息和数据混同,认为个人信息就是个人数据,只是在称谓上存在不同而已。这就导致出现了一种思维定式,当谈到数据时,往往会想到个人信息,进而想到隐私。由这种思维定式会得出一个非常激进的结论:企业不能控制个人数据,控制数据就是控制了个人信息或隐私,进而得出个人数据不能被交易的谬解,致使数据产权制度难以建构。

数据和个人信息确实结合非常紧密,以至于难以区别,但是正如分子可以细分为原子,原子还可分为电子、质子、中子一样,各部分之间联系无论多么紧密,仍有区别的必要和可能。信息和数据的区别在于:信息的功用在于消除人们认识上的不确定性,它是一种体现语义的信息,位于内容层;而数据是对信息内容进行记录的句法信息,是信息的载体。可以说,信息与数据之间彼此依存且互为依托,可谓“橘肉和橘皮”的关系,橘皮毕竟不同于橘肉,并不因其结合紧密而不可区分。

数据和信息的区分不单单是纯粹学理上的分析或者学者的设想,更有其法律根据。在规范层面,《民法总则》的制定过程已表明了区分信息与数据的立场。《民法总则(草案·一审稿)》第108条第2款采取的是“数据信息”的笼统表述,将其与作品、专利、商标等一并作为知识产权的客体加以规定。但《民法总则(草案·二审稿)》随即转变立场,将“数据信息”拆分为个人信息和数据,分别在第109条和第124条加以专门规定。这种明确区分的格局为《民法典》总则编承继——《民法典》第111条规定个人信息、第127条规定数据,清楚地表明了立法者对信息和数据从人格权和财产权进行分置的立场。

以此为基础,现行法关于个人信息和数据的定义,进一步指明了二者之间的区别所在:《个人信息保护法》第4条第1款等规定个人信息应“以电子或者其他方式记录”为形式要件,而《数据安全法》第3条第1款则将数据界定为“以电子或者其他方式对信息的记录”。据此,数据与信息之间是记录与被记录的关系,或者更确切地说,二者之间是形式与内容的关系。由此,便为信息与数据的概念区分提供了坚实的规范基础。总之,信息是内容、知识等,其功用在于解决不确定性;而数据是形式,是表现信息的载体。从符号学的意义上看,信息处于语义(内容)层,而数据则处于句法(符号)层。就此而言,二者处于不同的层次,彼此之间有联系亦有区别:个人信息位于内容层,是一类新兴人格权(益)的客体;而客观存在的个人数据位于句法层,是一种财产权的客体。数据乃信息的载体在《数据二十条》,如第4条“不承载个人信息和不影响公共安全的公共数据”、第6条“承载个人信息的数据”等表述中也得到明确体现。

通过数据和个人信息的区分也进一步明晰了数据产权的保护客体——数据产权的保护客体乃是位于句法层的数据,而非语义层的信息。我国有学者认为,法律之所以对数据给予财产权上的保护,其目的并非是为了保护数据本身,而是通过对数据这一载体的确权,使权利人享有对其上承载之信息的控制权。换言之,权利人对于数据享有的权利,本质上是其对特定信息享有之利益的投射,因此,数据权利的具体内容和行使方式,也应围绕特定信息的自身特点进行建构。德国学者施派赫(Specht)的观点与之相左:“数据产权的客体是句法层面作为载体的数据,而不是语义层面的信息。”循此,数据权不能简单等同于信息权。虽然数据产权人有权按照自己的意愿使用数据,但数据产权不赋予权利人任何与数据内容(即语义信息)相关的权利。不仅如此,当语义信息之上存在其他原始权利时,数据产权还会受到相应限制。就此可以类比作品和书籍的例子:当书籍所载的信息构成作品时,书籍所有权属绝对权无疑,权利人可全面支配其书籍,但对书籍以展览、出租等形式的利用,却受限于其所承载作品的著作权。同理,当数据之上载有个人信息时,在对个人数据进行流通利用时应注意保护其上可能承载的个人信息。于此可进一步类比日记与日记本,当日记之上载有个人隐私时,尽管日记本的所有者拥有充分所有权,但是如有人对日记本所记录的内容有隐私权,这时日记本的所有权人只能在不侵害隐私权的前提下使用该日记本。在保护个人信息的前提下,数据处理者可以通过技术手段,如借助“可用不可见”的差分隐私、同态加密等隐私计算技术,实现对个人数据的利用。若个人信息被彻底匿名化,则此种数据已不再属于个人数据,数据处理者自然可以不受限地利用。

信息与数据之功能定位不同,在认知上应对之予以区隔,但区隔不意味着割裂,数据与信息仍具有一体两面的本质联系。信息是数据的来源,数据又可以反过来产生新的信息内容。数据的真正价值不在于代码这一数据外在形态,而在于隐藏其中的信息内容,因此,数据与信息彼此之间相互关联,形成了一种共生的统一体。在此种紧密联系下,只有以个人数据所有权为基础方能维护其上个人信息的完整性,为现代信息社会人格尊严提供外衣。诚如有学者所言:“对于包含人格权益的数据,显然不能将所有权归于大数据掌握者,这会使个人基于人格权益对个人数据的控制和支配陷入被动的局面。”可以说,个人数据所有权是个人信息自决权在数字时代进一步发展的结果,是个体人格在数字世界自由舒展的权利基础。只有当个人对其数据拥有所有权时,才能有效地保证信息自决。一方面,《个人信息保护法》赋予了信息主体包括更正权、删除权、可携权等权能在内的个人信息权,虽然这些权利指向的是语义层面的个人信息,但必须借助句法层面的个人数据权利才能实现。以删除权为例,只有赋予个人以个人数据所有权,个人要求企业删除句法层面的数据才真正具有正当的权利基础。另一方面,个人信息权贯穿个人数据处理活动的全生命周期,个人信息主体可以持续地影响个人数据处理活动,在这一背景下,即便法律没有明确赋予个人数据所有权,个人也在事实上取得了类似的法律地位。如果不承认这种事实状态,而将个人数据产权配置给作为处理者的企业,很可能会反噬个人信息权。

(二)数据产权主体:来源者和处理者分离

数据往往是诸多数据参与方共同作用形成的。在数据生产与使用过程中,往往涉及用户、原始数据企业、第三方数据企业等多方利害关系人。面对如此多的数据参与方,应当基于何种逻辑来确定产权的归属以及各方的法律地位,进而构建满足各方合理诉求的产权配置方案,成为亟待解决的难题。

对于用户数据产权的配置,司法实践中依循“谁收集,谁所有”的确权逻辑,许多案件都将企业收集的个人数据定性为企业商业秘密。学界不少观点也赞成将个人数据产权配置给企业。该主张主要以劳动赋权理论为依据,将劳动与数据价值的关联作为证成企业数据产权的理由,其核心理据可概括为以下两点:其一,虽然用户数据源自用户的网络行为,但用户并非有意识地生产数据,数据只能算作用户网络行为的“副产品”,而非劳动产品。因此,用户并不当然对其生成的数据享有产权。其二,单个用户数据几乎没有财产价值,只有经过企业采集、分析、加工后,用户数据才有价值。鉴于用户数据中的财产价值主要由企业创造,用户数据的财产权应归属于企业。故基于劳动赋权理论,应当将用户数据的产权配置给企业,用户对自己生成的数据仅享有个人信息权益这类人格权,此种权利配置模式也更有利于提升数据使用效率。

从比较法上看,德国学界早期也采“谁收集,谁所有”的观点。威尔(Welp)在1988年率先提出数据生产者(Skribent)的概念,即那些通过输入或运行程序产生数据的人为数据所有权人。但该学说忽视了数据生成背后可能存在的委托或者接受委托等合作关系,如雇主委派雇员操作设备生成数据,则数据生产者应当是雇主而非雇员。据此,策希(Zech)对数据生产者理论又作了进一步修正,即那些在经济或组织上负责启动数据生产的人才是数据生产者和数据所有权人。

然而,数据生产者理论过度偏向了数据企业,很大程度上忽视了用户的贡献。从数据的全生命周期来看,数据起源于用户的网络接入行为,考虑到用户是数据产生的源发者,对用户进行赋权应该成为数据权利配置的起点。德国学者费泽(Fezer)也强调,用户的个人行为是数据得以产生的源头,其产生的原始数据应当视为个人的无形财产。在此,费泽对个人行为作广义解释,无论是个人主动生成的数据,还是被动记录的数据,如由机器生成或自动化的反射数据(Reflexive Daten),均属于个人行为生成数据。在这一基础上,费泽作了进一步展望:“在资产阶级社会的历史上,无体财产权的正当性是个人的智力创造。到21世纪的数字信息社会,数据所有权的正当性基础是数据由公民个人行为生成。由此显现出了一条清晰的产权发展的历史脉络:从动产或不动产有形物的物上所有权,到智力付出的知识产权,再到当代由数字行为产生的数据所有权”。

数据源发者的思潮在美国也有体现。在hiQ诉LinkedIn案件中,美国第九巡回法院的法官表示,LinkedIn平台上的数据是基于用户的贡献产生,应由用户而不是LinkedIn享有这些数据的所有权。因此,法院通过诉前禁令的方式要求LinkedIn移除对hiQ的技术屏蔽。也正是基于这样的思想,互联网之父Tim Berner Lee提出了建立在分布式存储技术之上、由用户自己控制个人数据的Solid项目。Bergelson则从提高社会整体福利的角度出发,主张将数据权利分配给数据主体。

随着数字经济的发展,学界对用户的数据生成行为的认识不断深化,数字劳动理论进一步证成了个人数据所有权确立的正当性。在数字时代,劳动和娱乐逐渐失去了界限。企业名义上免费提供的网络服务,实际上成为用户的劳动工具。用户使用网络服务的消遣时间,也是其无偿为企业生产数据的劳动时间,但用户从中得不到任何报酬。而企业实际掌控着用户数据,并将其聚合起来作为大宗商品出售而获利。在这一意义上,企业与用户之间存在着经济剥削关系,用户无偿劳动所创造的剩余价值和利润被企业垄断。为矫正此种不公正局面,有必要将个人数据产权配置给作为数字劳动者的用户,以使全体网民参与数据红利的分配具有正当性前提。

需要特别指出的是,在《数据二十条》制定过程中,起草者认为推动数据产权结构性分置应当跳出所有权思维定式而聚焦于数据使用方面的权利,国家发改委负责同志在《数据二十条》答记者问时也多有“淡化所有权、强调使用权”的表达,对这种观点需要进一步延伸思考之处在于,跳出所有权或淡化所有权思维,不等于否定所有权。假若作为数据使用权之“母权”、源权利(Quellrecht)的数据所有权被彻底否定,数据资源持有权、数据加工使用权、数据产品经营权将失去根基,成为无水之源、无本之木。淡化所有权,是就数据所有与数据利用进行比较时作出的一种简明表达,更多的是强调通过数据的结构性三权分置,“促进数据使用权交换和市场化流通”。换言之,《数据二十条》之重点在于确立企业对其持有的数据享有数据使用权,并着力通过制度安排推动企业数据使用权的流通利用,但这并不意味着要否定所有权——否定数据所有权既不符合逻辑,也不符合事实。正如《数据二十条》第3条所指出的那样,要“根据数据来源和数据生成特征,分别界定数据在生产、流通、使用过程中各参与方享有的合法权利”。由此可见,数据产权的结构性三权分置建立在尊重数据来源和数据生成两个重要事实的基础上,这才符合《数据二十条》的规范意旨。

赋予用户以个人数据所有权,还有助于促进人格权保护由实体空间向虚拟空间延展。正所谓“皮之不存毛将焉附”,如果仅宣称个人拥有信息自决权,却不能给个人以数据所有权,个人信息自决权只能是一纸空文。只有当个人对其数据拥有所有权时,才能有效地保证信息自决。对个人来说,个人数据所有权的价值不仅在于他可以使用自己的数据,更在于他可以阻止别人使用这些数据。只有当个人能够从根本上排除他人使用数据时,才有可能再去谈论信息自决的问题。在这一意义上,个人数据所有权是个人信息自决权在数字时代进一步发展的结果,是个体人格在数字世界自由舒展的权利基础。为强化对个人信息的全面且立体之保护,有必要通过将数据所有权赋予个人的方式,实现个人权利从内容层向符号层的延伸。

(三)数据产权内容:所有权和用益权分离

在数据来源者和数据处理者区分的基础上,需进一步回答数据衍生出来的各类权利如何在数据来源者和数据处理者之间进行合理地划分。有观点认为,用户在数字平台上所产生的一系列数据及其所衍生出来的各项权利,由用户和数字平台共同拥有。但共有模式的弊端十分明显,不仅很难合理、清晰地区分用户和数字平台各自在多大程度上拥有这些权利,而且不利于充分发挥数据的效用。因此,如无必要尽可能不采共有模式。

从数据的全生命周期来看,数据起源于用户的网络接入行为,对用户进行赋权应该成为数据权利配置的起点;数据处理企业付出大量的劳动和资金投入,因而赋予其相对稳定的财产权有利于数据资源的优化配置与激励机制的形成。但若赋予数据处理者数据所有权,就违背了数据是由用户引发产生这一逻辑起点,也不利于构建共建共享、互联互通的互联网。于此,可以借鉴“自物权—他物权”和“著作权—邻接权”的权利分割模式,在数据权利体系设计上,根据不同主体对数据形成的贡献程度不同,构建数据源发者拥有数据所有权、数据处理者拥有数据用益权的二元权利结构,实现用户与企业之间数据财产权益的均衡配置。在这一权利结构下,如果所采集的数据源于自然人用户,如自然人的上网记录、行踪轨迹等,由该自然人用户享有数据所有权,合法的数据采集企业享有数据用益权;如果采集的数据并非源于自然人,而是诸如气象、地理等公共数据,则该情况与无线电频谱类似,相关数据所有权属于国家,数据用益权依然归于合法的数据采集企业。由于单个或者少量数据的经济价值并不高,在数字经济时代,来源者的数据所有权目标一般不是获取直接的经济回馈,而是将数据作为功能要素换取智能化信息服务。

依照“所有权+用益权”的“两权分立”模式,数据用益权是从数据所有权派生而出的,数据所有权是数据用益权的母权,数据用益权可以通过法定或者约定的方式产生,也可以通过有偿交易或者无偿授权的方式取得。法定取得的数据用益权,主要适用于自然环境相关的数据采集,此类数据的所有权应归为国家所有,但数据采集人可以在国家法定授权的范围内合理使用,前提是不得损害公共利益。约定数据用益权的产生则来自个人、组织的授权行为和数据处理的事实行为。

赋予作为采集、存储数据的数据处理者的企业以数据用益权符合数据生成的逻辑,而根据数据来源者和处理者的不同贡献进行赋权符合公平原则,这种数据用益权的赋权模式可以类比著作权和邻接权。一部小说的写作是小说作品以及一系列著作权利最主要的缘起,其后以小说为基础进行的再创作,如评书表演、电影和电视剧拍摄,都可能使小说的影响力提升,有时还会比原小说更具名气,但即便如此,评书表演者或影视剧制片人对小说作品也不享有著作权而只能享有邻接权,因为作品的原创是一切后续财产权产生的源泉(无论价值大小)。上述思路同样适用于数据权属的分配问题。无论平台、企业还是数据公司对数据的采集、存储、加工投入多少,都不足以使其超越数据的源发者——用户,而成为数据所有权人,只能取得类似于邻接权地位的他物权。这符合数据产生的实际情况,也客观地呈现了各方参与者在数据形成过程中发挥的不同作用,更为重要的是企业的数据用益权的价值不会因其“他物权”地位而受到任何影响。

赋予作为数据源发者的用户以数据所有权是尊重数据权利源泉的表现,而数据处理者之所以享有数据用益权,源于双重的正当性基础。一方面,根据洛克所倡导的劳动产权论,付出劳动者应享有劳动产品的财产权,故而处理所取得的数据都应当受到财产法的保护,即赋予其数据用益权。同时,在数据的采集和加工过程中,数据处理者需要投入巨大的资金及其他成本,赋予其用益权也是出于鼓励其市场投入积极性的考虑,以避免“公地悲剧”现象。另一方面,仅仅基于劳动和投资便让数据处理者享有用益权尚不具有充分的正当性,因为用益权源于在先的所有权,所以作为源权利人,数据所有权人的授权必不可少。无论数据所有权人是自然人、企业还是国家,数据处理者合法处理数据的一个必备的前提条件,就是经数据所有权人的知情同意,而这也是其取得数据用益权的另一正当性基础。

(四)从两权分离到三权分置

“数据所有权+数据用益权”的两权分离模式在《数据二十条》中得到了相应的体现。一方面,《数据二十条》第7条采纳了“数据来源者”的概念,强调要“充分保护数据来源者合法权益,推动基于知情同意或存在法定事由的数据流通使用模式,保障数据来源者享有获取或复制转移由其促成产生数据的权益”,并特别提出了个人数据财产权益的实现方式,即“探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制”,这实际上承认了个人作为数据来源者对自身数据享有财产权益。另一方面,针对数据处理者享有的数据权利,《数据二十条》明确了要“合理保护数据处理者对依法依规持有的数据进行自主管控的权益”,并于第3条提出要“在保障安全前提下,推动数据处理者依法依规对原始数据进行开发利用,支持数据处理者依法依规行使数据应用相关权利,促进数据使用价值复用与充分利用,促进数据使用权交换和市场化流通”。更为重要的是,《数据二十条》开篇即将“促进全体人民共享数字经济发展红利”作为构建数据基础制度的重要目标之一,而只有赋予全体用户以数据所有权,才能使其真正拥有分享数字经济发展红利的权利基础。从这一意义上看,《数据二十条》的规定已然形成了“来源者数据所有权+处理者数据用益权”的两权分离模式。

在两权分离基础上,《数据二十条》进一步提出数据三权分置方案,于第3条规定:“根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,推进非公共数据按市场化方式‘共同使用、共享收益’的新模式,为激活数据要素价值创造和价值实现提供基础性制度保障”。然而,“数据资源持有权、数据加工使用权、数据产品经营权”作为《数据二十条》的创新提法,在法学领域并无与之相匹配的权利,这在一定程度影响了数据三权分置方案的落地实施。具体而言,在现行法框架下,难以找到与数据三权分置方案匹配的权利,而将这些新型权利纳入现行法律制度存在困难。首先,就数据资源持有权而言,我国民法从未使用过“持有权”概念,此次引入“持有权”就是为了淡化“所有权”,强调“使用权”。此种区别“所有”和“持有”的思路,对于理解数据资源持有权具有重要的指导意义。换言之,政策文件的起草者使用“数据资源持有权”而非“数据资源所有权”的概念,意味着数据资源持有权中的“持有”就是为了区别于“所有”。在此前提下,需要探讨如何在现行民法尚未采用这一概念表述的背景下,让持有权落地的问题。其次,就数据加工使用权而言,我国民法也从未规定过“加工使用权”的概念,通常只要拥有了原材料所有权即可当然地拥有其加工使用权,例如,拥有面粉的所有权即可将其加工为面包,拥有木材的所有权即可将其制作为家具,这是所有权的当然表现形式,乃是一项权能而非一项独立的权利。倘若称之为权利,则应当具备法律上权利的条件并符合法律上权利的标准。最后,就数据产品经营权而言,产品所有者可以对产品进行许可、使用乃至交易,此类经营性行为也是产品所有权的一项当然的权能。

在此背景下,如何将《数据二十条》中的政策语言转化为法律语言,使得数据三权分置方案这一纸面上的政策规定转化为法律上的权利规范,成为亟待解决的理论难题。实际上,数据三权分置是以数据两权分离为基础,在数据来源者的所有权和数据处理者的用益权相分离的基础上,以数据用益权为底座基础性权利而展开的制度设计。将数据三权分置方案纳入数据用益权理论框架中,数据资源持有权、数据加工使用权、数据产品经营权就可被视为数据用益权在“数据资源—数据集合—数据产品”各阶段的具体表现形式,由此形成了从“两权分离”到“三权分置”的确权思路。

数据三权分置乃是数据用益权在数据生成和利用不同阶段的具体实现形式,也可以从《数据二十条》中得到佐证。例如,《数据二十条》第7条规定:“在保护公共利益、数据安全、数据来源者合法权益的前提下,承认和保护依照法律规定或合同约定获取的数据加工使用权,尊重数据采集、加工等数据处理者的劳动和其他要素贡献,充分保障数据处理者使用数据和获得收益的权利”。从该条表述可以看出,文件起草者将“数据加工使用权”等同于“使用数据和获得收益的权利”,而“使用、收益”正是笔者主张的数据用益权的核心内容。

从两权分离到三权分置的确权思路并非数据所独有,在农村土地产权改革中,土地所有权、土地承包权、土地经营权的三权分置模式得到了广泛应用。这种模式将土地的所有权、承包权、经营权分别赋予不同的主体,使得土地的流转更加灵活,土地的使用效益得到了最大化的发挥。借鉴这一经验,可以将数据产权中的数据所有权和数据用益权分离,再进一步将数据用益权分割,形成数据资源持有权、数据加工使用权、数据产品经营权在不同阶段的三权分置模式。这种结构性的三权分置模式可以有效地破除数据市场发展面临的产权障碍,在保护数据来源者合法权益的基础上,最大限度地促进数据流通利用。首先,数据资源所有者在取得对价后,可以将持有权和加工使用权交给专业的数据处理者,这不仅可以保障数据所有者分享数据红利,还可以促进数据资源的充分利用,避免数据资源的浪费。其次,承认数据处理者基于数据用益权享有数据资源持有权和数据加工使用权,可以有效防止数据被不当爬取,激发数据处理者的创新意愿,推动数据加工技术的不断发展,促使数据处理者利用自身的技术和专业能力,对数据进行深度挖掘和加工处理,提高数据的使用价值和经济效益。最后,数据产品经营权的分离能够推动数据产品市场的形成,促进数据产品的多样性和市场竞争,提高数据产品的质量和服务水平。数据产品经营者可以将经过加工的数据产品进行销售和许可使用,实现自身的经济价值。


四、纵向分级:数据三阶段确权及其实现路径

数据要素市场依据不同的交易标的物划分为数据资源、数据集合、数据产品三级市场结构。整体上看,从数据资源到数据集合,再到数据产品,数据产权形态表现出由繁及简标准化的特征,各利益相关方的数量也依次递减归一。通过三阶段确权,可以使数据确权的复杂问题得到有效解决。

(一)数据资源阶段:数据资源“所有权+持有权”的分置结构

数据资源是最本源的数据,具有体量大、结构复杂不一、来源众多等特点,在未经整理和分析的情况下,其价值通常难以体现与释放。在数据资源的生成过程中,其来源表现为一个巨大“开集”,个人、企业、政府和各类社会组织产生的非结构化原始数据均可以纳入数据资源的范畴。就此而言,个人、企业、政府均有可能成为数据资源的来源者和所有者。对于合法收集数据资源的数据处理者而言,其实际占有、控制数据的事实可派生出数据资源持有权。在性质上,数据资源持有权类似于物权法上的占有,数据资源持有权人可以此对抗他人不当爬取,但尚无法积极支配和使用数据。从逻辑上看,在数据资源持有权、数据加工使用权、数据产品经营权的分置布局中,数据资源持有权构成了数据加工使用权与数据产品经营权的前置性基础权利。然而,数据资源持有权作为一项弱权利,因其本身不具有积极权能,无法为数据资源的后续流通提供根本性的制度支撑。在数据资源采集阶段,数据所有权是关键所在,第三方是否能获得数据资源持有权,仍取决于个人数据所有权人的意愿。因此,在数据资源阶段,重点在于解决个人数据所有权的确权和授权问题。只有在充分尊重和补偿个人数据所有权的基础上,才能为后续的数据流通利用奠定正当性。

1.数据资源所有权的确权路径

根据数据源发者理论,个人对源发于自身的数据享有所有权。在企业数据领域,由企业自发产生的数据的权属判断标准与个人数据类似,企业对源发于自身的数据享有所有权,如企业的经营数据、设备产生的工业数据等。对于这种纯粹源发于企业的自有数据,《数据二十条》第5条对企业权益作了专门规定:“对各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的数据,市场主体享有依法依规持有、使用、获取收益的权益,保障其投入的劳动和其他要素贡献获得合理回报,加强数据要素供给激励。”不过,实践中纯粹源发于企业自身的数据仅占少数,绝大部分数据是由企业从外部收集所得。对于企业收集的诸如个人上网浏览记录、商品购买记录等个人数据,该数据所有权仍然归属于作为数据源发者的个人。

公共数据既包括了政府机关收集的个人数据和企业数据,也包括政府机关自身在履职过程中形成的政务数据。对政府在履职过程中自身形成的政务数据,如果与个人和企业无涉,国家可依法享有数据所有权和持有权。但对于政府机关收集的个人数据和企业数据是否归国家所有,存在争议。一种观点认为,公共数据由国家机关收集、加工、存储,且具有公共性,应当属国家所有或全民共同所有;至于公共数据的类型,在所不问。对于公共数据中的个人数据,个人本身并不享有所有权,国家依法享有占有、使用及流转的权利。另一种观点认为,对于公共数据中属于个人数据或企业数据的,应当由个人或企业享有所有权,而对于其他数据,则由国家享有所有权。这是基于保护个人信息、维护个人尊严和私法自治的考虑。笔者持后一种观点:对于政府部门收集的个人数据和企业数据,个人和企业作为数据来源者应享有数据所有权。这也与前文所述的数据资源所有权归属于数据来源者的结论一致。

2.数据资源所有权的实现机制

从权利行使的角度看,若国家或企业为数据资源的所有权人,其往往同时控制着数据,具有较强的权利行使能力。但对个人而言,其产生的个人数据往往散落在不同的平台,而且在与平台的谈判中也处于结构性弱势地位。因此,即使赋予用户以个人数据所有权,他也很难从企业那里获得公平合理的补偿。在当前的数字技术形态和数据产业格局下,德国学者建议个人数据交易可以通过“以服务换数据”(Dienst gegen Daten)的方式进行,其后又发展为“以给付换数据”(Leistung gegen Daten),这为个人数据所有权的实现提供了一条可行的通道。但也需要指出,实证研究表明“以给付换数据”交易模式对用户数据所有权的实现未尽顺畅。因为,平台企业提供网络服务的边际成本接近于零,而个人数据的价值其实远超网络服务的价值,这也是目前数字企业超额利润形成的根本原因。不过,由于用户与平台的不对等地位,面对企业提供的“以给付换数据”的网络服务协议,用户若要想使用网络服务,只能被动地予以接受。网络平台基于网络服务协议而取得的用户数据使用权,只是创造了一种形式上的合法性假象,用户根本没有能力向企业索取补偿。为矫正此种不公正局面,税法学界提出了向企业开征数据税、在二次分配环节补偿用户的建议,“数据税的征税对象是企业使用用户数据的行为,目的在于使企业支付数据使用对价”。但是,征税是国家行为,个人不能至少不能直接受益,也无法根据每个人的网络行为量化对价。毕竟征税和以数据换取对价的逻辑不同,税收是予以外部平衡的一种国家行为,所收取的数据税也是交由国家(政府)用于向社会提供公共产品、满足社会共同需要,与个人的“数字劳动”贡献多少并不相关。“以给付换数据”是根据每个人不同“数字劳动”产生的个人数据所有权实现方式,是市场主体之间内部的数据利益分享机制,与数据税的功能定位不同,二者不可替代。

欲使个人数据所有权真正落地,必须为之配备相应的实现机制,目前具有可行性的是业界正在探索的个人数据资产账户业务模式。实践中,个人数据的存储呈现零星散乱的特点,同一主体不同领域的个人数据分散在不同平台之上。用户某一行为产生的个人数据,可以被多个平台从不同维度收集,例如,个人使用移动网络在淘宝进行购物,电信运营商会收集到用户设备所处地址、流量使用情况等数据,电子商务平台会收集到用户商品浏览记录、订单等数据,银行会记录下用户消费数据。这不仅使得个人数据的存储碎片化和管理复杂化,而且也导致用户难以有效行使个人数据所有权。为强化个人对自身数据的控制,实践中已经开始探索创建个人数据资产账户的业务模式,其中以英国Midata项目和韩国MyData项目最为典型。在此种业务模式中,由第三方机构为每位数据主体创设一个专属的数据账户,类似于银行账户。个人数据资产账户具体包括三种功能:(1)数据聚合。个人可以通过行使数据可携权,将散落的数据聚合到个人数据资产账户中。(2)数据管理。在将个人数据分类、集中存储到个人数据资产账户平台后,可对数据开展清洗、分析和挖掘等处理工作,通过数据集成、数据接口等机制,方便用户进行数据访问、管理和使用,既为个人生活提供便利服务,也为个人数据后续交易奠定基础。(3)数据交易。对用户个人数据资产进行商业化运营,开展数据产权交易和数据服务交易,交易过程对数据所有者透明,支持数据查询与共享、数据使用与交易、数据加工与产品等增值业务,为个人提供数据收益与结算服务。借助个人数据资产账户,个人可以通过“我的数据我做主”有效控制自己的数据,进而实现“我的数据我受益”。

党的十九届四中全会首次提出“将数据作为生产要素参与社会分配”。从理论上说,个人作为数据要素的生产者,本可以凭借这些生产要素参与到社会分配中。但此前由于欠缺存储、聚合个人数据的载体,个人所生产的数据如同面包屑一样被随意丢弃,最多可以换取所谓的免费网络服务。个人数据资产账户一旦建成,将发挥如同面包房一样的作用,个人可以将数据碎屑聚合到一起进行销售,在其数据每次被使用时都会收到小额支付,从而真正实现对个人数据的控制和收益。未来,个人可以依托个人数据资产账户,将自身数据作为生产要素参与到社会分配中,从而实现共享数字经济的共创红利。

在登记确权方面,由于数据主体每天都会产生新的数据,个人数据总量不断扩张,数据内容也处于动态变化的过程,由相应的审查人员进行逐条审查欠缺现实可行性。因此,笔者建议借鉴专利、商标的审查登记制度,建立个人数据资产账户的登记备案制度,对个人数据资产账户进行概括性登记,为明确在先权利以及证据调取等提供便利。

从域外法实践来看,各国已开始实施个人数据资产账户项目,以加强个人对自身数据的控制,从而使个人在自身数据每次被使用时都会收到小额支付。有研究表明,大部分用户对其个人数据的收集和使用并不满意,但要想全面融入当代生活,用户不得不同意平台继续收集和使用个人数据。这种情况正在开始改变,人们正在努力改变互联网商务的运作方式。例如,哈佛大学开展了一项“供应商关系管理”(Vendor Relationship Management,简称VRM)的项目。该项目专注于供应商关系管理(VRM)的概念,其重点是使用户在其数据方面成为有能力的经济行为者,扭转用户与数字企业(供应商)的关系,避免用户成为受数字企业剥削的经济单位。为实现这一目标,该项目鼓励开发相应技术,使个人能够更充分地管理自身数据,同时提高对他人使用自身数据的控制能力。如果通过技术,用户能够收集和控制自己的数据,或者有能力有选择性地分享这些数据,甚至能够控制他人使用其数据的条件,他们就可以改变自身与数字企业的关系。目前许多数据产品都采用了VRM概念。例如,著名计算机科学家杰伦·拉尼尔(Jaron Lanier)提出了“一个世界”的概念,在这个世界里,个人在他们的数据每次被使用时都会收到小额支付;有的学者则专注于开发个人数据银行或账户,用户可以在其中存储和出售对其数据的访问权;还有学者通过在实验室构建模型来探索个人数据银行的市场发展情况。这些实践做法都昭示着个人数据权利的实现机制大有可为,对数据企业而言,未来的发展可以说是得个人数据者得数字天下。

3.数据资源持有权的取得方式

从规范目的上看,设立数据资源持有权主要是为了鼓励“依法持有”与“合法持有”,并对“非法持有”作出否定评价。若数据持有者是依法依规持有的数据,则享有进行自主管控的权益(《数据二十条》第7条)。未经持有权人允许,他人不得随意访问、复制、篡改、删除数据。当然,对这种自主管控的持有权的保护要限定于合理保护的范围,未来可以参照对知识产权的限制,建立数据合理使用、法定许可使用、强制许可使用等数据用益权限制制度以限定其边界。欲实现对数据确权与数据利用的平衡,在避免“公地悲剧”的同时,也要防止“反公地悲剧”。

如上所述,企业能否对从外部收集的数据资源享有持有权或加工使用权,取决于数据所有权人授权。无论所有权人是自然人、企业还是国家,除有法定事由外,合法处理的基本前提条件即数据所有权人的知情同意。数据处理者取得数据来源者的授权,可以通过用户服务协议进行确认。授权机制需要区分一般授权和特殊授权两种形式。一般授权是授权数据处理者对数据的有限利用,即作为以服务数据来源者为限的企业内部资产,除已完全匿名化的数据外,不得将个人数据用于其他目的;特殊授权是授权处理者可以将数据用于其他目的,包括将数据开放、共享、许可他人使用。

公共数据分为两种类型:一是政府自身在履职过程中形成的政务数据,如果与个人和企业无涉,国家可依法享有数据所有权,政府机关依照法定职责享有对政务数据的持有权和加工使用权;二是各级党政机关在依法履职、提供公共服务过程中收集的含有个人信息或企业信息的数据,依照前述来源者和处理者两权分离的模式,这类数据的所有权属于被采集的管理对象,而采集者政府机关基于法定授权和个人的同意享有数据用益权基础上的数据资源持有权。就此类公共数据的使用方式,《数据二十条》第4条规定“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照‘原始数据不出域、数据可用不可见’的要求,以模型、核验等产品和服务等形式向社会提供”,实现数据利用与个人信息保护、公共安全的平衡。对于不承载个人信息和不影响公共安全的公共数据,则要推动按用途加大供给使用的范围。同时,《数据二十条》还列出了负面清单:“依法依规予以保密的公共数据不予开放,严格管控未依法依规公开的原始公共数据直接进入市场,保障公共数据供给使用的公共利益”。在公共数据的使用是否收费这一问题上,需要结合公共数据的用途进行判断,对用于公共治理、公益事业的公共数据要有条件无偿使用;对于用于产业发展、行业发展的公共数据,则是有条件的有偿使用。

(二)数据集合阶段:数据加工使用权

原始数据资源具有海量、分散、“多对多”的特点,难以直接成为交易标的。要实现分散海量的数据资源向多样的数据产品需求高效流动,就需要建立类似土地、资本等要素市场中基于中间态的流通体系。在数据流通体系中,将数据元件组成的数据集合作为数据资源和数据产品之间的中间态,具有合理性。所谓数据元件,是指根据特定标准(如年龄、收入、学历等)对原始数据进行整理、提炼,同时剔除掉残缺数据、错误数据、冗余数据,对数据进行可信认证,检查数据的真实性、可信性和一致性,最终形成的数据标品。这些数据标品可以进一步汇集形成数据集合。相较于原始数据资源,数据集合具有更高的应用价值和市场价值,具有规模化、结构化、标准化的显著优势。在从单个原始数据向数据集合的汇集过程中,数据实现了从分散到聚合,相关主体也逐渐从多元到归一,从而为数据产权“一对多”的有效运行奠定基础。

从产权配置上看,数据集合由海量原始数据经初步加工整理形成。企业要想取得数据集合的加工使用权,需同原始数据所有权人协商谈判。因数据集合所涉主体众多,为降低交易成本、提高谈判效率,用户可以将个人数据资产交由第三方的数据信托机构托管,由专业的信托机构代表用户与数据企业进行集体谈判,并订立标准的数据许可使用合同,企业由此取得数据集合的加工使用权。

1.数据集合加工使用权的取得与实现机制

数据集合由海量用户数据汇集而成,企业如何与每位用户谈判并取得加工使用权成为实践难题。如果要求企业与每个用户逐个谈判以解决获取用户多少数据、给予用户多少份额的数据收益等问题,将极大增加交易成本,影响数据集合整体功能的发挥。换言之,要求双方针对复杂多变的个人数据的许可使用进行一对一的谈判和定价,以此确定个人数据的适用范围、程度和方式,会产生过高的谈判及交易成本。

因此,为降低谈判和交易成本,有必要引入第三方机构代行个人数据所有权。随着数据应用技术的发展,个人数据的使用方式推陈出新,个人数据主体通常欠缺专业知识来作出理性决策。为减少权利人的维权成本,提高权利行使效率,方便他人使用个人数据,有必要借鉴著作权领域的集体管理制度,将个人数据资产账户交给集体管理组织(如数据信托机构)托管。对于此种业务模式,《数据二十条》持肯认态度,鼓励“探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制”。不同主体个人数据资产账户的聚合也可以提高议价能力,由数据信托机构跟数据处理者协商具体的使用费用。数据信托机构经数据主体授权,得以自己的名义行使数据权利,包括控制个人数据的使用,与使用者订立许可使用合同,向权利人分配使用费,进行维权诉讼、仲裁等。

从域外法看,不少国家已经开展了与集体管理组织类似的个人数据信托制度研究。例如,根据英国开放数据研究所提出的数据信托理论,个人数据权利人可以将其个人数据委托于具有独立资格的第三方机构进行管理,并由该第三方主体对数据控制者的数据处理行为予以监督。可见,英国的数据信托模式系“三方主体”的信托结构,为保障个人数据权益免受数据控制者的不法侵犯,在个人数据权利人和数据控制者之外设置第三方信托机构作为受托人,接受个人数据权利人的委托管理个人数据。在实践运用中,英国的数据信托模式在智慧城市公民个人数据管理中得到应用。在智慧城市数据管理项目中,由第三方机构Sidewalk Labs作为受托人,对城市数据进行管理,并建立数据共享标准向个人分配数据收益。

2.数据集合加工使用权的登记及效力

根据《数据二十条》的指导意见,数据使用权将成为未来数据产权登记的重点对象。《数据二十条》第3条规定:“研究数据产权登记新方式。在保障安全前提下,推动数据处理者依法依规对原始数据进行开发利用,支持数据处理者依法依规行使数据应用相关权利,促进数据使用价值复用与充分利用,促进数据使用权交换和市场化流通。审慎对待原始数据的流转交易行为。”据此,数据使用权而非数据所有权的流转才是未来数据产权交易的主流模式,故亟待构建数据使用权登记制度。

在现阶段,数据集合加工使用权主要由合同创设,受制于合同的相对性,必须经登记才能对抗第三人。对此可以参照土地经营权的经验,赋予当事人自主决定是否登记的选择权。《民法典》没有对土地经营权的性质给出明确答案,而是赋予当事人选择权,在不同语境下土地经营权可被确定为物权或债权:对五年以下以出租方式流转的土地经营权,因时间短、影响小,允许双方通过合同自由创设权利与义务;对五年以上的土地经营权,特别是通过入股、抵押等方式流转的土地经营权,由于持续的时间长、土地的投入和产出大、影响范围广,为保障交易安全,此土地经营权属于物权,具有对世性和排他性,经登记可以对抗善意第三人。于是,登记或流转期限五年以上的土地经营权属于物权,五年以下以出租方式流转的土地经营权属于债权,以满足不同土地经营权人对土地经营权的不同需求。

同样,对于价值“半衰期”长的数据集合,企业可以选择将数据集合加工使用权登记于交易平台上;对于价值“半衰期”短的数据集合,则没有必要对加工使用权予以登记,可以通过合同安排自由交易。前者具有物权性效力,属于对世权,按照法定程序及要求获得权利内容;后者具有债权性效力,属于对人权,按照约定明确权利内容。

(三)数据产品阶段:数据产品“所有权+经营权”的分置结构

数据产品是开发者通过一定的算法,对数据集合进行深度的分析过滤、提炼整合并进行脱敏处理,最终形成具有市场价值的衍生数据。目前,在有关数据确权的研究中,学界通常将数据产品与数据资源、数据集合置于同一维度中进行考察。例如,有学者认为,“淘宝诉美景案”的生意参谋数据和“大众点评诉百度案”的用户点评数据均属于企业数据,两者并无实质差异。然而,生意参谋数据和用户点评数据在本质上迥异,前者属于数据产品,后者则属于原始数据资源。生意参谋是平台基于用户数据集合的加工使用权,结合数字技术开发出的数据产品,平台对该数据产品享有独立的所有权,得自主经营数据产品并享有收益。《数据二十条》第7条也强调:“保护经加工、分析等形成数据或数据衍生产品的经营权,依法依规规范数据处理者许可他人使用数据或数据衍生产品的权利,促进数据要素流通复用。”与之形成对比的是,用户点评数据仍然属于原始数据资源的范畴,尽管这些原始数据是网站付出技术和劳动所得,但大众点评网站并没有通过一定的算法对这些个人数据进行清洗、筛选等标准化工作,故用户点评数据应当归用户所有,企业仅享有数据用益权基础上数据持有权和加工使用权。

1.数据产品为独立的权利客体

在数据产品生成阶段,数据处理者对数据集合进行深度汇总与分析,从杂乱无章的数据集中提炼内在规律,形成具有价值的信息供数据控制者作归纳性推演,是数据从量变到质变的过程,也是数据价值生成的最高点。数据产品本质上属于经加工形成的新型数据,可以按照“加工取得所有权”一般原理进行处理。数据产品虽然派生于数据资源或数据集合,但因加工行为增加的数据价值大于原初数据,故加工所得数据产品可归加工人所有。此点也可以在比较法上得到支持,有德国学者主张对数据加工处理行为类推适用《德国民法典》第950条第1款。该款规定:“因对一项或数项材料进行加工或改造而制成一个新的动产的人,取得此新物的所有权,加工或改造的价值显著低于材料的价值的除外。”据此,当因加工致使数据产品价值显著大于原始数据或数据集合价值的,可以由加工人取得数据产品所有权。如果数据产品的创造性达到知识产权的保护门槛,自然也可以适用知识产权法的保护路径,由数据产品开发者对其创造的数据产品享有知识产权。目前数据服务越来越多地以数据产品的形式呈现,例如,征信服务最终通过个人信用报告的形式呈现,仍是以数据为载体。在这一意义上,数据产品和数据服务的界限趋于模糊,界分的意义不大。

作为经深度加工提炼形成的新型数据,数据产品已基于人类劳动的凝结而成为独立的客体,完全可归属于数据产品开发者所有,并可进入市场领域流通。否则,若将数据产品与数据资源、数据集合相混淆,那么,后两者之上的诸多交易限制(如个人信息权)将适用于数据产品,进而引发数据产品也无法进入市场流通的困境。将数据产品与数据资源、数据集合相区分,亦可回应“共同所有”和“双重所有权”问题。有学者认为,对于平台基于个人数据聚合、加工、分析所产生的衍生数据权利归属,应当由自然人与平台分别所有或共同所有。还有学者提出了企业与个人的双重数据所有权结构的观点,其中包括个人的名义数据所有权和企业的实际数据所有权。然而,我国现行法并不能容纳所谓的双重所有权结构,且双重所有权不仅没有清晰的权利归属,反而会制造权利纷争,进而影响数据效用的发挥。实际上,数据资源所有权和数据产品所有权的客体指向本就不同:数据产品已基于数据资源所有权或用益权的行使而从数据资源中独立出来,其权利客体指向的是已特定化的数据产品,可归属于数据产品开发者;而数据资源所有权的客体则是处于原初状态的数据资源,根本就不会出现所谓“双重所有权”或“共同所有”的现象。

数据产品开发者对其开发的数据产品享有所有权,主要包括占有、使用、收益和处分四项权能。其中,数据产品的占有是指产品开发者有权对数据产品储存并进行控制,并有权决定以何种方式来控制数据产品。使用权能指的是所有权人对于数据产品有权自己使用,或许可他人使用并收取费用。在许可他人使用情形中,权利主体有权在许可使用合同中约定被许可人的义务,如不得二次转让、传播和利用数据产品,也可以限制被许可人转让和利用数据产品的次数。收益权能既包括权利主体出售产品或者许可他人使用产品而获取利益的权利,也包括权利主体通过自身使用产品为他人提供预测、分析等服务而获利的权利。收益权能的实现应当以权利主体遵守市场秩序、不违反公共利益、不构成恶性竞争、不侵害个人信息为前提。处分权能意味着所有权人可以将数据产品转让给他人,在转让数据产品后,原所有权人是否应当删除数据产品,应当由双方协商解决。由上述四项权能可以推知,数据产品经营权乃数据产品所有权的题中之义,数据产品所有权人有权自主经营数据产品并获取收益,数据产品所有权乃是数据产品经营权的“母权”。

2.数据产品所有权的生成路径

数据产品所有权既可基于数据所有权或用益权的行使而原始取得,也可基于债权契约而继受取得。

其一,基于数据所有权的行使产生数据产品所有权。企业作为数据所有权人对自身行为产生的数据享有使用权能,若企业利用这类数据开发数据产品,数据资源由于渗入人类劳动而脱离自然状态,成为独立于原始数据的数据产品,其所有权亦为企业享有。

其二,基于数据用益权的行使产生数据产品所有权。这里主要指企业基于用户数据集合开发数据产品的情形。企业作为数据集合用益权人从数据资源中分离出特定数据产品,是其数据用益权之使用和收益权能的体现。此时,数据用益权成为将数据资源转化为数据产品的桥梁和纽带。

其三,基于债权契约继受取得数据产品所有权。例如,基于买卖合同取得算法模型的所有权。此时,在买受人取得之前,数据产品所有权已经由数据所有权或用益权的行使而生成,数据产品不同于数据资源,可以作为交易客体。实践中,应注意区分对数据资源的处分和对数据产品的处分。


五、结 语

数据之上的权利关系纵横交错,意味着很难对数据进行平面化界权,而是应将其置于数据的权利层级性思维中,建立由点到线、由线及体的立体化思维范式。为解决数据确权难题,笔者基于层级性思维提出“三三制”数据确权法。首先是横向维度的三层分离:在权利客体层面严格区分信息与数据;在权利主体层面区分数据来源者和处理者;在权利内容层面区分数据所有权和用益权。如此一来,在权利客体层面严格区分个人信息与数据,并分别为个人创设个人信息权和个人数据所有权,便可以基于权利分割思想从后者分离出企业数据用益权。在纵向上,数据内部存在三个层级,其形成过程以线性链条形态呈现——从最初数据资源的采集,产生原始数据;到经过清洗、入库变成标品,汇聚成数据集合;再到最后开发、衍生出数据产品。由此,在数据内部形成了三级递进的逻辑链条:“数据资源—数据集合—数据产品”。在原始数据采集阶段,数据资源所有权归属于数据来源者,数据处理者对收集、存储数据资源可依法依约享有数据资源持有权;在数据集合阶段,用户可以将个人数据资产账户交信托机构托管,由信托机构代表用户与数据处理者订立数据许可使用合同,数据处理者可依约取得数据集合的加工使用权;在数据产品阶段,基于数据集合的加工使用权,数据处理者可从数据集合中开发、衍生出数据产品,并对数据产品享有独立的所有权,得自主经营数据产品并享有收益。这样的思路既使《数据二十条》落地可行,也能以其所具有的坚实理论基础而对数据确权和流通利用实践发挥着重要的指导作用。

数据负载利益多元化及数据形态多样化的特征,为数据权利层级性的证成提供了深层理论依据,也是贯穿于数据三层三阶权利配置思路的主线。此种确权思路在确保数据来源者初始权利,宣示数据资源产权归属和支配意义的同时,也满足了数据处理者利用数据并受保护的需求,从而以数据用益权为基础权利,为数据采集、数据利用、数据产品交易构建了数据资源持有权、数据加工使用权、数据产品经营权三阶段分层确权格局。


本刊已发相关主题的文章还有:

1. 彭诚信: 《数字法学的前提性命题与核心范式》(2023年第1期);

2. 沈健州: 《数据财产的权利架构与规则展开》(2022年第4期);

等等。
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存