查看原文
其他

唐建国 | 新数据观下的数据权属制度实践与思考

唐建国 法学杂志 2024-01-09
【作者】唐建国(北京市大数据中心副主任
【来源】《法学杂志》2022年第5期数据产权专题
内容提要:树立新数据观,需要深入认识数据以及数据资源、要素、资产和资本,探索数字经济制度创新。从数据二元化结构的视角分析数据权属,进行数据权益的双层制度设计,形成以数据载体为基础、以承载的信息内容为抓手的数据权利行使结构。维护各数据主体的正当权益,确保数据交易更加稳定安全可靠,最大程度降低数据流动的权属不确定性,以此推动数字经济立法和数据要素市场化配置改革,促进数据流动共享和应用赋能,助力数字经济可持续健康发展。

关键词:数字经济;数据权属;法律制度;改革实践



目次

一、认识数据二元化结构,构建新数据观

二、基于新数据观,探寻数据权利体系

三、把握权属特征,推动数据要素市场化配置改革


党中央国务院高度重视数字经济发展并将其纳入国家战略,习近平总书记指出:“数字经济正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。”数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。[1]2020年发生的新冠肺炎疫情将数据要素推上新型生产资料的历史舞台。如果把数字经济比喻成蛋糕的话,数据就是面粉,用数据赋能实体经济助力降本增效,甚至创造新的数字消费需求,是数字经济的核心价值所在。如何把这块经济蛋糕做大做好,实现分配均衡和安全使用,必须要从制度规则入手,加快构建适应新生产力发展的新型生产关系。


数据是具有可再生能力的新“石油”,已成为我国要素市场化配置综合改革的重要内容。聚焦规模、质量、流动、安全等方面,一场数据供给侧改革之风扑面而来。笔者结合多年来参与推动信息化建设的工作经历,根据起草制定《北京市数字经济促进条例》和促进数据要素市场化配置改革中的一些实践思考,基于新数据观,尝试从法律层面认识数据,进而厘清权属问题,以促进数字经济繁荣健康发展。


一、认识数据二元化结构,构建新数据观


所谓新数据观,是对数据的新认知。近年来,大数据、人工智能、区块链、隐私计算等技术的快速发展,为我们提供了看清数据真容的全新视角,进而带来定纷止争解决问题的可能。新数据观都包括哪些内容?笔者从如下方面逐层阐释。


(一)概念辨析


“数据”一词,英文是“data”,是指对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材,一般指科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等数值。


“信息”一词在英文、法文、德文、西班牙文中均是“information”,一般指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。


“知识”一词,英文是“knowledge”,是指人类在实践中认识客观世界(包括人类自身)的成果,它包括事实、信息的描述或在教育和实践中获得的技能。


“智慧”一词,英文是“wisdom”,是生命所具有的基于生理和心理器官的一种高级创造思维能力,包含对自然与人文的感知、记忆、理解、分析、判断、升华等所有能力。


笔者认为,从数据到信息、知识和智慧,是一个从宽口径到窄口径的演变过程。一定意义来讲,无论文理科,所有学科都是一门“历史学”。历史的核心是智慧,读史使人明智,以此面对不确定的未来。智慧是人对知识的运用,而知识表现为信息的集合,信息有很多种载体,长期以来主要是书籍。随着移动互联网的快速普及,人工智能算力和算法的突破,海量数据开始出现,大数据概念横空出世。[2]爱因斯坦说:“问题不能在发生的同一层面得到解答”,大数据唤醒社会隐藏的认知盈余,基于大数据,因果关系开始让位相关关系,人们形成了一种新洞见,具备了超范围协同、超时空预判、精准调控、双向触达等解决问题的新能力,数据也成为表达信息、知识和智慧的新载体和新方式。


(二)数据从资源、要素、资产到资本——形态演进和价值跃升


数据,在数字经济的语境下,一般是指由具体的比特字节或者软件代码所承载表现的各种数值。在不同的生命周期,数据可以分为零次数据(原始)、一次数据(清洗)、二次数据(统计)、三次数据(研判)等不同状态。[3]数据内容按照不同的数据计量层次,可以分为定类数据、定序数据、定距数据和定比数据。[4]数据具有边际成本接近零、获得的非竞争性、使用的非排他性、价值的非枯竭性、源头的非稀缺性等特点,打破传统生产资料有限供给对经济增长的制约。


数据资源是一系列乃至规模巨大的数据集和数据库表,具有潜在的挖掘价值。数据资源的产生源起于三次信息化浪潮,第一阶段是信息化建设,主要表现为开发建设大量信息系统,随之产生必要的业务数据,由用户单位在业务场景中分析使用。第二阶段是移动互联网普及,随着电子商务的广泛应用,大量个人信息和行为数据产生,数据开始流向自动驾驶、人脸识别等人工智能应用场景,出现了《未来简史》所描述的“大数据分析使得数据比人类本身更了解自己”的情形。第三阶段是产业互联网兴起,工业互联网、车联网、物联网的建设,使人人互联变为物物触达,物理空间开始数字化,主要用于机器读取且与个人无关的工业数据、感知数据大量出现,比如通过毫米波雷达扫描形成的体现三维坐标向量的点云数据,典型代表如二维码的普遍使用,我们称之为新型数据资源。数字经济开启了全球“新航海”时代,而新型数据资源,就是数字经济新蓝海中的灯塔,引领探索者去发现新大陆。


数据要素是指按照统一标准体系对原始数据进行清洗、加工、治理,直接拿来可用并具有交易价值的数据资源。不是所有数据、所有的数据资源都能称之为数据要素,数据要素本质上是一块儿“熟地”,是高价值数据资源的代名词。


数据资产,也称数据财产,是指由个人或企业拥有、控制或者应用的,能够为自身带来经济利益预期的数据资源,[5]具有现实性、可量化、可控性和经济性等基本特征。当前,互联网平台企业纷纷建立起自身的数据资产优势,其所掌握的数据规模、准确性、鲜活度,以及采集、分析、处理、挖掘数据的能力决定了企业的核心竞争力。数据资产管理制度体系,包括登记确权、质量评价、价值评估,以及入表(纳入资产负债表)、入股(纳入企业股权出资)、入贷(纳入金融抵押贷款)、入统(纳入经济统计体系)、入税(纳入资产税收征缴)等系列制度。如果没有上述配套制度的建立和实施,数据资产虽然现实存在,但不能得到法律层面的保障。


数据资本是指将数据资产的价值折算成股份或出资比例,通过数据交易和数据流动变现为资金。数据资本化的前提是权属登记、质量评价、价值评估和交易流通。在数据资产入股方面,启迪公交(北京)科技股份有限公司成为第一个“吃螃蟹”的人,该公司于2018年6月26日由启迪科技城集团有限公司、北京公交集团资产管理有限公司、北京融沛数据科技有限公司、北京巴士传媒股份有限公司等发起成立,按照出资协议,启迪科技城、融沛数据、北巴传媒均以现金出资,公交资产公司以系统及数据资产出资。系统资产指公交e路通和定制公交两个系统的所有权,数据资产指城市地面公共车辆GPS定位数据、调度数据、车辆CAN数据,以及相关的车辆、线路、场站基础数据的使用权和唯一收益权。根据第三方评估,公交资产公司系统及数据资产的评估值为9963.19万元,使用期限为20年,占企业股权比重约为30%。由此可见,从数据资源、数据要素到数据资产,再到数据资本的逐次演进,为未来中国经济增长提供强大的资本来源。而今天的数据要素市场化配置改革和多级次交易制度,有望成为房地产市场的翻版,掀起新一轮的财富运动和更猛烈的经济浪潮。对比房地产制度,数据领域还有很多制度空白和阻碍,一切才刚刚开始。


(三)数据二元化结构


数据的二元化结构,可以从如下两个角度来理解。


1.法律视角:载体—内容。载体是指单纯数字化的单元,狭义来讲,主要是指比特字节或软件代码,广义来看,也包括服务器、云计算中心、通信网络、带宽、交换机、路由器等网络存储和交换传输资源。有学者认为,数据与信息是“工具和本体的关系”,数据指的是物理技术上的比特流,是传递信息的工具,并依赖于代码。[6]内容是指个人信息、知识产权、算法、数据产品、数据服务等实质性成果。为此,数据权属同样具有二元结构,即分解为对载体和内容的权利,载体权属包括收集、转化、存储、修改、删除、传输、共享、开放等;内容权属包括知识产权,个人的知情权、删除权以及对内容的财产性权益。


2.技术视角:信息—价值。基于隐私计算和区块链技术,我们可以对数据的内容进行加密处理,形成匿名化、去标识化,而将大数据背后的计算价值进行释放和流动,这一点正是北京市探索新型数据交易范式的基础理念,即“数据可用不可见、用途可控可计量”,据此,北京国际大数据交易所(以下简称“北数所”)开发了IDex数据交易系统,搭建起“原始数据不出域、交易数据使用权”的数据流动公共服务平台。


二、基于新数据观,探寻数据权利体系


商鞅在《商君书》中说:“一兔走,百人逐之,非以兔可分以为百也,由名分之未定也,夫卖兔者满市,而盗不敢取,由名分已定也。”只有确定的权属,才能有稳定和公平的交易。为构建有序的数据要素市场,培育风清气正的数字经济环境,应当从法理上明确数据权属,如此才能避免对数据权益的无序追逐。


(一)国内外数据立法评析


近年来,一些发达国家或地区出台了一系列数字经济制度规则,如欧盟《通用数据保护条例》《非个人数据自由流动条例》《数据治理条例》《数据法案》,英国《数字经济法(2017)》以及《数字经济伙伴关系协定》(DEPA)等,其中“促进发展、兼顾安全、激励创新、审慎监管”的价值立场和相关国际规则值得关注,由于国体、文化和产业基础不同,欧盟国家在数据流动和个人数据保护方面偏于保守,而美国趋于开放和霸权色彩,鼓励其企业全球化布局。


我国没有全面系统的单独数据法,《民法典》《电子签名法》《网络安全法》《电子商务法》《反垄断法》《数据安全法》《个人信息保护法》等法律,仅有一些原则性或者局部规定。在国内的司法实践中,对于数据领域的法律纠纷,如仿冒混淆、虚假宣传、网络不正当竞争行为等,基本适用《反不正当竞争法》及相关司法解释。总的来看,这些数据相关立法有两大特点:一是大部分是从规范的角度提出底线和红线要求,如对数据处理者在数据分类分级、数据出境审查、市场竞争等方面,均设定了游戏规则和相应义务,而界定权属等促进发展的内容相对较少,为地方立法和行业立法提供空间。二是关于数据内容的立法相对较多,比如个人信息保护法以及专利、商标、著作权等领域立法,关于数据载体的立法,特别是数据收集、登记、治理、共享、开发、利用、交易、评估、资产化、争议解决等数据行为中的权利义务关系,没有清晰全面的调整规范。笔者认为,我国数据立法滞后原因主要是三点:一是立法本身具有滞后性,且是一种需要限制的权力,正如英国学者哈耶克所说,“立法是人类所有文明中充满了最严重后果的发明之一,但法律本身却不是被人类发明出来的,立法赋予了人类以一种威力无比的工具”。[7]二是东西部地区存在发展的不均衡现象,国家层面立法时机尚未成熟。三是数字技术发展日新月异,学术界和立法者对数据活动中存在的问题、生成的原因、解决之策、利弊权衡以及发展趋势等,尚未形成共识。


2021年以来,以《浙江省数字经济促进条例》《广东省数字经济促进条例》《河南省数字经济促进条例》《河北省数字经济促进条例》《广州市数字经济促进条例》《深圳经济特区数据条例》《上海市数据条例》《重庆市数据条例》《浙江省公共数据条例》为代表的数字经济地方法规密集出台,对“数据”的采集、汇聚、共享、开放、交易等行为设定了权利义务关系,明确了数据的人格权、财产性权益。总的来看,地方数字经济和数据立法近年来明显加快,并将制度创新作为带动区域数字经济发展乃至构筑区域竞争优势的重要引擎,但是由于这些法规层次仅限于地方事权,容易出现同类数据的权属不一的立法认识分歧,且对于跨区域的数字经济活动,可能引起属地主义和属人主义的适用范围乃至司法管辖权争议。


(二)数据权属研究


笔者认为,根据数据本身的特性,数据权应当是一项单独的权利体系,多维视角下,数据权涵盖主权、公权和私权三大范畴,[8]数据具有多重权属特征。


1.主权。国家主权是一个国家在国内的最高权力和在国际上的独立自主权利。数据作为网络空间的重要元素,已成为国家基础性战略资源,与自然资源、信息资源、智力资源同等重要,数据主权的概念应运而生。虽说网络无国界,但是公平正义、诚实信用等法律制度和普世精神还是绝大多数人所倡导和遵循的,绝对自由和无政府主义不是主流价值观,从网络传输节点、数据存储地点、信息服务主体、网民行为习惯和网络文化价值的实际来看,都带有鲜明的地域特点和主权国家色彩。另外,数据关乎国家安全,数据安全上升为国家战略,如果特定人类族群的大规模基因数据被泄露公开,有可能会加快“量身定制”生物武器的研制进程。参考国际法的理论,数据主权表现为数字空间独立权、数据跨境平等权、数据司法管辖权和网络侵略自卫权四项权力。


2018年3月,美国特朗普政府颁布《澄清境外数据的合法使用法》(以下简称“云法案”),其中规定,在美国政府提出要求时,任何在云上存储数据的美国公司都要将数据转交给美国政府。而位于美国境外的公司,只要被美国法院认为“与美国有足够联系且受美国管辖”,也适用上述规定。此外,公司位于美国境内但是数据中心在境外的企业,也必须遵守此要求。与此相对,2018年5月,欧盟出台《通用数据保护条例》(以下简称“GDPR”),提出建立数据跨境白名单国家认证制度。2018年3月,欧盟委员会发布立法提案,拟调整对大型互联网企业的征税规则,依据这项提案,任何一个欧盟成员国均可对境内发生的互联网业务所产生的利润征税,而依据现行规则,互联网企业只需在总部所在地一次性交税;2019年7月11日,法国参议院通过了数字税法案;2020年3月11日,英国政府宣布,将从4月1日开始对亚马逊、脸书和谷歌在内的众多美国科技巨头征收2%的“数字服务税”。为了维护国家主权、安全和发展利益,2021年6月,我国正式颁布《中华人民共和国数据安全法》,其中规定:“任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和国可以根据实际情况对该国家或者地区对等采取措施。”


国家对本国数据行使主权展示了国家的独立性和自主性,对数据控制权和管辖权的高度重视,对于有效解决大规模数据安全问题,以及打击数据恐怖主义、跨境数据犯罪等具有重要意义。为此,数据跨境、司法管辖、税收征缴等方面的制度设计,属于典型的国家事权,地方立法无权涉及。


2.公权。公权可以界定为以政府部门、法律法规授权的组织为实施主体,以公共利益最大化为价值取向,依靠行政强制力维护公共事务参与秩序的一种集体性权力。公权主要涉及行政法律关系,由一系列行政法律或法规调整规范。数据公权是由传统公权主体依法履职所衍生,以公共数据为行使权力的对象,以公共数据的汇聚、管理、使用、评价为主线,以服务于社会治理为最终目标。


研究数据公权,首先要合理界定公共数据的范围。一般而言,公共数据类似空气和水,具有公共属性。对于公共数据的界定,目前学术界主要有三种分类:一是政务数据,主要是由财政经费保障,依法履职收集的数据(如法人数据库、自然人数据库、空间地理资源数据库),以及在信息化建设过程中产生的电子政务数据(如电子证照库),乃至依法购买的一些社会数据,这些数据相当于个人和市场主体的数据权利让渡。二是政务数据+公共企事业单位数据,在前者基础上,增加供水电气热、交通、医疗、通信等公共服务企事业单位掌握的数据。三是凡不涉及国家秘密、商业机密和个人隐私的,具有公共利益价值的数据,在前两者的基础上,也包括互联网平台企业等数据处理者的数据。笔者认为,三种分类方法各有利弊,鉴于公共数据的公益性,将公共数据范围划得小一点儿,有利于促进社会数据市场化交易;范围划得大一点,有助于推动公共数据主动开放和依申请开放,促进数据红利的最大化释放。考虑到公共服务企事业单位和其他市场主体的复杂性,以及国有资产和企业资产的自主决定权问题,从准确把握数据公权内涵的角度,《北京市数字经济促进条例(征求意见稿)》第16条规定采取了公共数据的第一类认定标准。将其界定为本市各级国家机关、经授权具有公共管理职能的组织在履行公共职责和提供服务过程中收集和产生的,依托计算机信息系统记录和保存的各类数据。


笔者认为,数据公权的内容包括六个方面:一是政府部门为了公共利益的需要,对社会公众行使的数据收集权,比如新冠疫情防控期间,国家和地方政府基于大数据技术开发健康码信息系统,依据《突发事件应对法》等法律法规,采集公民的个人基本身份信息、手机号码和位置信息等,在流行病调查、密接排查、出行防控等工作中发挥了积极作用。一般而言,政府部门在收集数据之前,应当明确告知收集数据的目的和用途,保障相对人的知情权。二是为了降低采集数据的成本,避免重复采集数据,由数据收集权所派生,实现不同层级国家机关和不同行业部门之间基于履职需要的数据共享权和义务。三是在成功收集数据的基础上,政府部门自然而然形成的存储、复制、传输等数据管控权。四是由于初次收集的原始数据在字段完整性、内容真实性、更新频次、存储格式方面往往存在一定的质量瑕疵,或者需要与其他来源的数据进行字段补充和比对校核,以提高数据项的使用价值,收集数据的政府部门往往需要对这些数据进行加工处理,为此相应享有数据处理权。五是为了正常履职或者提升精细化管理效能,政府部门必然需要使用数据,这就产生了数据使用权。这里的使用也包括征用,比如2022年2月欧盟发布的《数据法案(草案)》第五章提到,公共部门机构和工会机构在特定紧急情况下可以使用企业持有的数据。六是在不侵害国家秘密、商业秘密和个人隐私的情况下,政府部门对于利用财政资金处理形成的数据资产,致力于社会公共利益最大化,具有数据开放权和义务。2007年4月,我国颁布实施《政府信息公开条例》,建立政府信息主动公开和依申请公开制度。数据开放源于信息公开,但内涵和范畴有所不同,数据开放,既是权利也是义务,对于引导带动社会数据开放具有积极意义。目前国家和地方均建立政务数据开放网站,将大量的公共数据进行无条件开放和有条件开放。应当说,数据的公权力在行使过程中必须坚持依法行政、接受监督、法无授权不可为、法定职责必须为的原则,如此才能抑制公权力被滥用。


3.私权。私权主要由民法制度来确认、保护和规范。我国《民法典》明确了人身权和财产权两大权利体系。按照民法理论,人身权与民事主体的人身不可分离,没有直接的财产内容,具体包括人格权和身份权,人格权包括生命权、身体权、健康权、姓名权、名称权、名誉权、肖像权、知情权、隐私权和信用权等;身份权包括亲权、配偶权、亲属权以及知识产权中的身份权。财产权包括物权、债权和知识产权中的财产权利。


数据是新型生产资料,无论载体还是内容,均具有财产权利属性,其承载的内容,如果涉及自然人、法人和其他组织的权益,也具有相应的人身权特征。在我国《民法典》制定过程中,很多专家呼吁对数据权属和权益类型进行界定,然而,考虑到数据本身的可复制性、多主体性与民法中物权具有的特定性、排他性不相协调,国家立法层面最终没有对数据权属作出明确规定。2021年6月,深圳市颁布国内首部数据领域的地方性法规《深圳经济特区数据条例》,第3条规定:“自然人对个人数据享有法律、行政法规及本条例规定的人格权益。”第4条规定:“自然人、法人和非法人组织对其合法处理数据形成的数据产品和服务享有法律、行政法规及本条例规定的财产权益。”这部法规第一次提出了数据的人格权益和财产权益,但只是对个人数据中的人格权和数据处理者的数据财产权进行了规定,回避了个人数据的身份权和财产权以及法人数据的人身权等存在较大争议的问题。


随着各行各业数字化转型步伐的加快,大量的数据得以产生和沉淀,形成丰富的“矿藏”资源,一方面,任何合法的数据收集、清洗、加工等数据处理行为,都是劳动者的增值活动,劳动者应当享有财产权益。另一方面,个人数据具有商业价值,商家利用人工智能技术可以精准推送广告、销售金融产品乃至商账催收,非法获取和使用个人数据已经形成“黑色”产业链,保护个人数据权益成为数字经济发展的重中之重。在网络游戏乃至在元宇宙的世界里,“数据人”“虚拟人”“虚拟财产”“NFT同质化代币”“DIFI去中心化金融”等概念,进一步将数据私权推向新的高度。为此,数据私权应是财产权和人身权的综合体。为此,构建一个开放且具有弹性的私权体系,已成为大数据时代的迫切要求。


(1)财产权。要想从法律层面研究数据财产的权利,先要从经济角度分析数据财产的价值问题,进而明确数据财产权利有哪些、归属于谁。


首先,关于数据财产价值。数据财产价值必须要落在商品这一形态,如脱离市场活动和劳动创造,泛泛谈论数据价值没有意义。数据商品可能是一个收集原始记录的数据库表、经过人工标注的数据集或者是经过大规模训练之后的算法模型。数据商品拥有具体劳动(指生产目的、劳动对象、所用工具、操作方法、生产结果都各不相同的劳动)和抽象劳动(指无差别的一般人类劳动)二重属性,数据商品的价值也包括使用价值和交换价值两个方面。数据商品使用价值,指的是数据商品能够满足人们某种需要的属性,由其自身的规模、质量、稀缺性、更新频次、应用场景等属性决定。数据商品交换价值,与生产该商品的社会必要劳动时间成正比,与生产它的社会劳动生产力成反比,也就是说等量劳动交换等量价值,数据商品的价值在现实中主要通过市场交换的价格来体现,正如马克思在《资本论》中指出的:“从商品到货币是一次惊险的跳跃。”应当说,正是人类的劳动,将数据“矿产”资源从离散、沉睡的状态唤醒,进而成为生产要素乃至商品,才真正具有了数字经济的生产资料意义。


孟子曰:“民之为道也,有恒产者有恒心,无恒产者无恒心。”当前,建立数据财产制度的社会呼声越来越高。在北京市数字经济立法调研中,奇安信公司认为,如果完善企业会计制度,将数据财产纳入资产负债表,列成日常投资项目,进行经营成本摊销,将极大调动社会层面的数字经济投资热情。为了加快数据资产化进程,《北京市数字经济促进条例(征求意见稿)》第21条提出:“本市探索建立数据生产要素会计核算制度,推动数据生产要素资本化核算,激发企业在数字经济领域投资动力。推进建立数据资产的登记和评估制度,支持开展数据入股、数据信贷、数据信托和数据资产证券化等数字经济业态创新,培育发展交易撮合、评估评价、中介经纪、托管运营、合规审计、争议仲裁等数据服务市场。”


其次,关于数据财产权利。数据财产权利主要是指数据处理者对原始数据资源进行劳动创造所形成的财产性权益。数据财产权不是物权,由于可以低成本复制,不具备一物一权、对世权的属性,照搬物权中的所有权提法是有问题的;数据财产权也不等同于知识产权,由于数据的二元化结构特征,除少量与《著作权法》《专利法》《商标法》《反不正当竞争法》保护客体存在交叉以外,其内容部分只有能够上升为知识创造的,才能纳入知识产权保护体系,大量其他类型的结构化数据以及非结构化数据仍然无法纳入保护范围,且载体部分的保护明显缺失。数据财产权应当与物权、债权、知识产权相独立,被单独列为一种财产权利。


作为数据财产权的对象,数据商品包括数据内容、数据载体、劳动增值三要件。数据权利主体包括数据载体拥有者(一般为数据处理者)、数据内容拥有者两个主体,就数据内容而言,如果是个人信息、私有财产之外的一些公共性质的东西,如地球气象、自然资源、公共环境、科学技术、文化知识、城市基础设施等,可以视为全民所有或者归为无主不受法律保护。数据财产权既可以是独有权利,也可能是共有权利,主要取决于数据内容的主体与载体的主体是否为一体,数据内容的权利属性如何,私有还是公有,以及内容权利人是否让渡或者放弃权利。总的来看,数据处理者控制数据载体,进而控制数据内容。这一点类似画家进行人体素描,画作属于画家,但不能侵害模特肖像权,如果公开发表应当得到模特的许可,并支付一定的报酬。欧盟公布的《数据法(草案)》,肯定了数据共同生成者拥有访问权、使用权,让用户和服务产品的供应商在获取数据方面处于平等地位。


回到日常生活,每天都有大量的网民在抖音平台发布自己创作的短视频,在微信自媒体公众号发表创作文章,在全民K歌App上传公开自己演唱的歌曲,在《原神》网络游戏中提升角色的冒险等级和装备水平,不一而足。这些数据内容的所有权归作者,作者可以决定是否发表、修改和删除,但是这些数据载体都经过互联网平台企业的技术处理并存储在其公有云,数据处理者有足够的算法能力对这些数据内容进行价值挖掘,而作者很难脱离网络平台将数据内容下载到自己的电脑或移动终端,更难以迁移到其他类似平台,互联网平台也可以主张,如果没有我们提供的平台服务,数据内容的创作和权属也无从谈起。电子病历、医疗影像是高价值的医疗健康数据,医院的工作人员对病患的健康信息和诊疗信息进行记录并数字化存储,就每一份电子病历、医疗影像而言,其财产权归病患和医院共同所有,病患拥有个人基本信息,花钱看病视同购买了医院医生的诊断结果,主要涉及病患的人身权,其个人诊疗过程和结果,在大数据条件下,对新药研发、诊疗方法改进和医保费率调整具有商业开发价值,也具有了财产权属性;医院拥有数据载体和医生的诊断结果,并实际控制电子病历。如果医院对电子病历数据进行商业化开发,应取得病患的授权或者支付一定的报酬,当然如果医院进行了匿名化处理,利用大数据技术进行人群活动和病理演化统计分析的话,则淡化了数据具体内容,强化了数据载体和大数据的计算价值。这一做法是符合我国《个人信息保护法》规定的,该法在适用范围部分,已明确把匿名化处理后的信息排除在个人信息之外。再举一例,道路基础设施和电子地图是重要的智能网联汽车的训练数据,国内外自动驾驶汽车企业都需要上路测试并收集数据,有的通过毫米波雷达方式,还有的通过摄像头方式。由于城市道路属于城市公共交通基础设施,上路测试需要经过交通管理部门审批,一般而言,自动驾驶汽车企业收集的数据都归自己所有,后来者要想获得此类数据,要么自己申请上路审批重新收集,要么出资购买。2022年2月24日,清华大学智能产业研究院联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布了全球首个基于真实场景的车路协同自动驾驶数据集,向境内用户提供开源下载使用,能够有效服务科研、产业、政府机构,有效协同各方进行车路协同研究、产业落地和市政规划建设,促进我国车路协同发展。[9]


数据财产权人应当对数据财产拥有所有权,具体体现为占有、处理、收益和支配权,按照《数据安全法》《个人信息保护法》相关规定,数据处理活动主要包括:收集、存储、使用、加工、传输、提供、公开、删除8种情形。关于是否承认数据财产所有权,学术界存在分歧,不主张所有权的人,主要理由就是数据可以低成本复制且公开后无法有效管控,应当归入公共产品范畴。从促进数字经济发展、激发数据价值挖掘的角度,应当支持数据财产所有权人,特别是支持数据处理者(也包括自然人)主张财产性权利,只有这样的制度设计,才能促进数据要素的有效供给。我们也鼓励数据处理者通过合理支付报酬、让渡数据可携带权和使用权等民事合约方式,取得数据内容所有者的许可,促进数据红利的合理分配。在《北京市数字经济促进条例(征求意见稿)》第20条,我们尝试进行这样的制度设计,“除法律、行政法规另有规定或者当事人另有约定外,单位和个人对其合法收集的数据,可以依法存储、使用、加工、传输、提供、公开等,其所形成的数据产品和数据服务的财产性收益受法律保护。”另外,我们也在立法中强调,数据处理者要坚持技术向善理念和合理注意义务,即数据使用行为的正当四性:来源正当、行为正当、使用场景正当、传输存储正当,在此不再赘述。


最后,关于数据财产所有权的实现。设立和实施数据财产所有权制度,必须要解决唯一性问题,这就需要配套建立数据财产确权制度,辅以登记、公示、变更、撤销以及调解仲裁等利害关系人争议解决机制,保障数据财产和权属的有序流转。在不能进行数据有效确权保护的情况下,数据的每一次开放和复制,就是一次数据控制权转移和权益减损,导致数据所有权无从实现。


随着区块链和电子签名技术不断成熟,通过安全认证的技术手段进行数据财产登记是一种有效的确权方式,虽然任重道远,但充满希望。北数所基于隐私计算和区块链技术,搭建数据登记服务系统,2021年11月在全国率先推出数据资产凭证,开辟了交易平台体系内数据确权的先河。2021年6月份,蚂蚁鲸探发行了敦煌系列NFT,九色鹿王和敦煌飞天各发行8000份,共16000份数字藏品,NFT+敦煌元素+蚂蚁链+支付宝+付款码赋能,每个仅需要10个支付宝积分和9.9元,这两款皮肤瞬间被抢光。国信优易数据股份有限公司于2019年开始探索实施数据水印技术,对通过其交易平台流转数据打上确权标识。


基于北京市政务数据目录区块链的实践(后文详述),建议建立全社会层面的数据财产登记流转溯源链。每个上链主体都可以看到自己产生哪些数据财产,各类数据财产的传输路径和接收主体,他人将这些数据财产用作哪些用途,完整的链条清晰可见,由此,数据的删除权、携带权也可以实现。一般而言,数据财产生产者、拥有者是所有权人,数据接收者和数据处理者是数据财产使用权人;如果数据所有权人保证其将数据财产独家转让后自己不再保留备份,数据接收者即是所有权人;数据处理者也可以成为新的数据所有权人,前提是获取渠道合法合规,但仅对其劳动增值部分拥有权属。


(2)人身权。随着《个人信息保护法》的颁布实施,与个人特性密切相关的生物识别数据、与社会其他主体交互产生的行为数据,以及属于个人知识产权的成果,都可能成为数据人身权的保护对象。如前所述,数据二元化结构表明,数据内容的权利主体主要享有人身权利,而数据载体的权利主体即数据处理者主要承担义务。笔者结合对《个人信息保护法》相关内容的理解,尝试从人格权和身份权两个方面进行分析。


在人格权方面,个人对其个人信息的处理享有知情权、决定权、可携带权,有权限制或者拒绝他人对其个人信息进行处理;与个人主体特性密切相关的数据内容权利,必须要通过对载体的控制得到实现,行使个人信息查阅、复制、转移、核实与更正、补充、撤回同意、删除的权利。而数据处理者应当履行相应的义务,比如:保证个人信息的质量、安全;以显著方式、清晰易懂的语言真实、准确、完整地向个人告知信息处理规则,并解释说明;应个人信息处理者的要求删除个人信息;不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息;不得从事危害国家安全、公共利益的个人信息处理活动。《个人信息保护法》侧重阐述个人的权利和信息处理者的义务,从权利与义务一致性来看,还应指出个人的义务和信息处理者的权利。


在身份权方面,2021年10月28日,脸书公司宣布,将把公司名称改为“Meta”,其CEO马克·扎克伯格表示,元宇宙是下一个前沿领域,“下一个平台和媒介将是更加身临其境和具体化的互联网,你将置身于体验之中,而不仅仅是作为旁观者,我们称之为元宇宙。”这个脱胎于网络游戏的超越宇宙,或者说平行宇宙,不仅是一个新概念,而是去中心化的世界。数字创造、数字资产、数字市场、数字货币,支撑了整个元宇宙的经济体系。[10]还有数字社区,将来会有越来越多的人沉浸在这个数字空间,这个空间里,每个人都会有一个虚拟身份,现实社会中人的身份行为,如宪法赋予公民的基本人权,选举与被选举、言论游行集会结社自由等,都可能会迁移、孪生乃至原生到这个数字世界。围绕数据身份权的制度设计,目前看还有点儿遥远,国内外的立法还是空白,相信技术的突破会不断将幻想变为现实,乃至颠覆我们今天的认知和想象力,一切不是没有可能。


三、把握权属特征,推动数据要素市场化配置改革


2018年以来,北京市启动实施大数据行动计划,加快建设新型智慧城市,努力打造全球数字经济标杆城市,数据全流程管理和开放利用是其中的重要内容,笔者有幸亲历工作一线,参与并推动了公共数据治理、开放应用、授权运营、评估评价、北数所组建等重点工作,现将一些经验做法进行总结。


(一)基于区块链技术进行登记——实现数据财产唯一性确权


信任是第二代互联网的特征,区块链是价值互联网的基石。[11]基于P2P网络、数据加密、时间戳、智能合约等技术架构,区块链具有数据真实可靠难以篡改和去中心化两大特点,可以帮助建立数据资产信任体系,解决数据财产的唯一性认定难这一长期制约数据财产所有权制度实施的技术问题。


案例1:政务数据目录区块链。为了建立全市政务数据的基本台账,推动数据汇聚、共享、开放和应用,2019年10月,北京市经济和信息化局(以下简称“市经信局”)在全国率先启动建设目录区块链项目,基于以太坊Fabric超级账本搭建联盟链,建立“职责—数据—库表”三级数据目录体系,以部门三定职责为根基逐一梳理建立“职责目录”,对应形成全市“市—区—街”数据目录、信息系统台账,并在目录区块链上进行注册。2022年以来,北京市大数据中心依托“长安链”底层架构和区块链试验算力平台,对目录区块链进行全面升级和数据迁移。目前,市级层面,80个市级政府部门、1552个信息系统、9641条职责目录、107799条数据目录完成上链;区级层面,726个区级部门、1149个信息系统、59537条职责目录、197283条数据目录实现上链;北京市大数据平台累计汇聚371亿条政务数据,支撑领导驾驶舱、疫情防控、社会信用、一网通办等155项重点业务应用。通过目录区块链,北京市在国家机关体系内确定了各类政务数据源的归属和责任主体,明确了数据内容、更新机制、共享开放属性,并与产生数据的信息系统进行挂接,将“依职责产生数据、数据目录上链不可更改、高频数据依据智能合约自动共享”的理念落到实处,实现了业务数据分布式存储、高频共享数据集中式汇聚,目录区块链在北京市大数据行动计划中发挥了“定海神针”作用。


案例2:社会数据交易登记系统。我国《数据安全法》第33条规定,“从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录。”由此可见,数据交易服务商是提供数据财产确权服务的重要主体。2021年9月30日,北数所基于自主知识产权开发的数据交易平台IDeX系统上线。该系统是国内首家利用综合数据技术、探索数据交易创新模式的新平台,依托在隐私计算、区块链及智能合约、数据确权标识、测试沙盒等领域的技术优势,构建新型数据交易系统。该系统面向会员单位,本着在先申请、形式审核、社会公示的原则,为拟上架交易的数据产品提供发布主体和内容登记服务,在数据交易、资金结算、资产交割等环节具备时间戳功能,实现行为确权抗抵赖且可追溯。目前,IDeX系统上架涵盖数据集、数据报告、数据服务等多种形式的数据产品超过500项,数据交易调用量达到1300TB。在国家尚未建立数据权属制度的情况下,北数所通过上链上系统的登记机制,在全国率先探索了数据财产确权的市场化方式,给出了“北京方案”。


(二)无条件开放公共数据——公共机构让渡数据财产所有权或使用权


为了全面深入推进政府信息公开,通过公共数据开放赋能经济社会发展,2019年10月,北京市大数据工作推进小组办公室印发实施《关于通过公共数据开放促进人工智能产业发展的工作方案》,2021年1月,北京市大数据工作推进小组办公室印发实施《北京市公共数据管理办法》。根据上述政策要求,北京市公共数据开放分为无条件开放和有条件开放两种,其中无条件开放是一种普惠型的数据供给方式,市经信局通过发放问卷、座谈交流、窗口服务等方式收集社会公众和企业对政府开放数据的需求,并将需求反馈至各相关单位,组织编写年度公共数据开放计划,通过市公共数据开放平台(前身是2016年底上线的市政务数据资源网,2022年初更名,由北京市大数据中心负责日常运维)向社会公众无条件开放公共数据。目前,北京市政务部门和区政府共114家单位面向社会无条件开放了13230个公共数据集,563279个数据项,10854个数据接口,59.86亿条公共数据,包括政务服务、交通出行、气象卫生、财税金融、城市管理、车路协同自动驾驶、人工智能训练等热点领域的约1.48亿条高价值公共数据,对于上述数据,社会公众可以下载获取或调用接口服务。为了支持全社会做好新冠疫情防控,市经信局、北京市大数据中心在健康宝生产数据库的基础上,推出服务数据库,两年来,为睿家科技、首信、百度等从事图像识别、门禁闸机和重大活动保障的40余家单位提供“健康宝”数据服务,累计向AI智能终端提供接口调用5.35亿次,支持安装1.64万个智能终端设备,服务3105个应用场景,初步估算带动人工智能产业规模超过10亿元。


笔者认为,公共数据是新型国有资产。公共数据无条件开放就是公共机构让渡数据财产的所有权或使用权,其意义不仅仅在于打造透明型政府和服务型政府,更重要的是让数据取之于民,用之于民。可以说,数据开放程度是区域营商环境的重要内容,数据开放就是为数字经济注入源头活水,让社会公众和市场主体无偿、便捷地获取并增值开发这些数据,实现“放水养鱼”和数据招商。数据开放不应局限在公共机构和公共数据,如果能够将社会主体和社会数据组织起来,汇成数据开放的洪流,聚成数据开放的风暴,那才是更具改革意义的数据红利供给。当前北京市抓住“两区”建设的政策机遇,正在探索建设数据特区,打造新的数字经济区域增长极,正如《北京市数字经济促进条例(征求意见稿)》第19条规定:“本市探索在中国(北京)自由贸易试验区设立特定区域,鼓励多方数据导入和融合应用,允许区域内企业开展新技术、新产品、新服务的研发、试验和示范应用,建立适应数字经济特征的新型监管体系。”当然,我们也要看到某些公共数据财产可能会存在共有权的问题,大规模开放会造成多方数据融合后的数据敏感度提升,为此,推进数据开放必须要坚持安全合规和风险评估,采取必要的技术处理措施,避免给公共利益和第三人权益造成“误伤”。


(三)授权运营金融公共数据专区——推动数据财产所有权和经营权分离


2020年6月,北京市大数据工作推进小组办公室发布《关于推进北京市金融公共数据专区建设的意见》(以下简称《意见》),明确提出依托市大数据平台建设金融公共数据专区(以下简称“金融专区”),通过授权运营的方式面向社会提供社会公共服务。经北京市政府批准,市经信局与北京金控集团于同年8月份签署授权运营协议,其中约定,市经信局牵头负责政务数据的汇聚和整理,北京金控集团负责投资、建设、运营金融专区,在政府部门监管下推动政务数据产品服务研发和应用场景拓展。金融专区是全国首个公共数据授权运营的试点项目,通过数据汇聚、接口汇通(调用敏感数据需要得到权益人授权)两种方式,累计归集企业注册登记、税务、社保、医保、公积金、不动产、政府采购等1799项政务数据,累计超20余亿条,覆盖全市250余万市场主体,并依照业务类型实现按日、按周、按月稳步更新。按照网络安全等级保护三级的要求,北京金控集团旗下金融大数据公司将金融专区建成涵盖基础设施层、数据层、平台能力层、业务支撑层和应用层的金融科技基础设施,结合联邦学习等隐私计算算法,实现了在“原始数据不出域”的前提下,支撑金融创新应用开展。截至2022年4月30日,金融专区支撑北京贷款服务中心登记业务申请共48350笔,意向贷款金额约2031.92亿元;审批通过42107笔,涉及金额约1768.23亿元,其中信用类贷款金额456.13亿元。支持在京商业银行实现普惠金融产品落地,如与工商银行北京分行联合开发的“惠e贷”、与中国银行北京分行联合开发“中银企税通宝”等信用贷产品,年化利率为3.85%,两款产品累计为近1000户在京小微企业推送授信额超20亿元。


从数据权属角度来看,金融专区的创新点主要体现在公共数据授权运营,或者说公共数据财产所有权与经营权的分离。首先,金融专区所有权属于北京市政府。按照《意见》要求,金融专区是北京市大数据平台的组成部分,而北京市大数据平台是北京市政府授权市经信局组织建设,大量的政务数据无条件汇聚到北京市大数据平台,成为市级国家机关和市区两级国家机关的数据共享载体,为此,金融专区与市大数据平台均具有国有资产属性。其次,金融专区经营权下放市场主体。为了发挥市场在数据资源配置中的决定性作用,更好地实现政务数据对实体经济的赋能,市经信局代表市政府通过签订授权运营协议的方式,将金融专区数据财产的“用益权”委托北京金控集团——这一金融领域市属国企行使,专区运营单位有权占有、加工、使用金融专区数据,并取得合理收益;金融机构等市场主体可以使用金融专区的数据产品和服务,通过与自身业务数据融合应用训练算法模型,创造出新的数字金融产品。最后,金融专区运营单位应当接受行业监管。《意见》明确要求,运营单位不得对外转让金融专区的原始数据,并确保数据安全合规使用,在金融创新应用中符合国家和本市金融监管政策。两年来,在各方的指导和监督下,金融专区进入稳健运营的良性轨道,已经成为北京科技金融的重要基础设施,在首都营商环境和社会信用体系建设中发挥越来越大的支撑作用。


(四)创造新型数据交易范式——推动数据财产使用权交易


为打造全球数字经济标杆城市,解决数据要素流动的瓶颈问题,2021年3月31日,在北京市经信局、金融局、市委网信办、朝阳区政府的组织和支持下,金控集团会同京东集团、微芯研究院、华控清交公司共同发起成立了北数所。北数所基于数据二元化结构的新数据观,发挥首都科技创新和数据资源优势,在全国率先推动并引领“可用不可见、可控可计量”的新型数据交易范式。一年来,北数所以合规管理、促进交易为导向,发布《北京数据交易服务指南》,形成覆盖数据交易方式、交易安全、跨境流动等交易全链的规则体系;建设数据运营商体系和数据经纪商体系,并形成包括交通、气象、能源、公共数据专区、运营商、人工智能等六大社会数据专区;探索金融、医疗、商业、数据跨境等标杆应用场景,如与商业银行创新“业主贷”模式,双方将高价值数据密文计算后,将明文结果回传至银行,完成“业主贷”的发放,实现了用户信息保护,提升了银行风控和审批的效率;建设国内首个服务跨境场景的数据托管服务平台,在满足合规要求的前提下,试点开展跨境数据合规托管工作。


笔者认为,新型交易范式的实践意义体现在两方面。首先,搁置争议共同开发数据财产价值。在国家尚未明确数据权属制度的情况下,对于存在数据共有权的利益分配分歧的,特别是可能存在个人信息保护主张的,北数所能够基于隐私计算析离数据具体内容,搁置或者淡化数据内容权利主体的担忧,把数据背后的计算价值先释放出来。类似于存在历史性的权属争议房产,在司法判决最终下达前,让房子先用起来以满足社会的财富创造需求,对于房产租赁形成的资金,可以先提存再分配。应当说,这是一项绕开权属争论,促进数字经济发展的务实之举。其次,把数据财产使用权作为数据交易的主要标的。数据交易不同于物权交易,无论不动产还是动产,商品交付意味着物品所有权的转移,卖方不再占有商品,买方取得商品的绝对控制权,社会上流动的还是一件商品。对于数据财产或商品交易而言,一般情况下,卖方将数据商品复制N份卖出,自身还会保留原件,社会流动的数据商品变为1+N,流动频次与社会数据总规模呈现正相关关系,总体上表现为社会数据财富的倍增扩张。数据使用权交易,如同用户购买Office软件,表面上看用户得到一张光盘和软件驱动程序,其实用户购买的只是软件使用权,而不是微软公司的软件源代码或所有权。我们不排除存在卖方将数据财产的所有权进行交易的情形,但是卖方必须要保证买方取得数据财产的唯一控制权,即自身删除原始数据,这种情况在目前来看还没有成为社会主流,基于区块链技术开发的数字资产交易平台,最终要取得官方的合规性认可,目前看还有一段较长的路要走。

[1]数字经济的定义,摘自我国《“十四五”数字经济发展规划》。

[2]2013年,英国作家维克托·迈尔—舍恩伯格和肯尼斯·库克耶出版《大数据时代》一书,标志着大数据时代的开启。

[3]安顺市大数据发展管理局、贵州省邮电规划设计院有限公司:《城市数据运营:开启数据要素价值释放的钥匙》,社会科学文献出版社2021年版,第19、21、23、24页。

[4]郝海、崔晓迪、刘伦斌、李静:《统计学》,清华大学出版社2015年版,第43页。

[5]数据资产属于会计学范畴,数据财产属于法学范畴,两者概念有所不同,但语义指向的对象基本一致,工作实践中一般以数据资产表述为主,笔者在本文中不做严格区分。但在涉及数据权属的部分,笔者从法律的视角,主要使用数据财产的表述,进而阐释数据财产权、数据财产所有权。

[6]参见梅夏英:《虚拟财产的范畴界定和民法保护模式》,载《华东政法大学学报》2017年第5期,第46页。

[7][英]弗里德利希·奥古斯特·冯·哈耶克:《法律、立法与自由》,中国大百科全书出版社2000年版,第246页。

[8]安顺市大数据发展管理局、贵州省邮电规划设计院有限公司:《城市数据运营:开启数据要素价值释放的钥匙》,社会科学文献出版社2021年版,第101页。

[9]“亦庄贡献”全球首个车路协同自动驾驶数据集正式发布,https://www.sohu.com/a/525241317_121106842,访问日期:2022年8月9日。

[10]赵国栋、易欢欢、徐远重:《元宇宙》,中国出版集团中译出版社2021年版,第99页。

[11]赵刚:《区块链:价值互联网的基石》,电子工业出版社2021年版,第1页。

分享本文:

点击界面右上角按钮,在弹出框中选择“发送给朋友”或者“分享到朋友圈”

本刊微信号:faxuezazhi

本刊微信二维码:

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存