研究成果|孟天广 严宇:四维度构建数据资源“要素化”治理体系
正文
随着数字化浪潮席卷全球,数字技术正深刻影响着人类社会的未来走向。然而,数据要素的价值释放受制于模糊不清的产权归属。如何厘清数据要素的产权归属、明确数据权利保护与数据治理体系是世界各国面临的共同难题,严重制约着数据要素价值的最大化释放。
厘清数据生产和管理权属
数据要素要从数据和要素两部分切入。首先,何为数据?2021年发布的数据安全法将数据定义为“任何以电子或者其他方式对信息的记录”。国际标准化组织(ISO)将数据视为信息的形式化体现,便于后者的交流、理解和处理。欧盟2018年颁布的《通用数据保护条例》(GDPR)将个人数据定义为能够直接或间接识别自然人的任何信息。因此,数据作为信息载体,掌握数据并不仅仅只是掌握了信息,还影响着信息的权属、流通、使用、收益和处置等整个生命周期。
其次,何为要素?要素指生产经营活动时所需要的各类资料,譬如被视为三大生产要素的资本、劳动、技术。进入数字时代,数据成为推动经济社会发展“炙手可热”的要素,尤其是数据的经济价值凸显,这引发了现阶段对数据确权的诸多讨论。
数据要素作为一种“无形”要素,与资本、劳动、技术等三大传统生产要素相比,具有虚拟性、非竞争性、排他性与非均质性等显著特征。这导致数据要素是一种存在巨大确权困境的生产要素。从数据所承载内容而言,数据要素可以是关于政府或企业的,也可以是关于个人的。前两者在数据权属上相对比较清晰,政府数据是公共资源,由政府代表全民持有,企业数据是企业商业资产,属于私有数据。个人数据可以分为两类:个人信息与个人数字痕迹。从数据生产机制而言,分为原始数据与衍生数据,原始数据是未经加工、编辑的“原生数据”或“基础数据”,而衍生数据是基于特定目标和技术手段加工处理后的数据成果,一般具有更高的社会经济价值,被称为“增值数据”。梳理数据要素的价值实现过程,不难发现数据要素的价值实现需要两个必要条件:海量数据的采集汇聚和专业高效的数据挖掘。
数据要素确权的核心问题在于弄清楚数据生产和管理权属。结合人格权和财产权的理论逻辑,基于用户授权与加工创造的原则,如果从“数据谁持有”与“数据谁生成”两个维度切入,可以将所有数据分为四种类型:(政府或企业)自有数据、用户个人信息、用户数字痕迹和衍生数据。
数据持有者指的是数据要素被谁所持有,或者数据要素的使用被谁所管理。当然持有并不能等同于所有,尤其不等同于法律意义上的所有权,反映着现实世界中数据要素的“实际”所有权。现阶段数据要素持有者主要有两类:政府与企业。数据要素持有者一般具有两个属性:一是持有者能够汇聚或掌握远超个人所拥有的数据体量;二是持有者能够通过专业方法挖掘数据价值。尽管个人是数据关键生产者,但并非具备以上两种能力的“数据持有者”。
自有数据是数据持有者自身存在与运行过程中所生成的数据。譬如对于政府,自有数据是政务数据。用户个人信息是指通过用户授权、数据持有者在授权范围内记录所生成的个人信息,例如个人在数据持有者客户端上登记的姓名、手机号和身份证号等身份识别信息。用户数字痕迹是基于用户使用行为所生成的数字痕迹,包括用户浏览、搜索、消费等使用数字产品与设备时产生的数字记录。衍生数据指的是数据持有者运用相关专业知识、数据分析技术对其持有的各类数据进行加工与分析所创造出的数据分析结果或相应产品。
数据确权逻辑有两个路径
数据要素优化配置的关键问题是如何进行数据确权。产权制度被视为市场经济的基石,是优化资源配置、推动经济增长的重要条件。数据确权影响着数据要素的价值发挥、数据权利保护以及数据要素市场的培育。数据确权的逻辑有两个路径:一是人格权路径,另一个是财产权路径。人格权路径一般聚焦个人数据,尤其强调个人数据中涉及可识别个人身份的信息数据。人格权路径强调个人的隐私权,重视个人信息与人格尊严的关系。财产权路径则提出数据产权归属应该采取财产权方式。这样做不仅仅是出于提高数据挖掘分析水平、充分释放数据价值的目的,而且还被认为能够更好地保护个人利益。财产权路径的根本在于界定数据是由谁的劳动而生成。
上文提及的四类数据适用于不同的确权方法。政府与企业自身的数据——政务数据与企业运营数据,其产权归属较为明确,前者属于政府所有,后者是企业生产经营数据理应归企业所有。用户个人信息应该遵循人格权先于财产权路径,理应归个人所有,重在保护个人隐私,维护人的尊严与自由。个人数字痕迹通常由企业或政府持有且经济价值巨大,应当采取政府与个人共有、企业与个人共有的方式,其保护路径应以人格权和财产权相结合的方式,在个人隐私最大化保护的基础上开发利用数字痕迹、释放其价值。衍生数据一般来源于政府与企业对自身数据、用户数字痕迹的分析加工。数据“加工”过程中,数据持有者投入人力、设备、资金和技术等资源,且相关数据不涉及个人隐私,因此衍生数据理应由数据持有者所有。充分释放数据要素经济社会价值
充分释放数据要素的经济社会价值,就必须要构建数据资源“要素化”的治理体系:一是树立数据要素的分类原则,形成精细化的数据权属界定体系。数据要素存在多种类型,因此其数据权属需遵循分类原则,通过分类可以明确不同类型数据的生成主体与方式,从而判定数据要素产权归属与保护机制。
二是坚持隐私保护的底线原则,在释放数据价值中保护个人信息。现阶段大量数据涉及个人信息与数字痕迹,前者能够被直接用来识别个人身份,后者在一定条件下也能具有相似功能,因此个人隐私保护是释放数据价值的底线。
三是坚持经济社会数据(数字痕迹)的强监管原则,强化政社协同监督作用。数据要素经济价值巨大,但其开发也存在数据安全隐患,应该发挥政社协同实施强监管是必要原则。
四是倡导数据融合与协同开发原则,鼓励多元数据互通汇聚释放聚合作用。得益于数字技术的广泛应用,我国积累了海量多源数据,但这些海量数据为不同主体所持有仍未实现互联互通,因此坚持多类数据融合、多主体协同开发的原则才能最大化数据价值开发。
编制| 清华大学计算社会科学与国家治理实验室
转载| 版权归原作者所有,转载请注明出处。
来源: 中国证券报·中证网
实验室简介
清华大学计算社会科学与国家治理实验室(LCG-THU)于2021年12月批准成立,实验室挂靠清华大学文科建设处,作为教育部批准建设的全国首批哲学社会科学实验室,是促进文科与理工学科交叉融合的综合支撑平台与创新基地。实验室由副校长彭刚兼任主任,公管学院教授孟庆国任执行主任。微信公众号LCG-THU邮箱号lcg-thu@tsinghua.edu.cn
●
●