推荐 | 数据资产确权浅议
The following article is from 数据派THU Author 张家林
本文转载自公众号数据派THU
编辑:王菁
校对:林亦霖
数据要素市场发展起来后,自然的会形成大量数据资产。宏观上,数据要素价值流动,形成数据资产的过程示意图如下。数据资产列入资产负债表的时间问题,主要是需要解决诸如确权、定价、交易和计量等课题。这些方面的研究也随着相关政策和配套的法律法规的逐渐落地和实施而日益活跃起来。
本文对数据资产确权进行一些初步的分析和研究。采用的方法是,构造一个简单数据要素市场,建立一些核心概念和分析框架。然后运用这些核心概念、框架对数据资产确权的一些关键问题进行分析,提出一些解决方案和后续需要进一步研究的问题。
设想一个简单数据要素市场
,进入一级市场进行交易。买家
之所以设置一级和二级市场,主要是因为由原始数据集生成的数据资产的确权,和加工原始数据集之后形成的数据资产的确权有非常大的差异。因此,设定一级市场交易的是由原始数据集生成的数据资产;二级市场交易的是由一级市场数据资产经过加工后的生产的数据资产。
数据资产的生成需要一系列的过程和路径才能完成,包括从哪个数据源获取原始记录(Records)、通过什么传输通信网络将记录传输到记录/存储设施,并经过清洗、标注、合成等等一系列的加工过程,最终形成可以交付的资产。为简便,本文称之为数据资产生产链。
数据资产生产链的特性是由数据的“5V1P”特性决定的。“5V1P”指的是数据的量(Volume)、速度(Velocity)、类型(Variety)、可变性(Variability)、准确性(Veracity)和数据来源(Provenance)。一般情况下,数据资产的交付不是一次性的,而是持续的动态过程。
当数据资产进入市场后,如果不是被一次性的消费掉,那么如何使用这些数据资产就超出了卖家的控制。后续买家为了更好的使用数据,势必会对数据初始的来源、以及如何被处理的历史沿革需要更多的了解和把握。
由上面的示意图,可以看出,数据资产进入市场后,会不断的被处理、再加工、生成新的数据资产、再入市这样的迭代过程。为了确保每个数据资产价值在整个流通过程中保持,就需要对其生产链的完整性、一致性和准确性(以下简称“三性”)采取必要的措施进行保障。否则,数据资产的价值对于买家而言就没有任何保障。
由此,市场就势必会要求数据资产所有权人不仅需要静态的控制,还需要能够动态的控制生产链,也就是说能够支配和决定“生产活动的目的、对象、手段、方法和结果”。限于篇幅,本文仅讨论一级市场中,由原始数据集生成的数据资产确权问题。
一级市场的数据资产
中的数据是
数据源
1、数据出生地
数据集
2、数据出生证明
为了证明一个数据集是由某个数据源和函数f生成的,可以通过出具数据出生证明(DBC:Data Brith Certification)的方式实现。这是确保数据集生成过程中的一致性的非常重要的措施。因为,如果数据源或函数f发生变化,那么数据就不是以前的数据了。
数据出生证明是对原始数据集的生成路径做一致性和不变性做认证,即认证数据集
数据出生证明由第三方来出具。出具证明的认证机构(Issuer)可以是中心化的,也可以是联盟化的组织。理论上,当数据集产生一批新的原始数据后,就应该向认证机构申请该批数据的DBC。
本文为简化,假设整个数据集在生命周期内,不改变数据源和函数,因此,做一次DBC认证即可。由此,任何一个数据集就至少有一个DBC与之对应。其过程示意图如下:
3、生产链状态
{ datasetID: xxxxx
dataset name:
data birth place: DBP-ID;
data birth certificationID: xxxxxxxx
data source:
sensor device ID: xxxxxxxxx
sensor function:f
timestamp: xx-xx-xx
}
4、所有权确权
首先,在数据源和出生地之间,采用安全可信计算环境(TEE)。并在数据源采用零知识证明(ZKP)方式,证明写入到数据集
其次,在数据集全寿命周期中,每当新的数据生成时,就为其申请数据出生证明DBC。数据集的每个数据块都有DBC。并在映射数据集的数据到
最后,将数据资产
在具备上述三个基础设施后,在时刻
1)数据资产
2)数据块都来自相同的数据出生地DBP;
3)生产链状态一致,即
4)数据源设备、DBP的设备以及软件的所有权为A。
上述简化的讨论,主要是为便于建立基础的核心概念和分析框架。接下来,我们应用上述基本核心概念和框架,对由应用服务生成的原始数据资产的确权问题进行简要的讨论。
由应用服务(以下简称“App”)生成的原始数据资产,指的是原始数据集出生地是在一个App里。数据源感知的是具有民事权利的主体,这里统称为用户(User)。
一个App我们可以看作是由服务
对数据资产
因此,在生产链的状态描述信息中,需要增加公证的状态。由于每个用户的服务协议的具体条款可能不同,因此,公证需要维护一个动态变化的场景。处于效率的考虑,这类公证大多数采用可验证的单方隐私计算来解决。而不可能采用第三方公证的传统模式。由此,我们基于前述的框架,构建一个确权的示意图如图。由此,就可以进行有效的确权。
笔者认为,原始数据资产的所有权确权是整个数据要素市场的基石。因为,如果不能在一级市场对由原始数据生成的数据资产的产权进行清晰的界定,那么数据一旦流通起来,后续的确权将变得十分复杂、低效和混乱,使得市场最终陷入无法持续运行的困境。因此,有必要构建一个产权清晰、有效运行的数据要素一级市场。建立高效的确权基础设施,在源头上就把产权关系理顺。
同时,由于数据的5V1P特性,决定了数据资产生产链的“三性”的重要性。因此,所有权确权的核心就是对所有权人支配和决定“生产活动的目的、对象、手段、方法和结果”的鉴证。而实现上述目标,光靠理论和法律制度的完善是无法完成的,必须依赖一定的配套基础设施才能实现。
本文均指大数据。 张家林,《数据有价——数据资产定价研究初探》,2019 “大数据之父”维克托·迈尔·舍恩伯格。 中央关于数据要素、数据要素市场建设的文件以及数据相关法律、法规的一系列措施。 NIST 《大数据参考架构》
点击阅读原文,进入CCAD数据库
长按识别,添加小客服企业微信~
·END·
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文丨数据派THU
推荐丨谈佳辉
欢迎扫描👇二维码添加关注