其他
董学耕 | 数据产品超市——数据产品开发生产、流通交易和安全使用的一体化
一、数据交易所模式难以适应数据产品化要求
(一)涉公数据交易
对涉公数据,目前实践中一般采取的是进行“登记”确权,对涉公数据形成的数据集等在权威机构(例如数据交易所)进行“登记”,明确产权归属[2-4]。确权后,对涉公数据集进行交易。目前各地探索的数据交易所,基本采取这种形式交易涉公数据。交易所是单纯的交易所,对“登记”的数据集进行交易。这种模式涉及数据为涉公数据,范围相对小,价值密度相对低,主要针对大数据、小用户场景应用。
(二)关联对象“纠缠”
一般来说,更多的数据还是涉私数据。数据产品化确权过程中,关联对象无处不在,嵌入在数据采集、开发、使用等各个环节。数据处理包括对数据的收集、存储、使用、加工、传输、提供、公开、删除等行为,都应当取得关联对象的同意。关联对象授权与产品开发、使用场景是纠缠在一起的。不存在与关联对象无关的现成摆在那里的数据产品——唯一的例外是产品使用的数据全部为涉公数据,而没有涉私数据。
传统的交易所模式交易的是现成产品。这种交易所模式比附资金要素的证券交易所思维。资金作为一般等价物,是货币符号化的,自然是现成产品,与任何第三方主体无关,不存在任何关联对象。以资金为对象的交易所可以是单纯的竞价博弈。但是这种模式不适合数据交易,原因就在于数据交易中涉及到无数关联对象的“纠缠”。
类似地,数据交易与知识产权交易也完全不同。知识产权不涉及关联对象,也是现成产品,可以单纯竞价博弈,仅有个别例外,例如涉及肖像权的情形[1],即便此种情形,其涉及的关联对象也数量有限,不可能和大数据大用户(成千上万的关联对象)情形相比。但数据交易不是这样,总而言之,数据产品交易需要全新的交易模式。
二、数据产品开发生产、流通交易和安全使用的一体化集成
(一)数据产品离不开有公信力的安全可信平台支撑
数据产品与关联对象的“纠缠”意味着现成数据产品不可得,单纯交易不可行。那么怎样实现数据产品交易呢?
我们知道,数据产品形成过程涉及到多方面主体:数据资源持有者、数据使用开发者、数据载体提供者等数据处理者,当然还涉及关联对象。按照《个人信息保护法》[5]等法律法规要求,数据处理者只有在关联对象授权下才能处理相关数据,但是关联对象不可能在中间过程中进行授权,而只会在最终使用环节进行授权。而相关数据处理者在关联对象最终授权之前,必须恪守“数据不出域”“可用不可见”等数据安全和隐私保护要求。这是一个困境:没有数据产品提供最终服务,关联对象不会提前进行授权;没有关联对象授权,相关数据处理者无法将数据转化为数据产品。
此外,在权益分配得到明确保障之前,相关数据处理者尤其是数据资源持有者很难公开数据,因为数据公开意味着其持有权的对外分享,也就是相关权益的对外分享。
这意味着,我们需要一个安全可信的平台,形成一个更大的安全域、可信域,以此为边界,按照“数据不出域”的要求,让多个数据处理者进入该边界,在边界范围内实现数据的汇聚、交互、集成,也让数据处理者在这个边界内界定清楚相关权益,例如数据持有权的来源,权益分配关系,等等。同时这个安全可信的平台也要为关联对象所接受。也就是说,这个平台必须具有公信力。
“数据二十条”[6]指出:要完善数据要素市场化配置机制,更好发挥政府在数据要素收益分配中的引导调节作用,建立体现效率、促进公平的数据要素收益分配制度。
上述困境的破解就需要政府出手,需要发挥政府作用,由政府主导来建立一个有公信力的平台,一个安全可信的平台。数据产品的形成过程需要、也只能在这样的安全可信平台上进行。这不仅针对公共数据的开发利用,对其他社会数据、行业数据、企业数据,只要是跨多个数据处理者,都会面临上述困境,也就都需要有公信力的安全可信平台支撑,才能有数据产品的形成,包括开发生产、流通交易和安全使用。这就是“数据产品超市”,一个政府主导的集开发生产、流通交易和安全使用为一体的三合一集成平台。
(二)“华强北+淘宝+云服务”模式实现数据产品集成服务
数据产品不会作为现成产品出现在交易所,数据产品交易所(或者一般说数据交易所)不能是传统意义上的交易所。这个新型的交易所必须兼顾到数据产品的形成和利用全过程,它是一个政府主导的集开发生产、流通交易和安全使用为一体的“三合一”集成平台,我们叫做“数据产品超市”。
“数据产品超市”不仅仅是一个数据交易平台,而首先是一个数据产品开发生产平台,依托这一有公信力的安全可信平台,数据得以汇聚,数据产品得以形成;同时它也是一个数据产品流通交易平台,开发出的数据产品在“数据产品超市”上架,供需对接,流通交易;它更是一个数据产品安全使用平台,数据产品并不能孤立出来提供服务,因为其依赖于数据关联对象在数据产品使用场景中的实时授权,在授权同时,原始数据持有者才能实时提供数据,完成数据产品服务,这个过程必然依赖其原来开发生产的平台,依赖原来的安全域、可信域,在数据产品实时在线服务中实现“数据不出域”“可用不可见”。“数据产品超市”将数据汇聚和数据产品开发生产、流通交易、安全使用一气呵成,让数据产品开发者依托平台提供产品服务。这是一个“三合一”的数据要素开发利用集成平台。
形象地说,“数据产品超市”采用了“华强北+淘宝+云服务”的模式。通过“华强北”(借用其电子元器件供应链集成为电子终端产品的模式)集成数据供应链来开发生产数据产品;通过“淘宝”实现数据产品的流通交易;通过“云服务”实现数据产品面向最终用户的安全使用。
这种新型数据交易所的集成化——“数据产品超市”使数据产品开发生产、流通交易、安全使用一体化集成——并不是我们别出心裁,非要如此不可,而是由数据要素具有关联对象权益的特性决定的,非得如此不可。
(三)“请进来”模式解决公共数据开放难题
上述一体化集成模式顺便解决了公共数据开放难题和公共数据资源开发利用难题。
传统的数据开放通过政府数据开放网站,以可机读的方式开放数据集、数据文件或数据接口,可开放的数据不能涉及私权,因为没有关联对象授权,不能直接开放。能直接开放的只能是涉公数据。从开放属性来看,基本上属于无条件开放数据。而大量价值密度更高的有条件开放数据一般都涉及私权,很难通过开放网站的方式开放。
对于公共数据的开发利用,同样面临如此窘境。须得有关联对象授权,数据开发利用才能得以进行。
“数据产品超市”模式同时解决了上述难题,实现了开放安全化——变少量数据普遍开放为引进开发商到安全可信域进行大量数据产品化开发后开放利用,从将公共数据简单开放出去转变为将数据产品开发商请进来,开发数据产品对外提供服务。这就是“请进来”模式。
因为数据关联私权,数据产品开发必须在一个安全可信的区域内进行,“数据产品超市”平台公信力至关重要。同时“数据产品超市”必须按照平台经济的思维进行打造,以便开放式地“请进来”众多的数据处理者,而不是仅仅建立小范围的“俱乐部”。这样,在数据安全管理、开发商管理、用户管理等方面需要建立一成套的制度规范体系。
公共数据资源开发利用,必须在公共数据管理平台基础上,依托公信力的公共数据管理机构,并采取市场化、平台化运营模式,建立公共数据产品超市,在公共数据产品超市的安全域内——依托电子政务外网、政务云、政务中台等基础能力——对高价值密度数据进行产品化,再以数据产品形式对外提供服务。
(一)依托政务信息化底座的“大中台、微服务”架构
“数据产品超市”既然建立在政府主导的安全可信平台上,就充分依托政务信息化能力底座,快速形成能力,复用基础数据资源和安全能力,搭建“大中台、微服务”架构,实现快速生产开发。基于“大中台”融合共建优势,易于打破“数据壁垒”和“业务壁垒”,并确保数据安全利用,形成可持续发展的良性循环。特别是有利于通过“微服务”方式快速开发生产数据产品,形成数据服务。
(二)“线上+线下”和“前店后厂”运营模式
一是依托政务大数据基础设施,建立“线上平台+线下体验店”相结合的数据产品综合服务体系。二是按照“前店后厂”模式建立数据产品生产服务体系,结合了“后厂”的数据产品开发生产“加工厂”和“前店”的数据产品流通交易和安全使用“服务台”,同时具备了数据产品开发生产、流通交易、安全使用的一体化集成服务能力。三是搭建“1+N+X”运营框架,形成多元合作格局。1个总店+N个国内外园区、交易所合作伙伴+X个行业版主,精准提供数据产品服务。
海南“数据产品超市”从交易管理、监督管理、开发生产、运营服务和安全管理5大方面制定了20多个管理规则,确保数据资源流通的全生命周期安全可控、合规监管。同时,充分依托政务大数据安全体系,并通过规范化的技防、物防、人防体系确保数据有效监管,通过区块链、隐私计算等多种前沿技术,实现数据开发利用来源可溯、去向可查、行为留痕、责任可究。
海南模式的“数据产品超市”经过2022年一年的建设运营,取得了良好的实践成效。
注释:本文数据、信息两词通用,数据(侧重形式)和信息(侧重内容)相统一。
参考文献:
[1]董学耕. 数据关联对象对数据的决定权与数据产品化确权. 电子政务智库.[2]王建冬,于施洋,黄倩倩. 数据要素基础理论与制度体系总体设计探究[J]. 电子政务,2022(02): 2-11.[3]童楠楠,窦悦,刘钊因. 中国特色数据要素产权制度体系构建研究[J]. 电子政务,2022(02): 12-20.[4]T/NSSQ 025-2022 资产管理 数据资产确权登记导则[5]中华人民共和国个人信息保护法. 中国人大网[6]《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(国务院公报2023年第1号)
作者简介:董学耕,海南省大数据管理局党委书记、局长,高级工程师;研究方向:数字政府、数字经济、数据要素。
扫描二维码
获取更多精彩
电子政务智库