董学耕:数据产品瞬间集成和稳定性的实现
The following article is from 电子政务智库 Author 董学耕
摘要:
本文基于数据关联对象对数据要素的“决定权”、数据产品化确权和“数据产品超市”的运行机制,对数据产品概念进行了抽丝剥茧的深入分析。数据产品必须具备实时“瞬间集成”的特性,要求关联对象授权、原始数据提供、数据产品组装、数据产品服务输出必须是同时齐备。为此,本文梳理了实现“瞬间集成”的业务要求和技术要求。同时,数据产品还必须在时间的绵延中保障数据产品的“稳定性”, 才能保证其价值的稳定性,才能可确权、可经营、可交易、可资产化、可入表。
关键词:数据产品;数据产品超市;关联对象;确权;入表
本文进一步说明拙文《数据关联对象对数据的决定权与数据产品化确权》[1]《数据产品超市——数据产品开发生产、流通交易和安全使用的一体化》[2]中的核心概念“数据产品”。
根据《个人信息保护法》[3]的原则和规定,涉私数据的决定权在于数据关联对象,其利用必须获得关联对象授权。“只能是将数据做成数据产品,将涉及私权的数据融入到数据产品中,然后在使用数据产品的具体场景中由关联对象在线进行实时授权。这样,涉私数据依托数据产品才能在真实场景中经关联对象在线授权后安全使用、流通交易,一次授权一次使用。”通过在具体场景具体使用中关联对象对涉私数据在线实时授权(关联对象行使数据决定权并获得使用便利),数据产品开发者获得关联对象的权益让渡——成千上万的使用者每次使用时各自授权让渡其数据关联者的权益——从而实现对数据产品的完整权益拥有。[1]
一、关联对象对数据产品中涉私数据授权的必备条件
(一)数据产品超市安全域
数据产品形成过程涉及到多方面主体。数据处理者只有在关联对象授权下才能处理涉私数据,关联对象不可能在数据处理的中间过程中进行授权,而只会在数据产品最终使用环节进行授权。但相关数据处理者在关联对象最终授权之前,必须恪守“数据不出域”“可用不可见”等数据安全和隐私保护要求。这是一个困境:没有数据产品提供最终服务,关联对象不会提前进行授权;没有关联对象授权,相关数据处理者无法将数据转化为数据产品。
因此我们需要一个更大的安全域、可信域,把以“数据不出域”为要求的更大安全域、可信域作为边界,让多个数据处理者进入该边界,在边界范围内实现数据的汇聚、交互、集成。同时这个安全可信的平台也要为关联对象所接受,即该平台必须具有公信力。这就需要由政府主导来建立一个安全且有公信力的平台——“数据产品超市”,一个依托电子政务外网的大安全域。数据产品的形成过程需要、也只能在这样的安全可信平台上进行。
这不仅针对公共数据的开发利用,对其他社会数据、行业数据、企业数据,只要是跨多个数据处理者,都会面临上述困境,也就都需要有公信力的安全可信平台支撑,才能有数据产品的形成。这就是“数据产品超市”,一个政府主导的安全可信平台。[2]
(二)数据产品开发生产、流通交易和安全使用的集成
“数据产品超市”不仅仅是一个数据交易平台,首先应是一个数据产品开发生产平台,依托这一有公信力的安全可信平台,数据得以汇聚,数据产品得以形成;同时它也是一个数据产品流通交易平台,开发出的数据产品在“数据产品超市”上架,供需对接,流通交易;它更是一个数据产品安全使用平台,数据产品并不能孤立出来提供服务,因为其依赖于数据关联对象在数据产品使用场景中的实时授权,在授权同时,原始数据持有者才能实时提供数据,完成数据产品服务,这个过程必然依赖其原来开发生产的平台,依赖原来的安全域、可信域,在数据产品实时在线服务中实现“数据不出域”“可用不可见”。“数据产品超市”将数据汇聚和数据产品开发生产、流通交易、安全使用一气呵成,让数据产品开发者依托平台提供产品服务,是一个“三合一”的数据要素开发利用集成平台。
(三)数据产品实时“瞬间集成”的特性
涉及涉私数据,不存在与关联对象无关的现成摆在那里的数据产品,“在授权同时,原始数据持有者才能实时提供数据,完成数据产品服务”。可见关联对象授权、原始数据提供、数据产品组装、数据产品服务输出必得是同时的,这就是数据产品实时“瞬间集成”的特性。
当然,在此之前,数据产品需要提前开发成框架,这样才能在授权同时,原始数据瞬间提供、数据产品瞬间组装、数据产品瞬时输出服务,达成涉私数据开发利用的目标。
二、数据产品实时“瞬间集成”的业务实现
(一)实现数据产品“瞬间集成”的合约关系
下图为数据产品“瞬间集成”图示。
数据产品P相关的合约关系以数据产品开发者R为核心。
1.数据产品开发者与数据持有者的合约。数据产品开发者R通过购买数据生产者、载体提供者等数据持有者A,B,…N的数据要素持有权,获取数据加工使用权,开发数据产品P。这里需要合约关系c1。对于公共部门内部使用的数据产品,一方面是基于公共机构共享数据的合约,数据本身免费获取;另一方面是基于采购社会数据的合约,涉及增值服务开发还要适当补充付费。对于社会利用的数据产品,一方面是来自公共机构对社会开放数据的合约,数据本身一般是免费提供,涉及增值开发需要由代表政府运营数据的机构适当收费;另一方面是来自社会数据的合约,按照市场博弈价格收费。
2.数据产品开发者与数据产品用户之间的合约。这涉及到用户购买开发者R的数据产品P或数据产品的服务,这个协议就是用户使用协议。这里的用户既可以是中间用户U,用购买来的数据产品P或其服务,继续服务最终用户O(作为相关数据关联对象的个人或法人,也同时是相关服务的服务对象)——此种情形的用户使用协议记为c2——也可以直接是最终用户O,即数据产品开发者R直接服务作为服务对象的数据关联对象——此种情形的用户使用协议记为c23。
3.数据产品中间用户与数据关联对象之间的合约。对于c2的情形,还需要数据产品中间用户U与数据关联对象O之间合约c3,形成最终服务协议。
4.以上合约或协议除了从数据价值属性维度约定费用外,还需要从数据人身属性维度约定授权等事项。
通过在具体场景的具体使用中,关联对象O对涉私数据在线实时授权(关联对象行使数据决定权并作为服务对象获得使用便利),数据产品开发者R获得关联对象的权益让渡——成千上万的服务对象每次使用时各自授权让渡其数据关联对象O的权益——从而实现对数据产品的完整权益拥有。同时数据产品P的服务得以实现。
(二)实现数据产品“瞬间集成”的授权通道
有了上述合约关系,数据关联对象的授权通道便是:
1.在用户使用协议c23的情形,关联对象O在使用数据产品时直接将数据处理等权利授权给数据产品P,并通过P,授权数据持有者A,B,…N提供数据。
2.在用户使用协议c2的情形,借助进一步的协议c3,关联对象O在使用数据产品时借助与数据产品中间用户U的协议c3,以及U与数据产品开发者R的协议c2,将数据处理等权利授权给数据产品P,并通过P,授权数据持有者A,B,…N提供数据。
(三)实现数据产品“瞬间集成”的数据转移通道
上述授权链使得数据持有者的原始数据可以转移进数据产品,并通过数据产品向数据关联对象提供服务。数据转移通道如下:
依据协议c23或c2+c3,关联对象授权同时,该关联对象的数据从数据持有者A,B,…N转移到数据产品P。
所谓“数据不动算法跑路”是上述数据转移通道的一种技术替代。将相关算法模式植入数据产品,并连通数据持有者的相关接口,在关联对象授权同时,其相关数据按照算法模型计算出相应结果,将结果输出到数据产品,向关联对象提供服务。
(四)实现数据产品“瞬间集成”的服务通道
1.在用户使用协议c23的情形,关联对象O在授权数据处理的同时,直接使用数据产品P的服务。
2.在用户使用协议c2的情形,加上服务协议c3,关联对象O在授权数据处理的同时,直接使用中间用户U提供的数据产品P的服务。
三、数据产品实时“瞬间集成”的技术实现
(一)实现数据产品“瞬间集成”的数据产品架构
从数据产品“瞬间集成”的业务实现可以看出,数据产品架构须得内置授权通道、数据转移通道(或算法跑路计算结果传输通道)、使用服务通道。这显然要求通道连接的各端都须得实时在线互联,特别是众多数据持有者的数据需要实时在线互联,随时可被调取。
数据产品必须依托“数据产品超市”的安全可信环境。数据产品超市建立在政府主导的安全可信平台上,充分依托了政务信息化能力底座,包括政务云、数据共享交换等基础设施,复用政务基础数据资源和安全能力,构建起“大中台、微服务”架构,实现数据产品的快速生产开发、实时组装和安全使用。数据产品成为“大中台”上的“微服务”,依托“大中台”对外提供“微服务”。离开了数据产品超市的安全可信环境,离开的“大中台”,“微服务”就散架了,数据产品无法实时组装,不能提供实时服务,也就名存实亡了。反之,依托数据产品超市的安全可信环境,依托“大中台”,技术上就可以保障实时连接通道各端,从而使得数据产品实时在线,随时可以在授权下瞬间组装成型,提供服务。
(二)实现数据产品“瞬间集成”的数据产品交互界面
在数据产品的用户端,关键是要求授权通道。首先,在数据产品设计中,用户界面要有授权选项,并就关联到的数据做出列表,方便关联对象进行勾选、授权。也可以通过扫码等方式授权,更为便利化。其次,依托政务信息化基础设施,建设完善“个人数字空间”“法人数字空间”,方便关联对象对关联自身的数据进行管理,便利生成“个人码”“法人码”,通过扫码等方式便利授权。
(三)实现数据产品跨地域“瞬间集成”的确定性网络
我们在研究“扩大安全域”形成“数据产品超市”的时候[2],实际上是在省域或市域电子政务外网的范围内考虑的。但是我们还需要从统一大市场角度深入研究,这就涉及到跨地域的数据产品。我们要解决两个问题,一是允许跨地域的数据产品开发者利用本地的数据产品超市来远程开发产品;二是跨地域的多个数据产品超市之间的互联互通。
这需要通过确定性网络来保障。这样的确定性网络至少需要满足两个基本条件:一是确保远程传输的超低延迟、超低抖动(均毫秒级);二是确保跨地域连接和传输的安全、可信。
海南省在全国率先探索的电子政务外网“一网两线”(包括电子政务视联网)异构安全传输网络具备上述两个基本条件。一是视联网“极高确定性网络”具有低延时、低抖动、高安全的技术特点,在视频会议中能够实现数千公里双向回路传输延时仅38ms,且超低抖动多画面同步传输精度小于1ms。二是“一网两线”异构灾备系统已在全国多个省份建设。视联网作为电子政务外网备份网络,高安全性在海南、重庆、宁夏、广东等地的高质量攻防演练中得到验证。面对千万次的攻击和极为丰富的攻击手段,“一网两线”异构灾备系统一直延续“零”漏洞战果。
依托确定性网络,远程开发数据产品可以通过云桌面方式实现。桌面端远程操作数据,但数据不出域;在云端可全过程监管数据。借此可以解决跨地域远程开发问题。
同样,依托确定性网络,也可以解决跨地域的多个数据产品超市之间的互联互通问题。跨地域的数据持有者的数据同样可以“瞬间集成”,组装成数据产品,实时提供服务。
(四)实现数据产品跨地域“瞬间集成”的区块链等安全技术
在数据产品“瞬间集成”中,安全加持是必备的。其中,区块链技术不可或缺。一是通过区块链解决信任问题。保障各方面合约的执行,明晰责任边界,需要数据产品的关联对象授权、原始数据提供、数据产品组装、数据产品服务输出等环节全程留痕、不可篡改。二是跨地域的互联互通中,需要各地的数据目录上链,便于跨地域使用。此外,如有必要,密码技术、隐私计算等安全技术都可以进一步加持。
四、数据产品稳定性
数据产品不仅要能“瞬间集成”,而且在时间的绵延中还必须保障数据产品的“稳定性”,这样,数据产品才能实现可确权、可经营、可交易、可资产化、可入表。
(一)实现数据产品“稳定性”的合约保障
数据产品必须要求能够随时接受关联对象授权并同时调取数据持有者的数据。因此,对数据持有者必须要求:一是“公共部门对数据共享、开放行使审核权,只涉及合法性审核、安全性审核,并且应当一揽子审核、自动化审核”。相关数据使用“条件审核可以机器自动判别进行,可以预先写进智能合约,符合条件设定的标准即自动触发审核通过。”[4] 二是其他社会数据持有者须得在数据有偿使用协议中明确数据实时在线,在关联对象授权同时即可调取。
(二)实现数据产品“稳定性”的平台保障
对于“数据产品超市”运营者,必须保障数据产品超市平台的稳定性。既然建立在政府主导的安全可信平台上,首先是政务信息化能力底座的稳定性,“大中台”架构的稳定性。其次是平台连通的引入政务安全域的各系统的互联互通。再次是跨地域各平台之间的稳定互通。
(三)实现数据产品“稳定性”的监管保障
对于“数据产品超市”监管者,通过监管保障整个体系运作的稳定性,确保体系运行的合规、安全和稳定。一是监管平台运营者,保障平台稳定。二是监管数据持有者,保障按照协议履行,包括实时提供服务,保障数据来源合法、数据质量可靠、数据实时更新等。三是监管数据产品中间用户,保障数据产品正确使用,稳定提供服务,不超范围、不掉线、不超越授权。
(四)实现数据产品“稳定性”的数据安全保障
“数据产品超市”监管者还要在数据安全监管上发挥主导作用,一方面压实各相关市场主体的数据安全主体责任,谁经手,谁负责;另一方面要承担起监管责任。“数据产品超市”要建立起一整套网络和数据安全保障体系,包括但不限于制度安全、管理安全、技术安全。除了传统的网络边界安全、信息系统安全,更要注重数据本身安全。数据安全已经原子化,即不仅是总体的数据安全,更是关注每条数据本身的安全,保护国家安全、公民隐私和商业秘密,基于“知情、同意”和授权才能处理和使用。
五、数据产品确权与资产化
数据产品要求“瞬间集成”和“稳定性”,这要求数据产品关联系统的实时性和数据的鲜活性。现成摆在那里的数据集或“数据产品”不具备这样的性质,价值会随时间而衰减,不具有价值的稳定性,哪怕是相对稳定性,因此确权等无从谈起。数据产品必须具备自身的稳定性,才能保证其价值的稳定性,才能进而讨论确权、资产化和入表等问题。
(一)基于“稳定性”的数据产品确权
基于稳定性,可以对数据产品进行确权。确权的是数据产品,不是数据本身。数据产品确权给予数据产品开发者的过程如本文一开始所述[1]。对于确权的产品,可以采取登记方式,予以确认。登记主管机构,天然是数据产品超市管理机构,首先是运营者,并需要监管者——质而言之,代表政府对数据产品超市的所有者——确认。数据产品开发者向管理机构提出申请,由管理机构受理并审核、确认,颁发确权证书。
尽管如此,还需要法规形式对于登记机关的法律地位予以明确。
(二)基于“稳定性”的数据产品资产化和入表
基于稳定性,确权的数据产品经过在数据产品超市的市场供需博弈,形成价格机制,形成价值度量,即完成资产化。同样,资产化的数据产品需要以登记方式予以确认,通过向登记管理机构申请,由管理机构受理并审核、确认,颁发确权证书。
经过确认的资产化的数据产品可以入表,成为相关市场主体的资产。
注释:本文数据、信息两词通用。数据(侧重形式)和信息(侧重内容)相统一,可以通用。
参考文献:
[1]董学耕. 数据关联对象对数据的决定权与数据产品化确权. 载《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》.南方出版社,2023(即出).
[2]董学耕. 数据产品超市——数据产品开发生产、流通交易和安全使用的一体化. 载《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》.南方出版社,2023(即出).
[3]中华人民共和国个人信息保护法. 中国人大网
[4]董学耕. 数据关联对象“决定权”与整体政府数据共享开放. 载《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》.南方出版社,2023(即出).
作者简介:董学耕,海南省大数据管理局局长,高级工程师;研究方向:数字政府、数字经济、数据要素。
来源 | 电子政务智库微信公众号
责编 | 符丹丹
编辑 | 魏榕辰