查看原文
其他

董学耕:公共数据赋能“数据要素×”

董学耕 海南省大数据管理局
2024-09-15
摘 要

要发挥数据要素与其他生产要素的协同、在多场景多主体的复用以及多元数据的融合,需要结合具体产业业务场景将多元数据融合在数据产品中来实现,数据基础设施是基础,数据产品化是关键。公共数据在其中也发挥着引子、佐证、可信背书等关键作用,从而激发多元数据在融合中的价值释放。


关键词:数据要素×;数据产品;数据产品超市;公共数据;产业数据空间


国家数据局联合16个部门共同印发《“数据要素×”三年行动计划(2024—2026年)》指出:实施“数据要素×”行动,就是要发挥我国超大规模市场、海量数据资源、丰富应用场景等多重优势,推动数据要素与劳动力、资本等要素协同,以数据流引领技术流、资金流、人才流、物资流,突破传统资源要素约束,提高全要素生产率;促进数据多场景应用、多主体复用,培育基于数据要素的新产品和新服务,实现知识扩散、价值倍增,开辟经济增长新空间;加快多元数据融合,以数据规模扩张和数据类型丰富,促进生产工具创新升级,催生新产业、新模式,培育经济发展新动能。[1]


刘烈宏局长强调:与2015年“互联网+”行动相比,“数据要素×”实现了从连接到协同、使用到复用、叠加到融合的转变。


要发挥数据要素与其他生产要素的协同、在多场景多主体的复用以及多元数据的融合,需要结合具体产业业务场景将多元数据融合在数据产品中来实现,数据基础设施是基础,数据产品化是关键。


公共数据也发挥不可替代的作用。公共数据体量大、质量高、结构性好,持续服务能力强,特别是通过人口库、法人库建立的个人数字空间、法人数字空间可以作为个人、法人的数字孪生,可以为各方面数据进行可信验证。公共数据可以起到引子、佐证、可信背书等关键作用,从而激发多元数据在融合中的价值释放。


一、产业数据流动情况


(一)产业数据流动难


现实情况是,不仅公共数据共享开放和开发利用不足,社会数据、产业数据更是流动难。对于公共数据,还有“以共享开放为原则,不共享开放为例外”的要求,尽管执行中还存在不少问题,但是对于社会数据、产业数据,这方面的原则要求也还缺乏。


一方面,各数据资源持有者基本都是以数据安全为由,恪守“数据不出域”要求。[2]另一方面,数据资源持有者将持有的数据作为自有资源,不愿与社会或业界分享,这是因为数据资源的收益机制未能建立。结果是社会数据、产业数据流动难,难以形成大规模数据应用,我国超大规模市场、超大规模实时数据的优势难以充分体现。


(二)数据流动的法律要求


《个人信息保护法》[3]第四十四条规定:个人对其个人信息的处理享有知情权、决定权,有权限制或者拒绝他人对其个人信息进行处理。第四十五条规定:个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径。


以上规定,不仅明确了个人对其个人信息的处理的决定权,而且明确了有权要求其个人信息的查阅、复制、转移。尤其是关于“转移”的要求,意味着在个人决定权之下,个人信息处理者“应当提供转移的途径”。这意味着,数据共享、开放不仅是数据公共属性的要求,而且首先是数据人身属性的要求,个人有权要求数据按照其意志进行共享、开放。这不仅是对于公共数据,而是包括所有个人信息处理者,数据的人身属性都要求数据能够“转移”或者说“流动”。这是个人“决定权”的要求,这不是个人信息处理者所能左右的,不管这个个人信息处理者是公共机构、行业企业、互联网平台企业或是其他什么主体。


从法理上看,《个人信息保护法》的原则同样适用于法人数据:法人对其法人信息的处理享有知情权、决定权。也就是说,《个人信息保护法》关于信息处理决定权的原则,适用范围可以扩大到涉私数据(包括个人数据和法人数据),由数据关联对象行使决定权。这样,法人数据的“转移”或者说“流动”也是由数据关联对象(法人)决定的。


可见,社会数据、产业数据流动,与公共数据流动一样,都有法律保障。社会数据、产业数据的开发利用需要落实。


(三)产业数据的分类


一是与关联对象无关的产业数据,即非涉私数据。例如空间地理数据、气象数据。这部分数据与关联对象无关,只要解决了数据资源的估值、收益分配等机制,数据流动和应用相对简单。


二是与自然人无关,但是与法人业务秘密相关的产业数据。例如产业供应链协同数据,需要相关法人关联对象授权才能使用。


三是和法人以及自然人都相关的产业数据。例如医疗行业数据,例如商业行业的销售数据,例如智能网联汽车、电动汽车的联网数据。这些数据的使用不仅需要自然人授权,也需要相关法人关联对象的授权。


后两类数据都需要满足“数据不出域”的要求,其开发利用也就需要有“扩大安全域”意义上的数据基础设施支撑。对于第一类数据,虽然不涉及关联对象授权,但是其估值和收益分配机制同样需要数据产品化而形成的确权、估值体系的数据基础实施支撑。因此,产业数据开发利用、发挥乘数效应,高度依赖数据产品超市基础设施的支撑。[4]


二、可信数据空间和公共数据

促进“数据要素×”行动


(一)“数据产品超市”安全可信域


数据公共化基础设施的核心是解决数据如何从私有域走向公共域,破解“数据不出域”的矛盾。[5]


我们需要一个安全可信的平台,形成一个更大的安全域、可信域,落实“数据不出域”以此扩大的安全域为边界。按照“数据不出域”的要求,让多个数据处理者进入该边界,在边界范围内实现数据的汇聚、交互、集成。


这个扩大的安全域就是“数据产品超市”,一个集数据汇集、数据处理、开发生产、安全使用、流通交易为一体的安全平台,一个安全的可信数据空间,数据处理者在其中利用数据,开发数据产品,最终通过数据产品透出服务。


数据公共化基础设施就是安全可信的数据产品超市,不仅有安全技术加持,重点是可信。并非任意市场主体建立一个扩大的安全域就可以称可信,称具备公信力。必须由政府背书提供中立的、安全的、可信的平台支撑。形成可信数据空间要按照区域中心化的方式。在每个区域有个可信的中心,以此中心为基础建立可信数据空间,并在各中心之间通过分布式账本(联盟链)建立可信连接。而这个区域可信中心就需要政府出手,需要发挥政府作用,由政府主导来建立一个有公信力的平台,一个安全可信的平台。这就是“数据产品超市”,一个政府主导的集数据汇集、数据处理、开发生产、安全使用、流通交易为一体的安全可信平台。


“数据产品超市”建立在政府的公共数据基础设施之上,也就是建立在公共数据目录体系和政务数据中台基础之上,还可以有效利用公共数据支撑“数据产品超市”,使得公共数据与“数据产品超市”无缝连通,自然成为公共数据资源的开发利用平台。[5]


(二)数据资源收益机制


数据价值化基础设施要解决的核心问题是数据价值的确认和变现,以此解决数据资源持有者的数据资源的收益机制问题。


数据价值化需要通过数据产品化,数据只有融入数据产品,才能在具体应用场景中实现价值变现。通过数据产品确权、估值,形成数据资产,落实数据产品的实际价值,并进而使得嵌入数据产品的数据资源得以价值化。[5]


同一数据资源可以嵌入不同的数据产品,并因此获得多个数据产品而来的价值,这些价值是累加的。[6] 也就是说,数据资源是可以复用的。


从数据产品的收益中,嵌入其中的数据资源可以分有收益,成为数据资源持有者的收益。这就是数据资源持有者支持数据产品开发,支持数据资源共享开放的动力。


(三)公共数据的引子、佐证和可信背书作用


但是,社会数据、产业数据提供者(数据资源持有者)不仅要从数据产品中分有价值,分享收益,更需要承担数据真实性、实时性、准确性、完整性等方面的责任。


通过数据公共化基础设施即数据产品超市,数据产品得以开发生产,开发主体和数源单位得以确认身份并通过合约等关系明确数据责任,相关数据得以上链留痕并可追溯,等等。


同时,借助于数据产品超市的公共数据,为社会数据、产业数据的应用发挥引子、佐证和可信背书等作用。


一是“引子”作用。数据产品超市上,公共数据不是唱独角戏,而是作为序幕、引子,吸引更多的社会数据、产业数据进入超市,与公共数据融合,共同生成数据产品。这是因为,社会数据、产业数据虽然量大面广,但也还需要公共数据加持,才能生成更高质量的数据产品和服务。例如,虽然金融机构自身便持有不少高价值的用户数据,但是要满足风控的要求,也还需要更多维度的公共数据,包括公共信用数据等。也可以说,公共数据在数据产品超市中起到关键“药引子”作用,和社会数据、产业数据共同熬出一副“药”。


二是“佐证”作用。数据产品超市以及其上的公共数据为数据资源持有者提供佐证,确认社会数据、产业数据的持有者身份,从而使得相关数据可以正确地在数据产品中融合使用。


三是“可信背书”作用。数据产品超市以及其上的公共数据确认关联对象的授权行为,在数据产品使用场景,佐证正确的关联对象进行了正确的授权,从而使得数据产品可以正确集成并提供服务。不管是法人数据的授权,还是自然人数据的授权,都需要对法人或自然人验证身份。这些都需要数据产品超市的可信数据空间中的法人数字空间和自然人数字空间为此提供基础设施支撑。


(四)可信数据空间的公共数据基础设施


数据产品超市的可信数据空间依托人口库、法人库,建立相应的个人数字空间和法人数字空间,多维度数据对个人和法人进行画像,作为个人和法人的数字孪生,并通过个人码和法人码的形式,方便个人和法人利用。这样,个人可以利用嵌入在数据产品中的个人码,授权个人数字空间中的相关数据可以实时集成到数据产品中,提供相关服务。同理,法人(例如企业)可以利用嵌入在数据产品中的法人码,授权法人数字空间中的相关数据可以实时集成到数据产品中,提供相关服务。这套公共数据基础设施通过嵌入在数据产品中的个人码、法人码便利个人和法人随时调用,快速验证,秒级验证,秒级授权,秒级集成和透出服务。


此外,公共信用基础设施赋能社会数据和产业数据应用,相关数据产品可以嵌入相关主体的信用数据,包括数据供给方、数据关联对象以及数据产品使用方的信用数据,以便提供更方便、更快捷的产业数据产品应用。


(五)在安全可信域内的产业数据空间


基于以上可信数据空间基础设施,还可以达成自律的产业数据空间,在其上展开更加丰富多样的产业数据协同创新应用。这方面可以学习借鉴发达国家的一些经验。例如欧洲的“盖亚-X产业数据空间计划”。截至2023年,欧盟为推动数据空间计划的盖亚-X协会已拥有377家组织成员,其中包括NTT通信等日本公司以及4家中国机构。


从数据交易平台到产业数据空间,这不仅体现了世界各国数字竞争力的博弈,也揭示了数据交易平台从低级形态向高级形态发展的规律。


三、产业数据产品超市建设


(一)数据产品超市架构


数据产品超市作为政府主导的集数据汇集、数据处理、开发生产、安全使用、流通交易为一体的安全可信数据空间,提供公共数据开发利用与社会数据、产业数据的交互应用的平台。


海南数据产品超市已经搭建“1+N+X”运营框架,形成多元合作格局,1个总店+N个国内外产业园区、数据交易机构合作伙伴+X个产业版主,精准提供数据产品服务。


依托确定性网络,可以解决跨区域的多个数据产品超市之间的互联互通问题。跨区域的数据持有者的数据同样可以“瞬间集成”,组装成数据产品,实时提供服务。同时,各区域中心的政府为本区域的安全、可信背书,并通过联盟链方式(数据目录上链)可信互联。[5]


产业数据产品超市同样依托确定性网络互联互通。


X个产业数据产品超市总体上都由电子政务外网延伸扩大安全域的数据产品超市总平台给予背书,接受总平台监管,同时结合产业应用的若干特点,在数据产品超市总平台之外,相对独立运营。


(二)产业数据产品超市授权运营


产业数据产品超市的建立当然要发挥产业企业的作用,甚至可以说是关键作用。需要熟悉产业、有产业号召力和相当实力的企业来建设和运营产业数据产品超市。我们也知道,数据产品超市需要政府+市场合作,数据最终的安全、可信需要政府背书,政府需要落实对数据的合规、安全的监管责任,充当数据的“守夜人”。


因此,需要建立产业数据产品超市的授权运营机制。由代表政府行使公共数据运营的机构和数据产品超市总平台运营方共同授权,吸引产业企业参与公开竞争,产生产业数据产品超市运营者。


产业数据产品超市运营者依托数据产品超市总平台架构进行产业数据产品超市平台建设,组织产业数据产品运营活动,活跃产业数据产品市场,落实“数据要素×”产业行动。产业数据产品超市平台运营接受政府侧公共数据运营机构和数据产品超市总平台运营方的数据合规和数据安全监管。


(三)产业数据产品超市生态


产业数据产品超市之间要建设好跨行业的协同机制。基于确定性网络和数据产品超市总平台的基础设施,实现产业数据产品超市平台的低成本扩张,快速实施“数据要素×”行动。


引导数据交易平台向产业数据空间拓展。数据交易平台避免同质化竞争和低水平重复建设,要由单纯交易型向数据产品开发生产、安全使用和流通交易集成平台升级,要由普通型向产业特色型数据产品超市升级。


加强产业数据产品超市的规范和培育。鼓励阿里云、蚂蚁、京东万象等龙头企业牵头“产业数据空间”向产业数据产品超市演进。鼓励各行业建立行业性数据产业联盟,培育数据服务商生态。


注释:本文数据、信息两词通用。数据(侧重形式)和信息(侧重内容)相统一,可以通用。


参考文献:

[1] “数据要素×”三年行动计划(2024—2026年).(点击阅读)

[2]《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(国务院公报2023年第1号)(点击阅读)

[3]中华人民共和国个人信息保护法. 中国人大网(点击阅读)

[4]董学耕等.用数据点亮智慧之光:海南省数据要素市场建设探索与实践.南方出版社,2023.(点击购买)

[5]董学耕. 数据基础设施论纲Ⅱ——海南关于数据共享和开发利用的实践路径. (点击阅读)

[6]董学耕.数据从产品到资产到资源的价值化路径. (点击阅读)


作者简介:董学耕,海南省大数据管理局局长、高级工程师,研究方向:数字政府、数字经济、数据要素。

责编 | 符丹丹

编辑 | 魏榕辰

转载请注明来源 | 海南省大数据管理局





往期回顾
REVIEW

董学耕 | 数据关联对象对数据的决定权与数据产品化确权(一)

董学耕 数据产品超市——数据产品开发生产、流通交易和安全使用的一体化(二)

董学耕 | 数据产品超市——探索数据跨境安全有序流动的实现途径(三)

董学耕 | 数据关联对象“决定权”与整体政府数据共享开放(四)

董学耕 | 数据产品瞬间集成和稳定性的实现(五)

董学耕 | 论数据产品作为数据知识产权的登记和入表(六)

董学耕 | 数据关联对象的安全自决权与数据安全的原子化(七)

董学耕 | 数据产品所有权的登记和入表(八)

董学耕 | 数据基础设施论纲——关于数字空间、数据空间、数据资源体系、数据基础设施等基本概念的系统性梳理(九)

董学耕 | 数据基础设施论纲Ⅱ——海南关于数据共享和开发利用的实践路径(十)

董学耕 | 数据从产品到资产到资源的价值化路径(十一)

董学耕 | 数据产品开发与数据脱敏(十二)


点赞!
继续滑动看下一个
海南省大数据管理局
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存