海南省大数据管理局局长董学耕最新演讲:《海南数据基础设施建设思考与实践》
3月20日,清华大学计算社会科学与国家治理实验室“数据大讲堂”第一讲直播开讲。海南省大数据管理局局长董学耕受邀,为大家分享话题:“海南数据基础基础设施建设思考和实践”。以下为演讲内容精选。
2024年政府工作报告指出“健全数据基础制度,大力推动数据开发开放和流通使用”。但目前数据依然面临着不愿开放、不敢开放、不会开放的难题,海南以公共数据资源开发利用为切入口,在“数据不出域”的前提下,重点解决数据“供得出、流得动、用得好”的问题,在实践过程中,逐步形成了具有海南自贸港特色的数据基础设施的理论架构、实践基础和未来方向。
一、数据资源价值化
(一)数据以人为本—论关联对象的决定权
《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)发布后,关于数据权属,淡化了数据所有权概念,而从数据开发利用角度,“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,即业界所谓的“三权分置”。
人们热衷于数据处理者的“三权分置”,却遗忘了“数据二十条”中同样强调的数据来源者。为了和政务数据中的“数源单位”相区分,我们将数据来源者也称为数据“关联对象”。关联对象可以是个人,也可以是法人。众所周知,数据具有价值属性、人身属性、公共属性和主权属性,数据安全因此关系到个人权益、组织权益、公共利益和国家安全。关联对象相应的就是数据的人身属性。
我们不仅要从数据处理者的角度去进行“三权分置”,更需要从数据来源者即关联对象的角度来分析数据权益。基于关联对象对数据进行分类,以保护私权,让关联对象对数据处理行为行使其对数据的决定权。这正是《个人信息保护法》赋予个人的对数据的“决定权”。
关联对象对数据的“决定权”高于数据资源持有权、数据加工使用权、数据产品经营权。
(二)数据产品化确权的实现路径
基于以上“关联对象的决定权”的思想,海南省设计了数据产品化确权的路径。
一是对数据进行了多维度的分类分级,特别是按照关联对象将数据分为了涉私数据(包括个人数据和法人数据)和涉公数据(非涉私数据)。
二是通过数据产品化实现了在关联对象的授权下数据产品开发者获得了数据产品的完整权益,即所有权,从而也拥有了数据产品经营权。
三是通过发挥政府作用来建立一个有公信力的安全可信平台,开放式、市场化引进各类数据处理者,实现数据产品一体化的开发生产、流通交易和安全使用。
四是进一步发挥关联对象“决定权”作用,借助“整体政府”理念,在政府主导的安全可信平台上真正落实“共享开放为原则,不共享开放为例外”。
五是通过数据产品化机制实现数据产品的“瞬间集成”,保障数据产品的“稳定性”,进而保障数据产品可确权、可经营、可交易、可资产化、可入表。
(三)数据价值化的实现路径
数据要素价值化的前提是,不触碰数据的主权属性,不超越数据关联对象对数据的决定权,不侵犯数据的公共利益,同时要具备“可控制”“可收益”“可计量”的特征。数据价值化的路径有三步。
第一步是数据产品化确权。数据按照使用场景集成开发为数据产品,数据产品中含有数据授权通道,在数据产品使用环节,数据关联对象为获得使用便利,在线实时授权数据使用并让渡权利,在关联对象授权下,相关来源数据实时瞬间向数据产品集成从而形成服务,向使用场景透出,实现使用价值。
第二步是数据产品资产化。数据产品的“瞬间集成”意味着针对具体应用场景,其开发生产、服务提供、安全使用、流通交易在同一安全可信域中(“数据产品超市”即支撑数据产品的数据基础设施)。集成开发形成的数据产品除了具有“稳定性”特征外,同时还具备了物的价值的全部特征,“可控制”、“可计量”、“可收益”,即符合作为资产的全部特征。
第三步是反向赋予来源数据价值。数据产品涉及若干来源数据,这些来源数据被用于数据产品,就是数据资源。但并非数据都是数据资源,只有结合应用场景、被嵌入到数据产品中的数据才是数据资源。数据产品的价值可以分解出部分价值作为数据供给方的来源数据的价值,并在数据产品合约中约定。获得价值的数据作为数据持有者的数据资源,数据资源的价值成为数据持有者的权利,是一种用益权,即数据资源持有权。
综上所述,数据价值化的路径可以总结为:数据产品开发者基于安全可信数据基础设施上的数据共享开放,利用来源数据,自然获得数据加工使用权,加工出数据产品;通过确权,数据产品开发者获得数据产品所有权(及其附带的数据产品经营权),数据产品成为数据资产;数据产品再反向赋予来源数据价值,来源数据成为数据资源,并使数源单位获得数据资源持有权。
二、海南省公共数据资源开发利用的实践
(一)供得出——建立“三目录三清单”和全流程数据治理闭环管理机制
海南省自2020年开展公共数据开发利用试点以来,通过“三目录”“三清单”的业务架构(即职责目录、系统目录、数据目录;数据需求清单、数据责任清单、数据负面清单),以及公共数据全量质量探查,夯实公共数据的编目、归集与治理,为公共数据要素流通奠定了基础。
同时为保证元数据基础设施数据供给质量,建立了数据使用方和数据供给方之间的闭环管理流程,形成了“数据使用方反馈问题-统一受理形成问题工单-推动数源部门整改-限时办理反馈-办结”的全流程闭环。并通过建立7个一级指标、19个二级指标、31个三级指标的考核体系,对数据目录、数据归集、数据治理、数据服务、季度任务等情况进行打分,按季度对数源单位进行评估考核。
截至目前,海南省已建设全省统一的基础数据库,数据中台归集数据表96593个,完成全省100家单位累计928.36亿条数据;通过接口或库表形式共归集14个社会单位数据,主要涉及人流、物流、车辆信息、免税信息以及企业和家庭的水电气信息。
为了破解“没有最终提供服务,关联对象不会提前授权;没有关联对象授权,信息处理者无法开发数据产品”的难题,我省提出基于电子政务外网建立安全可信域,以此扩大安全域的破题思路,采取将数据产品开发商请进来的方式,在公共数据的安全域内——依托电子政务外网、政务云、政务中台等基础能力——对高价值密度数据进行产品化,再以数据产品形式对外提供服务。
(二)流得动——创新打造海南省数据产品超市
2021年12月,为创新公共数据资源开发利用与运营模式,推动产业数据融合利用,海南省大数据管理局通过招标模式选定中国电信合作建设运营“海南省数据产品超市”。以“政府+企业”双轮驱动,确保公共数据安全、合规、高效开发利用,以公共数据为牵引、促进海量社会数据开放流动,充分释放数据价值,赋能经济社会高质量发展。
数据产品超市基于海南省已建成的“七个一”大数据能力支撑底座,实行“前店后厂”的生产与服务模式,利用“数据产品化”实现公共数据、社会数据的共享流动、融合利用,打造数据要素市场培育新模式。
数据产品依托数据产品超市的安全可信环境,复用政务信息化能力底座(包括数据资源和安全能力),构建起“大中台、微服务”架构,实现数据产品的快速生产开发、实时组装和安全使用。数据依托“大中台”对外提供“微服务”,可以保障实时连接通道各端,从而使得数据产品实时在线,随时可以在授权下瞬间组装成型,提供服务。
在具体场景中,关联对象对涉私数据在线实时授权(关联对象行使数据决定权并作为服务对象获得使用便利),数据产品开发者获得关联对象的权益让渡——成千上万的服务对象每次使用时各自授权让渡其数据关联对象的权益——从而实现对数据产品的完整权益拥有,同时实现数据产品的服务。
为解决数据共享、开放中共享、开放条件模糊、审核流程繁琐、审核效率不高等问题,海南省通过对数据共享、开放的条件进行结构化分解,采用一揽子审核、自动化审核的流程和方式,无需通过“一数一审”的形式审核,即可实现全流程无人工干预自动审核效果的数据共享、开放审核模式,即“秒审”。
“秒审”机制已应用在全省62个省政府部门,覆盖218个系统,已申请共享审核通过171条秒审数据目录,审核时间从原来2个工作日缩短至秒级,大大减少审批时间,提高共享效率,进一步提高共享的获得感。
(三)用得好——出台数据产品所有权确权细则推动数据资产化资本化
2023年12月海南省发布《海南省数据产品超市数据产品确权实施细则》,作为全国首部数据产品所有权确权登记实施细则,该细则有三个特点。一是在全国首创性提出对“数据产品所有权”进行确权和登记。
《细则》引导数据产品在权属确认、流转备案等方面先行先试,探索数据资产化、资本化管理,激活数据要素潜能。
二是创新性提出技术性审查+合规性审查相结合的两级审查模式。《细则》要求按照“授权监管、便企高效、两级审查”的原则,引入第三方确权登记服务机构,秉持客观公正原则对申请对象的履约能力、数据来源的合法性等多方面进行实质性评估。
三是创新提出数据产品登记确权应当遵循“依法合规、自愿有偿、安全高效、促进流通、公开透明、诚实信用”的原则。《细则》提出,企业可依据自身需求向海南省数据产品超市申请对自身的数据产品进行确权登记。
2024年1月海南省发布《数据资产评估场景化案例手册(第一期)》,作为基于真实数据要素典型应用场景进行数据资产评估操作的指导性手册,选取了电力、旅游、海关、国际贸易、气象、制造6个数据要素典型应用场景,从行业现状概况、案例详情、评估目的、行业应用场景、评估价值类型、评估方法等几个方面提供了数据资产场景化评估的具体操作指引。
为解决不同应用场景下的数据资产无法适用统一评估标准、不同类型数据资产评估方法的路径选择等行业内常见问题提供了有效的解决思路和全面的解决方案,为数据资产入表、数据产品交易定价等提供价值参考依据。未来将持续分期、分行业推出系列合集,并适时联合相关单位编制细分行业的数据资产价值评估标准。进一步探索在重点业务场景构建数据资产价值评估标准库、规则库、指标库、模型库和案例库,提高数据资产评估总体业务水平。
三、构建数据基础设施体系
(一)何为数据基础设施
数据空间具有来自物理世界的各类结构,包括范围结构、业务结构等,这些结构构成数据基础设施。带有这些结构的数据空间就是数据资源体系。
也可以说,数据基础设施是数据资源体系的核心。根据范围结构,特别是业务结构,对数据空间进行梳理,也就是对数据资源体系进行梳理,形成的基本范围架构和业务架构等,就是数据资源体系下的数据基础设施。这里强调的是“基本”和“架构”,其具体含义只能来自物理关系和业务逻辑关系。基于物理关系和业务逻辑来构建数据基础设施。
对于政务数据空间,“政务”的定义相对明确。首先基于政务数据空间来构建政务数据基础设施。政务的业务基础是“三定方案”。依据三定方案梳理“职责目录”,代表了业务逻辑,需要信息系统和对应的数据空间来支撑,由此形成“系统目录”和“数据目录”。
以上“三目录”体系作为政务数据空间的元数据,就是数据基础设施的底层架构。数据的价值在于流通利用。基于“三目录”的元数据(数据字典),用户可以提出数据需求,落实到供给方的责任,由此形成数据“需求清单”、“责任清单”,不能提供的数据纳入“负面清单”。由此形成数据“三清单”体系。
数据具有主权属性、人身属性、公共属性和价值属性,其位阶顺序是:主权属性>人身属性>公共属性>价值属性。在主权不可碰之外,应当落实“数据以人为本”,即落实数据关联对象(自然人、法人等)对数据的决定权,作为数据公共利用和价值释放的前提。此即数据基础设施的顶层架构。数据要素化在于使用,在于发掘其价值属性。为此演绎出数据公共化基础设施和数据价值化基础设施。
(二)元数据、公共化、价值化数据基础设施
元数据基础设施,核心是解决单位内或中心化的区域内的数据共享、开放及其价值释放的问题,包括数据共享开放基础设施(目录体系、数据中台)、数据目录、数据分类分级、提质增效的指标体系等关键内容。
数据公共化基础设施,核心是解决数据如何从私有域走向公共域,破解“数据不出域”的矛盾,包括数据通过产品化出域、扩大安全域、可信数据空间、实时性与确定性网络(数据产品实时“瞬间集成”的特性、数据产品架构对实时性的要求、跨中心的数据开发利用要求确定性网络)等关键内容。
数据价值化基础设施,核心是解决数据价值的确认和变现的问题,包括数据产品化确权、数据产品估值与数据资产化、数据价值化从数据资产到数据资源、数据资源成为数据要素等内容。
数据要素与其他传统生产要素不同,不能简单用土地、资金要素比附。但是要实现数据的价值属性,即数据价值化,则意味着数据要素需要以某种形式嵌入到现行价值体系中。现行价值体系或经济运行体现在微观的财务体系和宏观财政体系中。数据需要纳入财务体系,即需要“入表”,“入表”的前提条件就是数据确权和数据资产化。
(三)基于政务空间构建政务数据基础设施
数据基础设施以公共数据资源体系为基础和研究样本。“三目录”“三清单”的底层架构和“数据以人为本”的顶层架构,构成了海南探索国家数据基础设施建设的基点。
其他领域的数据空间可以参照政务数据空间基础设施架构,形成具有互操作性、大范围的数据基础设施体系。
全国范围、全业务的数据空间基础设施,就是国家数据基础设施(NDI)。
四、下一步如何拓展的思考
海南省以数据产品超市为核心的数据基础设施已初具规模,并已经在部分垂直行业、部分省市推广,具备跨区域、跨行业试点基础,下一步拟构建以“确定性网络+联盟链+零信任机制”为核心的可信数据空间,推动数据产品超市模式实现跨省、跨域、跨境互通。
一是基于海南省公共数据资源体系优势,以应用场景和重点行业为牵引,进一步加强公共数据治理,高质量推动公共数据开发开放和流通使用,释放公共数据价值,普惠社会公众和市场主体。
二是聚焦应用场景推动数据要素产业发展。
一方面聚焦海南特色产业,如航空航天、南繁深海、医疗特区等行业,谋划打造一批示范性强、显示度高、带动性广泛的典型应用场景;
另一方面探索建设海南特色数字政府建设模式,鼓励政府带头采购数据产品和服务,鼓励政务部门发布“需求场景”,鼓励园区、企业开发产品和服务响应“需求场景”,从根本上将数字政府建设模式由“搞项目”模式变革为“谋场景”和购买服务模式。
三是加快实现聚焦场景的跨境数据双向流通,依托境内企业海外经营所需的数据双向流通需求,以及来数加工等数字贸易重点工作,海南将率先以特定国家特定场景跨境数据双向流通为突破口,争取与部分国家形成数据流通合作,实现重点场景业务通、规则通,为探索开展数据要素国际业务提供海南经验。
来源:海南省大数据管理局
END好文推荐Valuable Articles
南京版“数据二十条”:畅通数据要素大循环,探索构建南京数据交易场所