吕指臣、卢延纯等:数据空间建设的理论逻辑、发展现状与实践路径
文丨吕指臣 卢延纯 马凤娇
党的十九届四中全会首次将“数据”增列为生产要素,中国成为首个将数据作为生产要素的国家。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》明确提出“促进数据合规高效流通使用、赋能实体经济”的核心主线。
数据流通利用是释放数据要素红利、推动数据市场化利用的必然路径,也是激发数据要素创新活力与培育数据要素市场的关键。数据空间是以现代信息技术为支撑的数据治理系统,其作为安全可信的数据流通环境,为促进跨行业、跨地域数据要素流通、开发、利用提供强大支撑,在构建开放高效的数据要素市场中发挥关键作用。
因此,探讨我国数据空间相关制度建设、技术布局、应用场景、生态培育等实现路径,构建适应数据要素特征、促进数据安全高效流通、激发数据潜在价值的数据基础设施、建设数据空间具有重大现实意义。
文章首先深入剖析数据空间的概念界定、逻辑机理和现实意义,接下来系统梳理国内数据资源的管理利用情况、数据治理的现状和问题,以及数据空间的建设进展,然后以国际数据空间协会(International Data Spaces Association, IDSA)网站为案例来源探讨国外数据空间的发展进程与阶段、主要国家与领域,在此基础上总结国际经验与启示,最后提出我国数据空间的推进路径和政策建议。
梳理之前的研究成果发现,国内外相关研究人员围绕数据空间的研究主要包含理论研究和实践应用两个方面。
在理论研究方面,随着经济社会的发展,数据空间的概念不断发展变化,内涵也日渐丰富。2005年,迈克尔·富兰克林(Michael Franklin)等美国计算机科学与技术领域的专家学者首次较为系统地提出了“数据空间”的概念。此后,数据空间的定义不断延展,从可识别范围内抽象的数据管理,到松散连接(全局)信息的互联数据[3],再到连接利益相关方的多面数据平台。
数据空间具有数据源兼容性、数据管理和数据控制不完全性、服务质量不确定性和数据集成紧密性等特点,因此解决数据模型创新等技术问题是影响数据空间科学研究和领域应用的关键。目前,较为成熟的解决方案包括基于本体的数据模型[5]、分层数据模型[6]、基于关系嵌入的匹配方法[7]等。
在实践应用方面,近年来数据空间及相关技术发展迅猛,在部分行业和地区也取得了突破性进展。从行业领域来看,工业数据空间可视作跨企业的数据管理系统,存在丰富的应用场景和广阔的需求市场,因此是极具代表性的行业领域。
例如,有学者提出的异构数据的存储和访问方案,有学者建立的适用于工业数据的计算模型;还有学者搭建的提高生产车间智能化程度的车间匹配工业数据空间(industrial data space for machining workshop, IDMW)[11];此外,医疗数据的互联共享对医学研究和医疗诊断进展有直接影响,同样是数据空间研究的热点,例如整合热带病多源异构数据的按需数据集成(on-demand data integration, ODIN)的数据空间系统、面向用户敏感数据的可信集成知识(trusted integrated knowledge data space, TIKD)数据空间等。
从地区发展来看,欧盟的数据空间发展在世界上走在前列,无论是治理规则体系,还是基础设施建设都取得了丰硕成果。尤其是欧洲健康数据空间(European Health Data Space)在跨成员国、跨行业、跨部门数据利用方面取得了重要的机制创新。
综上所述,相关研究人员主要是从理论层面探讨数据空间的概念界定、主要特点和技术方案等问题,也有部分研究人员是从应用层面分析数据空间的基础设施、应用场景和风险挑战等内容。
但综合考虑我国数据资源实际情况、系统探讨我国数据空间相关制度建设、技术布局、应用场景、生态培育等实现路径的研究尚不多见。因此,在厘清推进我国数据空间理论逻辑的基础上,剖析我国数据资源情况和全球数据空间建设现状,进而提出推进我国数据空间建设的政策建议是本文研究的重点。
(一)数据空间的概念内涵
“数据空间”概念的提出者迈克尔·富兰克林(Michael Franklin)等从现实需求的角度出发,指出组织(如政府机构、企业、“智能”家庭)的正常运转依赖于海量跨域、异构又互相关联的数据源,从而将数据空间定义为一种涵盖特定组织全部相关信息的数据共存方法(data-coexistence approach),采用数据集成、数据虚拟化、语义建模和元数据管理等技术统一组织管理数据,提供数据编目和浏览、搜索和查询、更新和监控、事件检测和支持复杂工作流等服务。
随后的研究对数据空间的内涵有不少解读,但均是从特定的属性或技术等角度对原始定义进行延伸扩展。从实际功能的角度来看,数据空间是一种建立在数据基础上的、由实现共享目标驱动的业务协作模式;从应用场景的角度来看,数据空间是一种通用的多源异构数据组织和管理模式,它以数据价值联合挖掘为目标,将非可信环境下的多方数据的按需融合,为跨组织场景的数据共享、分析和服务提供了新的解决方案;从形态建构的角度来看,数据空间是网络空间从“以计算为中心”向“以数据为中心”转型的一种新形态,是在互联网和其他网络之上形成的由海量一阶数据实体组成的一体化虚拟空间;从技术适配性的角度,数据空间致力于构建跨组织创新协同和价值共创的数据流通利用生态,为解决当前的数据动态供给问题、数据自主权与可信问题、数据安全问题、数据互操作问题提供新的出路。
总的来说,数据空间是一种由治理框架定义的分布式系统,该框架在确保数据主权的同时支持安全可信的数据共享,核心功能包括明晰数据权属管理、保障数据安全流通、促进数据价值释放等。
(二)推进数据空间建设的逻辑机理
1.建设数据空间是释放数据要素价值的客观需要
生产要素是经济活动中的基本要素,是创造社会财富的根基和促进经济增长的动力。在农业经济时代,古典政治经济学家威廉·配第认为“劳动是财富之父,土地是财富之母”,土地和劳动是主要生产要素;延及工业经济时代,马克思提出“预付资本会转化为生产资本,会采取生产要素的形式”,资本成为重要生产要素;进入数字经济时代,数据成为一种新型生产要素,基于数据信息的价值创造成为社会经济发展的活力源泉。
与传统生产要素相比,数据这种新型生产要素天然存在一些特有属性。例如,与土地和劳动要素相比,数据要素的权属更为模糊复杂;与资本要素相比,数据要素的价值密度不均匀;与技术和信息要素相比,数据的互操作性和价值生成都依赖于安全可信的流通环境。
尤其值得关注的是,数据要素兼有正、负两方面的外部性。数据要素具有流通性强、复制成本低、报酬递增的优势,有利于提高资源配置效率,创造新产业新模式,培育发展新动能,从而产生经济规模和效率倍增的正外部性效应,但这些特性同样可能导致泄露用户隐私、滥用个人数据、扩大收入差距,甚至危害国家安全等负外部性效应。
数据空间创建了一个安全可信的数据流通环境,既保留了数据正外部性的优势,又降低了数据负外部性引发的风险,为激活数据要素价值奠定了扎实的基础。
2.建设数据空间是发挥我国数据资源优势的内在要求
数据管理领域的DIKW模型将数据(data)、信息(information)、知识(knowledge)和智慧(wisdom)纳入到一个金字塔形的四层级体系,呈现了由原始事实提取的数据向实践可用智慧逐层转化的过程。
按照这一理论框架,发挥数据要素价值的逻辑链条是先从海量数据中挖掘、提炼和加工信息,然后应用、创造和传播知识,最后归纳、总结并累积为能够指导实践的智慧。我国是全球最大的数据生产国,不但具有DIKW模型底层所需的海量且优质的数据,而且具有DIKW模型顶层所需的超大规模市场和丰富的应用场景。海量、动态、高增长、多元化的数据被广泛应用到各行各业,在创造比以往更多价值的同时大幅降低各类成本,极大地提高了价值创造的效率,使得我国在数据要素发挥新动能上具有得天独厚的优势。
数据空间的本质是实现数据资源安全共享、分析、加工等功能的基础设施。通过开发数据型产品、信息型产品等为经济社会发展提供智慧支撑,因此推进数据空间建设是我国将数据资源优势转化为国家竞争新优势的必然选择。
3.建设数据空间是发展新质生产力的重要载体
2023年9月,习近平总书记在黑龙江省实地调研时首次提出“新质生产力”的概念。2024年1月31日中共中央政治局第11次集体学习中,习近平总书记对其内涵作进一步阐释,“新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。”
新质生产力学说是面向科技创新驱动下信息时代的产业革命做出的时代性、历史性回应,强调要素禀赋变革及全要素生产率提升,赋予马克思主义生产力学说更契合经济技术变革的时代化新特征。
在新质生产力的发展中,数据不但是必不可少的生产要素,深刻融入生产、分配、流通、消费和社会服务管理等各环节,而且可以通过解构重组、汇聚融合等途径多层次、多元化地实现价值倍增,从而提升全要素生产率。
数据空间是信息时代的基础设施,为数据这一新型生产要素和土地、劳动、资本、创新等传统生产要素的有机结合创造了安全稳定的环境,触发了生产力结构深刻变革,为培育新质生产力提供了丰厚的土壤[23]。
(三)推进数据空间建设的战略意义
1.有助于加强数据安全与隐私保护,促进科技创新与技术进步
随着数字经济的深入发展,数据泄露和滥用、信息窃取和交易以及黑客入侵和攻击等数据安全问题日趋严重,不仅对国家安全构成严重威胁,而且对公民个人的合法权益形成严重侵犯。虽然近年来我国颁布了一系列法律法规,如网络安全法、电子商务法、个人信息保护法、数据安全法等,但是并不能在事前从根源上防范数据外泄等问题的发生。
数据空间采用隐私计算等技术方案构建可信环境,防止数据在传输、存储和使用过程中泄露和滥用,实现数据流通“可用不可见”“可控可计量”,使得数据可管可控。此外,数据空间蕴含着海量且丰富的数据,为科研机构、企业和个人提供了研究和创新的原材料。借助深度学习、人工智能等技术对这些数据进行分析,可以催生新的科技成果和创新应用,如智能交通、精准医疗、智慧城市等。
2.有助于提高社会治理水平,赋能国家治理能力现代化
算力驱动的新质生产力引发了社会结构分化、利益关系调整,对国家治理的理念、模式、手段提出重构要求。
我国大数据技术标准推进委员会、隐私计算联盟发布的《数据流通利用研究报告(2024年)》显示,2023年我国数据流通利用场景数量及数据规模均有明显增长,跨行业数据和公共数据流通利用场景分别占49%和27%,此外超过20%场景的数据规模为亿级,过半场景的数据规模为千万级,因此我国迫切需要构筑一个安全可靠的数据流通环境来保障数据要素合规高效地流通交易。
数据空间作为推动数据可信流通的重要技术支撑,能够有效降低数据供求双方的信任成本,帮助政府部门更全面、更真实地了解社会动态,及时调整政策预防和解决社会问题,更大力度推动国家治理方式从传统的粗放治理转向数据和智能驱动的精准治理。例如,政府部门可以通过分析人口分布、交通流量和公共设施使用情况等改善城市规划,提升城市管理效率,强化公共安全保障,提供更加精准和个性化的公共服务等。
数据空间还有助于打破地域限制,使得边远地区同样能享受到高质量的数据服务,促进区域间协调发展,缩小数字鸿沟。
3.有助于加速数字经济增长,推进全体人民共同富裕
随着数字产业化和产业数字化的加速推进,海量的数据同时被生产制造,但是数据标准不统一、数据库不兼容等问题使得数据难以互联互通,分散异构的数据源和跨企业、跨行业的数据融合运用需求之间的矛盾日益凸显,严重阻碍了数字经济的发展进程。在这种背景下,数据空间作为一种集成的、可访问的数据存储和处理环境,为安全高效地管理、共享和利用多源异构数据提供了解决方案。
因此,数据空间是数字经济时代的一种新的基础设施,对数字经济发展起到了“加速器”的作用,助力共同富裕的实现。
一方面,数据空间的创新效应和普惠效应可以创造巨大的社会财富,同时让全民共享数字红利。数据空间能够整合海量数据资源,促进数据的高效流动和共享,对传统产业进行全方位、全角度、全链条的改造,催生新的业态和模式,从而加速数字经济的发展,推动产业转型升级,提升经济的整体竞争力。同时,数据空间使得先富起来的居民和后富的弱势群体、落后地区和发达地区置身于同一个发展空间,为低收入群体人群、落后地区居民等创造更多就业和增收的机会。
另一方面,数据空间的溢出效应和协同效应能够促进区域平衡增长、行业协调增长。数据空间降低了信息传递的成本,提高了信息传递的时效,极大程度上强化了城乡间、区域间经济活动的关联程度,对邻近地区的经济发展质量产生边际递增的作用。
此外,数据空间还强化了数据要素和其他生产要素、供应链和产业链、数字平台和中小企业的协同联动,推动数字经济与传统经济深度融合,发挥规模经济优势,助力行业协调发展。
(一)国内数据空间的发展现状
1.我国数据资源的管理利用情况
第一,在数据生产方面,生产规模大、范围广、增速快。《全国数据资源调查报告(2023年)》显示,2023年全国数据生产总量达32.85ZB(泽字节),同比增长22.44%。
就数据生产的来源而言,设施物联传感数据的占比最高,贡献了超过4成的数据生产总量,这主要是因为在各地加速建设智慧城市的背景下,城市基础设施、资源、服务等数字化、网络化、智能化程度不断提高,摄像头、传感器、无线设备等实时捕捉的数据量增长迅猛;就数据生产的增速而言,交通运输类数据增长最快,在智能网联车的驱动下出行数据同比增幅接近50%。
来源于生产制造类的数据占比最低,同比增幅接近20%,这主要得益于旧设备的升级改造和智能设备的推广应用。
第二,在数据存储方面,存储需求基本满足,但终端存储占比高,产存转化率较低。整体而言,2023年全国数据存储空间为2.93ZB,当年新增的存储数据占近三分之一,存储空间利用率为59%。
分存储主体来看,政府和行业重点企业的利用率高于平均水平,达到约70%,数据服务商低于平均水平,约为35%;分存储方式来看,约有6成的数据存储于终端设备,而终端存储在灵活性和便捷性方面先天存在劣势,是造成数据开发度浅、复用率低、互联性弱等问题的重要原因。
第三,在计算能力方面,算力规模增长快、智算能力需求旺、区域发展差异大。我国适度超前布局数字基础设施,实现了广覆盖、高速率、低费用,不仅为居民提供了便捷的网络服务,而且有力支撑了经济社会数字化进程。一方面,我国算力规模持续增长。
《数字中国发展报告(2023年)》显示,2023年我国算力总规模达到230EFLOPS(百亿亿次浮点运算/秒),其中智能算力占比达到30%,居全球第二位,同时先进技术、人工智能、5G/6G等关键核心技术不断取得突破,高性能计算持续处于全球第一梯队。根据国家数据局公布的数据,截至2024年3月底,10个国家数据中心集群算力总规模超过146万标准机架,整体上架率为62.72%,较2022年提升4个百分点,东西部枢纽节点间网络时延已基本满足20毫秒(ms)要求。
另一方面,算力枢纽按需布局趋势明显。京津冀、长三角、珠三角地区算力规模占全国比重近6成,这主要是由于东部地区存在较大的实时计算需求,而实时数据处理仍依赖于当地存力及算力。
第四,在数据流通方面,数据流量稳步增长,但场内交易供需结构性失衡问题突出。根据我国四大运营商公布的数据,在智能终端设备、声像视听交互需求的推动下,移动互联网数据流通活跃度高涨,2023年全国数据流量同比增长7.6%。调查数据还显示,平台企业、中央企业分别成为汇聚行业领域和产业链数据的枢纽,平均数据交互量分别为行业重点企业的249倍、42倍,在赋能上下游企业方面扮演着重要角色。
与数据需求爆发性增长相矛盾的是,数据交易机构的产品成交率低迷,在27家交易所上架数据产品中仅有17.9%最终达成交易。以消费民生领域为例,数据产品购买方数量是供给方数量的2.4倍,但是产品成交率低于10%。这表明目前我国数据交易市场供求结构不匹配的问题较为严重,场内交易吸引力不足。
第五,在数据应用方面,数字经济核心产业发展势头强劲,公共数据和企业数据融合实践不足。
一方面,我国数字经济规模持续增长,连续多年稳居全球第二,对经济社会发展的引领支撑作用日益凸显。根据国家统计局公布的数据,2023年我国数字经济核心产业增加值预计超过12万亿元,约占GDP的10%。
我国数字产业化和产业数字化发展成效显著:衡量重点工业企业数字化水平的关键工序数控化率和数字化研发设计工具普及率分别达63%、80%;累计培育421家国家级智能制造示范工厂;电子商务、移动支付规模一直保持全球领先的地位,智慧农业稳步发展。
另一方面,我国公共数据开放共享也有力地推动了公共服务水平的提高,公共数据和企业数据的融合在不断深入,但仍需加强。截止到2023年12月底,全国一体化政务数据枢纽接入53个国家部门、31个省(自治区、直辖市)和新疆生产建设兵团数据,挂接资源达2.06万个,实现累计调用5361.35亿次服务,目前90%以上政务服务都可以在网上办理。
国家数据局公布的数据显示,互联网医疗用户规模达到了4.14亿人,国家智慧教育平台连接了近52万所学校,辐射近1900万名教师、近3亿人在线上进行学习。在2023年全国数据资源调查中,我国行业主管部门、地方省级政府开放数据量分别比2022年增长16%、18.5%,但是仅有18.6%的平台企业和51%的中央企业表示在开展自身业务的过程中使用到了政府开放的公共数据。
2.我国数据治理的现状和问题
关于数据治理的含义,可以从狭义和广义两个角度理解:狭义上的数据治理指数据本身的治理(governance of data),主要是维护和管理数据;广义上的数据治理指基于数据要素的治理(governance by data),是建立在数据要素价值上的治理,包括数据的应用和开发过程。
在数据治理的具体实践中,更多的是基于广义上的含义。国际标准化组织IT服务管理与IT治理分技术委员会等机构将数据治理定义为:建立在数据存储、访问、验证、保护和使用之上的一系列程序、标准、角色和指标,通过持续评估、指导和监督,确保数据高效利用。
在中国通信标准化协会发布的《数据治理标准化白皮书》中,数据治理指通过法律法规、管理制度、标准规范、技术工具等一系列手段,面向个人数据、企业数据、政府数据、公共数据等不同类型数据对象全生命周期开展有效的管控,以满足企业管理、行业监管、国家治理、国际协作等场景下数据应用的要求。
关于我国数据治理的现状,主要有三个特征:
第一,就数据治理政策制定而言,我国逐步推动构建数据治理规则体系,围绕数据安全保障、用户权益保护以及数据价值释放三个方面,形成涵盖法律、行政法规、部门规章等不同层级的制度规则。
国家部门层面,科技部、工业和信息化部、交通运输部、农业农村部、金融监管总局、国家医保局等部门围绕所管辖领域出台数据治理的指导意见,布局数据治理顶层设计;地方层面,许多地方政府根据中央和部委相关政策精神,因地制宜制定地方性条例,为促进数据高质量供给、推动数据合规高效流通、加强数据安全保障等强化保障支撑。
第二,就数据治理机构设置而言,从中央到地方一体化的组织架构初具形态,数据治理的权力关系和功能定位逐渐清晰。2018年3月国务院机构改革方案出台,各省市陆续结合当地实际情况探索设置或调整数据治理机构;2023年10月国家数据局成立,标志着我国开始从中央政府层面统筹推进数字中国、数字经济、数字社会规划和建设;此后,地方性的数据局也相继挂牌,但在设立方式上存在较大差异。
第三,就数据治理行动开展而言,日常监管为主、专项行动穿插的执法模式日益成熟。近年来,相关部门不断强化数据监管,一系列专项行动在净化互联网数据利用环境、规范个人信息收集使用行为、提升行业数据安全保障能力等方面收到了良好成效。
例如,中央网信办持续开展“清朗”系列专项行动,集中整治网上突出问题乱象,推动网络生态持续向好;2023年,国家金融监督管理总局办公厅印发《关于开展EAST数据质量“提升工程”的通知》,针对目前银行机构存在的EAST数据治理意识薄弱、数据治理体系不健全、数据错报等问题提出整改要求。
总的来看,目前我国数据治理还存在三个方面的问题:
第一,数据治理的法制保障不完善。对于非公数据的权属界定尚不明晰,法律层面对数据所有权、数据使用权和数据经营权的规定仍存在模糊地带,对于公共数据开放的保障机制有缺位,在评价标准、责任分担、考核监督等方面仍缺乏统一规范;
第二,数据治理的技术工具不成熟。当前隐私计算、数据防伪、数据水印溯源、动态数据屏蔽等技术工具尚处于初级应用阶段,可能产生的负面影响包括:数据质量控制不足,无法及时识别和纠正数据错误、缺失值或异常值,对制定和执行战略和规划产生误导;数据安全防护薄弱,缺乏先进的数据加密、访问控制和审计功能,造成涉及公民个人信息的数据暴露于外部风险;数据生命周期管理不当,导致数据冗余和存储成本增加;
第三,数据治理的制度体系不健全。政府在数据治理中的行为界限尚未明确,“不管就乱、一管就死”的悖论依然存在。同时,政府监管尚未形成贯穿事前、事中、事后全过程的动态监管机制。此外,科学有效的数据治理有赖于政府、企业、社会等多方共同努力,但是目前企业自治作用不明晰,群众监督也未得到足够重视。
3.我国数据空间的建设进展
在制度设计方面,近年来我国出台了一系列政策推动数据空间快速发展。2016年,《“十三五”国家科技创新规划》首次将“数据空间”作为先进制造技术提出。
2017年的《“十三五”先进制造技术领域科技创新专项规划》进一步指出要研发基于工业大数据的企业智慧数据空间构建等技术系统,开展平台典型应用。
2020年发布的《工业和信息化部关于工业大数据发展的指导意见》和2021年发布的《“十四五”信息通信行业发展规划》均指出在重点行业建立安全可信的工业数据空间,引导数据有序开放共享。
2023年10月,国家数据局正式挂牌成立,并于同年底联合其他16部门印发《“数据要素伊”三年行动计划(2024—2026年)》,为数据空间纳入国家数据基础设施建设提供明确的政策指引。
与此同时,与数据要素配套的监管制度和行业标准也在探索中日益完善。2022年底,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布,为数据产权确定、数据流通和交易、数据要素收益分配、数据要素治理等领域的政策标准制定确定了方向,也标志着我国探索和发展有序规范的数据要素市场的开始。
2023年8月,财政部下发《企业数据资源相关会计处理暂行规定》,标志着数据从自然资源转变为经济资产的理论创新落地国家统一的业务实践;随后印发《关于加强数据资产管理的指导意见》和《关于加强行政事业单位数据资产管理的通知》,为赋能实体经济数字化转型升级,推进数字经济高质量发展提供了有力支撑。
2024年,工业和信息化部印发《工业和信息化领域数据安全风险评估实施细则(试行)》,对重要数据和核心数据处理者数据处理活动提出具体要求。
在业务实践方面,我国数据空间取得了突破性进展,但整体上看我国数据空间的技术布局、应用场景和生态培育等仍处于初级阶段。
2024年6月6日,中国信息通信研究院牵头提出可信数据空间系统架构国际标准(IEEE Standard for Trusted Data Matrix System Architecture,标准编号:P3158),在国际共识的基础上首次提出了可信数据空间的系统架构,旨在为不同利益相关方提供清晰的建设指引,促进数据共享流通。
2023年深圳数字交易所达成了国内首笔基于数据空间技术的场内数据业务合作,标志着我国数据空间技术商用取得实质性进展。
(二)国外数据空间的发展现状
为了更全面、更准确地刻画世界各国数据空间建设的进展,本文对IDSA发布的案例进行综合分析。IDSA现有来自31个国家的169名成员。本文采用IDSA作为数据来源的的主要考虑是:
第一,时效性,IDSA门户网站Data Spaces Radar模块按日更新全球数据空间实践案例,提供各国数据空间建设的最新进展;
第二,连续性,Data Spaces Radar收集的案例时间跨度长,近四成对制度框架、实施方案等进行详细介绍,既能纵向分析单个数据空间的建设历程,也能横向比较多个数据空间的运行特点;
第三,规范性,所有案例采用统一格式对每个案例的主要功能、发展阶段、应用领域、挑战和解决方案等具体情况进行介绍,直观呈现了每个案例的特点;
第四,借鉴性,Data Spaces Radar案例涵盖制造业、能源、移动、物流、智慧城市、金融等领域,与我国《“数据要素伊”三年行动计划(2024—2026年)》圈画的重点领域高度契合,对我国的数据空间建设具有很强的参考价值。
1.发展进程与阶段
在数据空间的发展进程方面,全球建设数据空间不断加快。截至2024年8月,Data Spaces Radar共公开提供了178个数据空间案例,包括84个数据空间和93个用例(1个案例类型未知)。
由图1可知,2024年上半年新增数据空间案例38个,几乎是过去两年的总和(2022年和2023年分别新增16个、23个)。
此外,《全球数字经济白皮书(2024年)》的数据同样显示,欧洲目前已建成160个数据空间,较2023年同比增长60%,其中公共、行业和应用案例分别为19个、63个、77个。日本启动Ouranos计划,在新兴产业创新、城市公共服务、新能源汽车及电池、金融交易四大领域开展建设。
在数据空间的发展阶段方面,多数案例处于试点实施状态。IDSA从项目建设计划、主体间伙伴关系、资金资源、实施方案等角度,将发展阶段划分为探索、筹备、实施、运行、扩建五个等级,等级越高代表该数据空间越成熟,统计结果由图2所示。
接近一半的数据空间处在“实施阶段”,即数据空间已由构想落实为具体可行的行动方案,同时具备了基础设施建设等所需的资金、技术等资源,但是还没有对软硬件开展模拟测试。
约三分之一的数据空间处于已构建合作伙伴关系的“筹备阶段”。仅有不足1%的数据空间进入到接受新用户、开发新用例的“扩建阶段”,这意味着其财务和经营可持续,有能力应对市场变化。
2.主要国家与领域
从国家的角度分析,欧盟成员国在数据空间建设中走在世界前列。数据空间数量排名前十的国家中,除澳大利亚外全部为欧盟成员国(详见图3),这反映出欧盟国家积极打造基于数据的差异化竞争优势,建设数据空间的主动性强、重视程度高、起步时间早。以数据空间数量位列榜首的德国为例,一方面,德国在内部有序推动数据空间发展。
2015年德国联邦教育与研究部发起“工业数据空间行动”,2016年成立工业数据空间协会(Industrial Data Space Association, IDSA),随后发布工业数据空间参考架构模型,从业务、功能、流程、信息和系统五个层面为工业数据的可信流通与价值挖掘制定发展路线。另一方面,德国在外部积极寻求数据空间的扩张。
例如,2020年德国与法国联合发起超大规模的云计算平台Gaia-X,将工业数据空间参考架构升级为国际数据空间参考架构3.0版(IDS架构),从而吸引更多国际成员单位。
从应用领域的角度分析,数据空间涉及的行业领域广泛,尤其在制造业、能源和移动领域表现突出。图4展示了占比超过5%的应用领域,可以看出制造业/工业4.0领域的数据空间案例的数量最多,共有43个,占全部案例24.29%;能源和移动的案例数量分别为21个和13个;接下来依次是物流、智慧城市和绿色交易/循环经济。
总的来说,各领域数据空间项目建设的共同目标是实现数据的安全可信共享,激活行业/产业的数据驱动型创新。
但是在不同领域数据空间建设的侧重点也有所不同。例如,制造业/工业、能源、移动等产业更关注数据驱动方式及大规模生产经营模式的创新,打造可信数据生态环境,而健康领域更强调对个人数据自主权的保护,与此同时为科研创新与政策制定提供数据支持。
3.国际经验与启示
第一,在宏观层面,加强数据要素市场化配置改革的战略部署。在新一轮技术革命与产业革命交替演进的背景下,数字经济发展水平成为国际竞争力的关键因素。数据空间是数据基础设施建设的一种重要技术解决方案,发达国家围绕数据空间的技术创新、标准制定等方面开展了系列战略部署,抢占数据空间领域的主导地位。
以欧盟的数据空间治理为例,早在2012年欧洲委员会就提出《通用数据保护条例》(General Data Protection Regulation, GDPR)的构想,在全球范围内率先从法律层面对保护个人数据做出规定。
2015年,欧盟正式公布“数字单一市场”(Digital Single Market)战略,推动数字领域互联互通。2020年,欧盟先后出台《欧洲数据战略》(A European Strategy for Data)、《人工智能白皮书》(The White Paper on Artificial Intelligence)、《塑造欧洲的数字未来》(Shaping Europe’s Digital Future)和《欧洲数据保护监管局战略计划(2020—2024)——塑造更安全的数字未来》(EDPS Strategy 2020-2024——Shaping a Safer Digital Future)等,同时成立数据空间支持中心,并制定分领域的细粒度数据空间政策,力争成为全球数据空间领域的引领者。
我国可参考欧盟的数据空间治理规则体系,坚持顶层设计和实践探索有机结合、良性互动,统筹推进数字中国、数字经济、数字社会“三个建设”,加快形成系统完整、科学合理、协调统一的数据基础制度体系,为释放数据要素乘数效应提供坚实制度保障。
第二,在中观层面,面向不同行业领域打造高水平数据要素应用场景。2020年,欧盟综合考虑不同部门和领域数据的使用需求、潜在价值等因素,决定在九个战略部门和公共利益领域建立共同欧洲数据空间,包括工业(制造业)、绿色交易、交通、健康、金融、能源、农业、行政和技能,并分别制定了具体的、大规模的、以数据为重点的部门行动方案,为加快数字化赋能传统产业提供了政策引导。
我国的《“数据要素伊”三年行动计划(2024—2026年)》同样聚焦重点行业和领域,突出场景需求牵引,选取工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理和绿色低碳十二个领域开展重点行动。
未来,我国可进一步借鉴欧盟经验,从国家层面分领域推进数据要素协同优化、复用增效、融合创新等,同时统一规划数据汇集、处理、流通、应用及运营的所需的软、硬件设备,从根源上规避欧盟的基础设施重复建设问题。
第三,在微观层面,面向各方数据要素市场参与主体完善利益协调机制。在2020年发布的《人工智能白皮书》中,欧盟提出搭建欧洲、国家和地区三个层面协同的政策框架,促进公共部门和私营部门合作,搭建一个覆盖整体价值链的数字生态系统。
就我国数据基础制度建设现状而言,目前在数据产权归属认定、市场交易、权益分配、利益保护等方面都缺乏政策文件,尚不能充分保障和协调数据要素市场各参与主体的利益,对数据要素的畅通流动和高效配置造成阻碍。因此,我国亟需构建匹配数据要素特征、符合市场运行规律、满足经济发展需要的利益协调机制,丰富完善数据要素市场制度和规则,促进数据要素开发利用。
具体来说,就数据产权而言,要尽快健全公共数据、企业数据、个人数据的分类分级确权授权机制;就数据流通交易而言,要不断完善监管规则体系,打造规范高效、场内外结合的多层次交易体系;就数据收益分配而言,探索兼顾效率和公平的分配机制,在让市场发挥决定性作用的同时让政府发挥引导调节作用;就数据安全治理而言,探索适应数据特点的安全治理模式,鼓励多方社会力量共同参与治理。
数据空间作为数据资源高质量共享流通和高效开发利用的基本载体,具有不可替代的主体作用。结合我国实际国情,推进数据空间建设具有深刻的逻辑机理、重大的战略意义,且我国具备突出的数据资源优势、丰富的应用场景和广阔的需求市场,同时国际上发达国家的已有实践为我国提供了丰富的参考经验,因此,我们应通过一系列行动方案加快数据空间建设。
我们认为,完善的数据基础制度体系是建设数据空间的根基,先进的数字技术和基础设施为数据空间提供充足的内部动力,多层次数据流通交易体系保障数据空间的价值实现,国际合作将为数据空间提供外部动力和借鉴经验。
总的来说,推进数据空间建设的总体路径包括两大体系和两大支柱(详见图5),四个核心部分形成循环加持作用,共同推动我国数据空间建设。具体任务举措包括四个方面。
(一)丰富完善数据基础制度体系,加强数据全产业链多方协同治理
我国目前处于数据空间治理的探索阶段,制度是引领数据空间走向的关键。
一方面,要尽快丰富完善数据基础制度体系,规范数据生产、处理、流通、收益、管理等行为活动,完善数据要素产权、定价、流通、交易、使用、分配、治理、安全的政策标准和体制机制。
另一方面,要加快建立跨部门、跨行业、跨组织的横向规制框架,加强数据全产业链的系统治理,促成要素市场中不同主体的联动配合与行业上下游的共同发力,提高数据的开发程度和利用水平。
(二)鼓励核心技术研发,加强基础设施建设
技术创新是数字经济发展的活力源泉,同时深刻影响着经济发展格局。
一方面,应推动企业、科研机构和高校加强核心技术的理论研究与实际应用,突破数据加密、脱敏、溯源、传输等关键技术,推动技术演进标准化、规范化,保障科技链、产业链和发展权安全。
另一方面,强化算力中心、汇集数据池、数据交易所等数字基础设施体系化发展和规模化部署,持续实施“东数西算”工程,推动全国一体化算力网的建设,以数字中国建设带动数据基础设施合理超前布局,助力打造全国统一大市场,为数据要素全方位、全领域提振经济发展动能提供保障。
(三)丰富数据流动形态,构建多层次数据流通交易市场体系
数据的使用价值高度依赖于规模质量、多源融合和应用场景,通过流通才能创造出更大价值。因此,应持续培育和壮大数据产业链,大力支持数据流通模式和技术手段创新,以真实场景牵引技术进步,深入推进数据跨部门、跨层级、跨区域、跨主体的高效可信流通利用,如政务数据共享交换、互联网平台数据流通利用、工业互联网协同研发及供应链管控等。
同时,要进一步推动公共数据的汇聚融合、共享交换和开发应用,多措并举释放公共数据红利,提升公共数据的整体流通效能和经济社会价值。另一方面,数据的虚拟性、非竞争性、无边际成本性等复杂特征导致其交易存在确权难、定价难、互信难、监管难等挑战,因此要尽快完善数据产权结构性分置制度,形成中国特色的数据产权制度体系。
(四)加强数据空间领域国际合作,提升数字规则主导能力
一方面,积极学习主要国家和地区的建设数据空间的成功经验,大力推动数据空间的跨国交流合作。例如,建立跨境数据流动试验区,促进数据资产的跨境交易和流通,探索数据流动的实践和监管模式;开展数据空间示范项目,引入国外技术成熟领域如智能制造、健康医疗、智能交通等的数据空间技术;与其他国家共建数据交易平台,鼓励外国企业进入中国数据要素市场,同时支持中国企业走出去,深入参与全球数据价值链。
另一方面,在保持我国政策独立性的同时也要积极融入和塑造国际数据空间治理框架和标准,提高中国在数据空间领域的影响力。积极与关键国家和地区达成数据保护和数据流动方面的多边合作关系,明确数据跨境传输的规则和条件,建立数据格式、编码和接口的互认机制,提高数据的互操作性。在此基础上,大力宣传推广中国的数据空间技术标准和典型实践,积极参与数据空间相关的国际标准制定,不断增强我国在数据规则、数据标准等方面的制度性话语权。
来源 数据要素社整理自清华大学国情研究院(原文转载于北京工业大学学报(社会科学版),2024 年第6期,作者:清华大学国情研究院出站博士后、国家发展和改革委员会价格成本和认证中心助理研究员吕指臣;国家发展和改革委员会价格成本和认证中心主任卢延纯;北京大学经济学院博士研究生马凤娇)转载请注明来源
数据要素人才招聘“汇” (9月)