郑磊,刘新萍 | 我国公共数据开放利用的现状、体系与能力建设研究
摘要:近年来,国家高度重视释放数据要素的价值。公共数据是数据要素的重要组成部分,只有当公共数据不仅能在政府体系内部流转和使用,还能在市场和社会上畅通流动并被充分利用时,才能释放出更大的价值,全面赋能经济社会发展。随着我国公共数据开放的法规政策和标准的不断健全,各地公共数据开放平台数量和数据开放数量、容量、质量等持续上升,公共数据利用成效初步显现,但也存在不充分、不协同、不平衡、不可持续等问题。这些问题的背后反映出我国现有的公共数据开放利用体系与能力还存在许多短板与瓶颈。对此,应进一步构建和提升有利于促进公共数据在政府、市场和社会多元主体之间实现畅通大循环的体系与能力,以充分释放公共数据要素价值。
关键词:公共数据;开放利用;数据开放平台
一、引言近年来,我国高度重视公共数据开放工作,自2015年《促进大数据发展行动纲要》发布以来,陆续出台多个文件,对开放公共数据作出明确要求。其中,中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》首次将数据列为生产要素,并要求推进政府数据共享交换,研究建立促进公共数据开放和数据资源有效流动的制度规范。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》将“加强公共数据开放共享”作为“提高数字政府建设水平”的首个内容,明确要求“扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放。”中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》提出要“坚持共享共用,释放价值红利”,“对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据,加强汇聚共享和开放开发”,“对不承载个人信息和不影响公共安全的公共数据,推动按用途加大供给使用范围”。
公共数据是数据要素的重要组成部分,如果仅在政府体系内部流转和使用,其所能发挥的作用是局部和有限的,只有在市场和社会上顺畅流动并被充分利用,才能释放出更大的价值红利,全面赋能经济社会发展。因此,本文对我国目前公共数据开放利用的现状、体系与能力进行分析,并对未来公共数据开放利用提出可行路径。
二、我国公共数据开放利用的现状自2012年上海推出我国首个地方政府数据开放平台以来,各地数据开放平台逐步上线,数据开放利用水平不断提升。调查显示,各地开放数据平台总数从2012年的3个上升至2023年8月的226个。其中,省级平台22个(不含直辖市和港澳台),城市平台204个(含直辖市、副省级与地级行政区)。但仍有近两成的省级平台和近四成的城市平台尚未上线,国家层面的数据开放平台也尚未上线。从区域分布看,当前我国地方公共数据开放整体上呈现从东南部地区向中西部、东北部地区不断延伸扩散的趋势,同时也呈现区域发展不平衡的特点。目前,所有直辖市,福建、广东、广西、贵州、江苏、江西、山东、四川、浙江9个省份的省本级及下辖城市,以及湖北省的全部下辖地市都已上线了公共数据开放平台,但同时,陕西、青海省内的所有城市及海南、河南、吉林、辽宁和云南等省内的绝大多数城市尚未上线公共数据开放平台。
(一)各地公共数据开放的法规政策和标准不断健全,但缺少国家层面的法规保障
法规政策是推进公共数据开放的法治基础和重要依据,只有基础牢固才能使数据开放走得远、走得稳。近年来,越来越多的地方针对公共数据管理和开放利用工作制定了专门的法规政策和规划,对具体实践有较强的指导和监督作用。各省(区、市)出台了与数据治理、数据开放相关的法规政策,明确了对公共数据开放工作的相关要求。其中,上海、重庆、浙江等地制定了包括地方性法规、地方政府规章、一般规范性文件等多个效力等级的法规政策,形成一整套法规政策体系,从原则方向到具体实操等各方面对公共数据开放利用工作作出明确规定。然而目前,国家层面还缺少专门针对公共数据开放利用的法规政策。
除制定法规政策外,北京、天津、山东、浙江、四川、贵州等多个地方还制定了年度数据开放工作计划,列明了计划开放的数据集名称、字段、完成时间等内容。以山东省为例,山东省大数据局公布的“山东省直部门(单位)公共数据开放2023年度工作计划”中列明了2023年新增公共数据开放清单,并明确列出了数源单位、数据资源目录名称、数据项、开放属性、开放条件、开放方式、更新频率、计划开放时间等具体内容。
标准规范是数据开放相关制度规则建设中备受关注的部分,直接影响开放数据的质量。目前,江西、广东、贵州、山东、福建、四川、广西等地已制定了有关数据开放的地方标准,如江西省的《政务数据开放平台技术规范》、广东省的《电子政务数据资源开放数据管理规范》、贵州省的《政府数据 数据开放工作指南》、福建省的《公共信息资源开放 数据质量评价规范》、广西壮族自治区的《广西公共数据资源开放目录编制指南》等。这些标准对数据开放平台建设、开放数据质量管理、开放数据评价指标体系等方面作出细致规定,对促进和规范数据开放工作具有重要意义。
(二)各地公共数据开放平台数量显著增加,但运营服务水平有待提升
平台是数据开放的枢纽,数据开放平台连接了数据供需两端,是公共数据开放绩效得以体现的重要载体。当前,各地公共数据开放平台数量显著增加,功能不断迭代。在平台功能方面,大多数平台的开放数据目录更新、平台深度搜索、订阅推送、数据集预览与获取、社会数据开放、利用成果提交展示等功能日趋完善,但也要看到,公共数据开放平台在差错预防、用户交互、数据标签、筛选推荐、数据格式和数据可视化等方面存在较大的改进空间。
目前,很多数据开放平台难以实现高效而持续地运营,仍有一些平台对用户所有的反馈均采用“模板式”回应;有些地方开放的数据质量低,甚至以虚假的、无法理解的数据填充内容;有些平台将一些数据列为有条件开放,但实际上并未开放。同时,多数地方平台都能维持较为稳定的数据供给,但也有部分平台存在无法访问、网站崩溃、页面卡死等问题。
(三)数据集数量容量持续上升,但供给水平相对于用户需求仍很不充分
数据是公共数据开放的核心,高价值数据优先开放是各国公共数据开放行动计划的核心和主线。开放数据的重点不在于数据集数量多,而在于开放满足用户需求、高质量的数据集,并对这些数据集进行及时更新和提供详细的描述说明。截至2023年8月,各地公共数据开放平台上的开放数据数量和容量初具规模。2017年全国所有地方只开放了8398个数据集,2023年已增加到345 853个,其中山东省域有效数据集总数最多,达83 642个。
与数据集数量相比,数据容量更能体现一个地方的数据开放总量。数据容量指在各地平台可下载、结构化的数据集中,将字段数(列数)乘以条数(行数)得出的数据总量,用以衡量平台上提供的数据集的实际数据量大小。进一步来说,单个数据集平均容量更能反映一个地方开放数据集的平均水平。总体看,当前各地已开放的数据集呈现总容量和单个数据集平均容量偏低且地域之间差异显著等问题,其中以API接口形式开放的实时动态、高容量数据更是寥寥无几。
在数据开放范围上,目前各地政府开放的数据大多为政府各职能部门,以及履行公共管理和服务职能的事业单位开放的政府数据,来自国企、事业单位、民企、外企与社会组织等社会主体的数据集虽然也开始在数据开放平台上出现,但总体开放数量仍然很低。
在数据质量方面,数据质量直接影响用户对开放数据的利用体验,甚至关系到公众对于政府的信任程度,是决定开放数据价值生成的关键因素之一。高质量的数据有利于释放政府开放数据的价值,赋能数字经济与数字社会的发展。但总体看,目前各地开放数据仍然普遍存在生硬格式转化、碎片化、低容量、高缺失等质量问题,部分数据集名称表述不够清晰或文字过长、过于复杂,难以被用户理解。同时,在数据集持续更新方面,已经开放的数据集的持续更新比例较低。
(四)数据利用成果初步显现,但对经济社会的赋能成效仍然不足
数据利用成果是数据开放的成效,数据开放的目的在于促进社会和市场对公共数据的开发利用。近些年,各地组织了丰富的促进开放数据利用的活动,如线上征集数据需求、线下组织推广宣传活动、组织开放数据创新应用大赛等,对扩大数据开放影响力、提升社会数据利用参与度具有重要作用。然而,由于各地已开放数据集的社会需求度低,导致大部分开放数据并未得到充分利用,社会主体利用开放数据产出的优质成果数量较少。
虽然各地平台为数据利用成果提供了展示的页面,成果形式包括服务应用、数据可视化、研究成果和创新方案等多种类型,但目前各地的开放数据利用成果以初级服务应用与创新方案为主,其他类型的利用成果数量仍较少,且已有利用成果对数字经济、数字社会和数字治理的赋能作用有限。
综上,目前我国公共数据开放利用仍存在不充分、不协同、不平衡、不可持续问题,公共数据资源供给与社会需求之间存在较大差距,市场和社会对公共数据的需求尚未得到充分满足,各地公共数据的供给侧与需求方之间尚未形成有效、互信、可持续的价值共创生态。在供给侧,主要表现为公共数据开放的数量少、容量低、颗粒度粗、质量不高、数据更新不及时甚至无故“断供”、平台运营服务不稳定等问题;在需求端,则表现为公共数据利用主体和利用方式单一,有效的数据利用成果数量较少。
三、我国公共数据开放利用体系与能力存在的短板我国公共数据开放利用工作的可持续发展离不开深层次的数据开放利用体系与能力的支撑,但目前这方面仍存在一系列短板与瓶颈。
(一)公共数据统筹管理体系与能力仍需提升
在公共数据开放利用过程中,主体更多元、客体更多样,相互之间的互动关系极其复杂。长期以来,我国的政务数据化是以部门为中心展开的,由于数据技术、条块分割体制等限制,各级部门之间的数据网络往往自成体系,数据大都处于割裂和休眠状态,而公共数据开放利用对政府内外部的数据统筹管理体系与能力都提出了更高更新的要求。
当前,一方面,政府在内部体系中进行跨层级、跨部门、跨地域的公共数据统筹管理的体系与能力仍然不足,导致各地各部门公共数据开放利用工作缺少联动协同,开放平台之间未充分实现跨层级跨地域连通,开放的数据在内容和标准上也存在明显差异。公共数据开放后形成的利用成果也大多局限于本地范围或单个领域,跨地域跨领域的高质量深度利用成果很少。另一方面,政府与市场、社会主体之间尚未形成有效的公共数据开放利用的协同体系与生态,严重制约了公共数据开放利用深度和广度的拓展。
(二)公共数据赋能经济社会发展的能力有待加强
数字经济的发展离不开公共数据要素的支撑。公共数据开放利用是将公共数据资源转化为生产要素,进而释放出其经济社会价值。公共数据只有向市场主体开放并被其充分利用,才能使数字创新成为可能,进而赋能产业数字化转型和培育新模式新业态。然而,当前各地公共数据开放利用工作对数字经济的赋能作用不强。在数据供给端,由于存在政策法规不健全、开放意愿不足、组织推进乏力、回应能力缺乏、安全顾虑重重等问题,导致数据开放工作整体进展缓慢。
目前,各地公共数据开放更多侧重于无条件普遍开放的形式。通过这种方式开放的公共数据具有较高的普惠性和公益性,但往往经济价值不高。而具有较高商业价值的公共数据又往往因为具有较高的敏感性或安全风险,难以被开放出来并得到有效利用。部分地方虽然已通过有条件开放、数据沙箱等方式探索高价值公共数据开放路径,但往往会基于安全考虑设置了较高的获取门槛和条件,导致真正能够获取这些数据资源的社会主体少之又少。而且,目前各地公共数据开放利用的对象更多针对国有企业或大型民营企业,而中小微民营企业或创新团队获取公共数据的难度很大。在数据需求侧,虽然市场和社会主体对公共数据的需求不断增加,但也由于缺少对公共数据的采集背景和政府业务逻辑的准确理解,导致即使存在较好的数据开放利用的创意思路,最终却较难落地,甚至可能出现误用数据的情况。
除数字经济领域外,公共数据开放利用还有助于通过降低社会组织和公众利用公共数据的门槛,提升政府、市场与社会多元主体之间的协同合作,打造“共建共治共享”的社会治理格局,提升公共服务和社会福利水平。然而,当前公共数据开放利用工作对数字社会的促进作用还明显不足,向社会组织、科研机构和普通公众开放公共数据的能力还远低于社会期待。
(三)公共数据开放利用的生态体系尚需培育
在公共数据从开放利用到创造价值的过程中,政府、数据利用者、普通公众和外部环境的作用缺一不可。这些因素共同决定着开放数据的最终效果,构成了开放数据的“生态系统”。政府、企业、从数据和应用中受益的个人或组织是政府数据开放生态系统的主要利益相关者,政府政策和制度、政府数据管理和利益相关者参与是生态系统创造和发展的基础或条件,外部的社会、经济、技术、文化环境对开放数据是否有利也是生态体系的重要影响因素。
目前,公共数据开放利用的生态体系仍需进一步培育壮大。总体上,生态系统中各类利益相关者各自发挥不同的作用,并能从开放数据中获取价值,对生态系统至关重要。但目前,各地对公共数据开放利用生态系统的理解仍存在偏差,缺乏系统性的生态系统培育措施,更多关注于数据开放主体,而对数据利用主体、数据服务主体与社会公众的关注和支持不足。
四、公共数据开放利用的推进路径为解决上述问题,急需不断加强我国公共数据开放利用的体系与能力建设,解决“为了谁”“加强谁”和“依靠谁”等问题,有效促进公共数据在政府、市场和社会多元主体之间实现畅通大循环,充分释放公共数据的潜在价值。
(一)明确公共数据开放利用以赋能经济和社会发展为目标导向
进一步明确和强化公共数据开放利用是“为了谁”的问题,加强公共数据赋能数字经济和数字社会发展的体系与能力建设。不同于市场数据,公共数据是公共管理部门和机构在履行行政职能过程中采集和生成的公共资源。公共数据“取之于民”,也应当“还之于民”。政府应从用户需求出发,及时获取用户反馈,从供给导向转向需求导向,从以政府自身视角出发开放数据转变为从用户视角出发开放数据。
公共数据开放应尽可能降低各类市场和社会主体获取公共数据的门槛,使相对弱势的组织和个体也能平等获得和利用公共数据,共享公共数据开放的红利,营造普惠包容的公共数据开放利用生态。公共数据开放利用,一方面有助于赋能数字经济和社会的发展;另一方面,数字经济和社会的发展也会生成新的数据,进而反哺公共数据的“水池”,形成公共数据在政府、市场和社会多元主体之间的多向大循环和价值共创闭环。
(二)强化公共数据统筹管理和运营服务能力
明确政府在公共数据开放利用中的职责,解决“加强谁”的问题,强化政府对公共数据的统筹管理和运营服务能力。在宏观层面,应从数字化发展的目标出发,加强国家层面公共数据开放利用工作的基础制度建设,制定相关法规政策和标准,明确公共数据开放利用的原则、框架和战略,为各地推动公共数据开放利用赋能。地方政府应在守牢安全底线的前提下,提高公共数据统筹管理能力,顺应新一轮科技革命和产业变革趋势,通过公共数据开放利用助力数字化发展。
在微观层面,各地各级政府需要不断提升公共数据的运营服务能力,创新运营服务方式。为解决公共数据的供需矛盾,需要进一步探索公共数据授权运营这一供给模式,在保护个人隐私和确保安全的前提下,引入第三方主体,利用其专业能力深化对公共数据的挖掘利用,并以产品和服务等形式向社会开放,满足社会对公共数据的利用需求,尽最大可能释放公共数据的经济社会价值。
(三)构建多元主体参与的公共数据开放利用协同体系
解决公共数据开放利用“依靠谁”的问题,要构建政府、市场和社会多元主体参与的公共数据开放利用协同体系。公共数据开放的主体不仅是政府,仅靠政府内部组织之间的协同不足以支撑和保障公共数据开放利用工作的推进。需要政府、企业和社会等多元主体协同参与,构建一个包含行动者、组织、基础设施及关键资源的相互依赖的社会生态系统,以增加实现特定管理和政策愿景的可能性。协同性是数据开放生态系统的重要特征。各级政府应以系统和动态的思维来推进公共数据开放利用工作,充分考虑整个生态系统的复杂性和可持续性,实现开放数据工作的良性循环。
当前,公共数据开放利用水平较低的原因还在于政府开放数据的复杂性与非技术背景的公民数据能力之间的矛盾。公共数据的开放是一个高度专业化的工作,需要同样高度专业化的能力与之匹配。公共数据供给侧需要根据用户需求便捷、高效、安全地开放数据,这是开放数据效果实现的前提;数据利用方的利用能力包括数据搜索能力、理解能力、分析和利用能力等,也将影响开放数据的实际效果。因此,要构建和提升有利于实现公共数据在政府、市场和社会多元主体之间开放循环和充分利用的体系与能力,以充分释放公共数据要素的社会经济价值。
(本文原载于《经济纵横》2024年第1期,编发时有删减)
引用格式:郑 磊,刘新萍.我国公共数据开放利用的现状、体系与能力建设研究[J].经济纵横,2024(1):86-92.
责任编辑:张佳睿
网络编辑:刘维刚