韩若凡|数字法治政府建设背景下政府数据开放的实践考察与完善进路——以成都市公共数据开放平台为例
(一)政策导向下政府数据的开放目的
(二)政府数据的概念廓清
政府数据是政府数据开放的客体,然而政策文件中却同时出现了“公共数据”“政务数据”“政府数据”这几种相近的表述,造成概念之间的含混。理论界对于政府数据的界定也有所差异。有学者认为,政府数据与政务数据、公共数据是同义词,指的是政府在履行职责的过程中制作或者获取的数据。也有学者将政府数据与公共数据进行区分,认为二者的差别在于数据主体不同,前者主体为各级政府及其职能部门,而后者主体则是政府或者公共机构。有学者则认为二者的差别主要体现在行政主体自身产生的内部政务数据不属于公共数据的范畴。另有学者认同政府数据与政务数据内涵相同,与公共数据内涵有所差异的同时,扩张了政府数据的外延,认为政府数据是行政机关与授权组织进行政务管理或服务时产生或收集到的与其组织、行为相关的数据总和。
根据国际标准化组织的定义,数据是指可以由人工或者自动化方式进行通信、转移或加工的某种概念、事实、指令的特殊表达形式。关于数据的定义不存在异议。而“政府数据”这一概念相比于“数据”添附了“政府”二字,因此其概念的廓清实际上涉及两个问题:一是如何认识政府数据中政府的范围,二是政府与数据的关系。
首先,在政府的范围上,根据外延的大小不同,理论上有广义、中义和狭义三种认识。狭义的政府仅包含各级人民政府及其职能部门;中义的政府指的是行政机关以及根据法律法规授权或委托的具有行政管理职能的组织;广义的政府则是在狭义的政府基础上加上与政府存在合作关系的社会组织或市场主体。本文认为,宜采用中义的政府范围。狭义的政府范围导致政府数据的范围过于狭窄,具有行政管理职能的组织所享有的行政权力来源于行政机关的授予或委托,其在行使行政权时所收集到的数据本质上也属于狭义的政府数据,因此,应当将具有公共管理职能的组织数据纳入政府数据的范畴。从开放共享这一目的来看,采取广义的政府范围忽视了这些同政府存在合作关系的社会组织或市场主体的成本,可能导致他们的利益受到损害。故不宜过大界定政府的范围。
其次,在政府与数据的关系上,有生产、收集、管理、获取、加工、保存几种关系类型。本文认为,是否属于政府数据的范畴,应当判断政府是否拥有该数据或实际控制该数据。随着数字政府建设的逐步深入,政企合作发展起来,政府可能向市场主体购买数据。因此,不论是生产、收集还是加工、保存,这些界定方式均存在局限性,或随着政府数据获取方式的创新而随之改变。而拥有与控制则更接近政府与数据的关系本质。
因此,政府数据指的是行政机关以及根据法律法规授权或委托的具有行政管理职能的组织通过生产、收集、管理、获取、加工、保存等方式拥有或控制的数据。
(三)政府数据的公物属性
政府数据能够开放、应当开放的法理与逻辑建立在政府数据的公物属性之上。由于政府在获取数据中所处的特殊地位,他们在数据使用上往往效率很低。因此,为实现社会效益最大化,政府应当通过数据分级与开放将国家所有的数据交由公众使用,以实现将数据作为生产要素的目的。大陆法系上公物与私物的划分以物的功能与用途为划分标准,把服务于公共目的或为实现公共利益而供公共共同使用的物称为公物,把服务于私人目的或为实现私人利益而使用的物称为私物。公物又有公用公物与共用公物的划分,前者特指行政主体供其内部所使用的物,而后者是供民众共用的财产。本文中将政府数据称为公物,指的是共用公物。也有学者从财产与公共利益的关联程度、财产开发利用的负外部性以及规制执行成本为公物与私物建立了更为细致的区分标准。不论采取何种标准,政府数据均满足公物的成立条件。
关于政府数据的权属,不同地区出台的数据规范作出的权属规定并不统一。例如,《河北省政务信息资源共享管理规定实施细则》(2019)第4条第2款规定政府数据属于政府所有;《广东省政务数据资源共享管理办法(试行)》第4条也有类似规定。《福建省政务数据管理办法》第3条指出政务数据归国家所有。《重庆市政务数据资源管理暂行办法》第4条也采取国家所有的数据权属界定模式。然而,政府数据既为公物,应为国家所有。原因在于,其一,政府数据开放的目标是提供更加优质的公共服务和实现公共利益,政府数据国家所有能够避免私主体通过数据私有化控制支配市场,阻碍市场自由。政府数据国家所有有利于发挥国家在数据流通中的主导作用,防止数据资源的闲置或滥用。其二,政府数据本质上均来自个人数据,其正当性源于数据的采集目的。政府作为国家机关,代表国家收集个人数据并形成数据的所有权,不仅有利于政府数据公共价值的实现,提升社会福利,还不阻碍公民对政府数据的自由获取,有助于政府数据的社会化利用。
三、实践考察:数据开放的现存问题
根据《2022中国地方政府数据开放报告》,我国现有74.07%的省(不含直辖市)和55.49%的市(包括直辖市、副省级与地级行政区)上线了政府数据开放平台。其中,四川省的数据总量、有效数据集总数在全国居于第二位,其中可供分析的数据样本容量充足。在现有的数据开放平台中,最为基层的是市一级数据开放平台。因此,本文以成都市公共数据开放平台为考察对象,通过数据分析,指出当前政府数据开放的现存问题。
(一)内容:信息生态中的用户参与驱动不足
从政府信息公开走向政府数据开放,过渡与转向的内核是制度功能与目标定位的转变,即从增强政府的透明程度,到释放数据资源在经济发展和社会治理方面的潜能。从工具主义的视角出发,政府数据开放是为了方便市场主体对政府公开的原始数据进行开发、加工、创新和利用,以设计出更多创新性的产品和服务。从这个意义上来讲,政府开放的数据并不是越多越好,而应当切合公众的实际需求,尽可能地开放与公众相关、公众所需的数据。因此,政府数据开放在数据的范围与类型选择是否能够回应和满足公众对数据的关切和需求成为数据质量的评价标准。而公众对数据的关切和需求能够通过数据开放平台的公众参与程度予以量化。
首先,平台的公众关注程度以及公众参与概况。成都市公共数据开放平台于2018年6月开放,截至2023年10月4日,成都市公共数据开放平台访客总数为5445350次,所有注册用户中,共有350个企业用户,占比3.38%,10014个个人用户,占比96.62%。从平台访问数据上能够初步反映出平台的公众关注情况。平台设置了互动交流板块,用户可以在该板块中表达数据需求,提供内容建议,反馈问题,进行数据纠错,或进行咨询提问。根据平台公开的数据,用户在该平台上提出的需求均已获得回复。
其次,从数据主题的下载数量能够体现出公众对开放数据领域的偏好。通过对比平台上政府开放数据最多的领域与公众最为关注的领域的符合程度可以在一定程度上反映出平台开放的数据对公众数据需求的回应情况。公共数据开放平台上开放的热门数据同公众需求吻合程度不佳。一方面体现在数据数量前十所涉及的领域与其相对应的用户下载情况所涉及的领域排序存在较大差异;另一方面则体现在数据最为开放的领域并不切合用户需求。
(二)程序:数据公开应当加强隐私加密保护
政府所拥有和控制的数据资源与公民个人及其行为相关,政府数据开放与个人信息保护之间存在着天然的张力。从保护个人信息的面向出发,政府数据开放可能会给公民个人隐私带来严重威胁和泄露风险,应当在开放的数据当中对涉及个人隐私的部分作删除或加密处理,保护公民的个人信息合法权益。从政府数据开放的面向出发,只有扩大数据开放、促进数据再利用,才能充分发挥数据的作用,创造社会价值。根据价值与功能导向的不同,个人信息保护与政府数据开放对数据分别展现出收与放两种态度。因此,在开放数据时,应当注意对个人隐私的保护,在促进数据利用与保护个人隐私之间寻求平衡。2021年4月,全国信息安全标准化技术委员会发布《信息安全技术个人信息去标识化效果分级评估规范》(征求意见稿),2023年3月,国家市场监督管理总局、国家标准化管理委员会颁布《信息安全技术个人信息去标识化效果评估指南》,根据标识度不同对个人信息进行分级。在政府数据开放领域可以参照该标准,不予公开并注重保护1级(能直接识别主体的数据)与2级(消除直接标识符的数据)数据,3级(重标识风险可接受数据)与4级(聚合数据)数据可以准予公开。
成都市公共数据开放平台设置了权益保护反馈窗口,当用户认为开放数据侵犯其商业秘密、个人隐私等合法权益的,可以通过此页面功能告知数据开放主体,并提交相关证据材料。开放主体会根据核实结果,分别采取撤回数据,恢复开放或者处理后再开放等措施,最终反馈给用户。对平台的数据进行抽样调查,发现“成都供电公司维修信息”这一数据集中包含成都供电公司的维修受理时间、所属单位、姓名、电话、工单号、故障地址等内容,在开放的1001条数据当中,大部分姓名仅保留姓氏,存在少量维修数据保留了姓名全称的不规范情况。同时,所有维修地址均未作删除或加密处理。详细住址涉及个人隐私,却暴露在公众视野之下。根据《信息安全技术个人信息去标识化效果评估指南》,详细住址结合姓氏很可能被列为1级信息数据。由此可见,平台上开放的数据在隐私保护方面仍有待加强。
(三)主体:不同地区公开主体存在较大差异
对成都市公共数据开放平台所有数据的开放目录清单为样本进行数据统计,成都市以及下辖各市、区、县均有数据开放。对数据开放目录中的条目数量进行汇总,可以直观地看出不同地区的数据开放体量。
其中,成都市的开放数据体量最大,其余23个地区开放数据体量相差不大。进一步考察平台中各地区开放的数据来源,即数据的提供部门数量如下图所示。
可以看出,该平台上不同地区的数据来源情况存在较大差异,其中,成都市的开放数据来源部门数量为60个,数量最多;东部新区的开放数据来源部门仅为一个,即东部新区综合部。除东部新区综合部这一特殊情况外,相对而言,开放数据涉及的部门越多,则数据类型越丰富;开放数据涉及的部门越少,则数据类型越单一。可见不同地区的数据开放主体差异程度较大,没有较为一致统一的数据开放部门标准,具有随意性。
另外,根据成都市公共数据开放目录清单中不同数据开放条目的更新周期情况,平台开放的数据共存在实时、不定期、每日、每月、每周、每半年、每季度、每年8种不同的更新频率。在平台公开的全部7087条数据项目中,仅更新频率为不定期的就有3975条项目,占比56.09%。2022年6月,成都市《成都市“十四五”新型智慧城市建设规划》颁布,平台数据数量呈现井喷式增长,仅2022年一年开放的数据就占全平台数量的70%。由此可见,虽然成都市数据开放平台自2016年推出以来已经有5年多的建设历程,但数据开放工作却仍处于起步阶段。在公众参与、个人信息保护与开放主体方面仍有待完善。
四、政府数据开放的推进方向与完善进路
(一)以需求为导向选择开放数据内容
首先,以“信息生态”为理论基础,政府开放的数据内容应注重回应公众需求。F.W.Horton从生态学中生态系统的研究视角看待信息流动与信息交换,在1978年首次提出“信息生态”的概念。政府数据开放的价值与目标在于通过释放数据这一数字时代的关键生产要素打造数据市场,并在数据流动与数据再利用过程中释放数据价值。从功能主义的视角看待政府数据开放,数据能够被社会主体高效利用的前提是数据开放与需求的切合。基于此,在政府数据开放内容的选择上,政府数据开放主体与数据需求主体,即公共平台与公众之间存在着互动关系,使得政府数据开放并非政府单向性的行为,而是与个人、市场主体等社会数据需求方形成双向交互的系统性联系。引入“信息生态”的研究视角,在政府数据开放这个信息生态系统中,平台与公众作为要素同时存在,政府以公众需求为导向和驱动力选择平台上数据开放的内容,公众利用平台上的互动、交流、反馈板块表达对数据内容的需求,在开放与需求连续的信息交换之中,形成政府数据开放的良性循环,以促进政府数据开放价值与功能的实现。换言之,政府数据开放生态系统的良性循环以平台与公众之间的畅通沟通为前提。
其次,以数字法治政府意涵中的服务型政府建设为导向,政府数据开放需要保障公众参与。从上文对成都市公共数据开放平台的考察可以看出,虽然表面上数据开放平台的访问量与用户数量级表现良好,但细致考察平台上的公众参与情况,成都市公共数据开放平台相较于访问总量处于同一量级的上海市公共数据开放平台公众参与情况不佳。服务型政府是现代行政国家普遍遵循的价值理念与政府定位,要求政府将提供公共服务作为主要职能,以保障民生为工作重点,以人民满意为价值追求,通过一系列行政手段不断满足公众需求。2022年国务院颁布《关于加强数字政府建设的指导意见》指出,“加强数字政府建设对转变政府职能,建设法治政府、廉洁政府与服务型政府意义重大。”政府数据开放作为数字政府建设的重要内容,需要重视公众参与。具体而言,可以借鉴上海市公共数据开放平台的经验,在成都市公共数据开放平台上建设讨论区,在保留现有问答参与模式的同时开放更多互动交流形式,鼓励公众参与。
最后,以政府信息公开到政府数据开放的转型过渡为指引,政府数据公开应当及时收集公众反馈。从“公开”走向“开放”,两种制度的原则、范围等方面均有改变。政府数据开放实行的是需求导向原则,而政府信息公开遵循的是公开原则。在范围上,相较于信息公开,政府在数据开放上拥有更大的灵活性与自主权。因此,政府数据开放应当更加注重双向度的数据反馈,不能够遵循旧有思路公开了之。在对成都市公共数据开放平台的考察中,根据平台2022年年报,平台引入了智能问答,回答用户反馈的问题或意见、建议,能够做到事事有回复。但回答的内容较为简短,对于公众申请公开的数据公开情况没有进一步反馈,回答质量有待提高。可以尝试引入生成式人工智能,为用户的数据查找需求提供交互式的指引,为公众创造更为便利的数据获取体验。
(二)完善全周期的个人信息保护机制
规范层面,完善个人信息处理与运用规则。在政府数据开放领域,各地区的地方性法规或规章在促进政府数据开放的同时多对个人信息保护作出规定。以成都市数据条例为例,其中明确指出要建立数据安全责任制,加强数据流通中的个人信息保护。在数据的收集方面规定合法、正当、必要原则,限制个人生物识别信息的收集,并对突发事件中的个人信息收集作出特别规定。在依法委托私主体维护与管理数据开放平台方面,规定应当使其明确信息安全保护义务并签订保密协议等内容,从宏观层面强调了对个人信息的保护。在数字法治政府的建设进程中,随着数字技术辅助行政决策的实践增多,同时考虑到法律规范的概括性、抽象性与稳定性,技术规则逐渐受到重视,发展为与法律规范并重的重要指引。因此,在政府数据开放领域,各地数据主管部门可以借鉴《信息安全技术个人信息去标识化效果评估指南》中对于个人信息涉及隐私程度的评级标准,探索制定符合本地实际的数据处理细则,在数据的收集与公开全流程中完善匿名化、加密等数据处理与监督标准。
技术层面,加固平台数据库风险防御外墙。常用的个人信息保护手段即对识别性强的隐私信息化匿名化处理。匿名化虽然能够有效保护个人信息,但仍然存在“去匿名化”技术可能对个人隐私造成严重威胁的剩余风险。对此,有学者指出,应当在立法层面明确禁止信息去匿名。在技术层面,应当建立对于去匿名风险的防控机制,并将监管落实在政府数据开放从数据收集、数据处理到数据开放共享、数据利用反馈的全生命周期。自2012年上海市上线了全国第一个政府数据开放平台以来,实践至今,全国绝大部分省市已经建立了地方数据开放平台。但基于不同地区技术水平存在差异,部分地区数据库的风险防御能力较弱。实践中,政府数据泄露共存在恶意攻击、意外泄露与无意泄露三种原因。其中,恶意攻击导致数据泄露的原因比重最大。鉴于此,不仅要在技术上加强平台的风险防控能力,还要定期对平台上开放的数据进行检查,发现不当公开的隐私信息及时进行删除或加密,而不是被动地等待平台用户进行反馈。
理论层面,构建全周期的个人信息保护机制。鉴于个人信息在政府数据开放制度中的公共性面向,在数据收集段,应当避免重复收集,在身份信息、手机号码等足以识别身份的,不必采集生物信息。在数据开放后,政府数据开放情境下的个人信息删除权理念应当更新,赋予公民个人信息删除权,允许权利主体对涉及个人隐私的信息请求删除,只需要提供数据开放侵权的初步证明即可,相应的数据提供部门应当对该请求进行合理审查,作出删除与否的决定。在数据使用端,“经设计的隐私”起源于美国执法实践,指的是数据使用者应当履行数据的安全保护义务,包括前端的产品开发与后端的数据管理,个人信息保护应当纳入使用、处理数据的全流程。因此,数据使用者应当提供相应的数据使用中个人信息的保护策略,并接受数据的监督主体随时的监督。
(三)规范多元主体的协同数据开放体系
政府数据开放应当加强多主体协同。经过考察,成都市公共数据开放平台中各区县的数据来源部门存在较大差异。政府所拥有与控制的数据来源包括政府机关,法律法规授权组织,医疗、环保、交通、教育等不同领域的事业单位,以及市场主体等。依据《关于推进公共信息资源开放的若干意见》,上述行政部门与事业单位都是数据开放的义务主体。从公共数据的利用角度看,行政机关、具有公共事务管理职能的机构、社会组织都有将自身产生、收集的公共数据,用于行政管理、公共服务、生产经营的权限。在中央层面,政府数据开放发布的政策多为联合发文,呈现主体协同趋势。地方层面,加强部门之间的数据开放合作与协同有利于提高数据质量,在平台上形成更为规范的数据集。
政府数据公开应当明确开放主体的权利义务。政府部门公开动力不足,导致公众获取和利用政府数据的成本较高。同一地区各部门的数据开放情况也存在显著差异。平台上公开的数据条目与更新频率等,也由数据开放主体自主决定,存在较大的任意性。《促进大数据发展行动纲要》要求厘清各部门在政府数据开放中的数据管理权利与义务。政府数据开放的完善路径,应当在重点公开的数据领域,更新周期与数据质量标准等方面明确公开主体的权责,避免主体义务与业务间交叉重叠。
结语
数据开放是数字时代背景下各国政府的普遍实践,也是各国理论界的研究热点。近年来,随着政策层面对政府数据开放工作的重视程度提高,我国政府数据开放工作正如火如荼地开展。截至2020年底,全国各省市共208个地区上线了公共数据开放平台。由于政府对数据的利用、处理与创新方面存在天然劣势,政府数据开放制度的目的与功能不仅旨在加强政府透明度,接受公众监督,更重要的是构建以数据为要素的数字化市场,释放市场活力,促进数据再利用与产品创新。成都市公共数据开放平台上巨大的数据体量与较为完善的平台建设使之成为政府数据开放现状研究的优质样本。通过对平台开设区域的考察,分析研究数据开放目录,并对开放的数据进行抽样调查,发现现阶段的政府数据开放仍然存在以下三方面问题:一是在内容上,信息生态中的用户参与驱动不足;二是在程序上,数据公开应当加强隐私加密保护;三是在开放义务主体上,不同地区的主体存在较大差异。政府数据开放应当以制度目的为导向,在开放的内容选择上更加契合社会公众的数据需求。由于政府数据公开与个人信息保护之间存在天然张力,基于个人信息的公共属性,应当在政府数据公开中为涉及个人隐私的信息建立程序上的涵括全生命周期的保护与监督机制。同时,为提高开放数据的质量,应当划清开放主体权责,加强多元主体之间的数据开放协同。
往期精彩回顾
刘玉林 刘昱|认罪认罚的自愿性及其程序保障——基于协商性的尝试与突破
耿妆群|论执行过程中失信惩戒滥用问题的应对——以构建信用修复制度为路径
邵文龙 夏晓明|劳动者的辞职权问题研究——以裁判文书网200篇判决书为样本
上海市法学会官网
http://www.sls.org.cn