查看原文
其他

简议《上海市公共数据开放实施细则(征求意见稿)》—— 对征求意见稿的反馈和建言

开放数据小编 开放数据中国
2024-09-17

作者 高丰,开放数据中国

2022年9月13日,上海市经济和信息化委员会发布了《上海市公共数据开放实施细则(征求意见稿)》(参见[意见征求] 《上海市公共数据开放实施细则(征求意见稿)》)对公众正式征求相关修改意见。

总体而言,上海自2011年起一直属于国内政府数据开放的领军城市,在此版《细则》里,针对「有条件」开放的「样本数据集构建」、更为明确细化的「有条件申请流程」、对数据开放总体操作流程的明细程度都是值得称赞的。

开放数据中国结合国内外趋势及当前中国数据要素治理的变化,针对实施细则再进一步提出一些可能的修改方向,供参考。也欢迎各界朋友的意见交流。

1.基于隐私计算等新数据交付方式对公共数据开放定义的再思考

当前《细则》所采用的公共数据开放的定义是延续了《上海市公共数据和一网通办管理办法》、《上海数据条例草案》中的定义,即:

「第三条 定义

本办法所称公共数据开放,是指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。」

上述定义所约定之「原始性」是遵循开放数据的官方定义而延续至今的,但《细则》第二十一条,关于「数据交付」中提及:

「第二十一条  数据交付

鼓励探索利用隐私计算、联邦学习、数据沙箱等新技术、新模式进行数据交付。」

此处要思考的矛盾点是:当我们在数据开放交付中允许采用非原始下载或接口模式供给时,即考虑引入隐私计算等会对数据的「原始性」带来某种特性变化的技术时,是否还有必要将「原始性」列为数据开放必要特征?

而从另一角度考虑,当我们坚持数据开放「原始性」时,我们的根本诉求是什么?是为了规避对数据的多道加工从而使得源头采集的数据被加入过多后置的人工解读,或损失过多负载的信息。那么当我们通过技术手段去使得「数据可用不可得」时,如果数据使用者对所输入的开放数据的质量和信息准确性等有所质疑,那么我们的数据开放制度如何从机制上有效保障数据使用者可以对隐私计算等新型交付方式予以「反向质询」

2. 明确并强化「场景/问题为导向」

在2010年起,国际开放数据宪章在推动全球政府拥抱数据开放过程中新增了一项重点策略,即「Publish With Purpose」(直译为:带有目的地发布数据),其理念是针对政府所希望迫切解决的「问题」/「场景」,系统性地规划跨部门所应当开放的一组数据,从而有效助力社会创新。

在2018年开放数据中国针对《上海市公共数据和一网通办管理办法草案》的反馈意见中(参见:「公平透明、动态渐进」——建言《上海市公共数据和一网通办管理办法草案》),我们当时已提出应当在开放数据的工作原则中将问题(或称为场景)与需求并列,共同指导数据开放工作。


在本版《细则》中,我们看到所搭配的政策解读的长图中在「开展需求征集」中特别提到:「加强场景规划和牵引」,因此我们认为应当在《细则》正文中「第四条」添加「场景导向」

「第四条     【工作原则】

本市公共数据开放利用工作坚持创新驱动、场景和需求导向、公平公开、安全可控、分级分类、统一标准、便捷高效、流程规范的原则。」

相应可搭配在各部门推动梳理各自开放年度清单时,能够基于「场景」的思考,去考虑应该优先释放哪些数据?以及哪些数据可以搭配已经开放的,或需要协调其他部门同步本年度计划开放,从而可以共同攻克统一目标场景的?

当然,相关联的是围绕「场景」所带来的数据敏感性、重要性的差异,也会带来数据交付方式的差异,围绕场景系统性规划数据开放,也将更有效助力如何思考数据交付方式并保持「场景」相关的数据的交付方式一致性,这将有效帮助数据使用方避免应对多样异构的数据交付模式而带来工程复杂度。(关于这一点,也建议参考我们前述所谈及的开放范式的变化:高丰:AI时代「开放」数据的三大范式变化

3. 让数据开放惠及「中小企业」

数据开放是为了驱动数字创新,而在这个过程中如何让中小型科技企业能够真正从中受益是一个关键问题。《细则》二十七条也专门指出:

「 第二十七条  【创新利用方式】

本市鼓励对开放公共数据进行价值挖掘和开发利用,支持数据利用主体对开放数据进行实质性加工和创造性劳动后形成的数据产品进入流通交易市场,依法保护数据利用主体在数据开发中形成的相关财产权益。

本市鼓励不同规模、不同行业和不同所有制企业参与公共数据开放利用,引育数据专精特新企业,发展技术先进、主体多元、创新活跃、生态完备的数据产业集群。」

而在当前的有条件数据开放机制设计上,我们建议针对不同阶段的中小型科技企业,差异化评估数据申请,提供数据交付:

目前在《细则》的第十五条中,针对开放条件列举了:「使用场景要求」、「数据安全要求」、「数据利用反馈要求」、「技术能力要求」等,我们建议在具体指导各个部门设定开放条件及开展申请审核时,应当针对科技企业的不同发展阶段予以酌情的差异化处理即落实到考虑公平公正时,我们可能要追求的不仅是「平等」,而更要求「公平」,从而使得中小企业能够够得到各类要求

在现实中,数据安全要求、技术能力要求等很容易被转化为生硬的「资质要求」,而「资质」恰恰会成为初创企业在申请数据过程中的拦路虎。是否可能在通过开放平台及开放主体的联合努力下,可以通过差异化的数据交付方式如「仅提供富样本实现企业创意可行性验证,进而进一步考虑如何交付全量数据」、「采用沙箱交付数据进行严监管从而降低对企业自身安全能力的要求」

总结

上述仅为对《细则》的一些初步建议,从总体来说,正如开篇提及的,《细则》已经在多方面有所创新,并在国内领跑。但具体到实施,可能还会面临真正在落地过程中的不确定性和各类实际的困难,比如《样本数据建设》可以预期就会是一个落地中不那么简单的工作,如何使其即是真正可以被数据使用者使用的样本数据而同时又不给开放平台和开放主体带来过大的工作量,就会是一个很现实的难题

另一方面,《细则》作为数据开放的具体落地指导文件,在应对未来会被引入的公共数据授权运营(参考:我们理解的公共数据授权经营 | 简议《上海数据条例草案》)上似乎还未做太多的设定。未来两种不同制度如何很好地实现互补,从而最大化政府公共数据流动,惠及社会面创新,也是《细则》将迎来的一项挑战。


# 相关阅读

[意见征求] 《上海市公共数据开放实施细则(征求意见稿)》

我们理解的公共数据授权经营 | 简议《上海数据条例草案》

「公平透明、动态渐进」——建言《上海市公共数据和一网通办管理办法草案》

高丰:企业如何用好公共数据开放政策

高丰:AI时代「开放」数据的三大范式变化

继续滑动看下一个
开放数据中国
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存