建设“开放”的数据要素制度:数字经济和公共数据开放
Editor's Note
此篇为2月27日,高丰博士在邦信阳律师事务所所做分享的回顾。感谢邦信阳律师事务所对内容的整理和刊发。
The following article is from 邦信阳律师事务所 Author Boss & Young
引言:2024年2月27日,邦信阳律师事务所“邦培第535期”课程上线,本期课程由开放数据中国执行主任高丰博士主讲,由邦信阳律师事务所合伙人杜爱武、合伙人陈云开与谈。课程从数据要素市场发展的宏观背景出发,重点切入公共数据的开放流通问题,回顾并分析不同阶段国内外公共数据流通策略的变化、困境和机遇。本期课程内容由沈越律师、彭喜文律师整理。
主讲人介绍:高丰博士,开放数据中国执行主任 | 毕业于南安普顿大学 高丰博士是中国首个聚焦数据透明和权利的社会企业“开放数据中国”的联合创始人及执行主任。
“开放数据中国”,是中国第一个聚焦开放式数据要素流通创新和开放式数字治理的社会企业,旨在推进开放性的未来数字时代(Open Digital Future)。其主要工作在三大板块:「数字要素」「数字权利」「数字文化」。
一、数据的基本概念
(一)数据与信息之间的相对性
数据与信息是相对性概念。在不同的使用场景下,数据和信息的界限可能不同。随着技术的发展,机器可读性(Machine-Readable)的能力在不断提升,这将改变我们对数据和信息的理解。这意味着,在特定场景下信息也能转变为数据。
示例:从纸质课程表(信息)到课程表excel(数据)
“以纸质课程表为例,传统我们认为课程表扫描件/纸质课程表为信息,课程表扫描件上的结构化课程信息是数据。但如果我们今天的目标是训练一个机器视觉系统自动识别纸张上的内容,那么我们可能就需要将纸质课程表(这张照片)和课程表中课程安排数据两者都视为这个人工智能训练的训练数据。”
(二)数据存在多样、动态的价值路径
数据的价值路径是多样的。数据的价值路径,可以从单点数据的静态展示到批量数据的规律分析,再到知识凝练和预测规划。在这三种方式(静态展示、规律分析、知识凝练)上,同样一组数据在市场变现的过程当中,价值提供方式存在显著区别。
示例:公共交通数据的运用,单点-批量-凝练
“以公共交通数据为例,单点数据主要起到静态展示的作用,例如公交站台上对站点的显示;批量数据主要起到规律分析的作用,例如将城市所有的公交站点进行汇总;进一步扩大数据范围,并将其凝练到AI中,则能协助有效进行城市规划。”
(三)数据的复用性
数据的复用性也体现了数据在不同层次上的价值。初级产品和高级产品在数据市场中将发挥不同角色和价值。
示例:农产品一级市场与二级市场中,“磨坊”的促进作用
以农产品市场为例,将形成一级开发市场(低、中、高筋面粉、全麦面粉),进而形成二级市场(包子店、面条店、蛋糕店)。一级开发市场进展到二级市场,需要经过安全生产环境(磨坊)来进入到加工的过程。数据本身应当形成梯形市场规模。
回到数据交易的场景,在《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)中,以及近两年数据交易所的一些工作当中(例如,北京国际大数据交易所推动数据交易底层技术创新。针对数据权属界定不清、信息容易泄露等风险,运用隐私加密计算技术,将数据所有权与使用权分离,为供需双方提供可信的数据融合环境),都会涉及所谓的“数据可用不可见,用途可控可计量”。
因此,可以说,隐私加密技术等数据交易底层技术的创新,就像农产品市场中的“磨坊”,协助将原始数据规模化地加工成“面粉”,从而让数据能够共享到市场上,得到更好应用。
综上所述,在理解数据经济和公共数据开放之前,我们需要对数据的基本概念达成共识。数据的价值往往取决于其所处的场景和上下文,以及如何被分析和利用。在不同的市场和应用场景中,数据的价值和重要性可能会有很大的差异。
二、公共数据开放的定义及其发展
(一)公共数据的开放
公共数据即政府职能机构履行职责过程中所采集、管理的数据。原始的政府数据在颗粒度上相对粗糙,通常为大规模的统计数据。
然而,原始的政府数据往往并不能够直接达到公共数据开放的程度。公共数据的开放,仍需要回答“开放数据是什么?”“开放数据是怎么来的?”“开放数据和数据公开的区别?”“开放数据是如何被推动的?”四个问题。
其一,关于开放数据是什么?开放数据,是指任何人,不论目的,都能够自由获取、分享和使用的数据。
其二,开放数据是怎么来的?开源和开放,同宗同根。从最早的知识共享、wiki百科,到后来的开源软件、开源代码,数据开放是知识分子的浪漫主义开端。在境外,2010年起,伴随着“开放政府计划”(OGP),开放数据成为开放政府的一部分。
其三,开放数据和数据公开的区别?信息公开是开放数据的基底,开放数据是信息公开的一种自然衍生。信息公开解决知情权,数据开放解决使用权。在欧美体系下,从RIGHT TO INFORMATION转变为RIGHT TO DATA,开放数据是植根于政治逻辑的产物。
其四,开放数据是如何被推动的?开放数据通过文化与权利、政治与法律、市场与经济、技术与伦理的交融,不断向前发展。
(二)中国在数据开放上的实践
中国在数据开放方面经历了研究、引进、本土实践和异化等阶段。上海是中国最早开始信息公开试点的城市,具有独特的法律环境。2010年,上海市委要求开展政府数据开放的专项调研,调研肯定了上海走上开放道路的基调。上海将数据开放作为信息公开的延伸来实验性开展工作,通过上海开放数据应用创新大赛(SODA)等活动,推动了数据的开放和应用。
示例:上海开放数据应用创新大赛(Shanghai Open Data Apps,“SODA”)
上海开放数据应用创新大赛,是一个政府-社区间的协作比赛,实验性地有条件地解锁数据,从而使得数据应用效果能够通过比赛体现,反向论证引导开放。大赛落地的亮点包括“2016年废弃油脂回收数据+食品安检数据+大众点评数据打造[食安大看板]”以及“摩拜单车+地铁站数据打造[单车治理平台]”。
(三)数据开放的新挑战以及“开放的异化”
然而,自2019年起,数据开放在中国面临了新的挑战。“开放数据”单纯走入经济逻辑,使数据开放过分强调“回报”和“可带来的成效”,而不再讲究责任。
在此背景下,政府数据更多地提供给了能够给政府支付较高经济回报,或者协助政府进行社会利益最大化的主体(通常为规模成熟的企业),一些无力支付前述回报的中小型开发者或者企业在此过程中失去了话语权。因此,可以说,需求层次决定了开放的落地,人们在没有数据可用的背景下,对数据的开放性并无太高的追求和理解。对于有数据开放需求的企业主而言,此时数据质量已经不再重要了,能否获得相关数据内容才是关键。
因此,人们对数据的需求层次仍停留在“可访问”与“可获取”阶段,而好用、可信和共益数据有所缺失。数据在社区、反馈闭环与公共利益中获得治理,作为一种理想主义的追求,未能很好地得到体现。
(四)“开放数据”定义的再梳理
数据开放的价值在数据语境中出现了错位。原本的“开放数据”被重新定义为无条件开放数据和有条件开放数据。这导致了公共数据市场的进一步孤岛化。
示例:无条件开放数据与有条件开放数据的重分类
自2019年出台的《上海市公共数据开放暂行办法》起,所有上述政策文件(包括但不限于《贵阳市政府数据共享开放条例》《沈阳市政务数据资源共享开放条例》《贵州省政府数据共享开放条例》等等)均在数据开放框架下引入了“无条件开放(或称普遍开放)、有条件开放(或称受限开放/依申请开放)和禁止开放”3类分类体系。遵循此体系,各地方也已在数据开放门户中按无条件和有条件区别式提供数据(引自:复旦大学数字与移动治理实验室.中国地方政府数据开放报告——省域指数(2022年度)[R]. 2023.)。有条件开放的引入,使数据流通行为上限延伸至覆盖数据对外流通(即宽松定义的数据开放)的全光谱行为。(引自高丰.厘清公共数据授权运营:定位与内涵[J].大数据,2023,9(2):16-32)
示例:《上海市公共数据开放暂行办法》对“公共数据”及“公共数据开放”的定义
《上海市公共数据开放暂行办法》(上海市人民政府令第21号,2019年10月1日实施,以下简称“《上海市公共数据开放暂行办法》”)第三条:“本办法所称公共数据,是指本市各级行政机关以及履行公共管理和服务职能的事业单位(以下统称公共管理和服务机构)在依法履职过程中,采集和产生的各类数据资源。
本办法所称公共数据开放,是指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。”
结合《上海市公共数据开放暂行办法》以及其他相关规定,有条件地开放数据主要在于3个方面。其一,谁能去访问是有条件的;其二,数据的使用场景是有条件的;其三,数据的使用可以收取经济回报(成本费用)。然而,令人遗憾的是,截至目前,如何认定“有条件”的标准并没有得到细化。
三、公共数据运营
公共数据授权运营的理论和实践尚处于混沌和争议之中。
(一)公共数据的定义
当前,公共数据的外延逐渐拉宽,从窄向的“政务数据”,即在政府职能机构履行职责过程中所采集、管理的数据,慢慢纳入了提供公共服务的机构提供服务过程中所采集、管理的数据,最为典型的就如供水、供电、供气企业。此外,部分地区还将公立学校、公立医院等公共服务机构的数据,纳入公共数据的范畴之中。概念外延的扩展,其本质是数据类型的扩大,在原本单项的政务数据中填充了大量活跃的、动态性的行为数据。
那么随之而来的问题就在于如何盘活公共数据、激发公共数据的最大价值?
(二)公共数据开放的运营时代
高丰主任将公共数据开放的运营时代总结为三个“运营”。第一是产品运营,即并非公共数据资源的开放,而是走入了公共数据产品的开放。第二是生态运营,即作为产品自然需要进行市场营销、推广和服务,需要围绕用户进行生态运营。第三是价值运营,即要实现价值闭环、产生市场效益。
基于上述分析,不难发现,在公共数据开放的运营时代,行政机构并不具备进行运营的能力。因此,“授权运营”的概念应运而生,并逐步演化为“当红炸子鸡”。根据高丰主任统计,截至2023年11月,关于公共数据授权运营已出台或拟定的专项管理办法,覆盖13个省(直辖市)、36个地级市(区县),包含至少6种不同设计模式。
实际上,根据国家数据局刘烈宏局长的阐释,当前数据开放的主要困境为“三不”,即“不愿”、“不敢”、“不会”。根本问题在于谁实施,而并非现有数据开放的具体流通模式有问题。而公共数据授运营针对上述实施困境的回应都落在“公私合作”之上,即通过市场力量和行政力量的合作实现激励闭环、分摊安全责任、补足行政能力缺陷。
基于此,应当达成一种共识,即授权运营本质是一种公私合作机制,而非一种数据流通模式,授权运营是实现数据开放这个终极目标的一种路径。但这不代表政府不具有数据开放的责任,更不代表授权机构可以获得和行使公共权力。因此,从数字经济逻辑上来讲,公共数据授权运营构建了政府与授权机构相互依赖的共生体。
(三)授权运营的新问题
公共数据授权运营可能会激发出新的问题。
第一,授权运营机构的生产建设是否应当被认为是公共产品?主要涉及公共数据授权平台、运营产生的公共数据初级产品等的归属问题。第二,如何划定授权运营机构的权利边界?授权运营机构介入应用市场可能会造成不当竞争。参照《欧盟数据法案》(DATA ACT)中关于数据中介的要求,需要在中间服务和生产产品之间进行切割。第三,授权运营机构如何收费,核心问题就是如何平衡其中的价值抽取问题。
举例:某公司开发一款肺结节影像的医疗AI产品,需要大量的肺结节的影片。公司可能到某一个边远山区愿意提供相应的影像,并且公司提取走所有影像的知识结构,训练成数据,最后把全部影像还给该地区,将数据价值带走了。但该公司的主要服务对象大多为一线城市的三甲医院,该公司对影像来源的地区可能没有产生任何的经济贡献,甚至没有任何的社会贡献。此种情况下,如何平衡其中的价值抽取,再将数据价值回馈到来源地,这本身就是授权运营中产生的新问题。
观察授权运营的现有实践,各地对授权运营逻辑的理解差异导致形成了不同的操作实践。
以普惠金融为例,上海的“市场平台”模式、北京的“共享厨房”模式以及广州/苍南的“预制菜模式”,实际是通过不同的路径和方式提供同一类别的数据。
在全国层面展开时,就意味着需要付出高昂的学习成本和技术成本才能理清和统一各种模式,本质是形成了更为孤岛化的公共数据市场格局。对此,高丰主任倡议应由国家数据局或相关职能部门,基于行业整体视角进行垂直化的探索和实践。
BOSS&YOUNG
数据作为一种新型生产要素,其价值的最大化就在于数据要素得以市场化配置,从而实现要素自由流动和广泛开发利用。高丰主任认为要以开放为原则共建关键公共数据、以开放为原则责任化数据流通、以开放为原则标准化数据流通,实现以开放内核守卫、放大和释放公共数据的公共价值。
律师介绍
duaiwu@boss-young.com
杜爱武律师,上海邦信阳律师事务所主任、合伙人律师,上海市市场监督管理局反垄断专家库成员,江苏省市场监督管理局公平竞争审查和反垄断专家,上海市法学会竞争法研究会副秘书长,上海市涉案企业合规第三方监督评估机制专业人员名录库(第一批)成员。同时,杜律师还担任上海交通大学兼职硕导、华东政法大学兼职教授、上海对外经贸大学研究生校外导师,上海国际仲裁中心、上海仲裁委员会等多家仲裁机构的仲裁员,上海市黄浦区人民政府法律顾问等职务。
杜律师长期致力于竞争法律与政策及政府法律事务等方面的实务与理论研究,曾参与国家市场监管总局公平竞争相关标准评价体系课题评审、各级政府公平竞争审查第三方评估、政府重大行政决策后评估,对标国际领先经验为政府营商环境建设提供建议,提供疑难复杂行政执法案件法律咨询,并深度参与反垄断私人执行。
chenyunkai@boss-young.com
陈律师为上海律协国资国企业务研究委员会委员,山东省市场监督管理局反垄断与公平竞争审查专家库专家。陈律师专注于企业合规与政府监管、政府法律事务等领域,长期为大型企业提供竞争合规、经营者集中申报、反垄断诉讼、数据安全与个人信息保护等服务,为政府部门提供公平竞争审查等领域的第三方服务。
shenyue@boss-young.com
沈越律师专注于服务国有企业和政府部门,并以个人信息保护与数据安全相关服务、商业秘密保护、竞争法律和政策为特色,为政府部门提供商业秘密保护示范创建、公平竞争审查等领域的第三方服务。
沈越律师获得欧盟国际隐私信息保护专家(CIPP/E)、注册信息隐私经理 (CIPM) 认证,同时是英国皇家特许仲裁委员会中级会员(CIArb Membership)。
pengxiwen@boss-young.com
彭喜文律师专注于数据合规、投融资并购领域,其主要服务的客户包括交通银行上海市分行、太平金服、上海人寿等。在项目尽职调查、交易文本的起草、审核,企业内部风控和合规管理方面积累了一定的法律经验。
声明:本文仅代表作者本人观点,不得视为邦信阳律师事务所及律师出具的正式法律意见或建议。如需转载或引用本文的任何内容,请完整注明作者及出处等信息。如您有意就相关议题进一步交流或探讨,欢迎与我们联系。
点击“阅读原文”,登录邦信阳律师事务所官网了解更多资讯。