查看原文
其他

厘清公共数据授权运营:定位与内涵

大数据期刊 大数据期刊 2024-01-09

厘清公共数据授权运营:定位与内涵


高丰

开放数据中国,上海 200433


摘要当前,数据授权运营的理论和实践尚处于混沌和争议之中。基于对中国特色数据开放的认知,对当前数据授权运营和数据开放间并列互补或包含隶属两种关系论提出挑战,重新定位授权运营应为间接实施数据开放的市场化机制。开创性地提出对数据授权运营的运营产出和运营行为两个概念予以精细化拆解的必要性,厘清数据授权运营的内涵,即其由分类分级运营商生态支撑,围绕数据开放“权利-责任-利益”而主要产出初级数据产品供第三方再利用开发,而非仅是直接使用的社会-技术系统。

关键词公共数据, 公共数据授权运营, 数据要素, 公共政策

论文引用格式:

高丰. 厘清公共数据授权运营:定位与内涵[J]. 大数据, 2023, 9(2): 16-32.

GAO F. Investigation into authorized public data operation: its positioning and nature[J]. Big Data Research, 2023, 9(2): 16-32.


0 引言

数据作为一种新型生产要素,其价值的最大化在于数据要素得以市场化配置,从而实现要素自由流动和广泛开发利用。在这一背景下,公共数据——即“由国家机关、事业单位、经依法授权具备管理公共事务职能的组织,以及提供供水、供电、供气、公共交通等公共服务的组织在履行公共管理和服务职责过程中,收集和产生的各类数据”,在市场化过程中的流通利用,对数据要素发挥社会经济效益起着关键性作用。

作为公共数据流通的重要抓手之一,上海、北京等地自2011年起率先探索公共数据开放工作。虽然截至2022年10月全国已上线208个地方数据开放门户,但从整体社会感知而言,数据开放工作仍存在数据价值低、数据更新慢、数据质量差的问题。究其根本,在于两点:“不能”和“不愿”。一方面是“不能”,数据开放工作具备高度的技术专业性,需要直接面向数据利用方处理个性化需求,因而传统公共职能部门缺乏相应的技术能力和服务能力做好数据开放工作。另一方面则是“不愿”,即数据开放要求数据公益免费,而为了满足社会需求、保障数据安全和质量,又需要真实的资金、人力、物力投入,这就使数据开放工作成了“既要马儿跑,又要马儿不吃草”的任务,陷入了激励机制的死循环。

针对上述公共数据开放工作的实践困境,数据授权运营作为一种新型制度被提出,试图破除数据开放实施过程的阻碍,重新激活数据开放。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“十四五”规划)首次提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)中则进一步要求“推进实施公共数据确权授权机制”。在落地实践方面,成都市探索的统一授权市属国企平台公司运营数据的“成都模式”、北京市为行业数据流通应用打造的“金融数据专区”等已成为公共数据授权运营的典型案例,得到了学术界和产业界的广泛关注和研究。在配套制度建设方面,《上海市数据条例》是首个提出健全数据授权运营制度的地方法规,成都市在2020年探索“成都模式”过程中拟定并通过了《成都市公共数据运营服务管理办法》(但未公开发布),浙江省则在2022年第4季度面向社会公开发布了《浙江省公共数据授权运营管理暂行办法(征求意见稿)》。

然而,公共数据授权运营作为一项仍在探索中的新兴制度,其概念内涵、法律性质、运作方式、监管机制等尚有大量的疑问和争议。此前,已有学者就实践案例、法律性质、运营机制等问题,从社会系统下的公共管理和法学视角对部分问题予以了解读和回应;也有学者从联邦学习技术角度切入,分析了公共数据授权运营在技术系统视角下的实践案例

本文认为构建数据授权运营制度的关键是厘清为何需要授权运营(定位)以及授权运营究竟应该做什么和是什么(内涵)。通过分析总结当前学术讨论和实践,笔者发现一个普遍现象,即目前研究试图将授权运营和数据开放视为两种不同的数据流通(开发利用)制度,认为授权运营是一种数据流通的新模式。对此,笔者认为这不但不利于现有数据开放的公共数据治理制度和法规的延续和实施,也将在一定程度上给各利益相关方带来认知和实践上的冲击及混乱。而究其根本,关键在于清楚地认识到我国国情下的数据开放已不再是遵循开放性的数据对外流通的一个特殊“点”,而应当是构建在无条件开放和有条件开放分类模式之上的一个宽光谱“线”。因此,笔者认为授权运营并不创造新的流通(开放)模式(how),而是在保留现有数据开放机制的基础上将注意力转向解决“谁去实施开放”(who)的问题,以解决原有行政力量“不能”“不愿”而带来的数据开放低效等问题。

另外,当前关于授权运营的讨论往往单一认为授权运营的职能是“数据到数据产品服务”的“加工开发”,而忽视了前期规划、需求调研乃至后期运营维护、推广交易等多环节工作均可被完整或部分包含到运营活动中而带来丰富的授权运营可能。因此,本文提出应对运营行为和运营产出这两个常被粗放式讨论的概念做精细化拆解和讨论的必要性,并对两个概念做了初步的精细化探索,希望为进一步构建授权运营制度和开展相应实践提供新的理论支撑。

1 数据授权运营的定位

在讨论数据授权运营的过程中,无法回避的一个核心问题是数据授权运营如何在数据要素流通及市场化配置的框架中定位,其与数据开放间究竟是何种关系?本节将对现有论派予以梳理,进一步明确统一数据开放的定义,最后提出笔者的观点。

1.1 当前主要关系论派的梳理

当前在学术文献及政策的讨论中,主要思路是试图将数据授权运营和数据开放置于同一逻辑体系内,探讨两者的逻辑从属关系。而这一思路下,诞生了两种主流论派:并列互补论和包含隶属论。并列互补论的核心观点是数据授权运营、数据开放和数据共享总体构成了数据流通的3种路径,并将授权运营视为数据开放的一种补充机制。包含隶属论则认为,数据授权运营应被视为数据开放制度的一部分,是一种新形式的数据开放。

持并列互补论的学者站在数据要素市场化配置的宏观战略角度对授权运营定位予以阐述。张会平等人基于对“成都模式”的研究,认为“政府数据进入市场主要通过数据开放和数据授权运营两种路径来实现”;陆志鹏则进一步指出“公共数据授权运营是对公共数据开放的市场化补充,授权运营引入市场主体参与,扩展了公共数据开发利用的空间和深度”。这也在肖卫兵的论点中进一步扩展为“政府数据授权运营是政府数据开放缺陷弥补的一种补充机制”。总体而言,上述学者强调数据开放是公共(公益)性流通,而对应认为授权运营是市场化流通,因而两者并存互补于数据流通框架下。在这一论调下,陆志鹏、张会平等人均指出要平衡数据开放和授权运营的关系,避免授权运营过分冲击数据开放,给其带来新的阻碍。

构建包含隶属论的学者则将论点立足于一个基本事实,即国家“十四五”规划在“加强公共数据开放共享”一节中提出“开展政府数据授权运营试点”,因此授权运营是数据开放的一种特殊形式。宋烁进一步指出,“《‘十四五’推进国家政务信息化规划》和《要素市场化配置综合改革试点总体方案》中,政府数据授权运营也被列为完善数据开放共享机制的新举措”。因此,数据授权运营应当隶属于数据开放制度,是“依据有关行政公物管理与利用的法律进行规范,将数据作为国有资产实施市场化运营,兼具产业促进与公益维护多元目标的政府数据开放形态”

而在微观层面,两种观点均指出了授权运营区别于“现有机制”的差异,不同的是两者参照的“现有机制”有所差异,并行互补论中是数据开放,而包含隶属论中则是有条件开放。笔者对两种主流授权运营与数据开放关系论的主要观点做了汇总梳理,具体见表1。对比两个论派的差异不难发现,并列互补论参照的数据开放,其概念内涵显然并不包含有条件开放而仅遵循严格开放性的定义,而包含隶属论则是构建在既包含无条件开放又包含有条件开放的数据开放概念之上的。显然,数据开放的定义在不同论述中有所差异,因此,为了能够进一步厘清各种观点,笔者意识到关键是要先明确何为我国国情下应遵循的“数据开放”定义,也即先要统一和数据授权运营比较的参照物,才能在此基础上得出合理的论述数据授权运营和数据开放关系的结论。


1.2 对数据开放的统一认知

国际共识的数据开放强调开放性特点,具体如下。

● 技术开放性要求。数据应当可被机器读取,数据格式不使用专用封闭格式,数据内容应保持数据的原始性。

● 法律开放性要求。即采用开放授权从而确保无论身份、目的是什么,都可获取和使用数据,且可以自由再利用和分享数据。

● 社会开放性要求。即免费获取、使用和分享数据。

但笔者认为,在我国10余年对“数据开放”的研究、实践过程中,其概念内涵受落地实践的影响已发生了质的变化,演变为宽松的泛数据流通概念。笔者分析了部分主要省市(其中3个省、7个直辖市或省会城市)出台的法规政策,对如何界定“数据开放”——无论是政府数据开放或是公共数据开放,予以了汇总梳理和比对,具体见表2,试图透过此厘清本土数据开放的准确释义。



针对上述不同定义,若暂且搁置不同定义中对约定的数据特性的差异,而仅关注各版本定义的共同点,不难得出一个结论,即我国当下的共识是数据开放最宽松(或称之为最基础)的,可以被定义为“一种向社会提供数据的行为”,其实质就是数据的对外流通(为了便于区别不同释义的数据开放,笔者构建了表3)。


而进一步分析发现,自2019年出台的《上海市公共数据开放暂行办法》起,所有上述政策文件均在数据开放框架下引入了“无条件开放(或称普遍开放)、有条件开放(或称受限开放/依申请开放)和禁止开放”3类分类体系。遵循此体系,各地方也已在数据开放门户中按无条件和有条件区别式提供数据。有条件开放的引入,使数据流通行为上限延伸至覆盖数据对外流通(即宽松定义的数据开放)的全光谱行为(参见图1数据流通视角下欧美模型与我国模型)。

欧美模型以英国开放数据研究院的数据光谱为例构建,从图1中可知,我国数据开放等同覆盖了欧美模型中由数据开放(严格定义)和对外数据共享所覆盖的一段流通行为;我国的有条件数据开放实质等同于欧美模型下的对外数据共享的流通行为。


图1   数据流通视角下欧美模型与我国模型

而在这一过程中,由于各利益相关方既对原有严格定义数据开放有一定的敬畏和遵从,又需要考虑实践需求而突破开放性约束,因而在当前实践中存在“中间定义”的数据开放,而其释义的弹性空间则取决于对严格开放性约束的取舍比例。这一点也在当前政策表述中有所体现(参见表2对政策的梳理总结):当前仅上海市、青岛市、深圳市三地在数据开放的政策中对提供的数据所需符合的特性有所提及,且尚未达成一致。上海市、青岛市两地均提出数据应当具备“原始性、可机器读取”的要求,深圳市仅要求“可机器读取”而不再强调“原始性”。另一个常在讨论中被忽视的特性是上海市、青岛市政策中并行提及的“供社会再利用”的特性,即强调数据开放的服务目的应指向再利用(英文为reuse,即脱离数据原有采集目的而能通过开发分析用于新需求),而非简单的直接利用(英文为use,即直接通过阅读、检视等消化数据承载的信息)。

笔者认为,“中间定义”的存在是一个阶段产物。其释义的弹性空间受到各利益相关方特别是公共数据管理机构对开放性的认知、新型技术的加持(如隐私计算对数据流通安全性)以及数据要素市场大背景下数据开放经济模式的变革需要等因素的影响。随着时间推移,我国情境下的数据开放将最终泛化为对外数据流通行为(即宽松定义),其将演变为包含符合和不符合开放性的所有对外流通数据模式的“线”,而非再作为一个单一强调开放性的“点”。其与我国情境下的数据共享(对内数据流通)构成一个二元分类,总体称之为数据流通(参见图1)。

1.3 推倒当前论派:授权运营与数据开放既非并列互补也非包含隶属

基于第1.1节和第1.2节的梳理,笔者认为当前数据授权运营和数据开放的逻辑从属关系是错误构筑于对数据开放的片面选择性理解之上的。在尊重现实实践的前提下,我国的数据开放不应再被等同为严格的数据开放,而应被视为对外数据流通行为(宽松定义)。因此授权运营与数据开放两者既非并列互补,也非包含隶属,不构成逻辑从属关系。

在第1.1节中,笔者汇总梳理了当前两个论派的观点及参照物,而回归到我国情境下的数据开放释义,发现当前两个论派的逻辑从属关系都无法成立(参见表4)。因此,笔者认为两者实际并不应构建逻辑从属关系。


1.4 构建授权运营和数据开放之间的新关系论

基于上述对当前关系论的梳理及对我国国情下数据开放定义的梳理,笔者进一步得出一组授权运营和数据开放之间的新关系论。

1.4.1 授权运营应视为间接实施数据开放的机制,其强调市场化主体的参与

笔者认为数据授权运营和数据开放本质上解决的是两个不同类型的问题,前者解决“who”,后者解决“how”。即数据开放是为了解决如何(how)从数据拥有方提供数据至数据利用方(如是否提供原始数据,是否采用数据出域、可用不可得等技术手段,是否设立准入资格等都是how的一部分),而数据授权运营则是解决谁(who)具体去实施数据开放从而达成数据流通(即回答公共机构自身还是第三方去实施)。为了便于理解,此处通过一个通俗场景类比说明:同样是烹饪,食材通过煎、炒、烤、炸等不同方式都能制成菜品,这是how的问题;而选择是自己做,还是聘请第三方专业人士做,则是who的问题。

正如引言所述,数据开放当前的困境来自实施主体自身的“不能”“不愿”,问题出在谁实施上,而并非现有数据开放的具体流通模式有问题。授权运营的思路就是利用授权让具备能力和意愿的市场化主体代替原有的行政主体去执行数据开放。这一点,在常江等人对授权运营法律性质的论述中也得到了呼应:“……公共数据授权运营即属于 concession 语境下的‘公共服务特许权’。即政府在提供公共服务方面,因客观原因的制约,无法直接向社会提供完善的服务,而引入社会第三方,以合同的形式将通常应由其负责的全部或部分服务转由该第三方承担(当然该第三方不是狭隘的单一主体)。”也因此,公共数据开放作为一套公共数据对外流通的框架制度,其从解决谁去开放(who)的视角,可分为直接实施开放和间接实施开放两种类型,直接实施开放即通过公共部门自身开展行政化实施,间接实施开放即通过授权运营方式开展市场化实施。而间接实施开放也是实现公共数据生产与供给分离、增强多主体参与和提升市场化配置的有效手段,其优点在于引入市场化的专业力量来做专业的事务。值得指出的是,包含隶属论可被诠释为授权运营是一种数据开放的新形式,其是一种基于如何开放(how)构建的逻辑关系。而此处,基于谁去开放(who)分为了直接实施和间接实施,其应被理解为授权运营是一种数据开放的实施新形式而非开放新形式。而实施方式的分类逻辑不应等同于授权运营和数据开放构成包含隶属关系。

1.4.2 授权运营是“有条件开放”从“被动服务”转向“主动服务”的实现路径

笔者认为,授权运营的核心服务对象是“有条件开放”,但这不代表授权运营仅涉及有条件开放数据的运营。在公共机构确实认为有必要的前提下,也可引入第三方市场力量运营无条件开放数据,或无条件与有条件融合的数据等,其中无条件开放数据强调从原始数据加工为技术性数据产品,如API。同时,需特别指出的是,授权运营和有条件开放的概念中都会涉及“授权”(如参考文献中提及“向授权的服务商提供有条件开放的公共数据资源”),但两者含义不同:有条件开放的授权指具备授权资格的公共数据管理方对符合准入条件的数据使用对象授予“访问和使用数据的权限和权利”,其一般通过许可协议约定数据利用、再利用、重分发的规则;而在授权运营中则应指公共数据管理方授予市场化第三方“相应实施数据开放工作的权利与责任”。两者所授权的对象及权利均不同。

另外,当前有条件开放作为一种“申请”机制,笔者认为其处于一种被动服务的模式下,即等待有需求的数据利用方联络公共部门获取访问、利用数据的权限。而在这种模式下,数据开放容易陷入一个“先有鸡还是先有蛋”的怪圈。即没有充足的申请需求,公共机构就不会更好地通过技术产品方式供给数据;而没有更好的技术化供给,市场也就自然不会有动力来申请数据(因为数据用起来很麻烦)。因此,笔者认为,授权运营引入市场化能力,可以通过市场化自驱力让运营方将数据先主动转化为技术化产品或服务,以成熟的方式向社会主动供给,则能化被动为主动,加速数据利用方对数据的尝鲜过程,再通过需求提升数据供给的质量。

2 数据授权运营的内涵

在第1节中,笔者厘清了数据授权运营的定位——其是间接实施数据开放的机制。本节,进一步梳理明晰数据授权运营的内涵。为了回答这一问题,首先对当前政策法规及相关文献中的数据授权运营定义予以梳理总结,并基于此进一步对授权运营关键要素做精细的解读,厘清其内涵。

2.1 当前数据授权运营的主流定义

当前,在不同的政策法规及学术界讨论的文献中,数据授权运营存在不同视角、不同理解、不同细节颗粒度的界定,具体见表5。在汇总梳理中,涵盖了1篇国家政策、2篇省级政策法规、1篇地方技术标准、5篇相关文献,它们均对数据授权运营给出了较为完整的定义,在对它们的横向对比中,笔者对每一句定义都用下划线加字母标号的形式,对应标记出包含“授权主体”在内的7个定义元素,从而进行横向分析比较。


● 授权主体。就谁有权授权第三方,基本分为两类。一类是颗粒度较粗地界定为“政府”,但无明确机构指向;第二类则是细颗粒度,也相对主流,即确定公共数据的主管部门为授权主体。

● 授权对象。就谁可以被授权,当前定义方式基本分为4类。第1类,粗颗粒度地界定为“社会(主体)”,或按主体类型展开为“法人或非法人组织”;第2类,在第一类的基础上进一步加上约束性条件,试图对主体资格予以说明,但当前具体条件都较为宽泛模糊,如“特定的”“符合规定条件的”“可信市场主体”等;第3类,相对第2类进一步细化约束条件的方向,如“专业运营能力的机构”“符合规定安全条件的”等;第4类,直接指向某一类特定条件的主体,如“国资企业”。

● 授权客体。就被授权主体得到授权的内容对象是什么,在当前定义版本中,也存在3类不同的方法。第1类,强调数据的类型属性,即其是“政府数据”“公共数据”或“有条件开放类数据”,此类定义最为普遍;第2类,强调数据的价值属性,从而界定为“与民生紧密相关、社会需求迫切、商业增值潜力显著的数据”;第3类,跳出将数据资源作为一种授权客体的框架,而认为授权客体应是一种与数据相关的权利,其可以是“数据利用权”或“市场运营权”。

● 运营行为。就被授权主体应当开展的运营活动,各版本定义大部分指向了“开发利用”及其延展的系列活动,包括加工处理、价值挖掘、开发形成产品等。但除此之外,仅少数定义进一步延伸提出“市场化服务方式……满足需求”和“按照一定规则组织产业链上下游相关机构……(开发利用)”等行为。这种延伸一是跳出了“开发利用”的单一框架,二是提出了非被授权主体一方闷头干而是产业链协同的职能,值得进一步探讨。

● 运营产出。就运营活动后具体的产出物,当前有2种不同方式的界定。第1种最为普遍,同时指向较为具体,一般为“数据产品或服务”;第2种则相对抽象,如“促成外部主体的使用”、“满足商业创新和公共服务需求”等,其指向并不局限于数据产品或服务,其内涵想象空间更大但也相对模糊。

● 其他相关要素。在对定义横向对比梳理时发现,个别定义中提出了较为关键但当前未普遍提及的要素。一是关于“运营收益”的界定,即定义中是否明确说明授权运营在对外提供服务中的有偿性,目前浙江省台州市的地方标准以及肖卫兵在定义中明确纳入了此点;二是关于“平台约束”,即授权运营整体是否必须在特定技术平台上开展,当前仅中国软件评测中心在定义中明确纳入了“在构建安全可控开发环境基础上”的语句。浙江省虽未在其定义中予以明确,但其在征求意见的管理办法中明确提出了“授权运营域”这一概念,要求在此域内开展授权运营的具体运营活动。

基于上诉梳理比较可知,当前不同的数据授权运营定义中,针对授权主体、对象、客体,人们基本达成了共识,主要差异在于表述的严谨性和范围的确定。而这3个要素的进一步确定,则依赖下述两项要素的进一步明确。

一是运营行为。当前对其界定较为单一,过于突出与局限于“开发利用”。而实际上,正如在第1.2节中所论述的,授权运营是间接实施数据开放的路径,其应当覆盖数据开放的全部或部分行为。其应潜在包括数据开放中的需求调研、开放规划、市场推广等非技术工作,以及数据治理、产品开发、技术维护等技术工作。因此笔者认为对运营行为的进一步细化明确是厘清数据授权运营定义的关键之一。

二是运营产出。当前各版本界定中对运管产出的描述都尚显模糊,常见的是指称“数据产品和服务”,但此概念本身的界定尚不清晰,如果是面向终端的应用性产品则与数据开放本身的目标背道而驰。而“促成外部主体的使用”“满足商业创新和公共服务需求”等抽象目标的指向虽更符合数据开放原本的目的,但它们也需要进一步明确,对具体的产出物予以具象化,因此笔者认为,有必要针对运营产出予以进一步梳理。

考虑到文章的篇幅,无法对运营行为或运营产出做深入而细致的研究。但将在下述内容中试图揭示:即使是对这两个要素做初步精细化的解读,也能看到当前授权运营讨论中的局限性。从而期望为未来进一步深入开展运营产出和运营行为的精细化研究做好铺垫。

2.2 界定授权运营的运营产出:以初级数据产品为主,高级数据产品为特例

从运营产出的界定入手,要明确究竟何为“数据产品和服务”(以下简称数据产品)。

事实上,数据产品一词虽已反复出现在各类政策文件和地方法规中,但其定义仍是模糊和缺乏统一的,学术界也未对其准确定义达成共识。从数据科学宏观视角出发,数据产品可以宽泛定义为“来自数据或由数据支持、驱动的可交付产品,其可以是某种发现、预测、服务、决策、模型、范式、系统等形式,数据产品的最终价值将体现在知识、智能及决策等方面”。相对应地,《海南省公共数据产品开发利用暂行管理办法》中将公共数据产品定义为“对公共数据资源或融合社会数据资源进行加工处理、分析研究所形成的,能发挥数据价值的产品,包括数据模型、数据分析报告、数据可视化、数据指数、数据引擎、数据服务等”。而从数据交易流通视角而言,Pei J认为数据产品就是一种可计量、可流通的数据集。而《数据产品交易标准化白皮书》则更宽泛地认为“数据产品是一种产权可界定、可交易的商品,是数据要素市场的主要交易对象和标的”。其进一步对数据产品予以了分类,即初级数据产品和高级数据产品。初级数据产品包括数据应用程序接口、数据云服务、技术支撑、离线数据包等;高级数据产品包括可视化的数据分析报告等解决方案、针对特定业务场景的数据应用系统与软件、与云融合的各类大数据技术产品等。考虑到本文的篇幅和目的,笔者基于上述有限的文献,将初级数据产品和高级数据产品的定义及分类体系作为一个阶段化的工作框架,便于讨论。笔者认为初级和高级的二元分类在一定程度上回应了数据开放利用和再利用的双重目的,即初级数据产品服务的是再利用目的(供第三方进一步加工开发利用),而高级数据产品服务的是利用目的(供第三方直接消化信息和辅助决策)。若作一个通俗类比,视数据为蔬菜(如土豆),则初级数据产品可以是土豆丝、土豆片等经过粗加工的土豆,主要供第三方进一步加工为菜品。而高级数据产品则是由土豆直接制成的薯条、凉拌土豆丝、土豆泥等成品土豆食品,主要供消费者直接食用。

除了上述的理论讨论外,笔者试图从实践中识别数据产品具体的指向产物。从文献中梳理汇总了部分授权运营案例,并对产出内容予以了梳理,具体见表6。此处需要说明的是,对产出类型的分类套用了上述初级和高级数据产品的二元分类,而在对服务对象进行分类时,为了避免术语混乱导致意义不清,参照了王伟玲描述的授权运营生态链中的角色分类,即数据生产者、数据运营者、数据分析者、数据消费者、数据授权者和数据监管者。


通过对上述案例的分析不难看出,当前基本存在“初级数据产品-数据分析者”和“高级数据产品-数据消费者”两种“产品类型-产品对象”的组合模式。即终端的数据消费者需要的是以App、可视化、报告等形式存在,可将数据再次转化为信息的高级数据产品或服务,从而方便他们做出相应决策和行动;而数据分析者需要的是将数据产品作为一种生产资料,方便他们进一步开发利用和挖掘价值,将其加工为最终的高级数据产品服务于数据消费者。

那么对于数据授权运营,究竟哪一类是期望产出的呢?基于对授权运营的定位梳理,笔者认为授权运营既然是间接实现数据开放的机制,那么它应当同时满足数据开放后外部对数据的利用(use,即直接应用)与再利用(reuse,即开发利用),但应以再利用为主要目的,激活数据要素市场。这也就意味着,授权运营应当主要产出“中间态”或初级的数据产品或服务(如陆志鹏提出此类中间态产品的一种是数据元件)。而在特定情境或市场需求下,如果缺乏市场再利用的意愿或空间,也可由授权运营方直接产出服务于数据消费者的高级数据产品,但应同时兼顾初级数据产品,以满足潜在需求。例如,我国的交通市场建设以国有体制为主,从提供交通服务信息和建设智慧交通出行即服务(MaaS)服务的角度而言,可能市场第三方介入空间较小。因此从高效开发利用交通数据并尽快释放价值的角度,直接开发终端消费者所需应用应为授权运营方的主要责任。但与此同时,不应排除第三方可能在交通领域或非交通领域(如城市规划、商业选址)等需要交通数据,因此应兼顾开发并供给初级消费产品,以满足特定数据再利用的需求。

2.3 界定授权运营的运营行为:构筑围绕数据产品生命周期的运营行为链

授权运营的运营行为应当基于两点予以梳理。一是基于运营目标,即明确授权运营是服务于数据开放的,其目的是引入市场化力量实现数据开放,因此其目标自然是成功开放数据,释放数据价值;二是基于运营产出,即运营活动应主要围绕产出物开展,最终通过产出物的运营,实现运营目标。

第2.2节明确了授权运营的主要产出应是初级数据产品,即中间态的数据产品,而特例情况则是直接产出高级数据产品。因此一项必不可缺的运营行为是针对数据的“开发利用”,这也符合第2.1节中大多数定义的共识。而前述内容也已强调,运营行为不应局限于开发利用,而应围绕数据产品的生命周期来定义。因此,在此提出一个新的概念——运营行为链,其依循数据产品的生命周期,通过提供不同的运营行为在各个阶段响应不同运营需求。此处构造了一个初步的运营行为链示例,具体见表7。但受篇幅所限,无法对该概念做进一步深入、科学的细致讨论,此处仅借由此示例说明运营行为的复杂性。

在上述示例中,将数据产品生命周期简单分置为4个环节:规划、开发、服务和管护。开发环节是数据产品的核心环节,其将单一数据或多类型数据通过数据治理、挖掘的过程提炼价值,并最终经过开发、测试,形成可对外供给交易的数据产品或服务。而其前置,即规划环节,针对数据产品的需求进行调研,需要指出的是,调研不同类型的数据产品需求时复杂程度不同。如果目标是高级数据产品,则需要更多地对终端消费者进行调研;但如果目标是初级数据产品,则意味着需要总结数据分析者的不同高级数据产品研发需求,从中提炼出共性的中间态产品需求。任何数据产品和服务都不止步于开发部署,需要进一步走向市场,这就是服务环节。在此环节需要开展必要的市场推广,对接需求方完成产品或服务的交付,提供必要的技术支撑。而这个过程中,对于数据产品和服务,需要对需求方予以任何形式的准入控制,还需配套相应的访问控制类工作机制。如设定申请机制,则对应有审核;如设定限额限量,则配套有技术审计和用量控制。而在最后的管护环节,既有技术类工作(如对产品迭代),也有非技术类工作(如了解客户的反馈),跟踪掌握客户使用数据产品后的社会经济效益等,从而便于授权主体了解相应数据从授权到进入市场整个链条过程后的整体效益。

2.4 拒绝盲人摸象:重思数据授权运营的内涵及其对制度设计的意义

笔者认为,当前对数据授权运营内涵的理解存在片面性。基于对授权运营当前多版本、多视角定义的梳理,本文开创性地对运营产出和运营行为进行精细化讨论,并厘清授权运营的定位,得出下述结论。

2.4.1 授权运营是间接实施数据开放的机制,其授权客体应是权利而非数据

在当前各类定义中,多数定义建立在授权运营和数据开放有逻辑从属关系的基础之上,因此授权客体理所当然地被认为是数据,进而引出对公共资源本身的授权合理性、收益性等的讨论。而如果准确把握授权运营是间接实施数据开放的机制这一定位,那么其准确的授权客体应当将授权主体履行或执行数据开放的“权利-责任-利益”全部或部分授予被授权主体。因此在当前诸多定义中,将“市场化运营权”作为授权客体可能更加合理、合适,但其也需要根据具体情况对引入第三方所需开展的运营行为范畴做进一步的明确。而在此“权利-责任-利益”的授予让渡下,相应数据资源则作为附属品被允许授权运营商访问和使用。

进一步展开,这一权利授予伴随着相应权益的授予和配置,且符合“数据二十条”提出的“三权分置”:数据资源持有权、数据加工使用权、数据产品经营权。相对应地,在授权运营过程中,被授权方并不应实质持有或拥有数据,即数据资源持有权并不应发生转移和授权。而被授权方应因获得运营权,而相应享有数据加工使用权,从而认可并确保其数据产品或服务的开发投入可以享有对应的收益权利。就被授权方针对加工形成的数据产品或服务而开展的经营工作(即对应运营行为中的规划、服务和管护等非开发阶段工作),包括但不限于市场推广、交易交付、技术支持等,其相应享有数据产品经营权,从而可进一步就此阶段的投入享有合理的回报收益。而在授权运营过程中,因被授权方授权到期退出或授权期内违约等发生被授权主体变化的情况,或发生运营工作分段授权(如A负责原始数据至数据产品的加工开发,B负责对加工后的数据产品的经营)的情况,上述权属分置也能确保收益的合理归属。

2.4.2 授权运营涉及复杂的运营行为链,需要一个分类分级的运营商生态支撑

正如第2.3节中所讨论的,运营行为并非单一的开发行为,其依循数据产品的生命周期构成一条复杂的行为链,而复杂的运营行为链对应不同类型的服务提供者。这也契合“数据二十条”提倡的大力发展数据要素流通和交易服务生态的理念,即壮大“中间方产业”。这其中可以包含专业提供开发服务的产品开发商,专业提供数据产品、服务市场推广和交易撮合的数据中介商,专业提供数据产品面向客户的技术支撑、客户服务等的产品运维商等。当然,对于一家授权运营商,其可以仅具备单一行为职能,也可肩负多项行为职能(即复合型运营商)。

进一步,依据当前学术讨论的总结,存在3种授权方和被授权方之间构建授权的模式:行业主导模式、区域一体化模式和场景牵引模式。三者实际可以进一步合并为两类授权模式:场景授权、综合授权。场景授权即围绕特定场景的特定应用需求(即高级数据产品)授权特定的运营商;综合授权则是原则上将某一垂直领域(即行业主导)或某一区域(即区域一体化)所管辖范围内的各类型数据资源,划归授予第三方的运营权范围内。

在综合授权模式下,笔者认为授权运营商还应在运营职能行为分类的基础上,建立分级管理体系。一种可能的形式是,授权方直接授权并管理一家复合型运营商,类似信息化项目中的系统集成方。其从业务能力上,应具备强规划能力,即擅长广泛调研社会需求并发现共性的初级数据产品需求,能够在需求梳理的基础上进一步与授权方协同治理数据,并做好数据产品的开发运营规划。同时,此运营商(被授权方)应做好次级运营商的管理和协同,即根据与授权方达成的产品规划计划,组织、协同并管理好次级运营商完成相应数据产品的开发,并推向市场。进一步,该复合型运营商应做好最终的效用产出评估,整理用户反馈,并会同授权方基于上述评估和反馈汇总,开展针对性的数据治理和相应数据产品规划的迭代工作。当然,在分级体系下,应当还存在其他可能的形态,有待进一步结合数据当前的治理管辖现状予以讨论。

2.4.3 授权运营是以初级数据产品为主要形态,落地“城市即平台”理念的社会-技术系统

授权运营的主要运营产出是初级数据产品,其本着“再利用”的目的使第三方分析者和开发者进一步开发高级数据产品。在第2.1节中,部分对授权运营的定义中明确涉及了公共授权运营平台或授权运营域中此类统一技术底座的概念,而结合初级数据产品是授权运营的主要运营产出的事实,进而认为这是“城市即平台”理念的一种具象化:公共机构建设治理城市公共数据底座,其原始数据透过直接运营或授权运营方式转化为初级数据产品(即构成底座上的对外接口),最终城市中诞生的高级数据产品则如插积木一样,透过这些接口插拔于城市底座之上。

笔者认为,“城市即平台”视角下的授权运营不只是一套社会制度,也是技术系统的一部分,即授权运营是一套抽象的社会-技术系统,应构建、运行于统一的技术底座之上。如何理解呢?首先,从数据安全的基本要求来说,授权运营的任何开发利用工作都应基于一个统一的技术底座开展,即“数不出域”。其次,授权运营的所有产出都应运作与留存于统一的技术底座,即“保持数据产品与授权关系的松耦合”,这确保了数据产品的稳定和持续,也因此笔者认同常江等人和肖卫兵对授权运营应通过PPP构建契约的论断。再者,从公共数据的质量而言,根植于统一平台开展数据治理和初级数据产品开发运行,有利于各利益相关方溯源任何基于公共数据开发的产品和服务,从而确保可信的公共数据流通,也为数据要素市场的可信运行打下基础。

3 结束语

本文对当前普遍认知的数据授权运营和数据开放构成逻辑从属关系提出挑战。梳理、统一我国情境下数据开放的定义,认为数据开放在我国已泛化为对外的数据流通行为,因此数据授权运营不应当被视作一种新形式的对外流通行为,而应当被视作回应当前行政力量“不能”“不愿”瓶颈进而解决“谁去开放”的一种数据开放的实施新方式。

这一新关系论的提出,有以下3个方面的优点。

● 确保现行政策法规的延续性。其确保当前政策法规已设定的数据开放制度得以延续,不因授权运营的引入而产生冲突;同时,不人为将授权运营等同于特许开发(即特许对象获得数据仅为开发特定的应用程序),从而开历史倒车,破坏数据开放已取得的成绩。

● 有利于社会各方认知的一致性。其确保公共部门、数据利用方均对公共数据对外流通拥有一致的理解,不需要刻意区分对立数据开放和授权运营,进而造成认知和实践上的迷茫。

● 有助于制度探索实验的独立性。其确保公共部门探索实验数据开放(特别是有条件开放)和授权运营具备各自的独立性,即有能力、有意愿的部门可以选择直接开展有条件数据开放的制度建设并实践,而非必须采用授权运营;而授权运营的实验探索又不会影响既有开放制度。

在厘清授权运营定位后,指出当前授权运营的普遍讨论缺乏对授权行为和授权产出的精细化讨论,并初步基于现有的有限文献基础对此两点做了扩展讨论。虽无法全面细致地构建授权行为和授权产出,但通过论述已基本可以揭示当前普遍存在的对授权运营的简化单一理解,即其主要围绕“数据至数据产品服务”的“加工利用”开展,有相应的局限性。同时,也通过引入社会-技术系统视角,初步揭示了当前对数据授权运营单一从社会科学或单一从纯技术视角讨论的局限;并基于此,提出下一步应从社会-技术系统的视角对授权运营的制度进行设计,特别是对其运行逻辑和监管机制予以讨论和实验。

最后,在进行数据授权运营这一制度的建设和实践时,应紧密关注国内外类同逻辑下的实践和研究,包括但不限于数据信托、数据空间等,并从中总结经验,通过实践指导理论的进一步研究,通过理论总结反向指导研究,从而确保授权运营服务好数据开放,而非错误地开启历史倒车,走向单点式、垄断性的数据流通利用模式。


作者简介


高丰(1986-),男,博士,开放数据中国执行主任,主要研究方向为数据开放、数据要素制度、数字治理等。


联系我们:

Tel: 010-81055490

       010-81055534

       010-81055448

E-mail:bdr@bjxintong.com.cn 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作:010-81055307


大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号,获取更多内容
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存