深度分析数据要素市场建设现状、问题和建议,CMF专题报告发布
本文字数:8661字
阅读时间:22分钟
4月13日,CMF宏观经济热点问题研讨会(第83期)于线上举行。
本期论坛由中国人民大学一级教授、经济研究所联席所长、中国宏观经济论坛(CMF)联合创始人、联席主席杨瑞龙主持,聚焦“数据要素市场建设:现状、问题和建议”,来自国内政界、学界、企业界的知名经济学家王建冬、黄丽华、邹传伟、林琳、李三希联合解析。
论坛第一单元,中国人民大学经济学院教授、中国宏观经济论坛(CMF)主要成员李三希代表论坛发布题为《数据要素市场建设:现状、问题和建议》的CMF中国宏观经济专题报告。
报告围绕以下三个方面展开:
一、数据要素市场建设的现状
二、数据要素市场建设的问题
三、数据要素市场建设的建议
一、数据要素市场建设的现状
数据要素是数字经济时代最为重要的生产要素之一,我国出台多项政策文件,高度重视培育数据要素市场。2020年将数据定义为与劳动、资本、土地、技术并列的第五大生产要素。2022年由国家发改委牵头制定了“数据二十条”,聚焦数据产权、流通交易、收益分配、安全治理四大重点方向,初步搭建我国数据基础制度体系。今年上半年由国家数据局牵头颁布了《“数据要素×”三年行动计划(2024—2026年)》,将数据要素同传统产业和传统应用场景进行融合,充分发挥数据要素的放大、叠加、倍增作用,构建以数据为关键要素的数字经济。
其次,我国成立了国家数据局,统筹推进数据要素流通利用。其主要职能是构建完善的数据基础制度体系,促进数据要素市场化,推动数据资源的整合开放,优化数据资源的配置和提升应用效率。各个地方纷纷成立相应的数据管理机构和数据交易所,据不完全统计,自2014年以来,全国各地陆续建立了几十个数据交易机构,拉开了我国数据要素市场建设的序幕。
我国数据要素流通市场活跃度显著提升,总体规模不断上升,预计2024年可达到1592亿元。除政府推动的数据交易所,互联网平台企业旗下的子平台等数据交易平台所提供的数据平台服务较广并取得一定市场成效。
目前数据要素流通交易的主要模式主要有以下三种:
第一,企业间直接交易数据。数据的供给方和需求方通过早期互动、供需匹配沟通,包括对于价格和合同的谈判,最后签订合约和履约来完成数据交易。
第二,数据交易平台撮合。例如,上海数据交易所发布的交易服务流程包括交易前、交易中、交易后三个阶段,共九个服务功能。交易前需到达合规要求,包括数据治理、产品登记、产品挂牌。交易中包括交易测试、交易合约、产品交付、结清算。交易后包括凭证发放和纠纷解决。北数所交易流程由交易申请、交易磋商、交易实施和交易结束四个环节构成,除了撮合数据交易之外提供了其他衍生服务,如资产评估、法律服务和数据审计等。
第三,提供API接口进行数据服务。一方面,数据供给方可以直接给数据需求方开放API接口,另一方面也可以通过数据中介将数据的供需双方拉到自己的网络中,向他们提供相应服务和API接口。
二、数据要素市场建设的问题
(一)数据要素市场运行机制
数据要转化为生产要素,发挥要素作用,需经过资源化、数据共享、交易流通和分析应用的数据价值化过程,依赖云服务、隐私计算、人工智能等数字技术和数据中心等基础设施支撑,并需要清晰、透明、一致的监管政策保障数据要素市场秩序。据此,可将数据要素市场分为三个层级,分别为支撑层、价值层、政策层。支撑层是数据要素的基础设施及技术支撑,价值层包括数据供应商、数据交易机构和分析应用方,政策层是指构建统一数据标准、推动公共数据开放、激励市场主体数据共享、科学界定数据产权等。
1、支撑层
从理论上讲,区块链、隐私计算、多方安全计算等技术可以应用于数据要素流通交易业务中,以解决数据交易中的数据溯源、隐私保护、数据流通追溯等关键问题。然而,实践中基础设施和技术环境都离国家的战略目标、数据要素流通实践的需求、场内市场和场外市场流通环境建设的需求之间存在相当大的差距。
2、价值层
中国数商企业超过200万家,近十年年均复合增长率超过30%。但值得注意的是,我国场内数据交易规模仅占到整个数据交易规模的5%左右,这意味这场内交易市场相当不活跃。根据黄丽华老师2022年整理的数据可以看到,全国43个交易平台有10家处于停运状态,8家没有网站,11家属于拟建状态,三分之二的平台没有正常运营。
我国数据供给侧主要面临以下四个现实问题:
第一,合规成本过高。相对于其他生产要素,数据具有更高的流动性和可复制性,为避免合规风险,相关监管法律往往要求对数据进行严格完善的合规性评估,对数据供给方施加巨大合规压力。例如,《网络安全法》规定贩卖50条个人信息可入罪,数据流通出去之后的责任认定问题也同样限制了数据供给,使得企业不得不谨慎对待数据的流通利用,以免触碰法律红线。目前,企业进行数据交易需要平均支付15-20万元人民币来获取专业律所提供的《数据合规评估法律意见书》,这是相当大的成本。
第二,个人数据开发利用成本较高。个人数据的合规使用需要获取个人授权。从当前实践看,一是个人授权成本较高。群体个人数据授权难度较大,如商业保险公司可依靠群体个人健康数据,开发新险种,创新产品和服务。然而,在实践中,此类数据拿到完整授权难度较大。二是个人数据匿名化无清晰标准。AI大模型训练中需要大量个人数据,由于此类数据脱敏无清晰标准,目前多采用隐去电话、姓名、身份证号等关键信息等模式,是否合规仍处于模糊地带。三是个人共享数据动力不足。个人尚未在其个人数据共享中获取收益,导致个人数据流转和开发利用的内生动力不足。
第三,科研类数据共享程度不足。例如国家蛋白质科学研究设施、上海超级计算中心等大科学装置产生的数据以及像中国海洋大学、中国农业大学等科研院所采集的海洋、农业等专业领域数据等,往往都是在科研过程中收集存储,但事后科研数据共享从业人员或者数据贡献人极少选择主动共享数据,进而产生“科研数据割据”现象,不利于科研类数据资源的价值释放。
第四,公共数据开发激励不足。目前政府和事业单位未明确向公共数据授权运营单位收取费用的收费项目和收费标准。2020年中央网信办在上海、江苏、浙江、福建、山东、广东、贵州、海南等八个省(市)开展了公共数据资源开发利用试点建设,虽各省进行了积极探索,涌现出不同的授权运营模式,但政府作为公共数据资源持有方均未向授权运营单位收取相关费用,主要问题是收费项目和收费标准不明确,收费项目哪一级设立,收费标准哪一级审批,收费标准如何确定都需要进一步研究,以免造成上下政策“误差”,造成不敢收、不会收,不收又会造成国有资产流失风险的担忧。
从需求侧看,主要问题在于企业数据利用能力的不足导致有效需求动能不足。具体而言,直接体现在数据分析与应用环节:
第一,部分企业数字化转型进程缓慢,企业对于数据价值的认识与挖掘不够深入,未能充分利用数据驱动业务决策和创新。《2022年埃森哲中国企业数字化转型指数报告》相关数据显示,2022年数字化转型成效显著的中国企业比例不到两成。广大中小企业面临“三不”问题,即数字化转型不能转、不愿意转、不敢转阻止了其转型。
第二,尽管企业拥有大量数据,但缺乏相应的数据分析技术和实力,使得这些数据无法转化为实际的业务价值。例如,全国信息技术标准化技术委员会2020年9月发布的《数据治理发展情况调研分析报告》显示,大中型企事业单位普遍重视数据价值,并通过数据治理活动挖掘数据价值,但不同程度普遍存在组织机制、战略规划、体系标准不健全、技术工具不完备、治理能力不高等问题;中小企业数据治理水平则更低。总体而言,仅少部分数据得到开发利用或没有开发利用的企业大于80%。
第三,很多公共数字化应用场景尚未对市场充分开放,也进一步限制了数据需求方动能的增长。《2022中国地方政府数据开放报告》显示,目前全国地级、副省级和省级开放平台仍然只占全国覆盖率一半,且在已经上线的平台中,开放的数据在数量上还相对比较少,容量比较低。另一方面,政府数据外的国有企事业单位数据也属于公共数据范畴,但同样存在开放不足的问题,如公共交通、气象等高价值场景数据。
综合来看,我们在供需匹配上有三个比较严重的问题:
第一,“有数无市”和“有市无数”问题。“有数无市”是指产生大量的数据但没有市场。以医疗健康数据为例,医院和医疗机构每天都会产生大量的医疗数据,这些数据对于疾病研究、药物开发、健康管理等领域具有极高的价值。然而,由于医疗数据的敏感性和隐私保护的要求,这些数据往往被严格限制使用,缺乏一个成熟的市场环境来进行交易和流通。此外,医疗数据的标准化程度低,不同医疗机构的数据格式和质量参差不齐,导致数据难以整合和共享。这使得数据供应商虽然拥有大量数据,但却难以找到合适的买家和交易市场,形成了“有数无市”的局面。
“有市无数”是指数据供应商多以提供“粗加工”的原始数据为主,缺少个性化定制模式,数据规模小,整体较为分散、零碎,无法有效覆盖需求。数据交易机构仍多停留在简单撮合交易模式,缺乏深度价值挖掘。在工业领域这种局限尤为明显,例如一家制造企业可能需要根据自身生产线的特点来优化生产流程,但数据供应商提供的数据服务无法满足这种个性化的需求,导致企业无法充分利用数据来提升生产效率。
第二,数据要素价格发现机制不完善。一是公共数据授权运营单位向社会服务的公共数据定价机制不健全。《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》指出,推动用于数字化发展的公共数据按政府指导定价有偿使用,但目前全国仍未形成相对成熟公共数据定价模式。目前授权运营单位的公共数据定价主要分两类:一是制定公开的公共数据定价目录,纳入政府指导定价范畴;二是采取一对一议价方式收取相关费用。
二是企业数据价格形成机制不健全。目前企业数据以“点对点”场外交易为主,买卖双方遵循“卖方自主定价报价,买卖双方协商议定”模式实现交易。由于缺乏有效的价格形成机制,企业数据的定价往往随意性较大,难以反映其真实价值。
第三,高度的信息不对称。在搜索阶段,虽然当前的数据交易市场能够作为展示数据的窗口,但是买家仍需要付出较大的搜索成本,依赖于卖家维护的元数据来寻找对自己有用的数据集,卖家需要非常专业解释自己数据结构与内容。其次,数据质量与价值信息不对称,即卖家有更多关于数据质量信息,买家有更多关于数据价值信息。在交易阶段,买卖双方在价格谈判上会花费大量时间和精力,且对于数据是否合规等问题需要花费大量时间和成本确认。此外,数据交易中的安全风险也存在巨大信息不对称。
3、政策层
在政策层面,相应制度与法规仍然不完善。现实案例主要包括个人信息权、商业数据使用与不正当竞争、数据安全以及非法调用API接口等,体现了制度与法律法规层面的四个重要问题。
第一,数据确权等权属分置问题。理论与实践中划分数据权属困难重重。一是数据分级分类问题尚未解决,例如个人数据、企业数据和政务公共数据,原生数据和衍生数据等。二是数据所有权难以归于单方主体。一方面,如果将数据所有权归于数据收集人(如企业),则难以产生整体上的产权意义,另一方面,若将数据所有权归于被收集人(如用户),则不利于个人权利的行使和数据产业的发展。三是法律确权探索收效甚微。目前,国内外立法层面关于数据的规定越来越多,但都未对数据产权问题给出明确答案。从国内看,《民法典》总则编仅规定了对数据财产的法律保护,一些地方立法对数据权属的界定进行了探索尝试,但效果不佳。
第二,数据安全合规成本问题。数据交易过程中面临的合规安全等风险成本,导致买卖双方的参与意愿不高,数据市场流动性不够。目前,数据交易既要符合《数据安全法》下的数据合规要求,还要遵守《网络安全法》《个人信息保护法》等关于网络安全、个人信息保护等方面的要求。上海数据交易所还明确提出“不合规不挂牌,无场景不交易”的原则。
第三,数据要素流通市场建设的相关制度不健全。一是数据交易平台缺乏标准,国内数据交易平台几类模式并存,各自建立规则,存在隐藏的盲点和误区,数据标准化程度低,同时数据交易登记结算体系尚不完备,各个数据交易平台的资源难以有效整合。二是没有明确数据交易监管机构,数据交易市场准入、数据安全、数据滥用、数据交易纠纷等问题都缺乏监管。三是没有针对数据交易和应用的专门性法律法规。
第四,数据垄断如何判断。关于数据垄断的问题,是否存在数据垄断,如何判断?反垄断法如何适用?如何平衡数据生产与数据分享中动态与静态效率?从数据的静态效率来看,应用越广泛越好,但这可能会削弱数据投资激励,进而带来动态无效率。所以,数据垄断是一个很重要但没有解决的问题。
三、数据要素市场建设的建议
在提出对策前,我们对数据问题的成因进行了分析,主要包括以下两个方面:
第一,市场失灵。一是信息不对称,供需双方缺乏对数据需求准确的描述以及数据质量的信息不对称等。二是负外部性,数据流通过程中可能会带来隐私泄露、商业机密泄露等数据安全问题。三是垄断问题,企业出于商业秘密保护和核心竞争力的考虑严格保护数据。四是协调失灵,产业链上的各企业在数字化时可能存在协调失灵问题,且协调失灵也可能发生在单个集团公司内部的不同部门之间。
第二,政策失灵。一是数据交易所重复建设,各省市纷纷设立大数据交易所,但多停留在“一把手”工程,数据交易所存在重复建设和经营不佳的问题。二是面临发展与安全的二元政策矛盾,中央和地方存在多个负责大数据流通交易的管理部门,关注重点的不同容易产生在发展和安全之间的政策矛盾,政策和规则不统一,易造成数据跨行业、跨地区流通应用的阻碍。三是政策不明确和不稳定,企业无法形成稳定预期,会采取“法无授权不可为”的策略来规避政策风险,从而导致缺乏发展活力。四是公共数据缺乏数据共享激励机制,政府部门在公共数据授权运营过程中,将部分用于公共利益的公共数据转为授权运营,减少了公众免费获取公共数据的数量,增大了社会运行的整体成本。
针对以上两点主要原因,应对问题的基本思路如下:
(一)理解数据作为生产要素的价值
数据生产要素的价值在于产生提质降本增效和促进创新的经济效益,核心在于开发和利用数据。所以,数据基础制度设计要有利于数据的充分开发利用,而不是要最大化数据交易量和交易额。而且,要审慎对待数据作为一种资产的入表、用于抵押和融资。
(二)寻找数据要素的高效流通模式,兼顾交易和交互两大主线
首先,尝试多层次的交易模式。培育专业的数据要素市场参与主体,例如引入第三方专业机构,试点数据信托模式。借鉴国内实践的成功经验,如北京大数据交易所的“数据可用不可见、用途可控可计量”的交易模式,以及上海大数据交易所的数商新业态与数据产品登记凭证。积极提供质量评估、合规性评估、资产评估和纠纷仲裁等配套服务,推动数据溯源和可信交易。
其次,重视数据交互在数据要素流通中的重要作用。数据交互指通过与各方共享数据来支撑业务打通和创造新价值,各方共享业务发展带来的红利。数据并非必须经过确权、定价和交易后才能流通和使用,数据交互模式下没有确权、估值、“入表”和交易规则等服务需求,数据是否登记也不成为其可流通的必要条件。同时,需要解决匿名化标准、隐私保护责任边界、数据跨境流动、数据安全技术开发、大企业数据垄断等问题。数据交互的主流模式是API(应用程序编程接口)模式,包括消费者平台数据共享模式和产业互联网企业数据共享模式。
(三)如何有效保护数据投资激励
数据是否利用和共享范围越广越好?这类似于技术和知识,数据并非共享范围越广越好。虽然数据的非竞争性意味着从事后角度来看数据分享越多越好,但这也可能会降低针对数据的投资激励。但也需要审视用于判断数据共享是否不足的标准,以合理的共享程度为目标有助于提升社会福利。
(四)数据流通利用的关键
数据流通利用的关键是数据还是技术?数据的价值取决于服务能力,现阶段应用数据的能力更为重要。在面临拥有海量数据的阿里、京东和腾讯微视的竞争下,拼多多和字节成功崛起。ChatGPT大模型在美国崛起,也是技术和经济环境等多种因素的共同作用,而不仅仅是由数据量的差异导致。比起单纯的数据量,技术和有利于创新的体系、制度和经济环境更加重要。
在以上分析的基础上,提出如下建议:
第一,明确有效市场是数据要素市场发展的基础,政府的作用则是在市场失灵时进行补充和引导,政策制定需要且应当遵循市场规律和原则。一是构建合理的市场参与者激励机制,提高数据产品的质量和吸引力,在需求端提升各行业的数字化水平,推动数据要素的需求与应用场景等。二是优化数据流通交易模式,降低市场摩擦,尤其是重视数据交互的流通方式,协调推动数据交易和数据交互两种数据要素流通渠道。三是引导社会资本投入,谨防形成行政垄断,数据交易平台可以对市场放开,一些公共数字化的应用场景可以适当对市场放开。除此之外,政府可以加强技术研发与人才培养,建立健全数据安全保障与合规交易机制。
第二,以发展数据交易平台为抓手,进一步完善数据要素市场生态建设。数据交易平台应当树立好综合服务商的定位,不断提高服务水平和建设能力,做好规则制定、生态培育、技术创新、机制设计、安全保障等辅助服务,发挥自身中介价值。以构建互信协同的生态系统为前提,以机制和技术为驱动,以业务创新、合规创新、模式创新为核心,通过建设互信机制,连接数据产业链各个环节,让数据价值在链上流动起来,形成数据产出、交易闭环。
第三,探索更加完善的数据要素定价与收益分配体系。应综合各种定价方法,采用分类的差异化定价,尽量拓宽数据交易的使用场景,并据此作为定价基础。例如面对标准化程度高、投入产出都能清晰衡量、价值比较稳定的数据产品,采用成本法,依据形成过程中的劳动和资本投入定价;面对高稀缺性、高价值、受市场供求较大的数据产品,采用拍卖法,实时定价;面对定制化的数据产品或服务,采用协议定价方法。
针对数据的来源与用途,我们提出2×2矩阵的定价思路,将数据来源划分成公共数据和企业数据,将用途划分成商业用途和公益用途。对于企业数据进行商业用途而言,定价应当完全由市场决定,这样能够确保最大程度的发挥数据价值。对于企业数据和公开数据的公益化用途而言,不宜产生过高的定价,可以采用制定价格上限指引的方式提高公益用途数据的使用,提升总体社会福利水平。对于公共数据的商业用途而言,则需要兼顾效率和公平两个方面的平衡,可以进行最低限价的价格指引。与此同时,数据交易平台也要不断探索数据交易定价的规则方法,鼓励发展受市场认可的第三方权威数据资产评估机构,发挥数据市场价格发现的作用,使数据交易定价不断透明化、正规化。
论坛第二单元,结合CMF中国宏观经济专题报告,各位专家围绕数据要素市场建设的现状、问题和建议展开讨论。
国家发改委价格监测中心副主任王建冬从产权体系、流通体系、分配体系三个角度全面分析了我国数据要素市场建设的现状和问题。“数据二十条”提出,构建数据使用权的权利束体,分成数据资源持有权,数据加工使用权和数据产品经营权,从数据资源到数据产品是一个数据开发利用的链条转移,这意味着单纯的数据变成了数据、算法、算力的结合体。按照这一逻辑可根据来源方和处理方将数据产权分为两段:流通和使用阶段包括持有权、使用权和经营权,这一阶段要保护数据处理者的合法权益;生产阶段要保护数据来源者的合法权益,并通过知情同意和法定事由确定数据持有权的归属。
短期来看,数据基础性制度将催生3000-5000亿元规模的数据交易市场。中长期看,数据资产化催生的相关市场潜在规模将达到十万亿级,但目前的现状是竞争“白热化”和资源“碎片化”并存。接下来,应构建数据要素的多级市场体系,建立三级市场联动的新型价格机制;建立公共数据政府指导定价的基本框架;实现报价-估价-议价社会数据价格形成路径。在分配机制方面,未来需要探索建立体现效率、促进公平的数据要素收益分配制度,健全数据要素由市场评价贡献,按贡献界定报酬机制,更好发挥政府在数据要素收益分配中的引导调节作用,并引导企业承担社会责任。
上海金融与发展实验室前沿金融研究中心主任,万向区块链首席经济学家邹传伟讨论了消费者如何参与数据要素市场。消费者个人数据具有特殊性,在数字经济中由消费者主动或被动披露,并由互联网平台记录,据联合国贸发会议2021年《数字经济报告》,我们更强调数据权利,而不是数据所有权,数据权利体现为访问、控制和使用数据的权利。其次,由于隐私悖论以及专业门槛和规模经济的影响,消费者个人不适合直接进入数据要素市场。
基于数据要素的共性和消费者个人数据的特殊性,金融是理解数据要素市场最佳的视角。第一,金融系统和数据要素市场都不涉及实物商品的生产和流转,且数据要素市场的很多活动都能在金融市场中得到对应。第二,数据要素市场发展离不开金融系统的支持,金融是个人数据货币化的主要渠道,数据入表也需要通过金融系统变现。第三,金融是最早开展数据管理的行业。第四,金融为数据要素市场提供了“试验田”,韩国的My Data模式和印度的India Stack对于推进中国要素市场构建具有参考价值。
中国移动研究院用户与市场所所长林琳提出,数据要素的流通市场既包含数据资源的流通,也包含数据产品和服务的流通。可用、可信、标准的高质量数据资源才具备可流通的基础,而数据产品和服务是以数据使用方的需求为导向,整合多元数据以及技术方案形成可流通的数据产品和服务。数据要素流通不一定要完成商品从生产侧到消费侧的转移,使用价值的实现过程也是数据要素的流通。电信业务市场的资费发展历程是从政府定价逐步走向市场定价,对于数据要素定价具有借鉴意义。数据资源市场的定价适宜采用政府指导价,实施价格上限的管理。而数据产品和服务建议采用市场调节价,由市场决定价格。
以数据为基础,产业数字化将会走向智能化的阶段,通过数据驱动实现精准高效的决策。数据要素为制造业带来了四个范式的跃迁:第一,生产制造范式的跃迁,从人工驱动到智能决策;第二,管理运营范式的跃迁,从分散管理到统筹管控;第三,产业协同范式的跃迁,从信息互联到运营协同;第四,业态创新范式的跃迁,从局域运用的管域物用。在营销领域,数字化营销是典型的数据加技术双驱动模式,通过分析多元融合,多元数据,依托多种智能技术,打通营销的各个环节,实现更精准、更敏捷、更快捷的数据迭代,很好地发挥了数据资源市场和数据产品服务市场的作用价值。
复旦大学管理学院教授黄丽华认为,数据要素流通的实践模式有三种:第一,企业间直接交易,主要分为早期互动、供需匹配沟通、价格和销售合同谈判、合约达成、履约五个阶段;第二,平台交易(线上线下结合模式),容易出现有偏市场、去平台化现象以及不具备可持续发展能力等问题;第三,联盟+共享模式,主要包括面向某个需求应用场景、面向某个供应链协调运营应用场景,面向某个产业的数据共享或交易三种形态。
目前,我国数据流通和交易领域存在数据流通和交易不活跃、数据流通和交易合规成本高、数据流通和交易安全风险防范与监管体系不健全、可信流通技术与基础设施不成熟等问题。未来需要系统性地解决问题:第一,加强高质量数据供给,激活数据流通的源头;第二,激活有效使用需求,释放数据要素乘数效应;第三,建立健全流程规则,促进合规高效数据流通;第四,积极培育流通生态,降低数据要素交易成本;第五,大力促进技术创新,夯实数据流通基础设施建设。
延伸阅读
【视频】 邹静娴:再出发--2024中国宏观经济
张杰:构建中国优势“科技-产业-金融”循环体系:障碍、途径与改革突破口
黄石松等:发展银发经济要找准定位
伍戈:促进现实经济增速与潜在增速的匹配
于泽:发展新质生产力是应对全球格局变动的战略举措
【视频】 许宪春:2024年一季度经济运行的若干特点