核心要点
1、2022年场内交易的比重还是比较少,场外交易占了70%-80%。
2、国家数据交易所并不是只有一家,北京、上海、深圳有可能同时成为国家数据交易所。
3、产品定价有两个原则,(1)牵扯的个人的数据是最贵的(2)企业的数据是按条卖的。
4、70%-80%的数据需求方是金融企业。
5、任何一个国家和城市对于个人数据都非常敏感,所以数据交易中心是不碰个人数据的。
产业调研系列
数字经济作为国家顶层战略,两大抓手就是算力和数据要素。我们近期有幸邀请到了国内一线城市的数据交易所资深专家分享数据要素市场情况,现分享如下。
核心要点
1、2022年场内交易的比重还是比较少,场外交易占了70%-80%。
2、国家数据交易所并不是只有一家,北京、上海、深圳有可能同时成为国家数据交易所。
3、产品定价有两个原则,(1)牵扯的个人的数据是最贵的(2)企业的数据是按条卖的。
4、70%-80%的数据需求方是金融企业。
5、任何一个国家和城市对于个人数据都非常敏感,所以数据交易中心是不碰个人数据的。
1 数据要素市场简介
从全球数据流通的市场规模看,2021年和2022年整体在2000多亿人民币,欧美、北美洲大概1000亿,欧洲500多亿,整个亚洲500多亿,中国250亿左右。
中国数据要素市场交易的流通过程中分为场内交易和场外交易,场内交易就是全国各地成立的数据交易所和数据交易中心。有北京、上海、深圳、西部、贵阳等几个大的所,其他的地方如江苏、山东、安徽都有一些数据交易中心,国有背景的叫场内交易。2022年场内交易的比重还是比较少,场外交易占了70%-80%。由于包括数据20条、国家数据局成立等国家政策的提出,预计2025年全国数据流通交易的市场规模达到1500亿左右。由于两会刚刚结束,相应政策还没出来,这只是之前的预估,现在的市场规模还会逐步增大。
简单介绍一下国家战略布局的历程。2014年大数据写入了国家政府的工作报告,2016-2019是落地阶段,2020至今在深化阶段。比如最近在数字政府、数字经济和数据 20 条逐渐出来之后,包括发改委下面成立的国家数据局都是为了进一步拓展国家的数据战略布局。
2 数据要素市场的组成
大家都比较关注数据要素市场的组成方式,我们把数据要素市场分成了“10+3”体系,有十大主力板块。
十大主力板块包括:(1)金融板块,金融板块里包括银行、保险、资本服务。(2)贸易板块,贸易板块里面包括大宗商品交易、国际贸易。(3)治理板块,包括政府部门、事业单位、科研机构等。(4)交运板块,包括航运、空运、陆运,对吧,后面我会简单的介绍一下交运板块里有什么样的数据产品。(5)通信板块里包括网络运营商、通讯设备制造商等。(6)消费板块包括互联网、快消、零食、餐饮、酒店等。(7)医疗板块包括医疗服务、疾病防控、药品的研发生产。(8)工业板块里面包括冶炼、装备制造、轻工业、高新技术产业。(9)能源板块包括能源生产、能源贸易服务、能源装备等。(10)文旅板块包括图书影视、多媒体、旅游服务。
还有三大拓展板块,(1)综合板块,整体通用性产品,应用场景符合多行业数据交易需求(2)新兴板块,上数所数据资产的板块和MFT的交易叫新兴板块。(3)国际板块,20条里提到的和国际数据进行对接的。
3 数据流通的交易模式
数据流通有标准体系和相应技术,这些技术你们可能不是非常关注。同时由于国家对于数据的确权没有明确法律法规,数据交易所会对数据资源的持有权进行审核。接下来流通模式主要就是数据登记、数据定价、数据交易等。北京、上海、深圳、贵阳都是这样的交易流程。第一要在数据源进行数据治理,治理之后对产生的数据产品做产品等级,之后做产品挂牌,下一步做交易测试,交易测试之后是交易合约和产品交付,最后是清结算、凭证发放和纠纷解决(如有)。
4 数据要素市场的多样性
大家还会比较关心数据源如何产生数据产品和数据产品的形态,比如上数所有一个产品叫企业电智绘,企业电智绘数据的拥有者是国家电网,上海的国家电网提供了上海的企业用电的情况,数商把国家电网的数据做了数据治理(国家20条出台前,上海把数据商定义为数商),产生了企业电智绘。企业电智绘中有企业名称、统一社会信用代码、问卷地址、所属行政区域、用户行业分类、是否线上企业等信息,这些都属于企业电智绘数据产品里的数据分类。
对于需方来说(以金融行业为主),银行、投资机构等资方不可能一天跑够所有企业,也不可能了解企业实时的运行情况,就会通过上数所的数据产品对所要了解的企业进行用电观察,通过用电可以知道这家企业是否在良性循环。比如上海交通委下面的随身行给上数所提供了一个数据产品是停车场,在做汽车导航的时候可以在地图上看到去哪里停车的按钮,提供了周围可供停车的地方。还有中国远洋提供了海上情况的数据,以前根据海域的情况实时出保险比较贵,有了这个数据产品后可以根据船开到的地方自动打出保单,比原来的基础上便宜很多。原来的船运公司可能觉得价格太高不买,现在由于我们的数据产品,他们觉得价格比较合理,就会去购买。
5 数据要素市场的展望
在探索数据资产化的过程中,数据要素市场的终极目的就是把数据价值最大化。要达到数据资本化,第一步是数据资源化,这个已经完成了。数据资源化就是数据建仓,数据的建仓阶段、数据治理的阶段。现在数据应用和数据运营已经做完了,现在在做数据资产化的过程。数据资产化2.0在做数据权属的确定、数据价值的评估、数据交易流通和数据安全保障。最终的目的是数据资本化,做到数据资本公平按劳分配、普惠共享、数据资本共有,探索数据资产入表后可以拓展为数据资产作价入股、抵押融资、资产证券化等,有非常大的资产运用。它有非常广阔的运用,也是数字经济里数据要素、数据治理和数据流通的目的。
数据资本化的前提是知道数据的价值在哪里,要通过数据流通和价值评估来确定数据资本化的前提,就像固定资产入表做的折旧要做评估,评估的前提就是数据要产生价值。现在都在讨论数据资产成为数据产品之后,最终数据资本化之前,如何衡量数据产品的评估,这也是接下来会讨论的点。刚刚提到的15类数商是参与到整个数据要素市场运营和数据流通过程中非常重要的一环。
第一类是数据基础设施提供商,比如提供数据流通技术的信息技术基础设施、云计算、区块链操作系统的产品服务。
第二类叫数据资源集成商,是提供数据存储、数据中心、数据采集、数据中台等产品和服务的。
第三类是数据加工处理服务商,提供数据清洗、标注、融合、对异构数据进行处理和结构化产品服务。
第四类是数据分析技术服务商,提供数据挖掘、机器学习、预测分析等产品和服务。
第五类是数据治理服务商,制定数据标准、数据分级分类等服务。
第六类是数据咨询服务商,提供有关数据管理、数字化转型技术解决方案。
第七类是数据安全服务商,提供网络安全、云安全、信息安全、密码安全等安全类产品和服务。
第八类是数据人才培训服务商,是关于数据处理、管理、分析、治理等方面相关人才培训企业, IT 教育培训、编程教育、数据管理培训统称为数据人才培训服务商。
第九类是数据产品供应商,主要是数据要素型企业,包括金融、互联网、交运、医疗健康、能源、工业、通信,有其他行业的数据要素型企业归类为数据产品供应商。
第十类是数据合规评估服务商,主要对数据运营的合法性、流程合规性进行管理和监督。
第十一类叫数据质量评估商,主要对数据质量和价值进行评估的企业,这类企业现在还比较少。
第十二类叫数据资产评估服务商,主要是指对数据价值进行量化评估和审计的企业,通常这些企业经营业务包括资产评估、财务咨询、审计。
第十三类是数据交易经济服务商,主要指的是匹配数据要素市场供方和需方的企业,是促进数据交易的经济商和中介。供方提供的数据有些需方是不知道的,就需要数据交易的经济服务商来提供经济服务,他知道哪些企业有相应的数据,哪些企业需要相应的这个数据,可能会存在的信息不匹配需要相应的数据交易经济服务商去提供服务。
第十四类数据交付服务商是指数据方案进行执行落地的企业,提供比如隐私计算、融合计算、联邦学习等产品和服务。
第十五类叫数据交易仲裁服务商,主要是指是在数据要求市场中发生的各类经济活动,有违规的问题或争议进行解决的这些企业。
我们总的把这 15 类的数商统称为数据要素市场里进行数据流通、数据服务、数据交易、各种数据活动的数商。我们数据交易所成立的时候成立了数商协会,成员单位从原来的 200 家到现在已经大概有四五百家了。每一个企业进入数商协会时都会被打上标签,比如是数据交易经济服务商、是数据交付服务商、是数据质量评估商等,基本每周、每月、每个季度都会举办相应的数商活动,让各自的供应商做相应的匹配和服务。
比如有的数据要素型企业没有数据治理能力,可以从相应的数商里找到对应企业来进行数据治理,还有数据安全服务商对整个流程做安全服务。通过数商协会把数据要素市场的活跃度提升起来。
所以原来只有几百个数据产品到现在两三千个数据产品,第一是通过政策的大力扶持,还有通过数商协会的指导,把大量的企业拉入数据要素市场的活动中。
还有一些发展的特征。我国的数商主要集中于长三角、珠三角和京津冀,在中西部比较少,截止2022年在山西、云南、青海、甘肃都没有数商企业。上数所还发了100个数据资产(国内不能叫NFT,就叫数据资产),比如龙虎牌风凉油、回力、华山路老的建筑、上海博物馆等,包括和B站等合作都发布了一些数字资产(免费的),在接下来的过程中也会寻求二次交易的机会。这也属于数字经济里的一块,也属于我们数据要素市场里新的尝试。
Q:您刚才说的一套东西是否需要后续政策支持?政策主要的发起方有哪些部门?未来的大概进度?
A:国家政策方面,国家之前发布的政策虽然没有数据20条那么清晰,但我们也做了相应跟进,里面大部分的调理都是各个地区的所的实际运行情况向上提交后,才会发布国家级的政策,前提是各个地区的实际运行情况汇报后才能形成国家级的政策。外面说是摸着石头过河,其实这个石头从16年做到21年已经做了五年了,拥有相当成熟的经验。现在变成所之后,是给原来的中心加入了强的监管,比如相应的审计、财务和监管力度加入所里来。对于外部企业来说这也是一个背书,为什么很多金融机构要到我们数据交易所进行场内流通,很大一部分原因是中心和所承担了政府背书的角色,场外交易还是存在灰色力量的。
Q:是否可以认为您这边所做的事情是为以后发改委制定政策打样,未来会形成统一的标准并推广。
A:是的,我们已经在申请国家数据交易所了,当然国家数据交易所并不是只有一家,北京、上海、深圳有可能同时成为国家数据交易所。比如上海数据交易中心和深圳数据交易所可以升级成国家数据交易所,进行国内所有的数据流通业务和国际数据的流通,不是国家只有一个交易所。
Q:15类数商相当于15类参与方,刚才您提到2025年数据交易规模大概1500亿,这15类里面谁能吃到更大的蛋糕?
A:15类数商都能吃到蛋糕,就是谁多谁少的问题。最重要的是数据家公司,很多数据源的企业并不善于做数据中台和数据处理,它需要有数据加工商对原有杂乱无章的数据进行数据治理形成数据产品。数据加工商里有好几块,一块是数据加工处理服务商,一个是数据治理服务商、数据分析技术服务商和数据安全的服务商,这几块服务商有的同时身兼 2 类或者是 3 类,有的企业只做一类,比如XXX只做安全类的。做数据处理的服务商也会占据比较大的分量,因为任何数据都需要经过加工之后才能在数据交易中心/数据交易所挂牌。
除此之外发展机会比较大的还包括:目前数据资产评估服务商比较少,因为数据资产评估还没有明确方向,只不过目前通过相应手段总结了一些评估办法,但还没通过国家正式认证。数据资产评估服务商还处于萌芽阶段,未来数据资产入表之后都是需要这些服务商进行数据资产评估的。
还有数据交易中心和数据交易所,这些可能不能投资,因为背后都是国资委等。我们在两会的时候也提了相应的政策,在未来明确数据资产登记确权和数据资产凭证管理有可能成为国家数据教育组的法定职能。明确数据资产跟进确权和数据资产凭证管理这两方面这个数据交易所的地位也会很高,跟这些数据交易所有关联的相应公司都会获得可观的发展前景。我们最终的目的不是看现在的数据流通市场,而是看数据资产入表后对企业或地区的GDP的提升和对领导政绩的提升。
还有购买数据产品的企业,这些企业本来就比较有钱,都是一些金融机构。还有数据交易经济服务商,现在还比较少。了解数据交易中心和数据交易所相应的数据产品的企业比较少,需要数据产品的企业知道有哪些数据交易所提供需要的产品的也很少,市场上需要相应的中介进行匹配。现在有这样的企业,但比较少。比如青浦公安需要某些数据,但政府机构不能成为数商,要通过数据代理方找到相应公司提供数据服务,这个公司要去上数所这种公司采购相应的数据服务来给公安提供相应服务。对于公安来说,不知道哪里有、不知道数据质量和数据产品怎么样,就需要相应的数商提供数据服务。接下来的市场环境会和之前的信息化服务不同,原来标的几千万的项目可能都是买平台、服务器、软件开发等,对于数据要素市场来说就有大量的数据采购场景,就像企业电智绘和企业找停车都是根据相应的场景提供服务,数据要素市场大量的服务和合同都不靠硬件设施和人力衡量。
总结来看,数据加工商、未来的数据资产评估商和中介有大的投资潜力。其他的人才培训机构,这是政府和各大高校相互协调的,这个没有特别大的。数据安全已经有的做了很大了,在未来的数据要素市场里也会进一步扩大。
Q:企业的用电数据不是商业机密吗?为什么能出售?
A:这是授权的问题,比如企业去国家电网开通账户会有很多条款,可能没仔细看,肯定有一条是允许国家电网使用相应数据。包括运营商有大量的用户数据是在申请sim卡时就已经授权允许使用个人信息的。我们都是通过相应律所进行审核的,他可以使用企业相应的用电数据才能流通。同时并不是所有的数据交易中心/数据交易所都是卖数据,而是提供一个查询场景。比如查询用电地址周一到周五是否正常用电,答案只有“是/不是”,没说用了几度电。任何的数据产品都是“无场景不交易、不合规不挂牌”,所有的挂牌产品都是合规的,所有数据流通都是有场景的,只是提供数据服务不是卖数据。
Q:现在还没有特别的定价机制,但能不能提供大概的定价思路?
A:产品定价有两个原则,(1)牵扯的个人的数据是最贵的(2)企业的数据是按条卖的,比如企业电智绘有6条相应字段,每个字段对应的价格不同。如果要查企业名称可能1分钱,要查是否用电以及额度会比较高,比如五毛钱。因为调用量很大,所以定价不贵,贵一点的1-2元,基本上是1毛-5毛。需方在选择数据产品的时候在前面打勾,数据中心会向供方收取10%的服务费(之前没达到10%过,基本都是几个点)。我们是问供方收服务费用,不是问需方。因为我们只是个平台,需方把相应的钱打给供方,但是是以预付费的方式。需方也不是所有数据都要,他们有自己的数据部门进行分析,判断是否是优良企业/高净值客户。
现在的政策是先用公共数据,现在个人的数据比较少(可能场外比较多),但是场外个人数据的流通管不住,所以国家要把所有的数据流通纳入正规轨道,才会有数据安全法、数据条例等。
每条信息价格不同,但是调用量很大。我们70%-80%都是金融客户,比如今天要查5000-10000家企业,每个企业打几个勾就很多了,而且上海也不止一家银行,价格低但是流量大。
Q:买卖数据的双方主要有哪些?是否需要资质才能做数据交易?
A:原来我们数据交易中心没有相应的规定要买数据的前提,只要跟中心签一个购买协议,做一些预付款就可以了。但是现在变成数据交易所以后,买卖双方都是数商(非强制性)。现在要在数据交易所进行数据的流通,首先要成为数商,成为数商之后会给你打标签。比如我们城市有四十几家民营银行,这些银行都是需方,像我前面说的国家电网它也是数商,它能够把它的数据产品挂在我们的数据交易所里面。现在我们数据交易所的挂牌产品有 2000 多个,但是并不是数仓有 2000 多,一个国家电网可以提供 10 个或 20 个数据产品。原来数据交易中心的时候没有,但是现在强监管了,是需要先成为数商才能进行流通的。
现在主要的需方以金融机构为主,因为金融行业对于数据的需求量是非常大的,金融里面包括银行、保险、销金、小贷等。全国在 2021 年底的时候,人民的消费大部分都是通过支付宝、余额宝,花呗、抖音月付、京东金融等消费金融实现的,这些对于数据的这个需求量是非常大的。各个地区的交易中心和所现在最大的客户还是金融体系为主,最早的时候可以达到百分之80%-90%全部是金融。现在我们数据交易所,除了金融机构以外,其他行业的央企和国企也逐步的成为我们的需方。像政府除了公开数据以外,也需要大量的商业数据为政府做决策提供支持的。原来上海大数据中心通过本来的公共数据是完全不能够支撑一个城市/省相应的决策分类的,都是需要海量的商业数据来进行补充的。
Q:在数字时代,居民的数字身份是如何认证的?
A:之前的交易中心和交易所都不过多的做个人的业务,中国数据分三种,公共数据、商业数据和个人数据。国外就分个人数据和非个人数据。任何一个国家和城市对于个人数据都是非常敏感的,所以在数据交易中心的时候,我们是不碰个人数据的。在中国,人就是三要素,名字、身份证号码、电话号码。因为电话号码现在是实名制,所以电话号码加上姓名和身份证就可以确定你是你,这些在公安部里也是这样认证的。你在登录微信、 QQ 的时候会进行人脸识别,人脸识别的数据都是在公安的,这些东西都是跟数据流通有关系的。你每次认证的时候就会跳到公安的这个数据库去进行比对的。扫一下的过程都是在进行数据流通,只不过这一块是不能碰的,国家20条也规定涉及到个人隐私、国家安全的是不能动的,所以现在正规的场内交易是没有个人隐私数据的。
Q:如何定义数字银行的场景?
A:第一个是支付,因为数字货币出来之后我们用的最多的就是支付功能,这个在我们数据交易所是没有相应产品的,数字银行类和数字人民币的资源在我们数据交易所里都是没有的。其他应用的场景我觉得还是会偏向个人金融,除了买卖以外还有消费金融服务。
合规声明:本文节选自正式入库研究报告及国君计算机专家电话会议纪要,属于公开资料,如需全文PDF请后台留言。
- end -
欢迎加入行业交流群!
欢迎所有对计算机产业研究和投资感兴趣的盆友(包括云计算、网络安全、医疗IT、金融科技、人工智能、自动驾驶等)后台留言加入我们的行业交流群。我们的目标是建立系统的计算机产业研究框架,提高整个A股的IT行业研究水平,减少韭菜数量,普度众生。
数据要素、数字经济相关报告