查看原文
其他

把数据装进工具箱,需要分几步?

FII 福田产投
2024-10-09


6月16日,全国首个数据要素全生态产业园在福田启动。产业园以构建“1+5+6”产业发展体系为目标,即打造数据要素产业标杆园区“1”个目标,落户数据交易所、数据登记结算中心、数据要素产业科研机构等“5”个重点机构,集聚数据采集、加工、存储、流通、分析、配套服务“6”类优质数据优势企业,形成“资-供-产-销-用”良好生态闭环。

从数字经济的“上帝视角”来看,这意味着数据要素市场化的进程,再次向前推进不少。

数据作为人类生产和生活行为的载体,具有巨大的生产要素潜力。与之矛盾的是,数据要素迟迟不能进入大规模应用的生产要素队伍,实在是因为,数据这种“要素”有点特别。



流通or安全,这是个问题


数据要素全生态产业园的启动,也是福田将数字经济作为优势领域经济业态,长期以来一直处于发展优势位的结果。2021年,福田率先印发《福田区推进数字经济发展行动方案(2021-2023)》,成效颇为显著。2022年全年,福田数字经济核心产业增加值约为678亿元,占GDP12.3%。今年,福田区再出台最新三年行动方案。一季度,实现增加值同比增长达8.1%。


数字经济发展之快,令人咋舌。



数字经济的另一个伴生特征,就是数据量的爆发式增长。根据有关测算,2016 年中国数据总量为4ZB,预计在十年后的2026 年可达到 1024ZB。


然而,数据并未因其爆发出的增量而呈现出和传统资源一样的价值回归属性。恰恰相反,数据价值随着数字化进程,一路洛阳纸贵。大模型的出现让数字经济迎来了革命性的业态进化,而大模型训练的壁垒也正是数据。


相较于传统资源,数据资源存在诸多根本性区别特征,如本身是无意义的原始信息记录、可通过埋点收集、预设记录规则等承载物理世界信息,且数据可以轻易复制。随着信息技术的进步,数据的产生和使用产生天翻地覆的变化,数据存储、传输、处理的性能不断突破,网页、声音图像等半结构化、非结构化数据也逐渐得到有效处理和利用,数据在价值提升的同时,流通和安全的关系也变得微妙起来。


从商业角度而言,数据要素作为一种生产要素,应该具备流通属性。而数据承载信息、易于复制的特点又意味着并不能像实体资产一样管理,这就涉及另一个问题——安全。近年来,围绕数据安全甚至数据归属的商业案件频发,对物理世界的渗透让数据具有了行为归责、调查取证、运维排查等各种社会价值。在国际上,数据安全也成为大国博弈的高地。近年来,美国的战略重心已经从网络安全转向数据资源为核心的安全攻防体系,我国近年来也多次就数据安全出台相应文件。



数据作为除土地、劳动力、资本、技术外第五类生产要素的地位,在2020年在中共中央、国务院印发《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》被明确。工信部《中国数据要素市场发展报告(2021-2022)》报告提出,2021年我国数据要素市场规模达815亿元,预计“十四五”期间市场规模复合增速将超过25%,整体将进入群体性突破的快速发展阶段。数据要素市场化势在必行,数据安全作为最突出的矛盾亟待解决。



数据“中间件”或破局


强调数据安全,数据流通起来自然就有一定难度。


数据要素的市场化问题,很大程度上和安全性问题关联起来。数据可能产生于工厂监控日志,也可能产生于我们运动时佩戴的电子终端,它们终会去向不同的数据库。生产数据对普通人毫无意义,但对商业对手而言意味着机密;运动数据对于普通人而言有记录、社交等价值,对互联网企业而言可能意味着作息、消费习惯、活动地域等极具参考价值的决策依据。可以说,原始数据的价值视读取对象、样本量级等外在因素影响存在巨大差异,具备不确定性。

对于“敏感”的原始数据,数字化早期的解决方案是仅仅依靠物理隔离,如储存在本地。这种方式对数字化运维可谓灾难,例如一位工程师处理一处故障,可能需要半夜穿越半个城市去调取监控日志。这类难题有个形象的描述——信息孤岛,不仅仅造成人力浪费,更使得数字化仅仅能在小范围赋能生产,更遑论作为生产要素流通。


人们意识到,数据也需要一种“中间件”,这种“中间件”具备安全和价值两种属性,既便于流通,又使原始数据免于“裸奔”。同时结合物理隔离和“中间件”加工,数据要素就可以安全地进行市场化流通。

不难想象,这是在打造一个数据的“银行”,容量巨大,安保严密。

如此宏大的工程,确确实实在悄然实现。2020年,中国电子启动数据安全与数据要素化工程,创新性地提出了以数据元件为核心理念的数据要素化实现路径,并联合清华大学、北京大数据研究院以及所属企业中国系统、奇安信等单位共同编写《数据元件的结构化要求》《数据元件安全审核要求》两项团体标准文件。文件通过中国信息产业商会组织的专家评审,中国电子也在短时间内将技术推向实现路径。

中国电子定义了数据元件和数据金库两个产品,提出了以物理隔离、数据托管和模型转换实现存用分离的破题思路。关键数据存储与数据金库中,数据金库内的数据只有经过加工形成数据元件,才能到外网进行交换使用,让原始数据和数据应用进行隔离,满足了安全需求;数据元件的价值属性在于它的可确权、可定价、可计量和可流通,从而解决了数据要素化问题。


目前,中国电子已与徐州、湖南、德阳、郑州等多地政府合作,推进数据元件和数据金库产品以及相关服务的落地。数据元件也正作为关键商品,缓缓打开数据要素市场。以德阳为例,其率先完成“1+4”的数据要素核心基础制度的发布,以及27项细化制度的编制,为数据要素流通提供了制度依据,并于2022年底将首批数据元件在深圳数据交易所完成挂网交易。



数据要素市场化,前路漫漫


必须明确,技术落地距离完全的数据要素市场化相去甚远。相较于细分领域的数据元件流通,构建数据要素市场的前期需要另一项关键抓手——公共数据。


公共数据来源广泛,且往往包含多个维度的信息,如上文提及的运动数据可能指导商业决策就是典型例子。毫无疑问,公共数据可以更全面指导政府进行数据要素市场规范化建设;但问题的另一面在于围绕公共数据的采集与使用存在诸多问题尚未形成统一规范,如数据要素的公益性与收益模式的平衡,以及信息保护和数据价值释放的矛盾等,简而言之——谁用?有何好处?如何保护数据生产者权益?



带着灵魂三问,各区域在发展的同时积极探索公共数据的使用规范。在数字化程度越高的地方,公共数据释放的价值往往更大,进而推动数据要素市场进入良性发展,如福田区就在积极推动公共数据开放共享,支持公共数据高效高质利用。同时也在夯实公共数据安全底座,保障公共数据开放规范有序。一推一拉,都是必要动作,极力发掘数据要素市场潜能的同时也在摸索公共数据应用规则。数据要素市场的建立,有高明的数字化手段远远不足,更需要良好的营商环境,和政策指引。


数据元件和数据金库这类工具的出现,让数据具备更贴近传统生产要素的属性;另外一个划时代的意义,则在于将公共数据既有问题简化,让市场更易于形成可行的公共数据应用规范。《中国数据要素市场发展报告(2021-2022)》认为,时下技术管理双轮驱动、多领域多源数据融合、数据要素应用范围扩大、交易模式创新规范化、数据要素市场配置进程加速等趋势将在数据要素市场发展的进程中深刻体现。深圳数据交易所,数据要素全生态产业园,都是数据要素市场发展进程中的必然产物,现已来到我们身边。数据要素市场前路漫漫,但已有人星夜前行。



RECOMMEND


推荐阅读
☞  为了让B端企业吃到“算力”红利,政府和供应商有多努力?
☞  河套科创新机遇怎么抓?先强供应链!
☞  咖啡品牌搞科技创新中心?是指向时尚定义权的起手式
继续滑动看下一个
福田产投
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存