强调「复用性」是「数据要素X」的关键
# 引言
但是对数据要素×作用的发挥,最重要的还是它的多场景复用的能力,一组数据可以多次复用,所以可以不断挖掘出新的价值,这是为什么可以数据要素用乘来表达的一个最基本的特点
新经济学家智库,公众号:New Economist江小涓新年演讲:为什么互联网是+,数据要素是×呢?
上周,《“数据要素×”三年行动计划(2024—2026年)》发布之时,笔者即注意到此份文件中6次提及了「复用」,这可能是政府十几年中第一次如此密集频繁强调数据的复用特征。那么该如何准确理解「复用」?
# 复用 vs 利用
复用,英文的含义是Re-Use,我们也可以将其译作「再利用」、「重用」等。而相对于Re-Use,自然就是Use,中文也即是「利用」。
这一辩证关系反映在数据要素上,也即意味着:我们应当在「利用」数据要素之时,尽可能最大化数据要素的「复用」。
而这一点说起来容易,但在实践中,往往我们只见「利用」(Use),而会忽视「复用」(ReUse),这也是造成数据当前仅仅发挥“+”加数效应的原因。
# 复用,是一种交叉思维
「X」即意味着交叉。
在《行动计划》中对复用的表述指向了复用的两种类型:多场景复用,以及,多主体复用。
实际上,数据的原始采集/生产,是为了服务于特定主体在特定场景下的利用。而改变其原有目标场景和目标主体(Re-Purpose),即为「复用」。
打破「直线思维」,而认知到数据可以跨主体、跨场景「交叉」,则是任何数据「审核-准入」机制是否得以成功实施的关键。
# 复用,是一种产业链思维
复用,更是一种产业链思维。
我们开放数据中国在不止一个场合下表达过担忧:在大力提倡「开发利用」的绩效要求下,不难预期大量数据的「利用」案例会大幅产出。但值得我们深思的是,单一数据利用案例是否意味着数据要素的「乘法效应」?
现代工业产业链的发展值得我们借鉴和反思。我们需要的不是原材料到成熟产品的「两点一直线」,而是在原材料和成熟产品间能够尽可能拉长产业链,形成多级、具备可复用价值的中间产品。
换而言之,我们一定要谨慎评估「小麦加工为一碗饺子」的价值,更不要忽视「小麦加工为面粉-面粉加工为饺子皮-饺子皮加工为饺子」的链条价值。
# 复用的衡量标准:ReUsability(复用性、可重用性、再利用性)
在去年7月,开放数据中国曾发表了《ReUsability(可重用性),构建多元公共数据要素化流通的关键 》一文,我们在文中给出了ReUsability的定义:
数据的可重用性,其表征了数据被加工处理后,多大程度上其原本所蕴含信息(维度及颗粒度等)发生了损耗,从而是否仍可满足下游的「不确定」场景的「多元化」的加工、开发、利用的需要。
开放数据小编,公众号:开放数据中国ReUsability(可重用性),构建多元公共数据要素化流通的关键
并指出:
数据(或数据产品或服务)是否具备「可重用性」,是判断数据是否「要素化」,还是「产品化」的关键标准。
开放数据小编,公众号:开放数据中国ReUsability(可重用性),构建多元公共数据要素化流通的关键
我们认为,有必要进一步基于「复用性」的概念,去深入探索数据分级分类应用的可能性,结合市场需求、应用领域特性等刻画出不同数据的供应产业链条,梳理数据「复用」的中间产品需求并判断市场成本-收益,从而真正激活数据要素市场的「X」法效应。