查看原文
其他

深度 | 数据的特征、价值、风险与监管

许宪春 中国金融四十人论坛 2023-03-29
作为一种新型生产要素,数据将对传统生产方式产生重大影响。根据近期公布的国务院机构改革方案,我国将组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等重任。

在近几年的实践探索中,我国数据要素市场取得较快发展。但制约数据要素市场和数字经济发展的许多关键问题仍待破解,如数据确权、数据孤岛、个人信息保护不足、数据资产价值衡量等。从数据采集到管理,再到数据开发和数据利用,都需要详细扎实的基础理论研究。

2022年10月,中国金融四十人论坛(CF40)课题《大数据背景下不同领域数据资产价值探讨与测度研究》,对大数据在政府、企业、居民中的应用,各类数据资产的分类、特征和价值测度,进行了系统梳理、分析和研究,并在此基础上对各类数据的使用及其保护和监管提出政策建议,为完善数据要素市场体系提供参考。该课题负责人为CF40学术顾问、北京大学国家发展研究院特约研究员许宪春。

本文摘编了课题成果的部分内容,以期为读者更深入了解数据的价值提供一些参考。

*本文摘编自中国金融四十人论坛(CF40)课题《大数据背景下不同领域数据资产价值探讨与测度研究》,课题负责人为CF40学术顾问、北京大学国家发展研究院特约研究员许宪春。文章仅代表作者个人学术观点。

大数据背景下不同领域数据资产

价值探讨与测度研究(摘编)

文 |许宪春 

数据的价值有高度的领域依赖性,企业、政府、个人领域的数据类型不同,数据特征不同,大数据在各个领域发挥作用的形式也各不相同,即数据的真正价值“隐喻”在不同的领域中。要挖掘这些价值,需要深入诠释其领域特点,才能实现数据这一新型资产价值的深度开发与应用。

本研究总结梳理大数据在企业生产经营、政府治理和居民生活中的应用场景、发挥作用的方式,归纳提炼企业、政府、个人领域数据的特征与分类,探讨分析企业、政府、个人领域数据资产价值的测度方法,以期为健全数据要素市场运行机制,完善数据要素市场体系提供基础研究参考。


一、数据的八大特征与数据资产的界定

伴随着信息技术与互联网的迅速发展,数据呈现爆发性增长,中国海量数据快速增长,数据量年均增速超过50%,预计到2025年,数据总量全球占比将接近30%,成为数据量最大、数据类型最丰富的国家之一。数据在经济社会发展中发挥着越来越重要的作用,已经发展成为关键的生产要素。中国高度重视要素市场化配置的体制机制建设,明确了加快培育数据要素市场,提出了数据要素价值测度的时代命题。

本研究将数据定义为已记录为可存储、传输或处理的数字化形式的观察结果,并能够从中获取信息和知识以支持决策。

通过梳理相关文献,并结合对数据相关企业的实地调研,总结出数据具有如下特征:

数据具有非竞争性。数据的复制成本低(边际生产成本为零或接近零),且同一数据可同时存在于多个位置,因此几乎可以无限地共享。与传统商品交易不同,在数据的交易中,随着交易规模的扩大,交易价格下降。

数据的权属较难界定。数据价值形成过程中包括数据的获取、存储、分析和应用等多个环节,参与各个环节的主体对数据价值的创造做出了贡献,导致数据在其生命周期中拥有多个支配主体,进一步造成数据权属难以界定的问题。

数据具有非消耗性。区别于资本、劳动、土地等传统要素,数据在形态上是不损耗的,数据并不会像传统资产(例如机器、建筑物或自然资源)那样自然地衰减或耗尽。相反,在使用数据的过程中又会产生新的数据,使用的越多,数据的体量越大,这给数据的折旧问题带来挑战。

数据具有时效性。数据是时刻更新的,尽管交易中可以约定所交易的数据是实时更新的或是历史产生的,但时效性是影响数据价值的重要特征之一。数据的价值可能随着时间的推移而贬值,贬值的速度取决于数据的类型和市场需求。

数据可以实现融合增值。单一数据的价值往往有限,但是与其他数据相结合使用时,能够挖掘的有效信息更多,数据的价值也会增加。

数据的价值与其应用场景有关。同一数据在不同的应用场景会产生不同价值。现阶段数据供给者较难对数据进行统一定价,在交易时多采用买方约价结合市场化议价的方式确定价格。

数据的价值受其准确性影响。只有通过对数据进行挖掘、分析,并基于其包含的有效信息进行决策,才能给数据拥有者带来价值。当数据准确性较高时,数据拥有者能够基于该数据做出正确决策,从而提高数据为其带来利益的可能性;然而,如果基于一份不准确、甚至错误的数据所做出的决策可能给数据拥有者带来损失。可见数据的准确性将直接影响数据价值。

数据的价值受其完整性影响。数据的价值随其完整性的增加而增加,一个数据集包含的年份越长、变量越多,其包含的有效信息越多,市场需求也越大,数据的价值也越大。

基于理论研究和实地调研的总结,本研究认为数据在满足下列特征时方可认定为数据资产:(1)经济所有权明确;(2)拥有明确的使用场景并能够为所有者带来未来收益;(3)使用周期在一年以上;(4)是生产活动的结果。

本研究依据数据来源方对数据类别进行界定,即企业数据是指来源于企业的数据,政府数据是指来源于政府的数据,个人数据是指来源于个人的数据。

在具体分析中也会涉及不同类别数据交叉的情况,但应注意这类交叉发生在数据的使用阶段,若多个来源的数据在使用阶段混杂在了一起,则认为这个“数据包”中包含了本研究所界定的多个类别的数据。


二、企业数据分类、特征、价值测度方法与建议

大数据背景下的企业数据是指以数字化形式记录、存储、传输或处理的观察结果,并能够从中获取信息和知识以支持决策。从企业数据资产的价值测度角度,对于企业部门,从企业数据的生成方式和来源角度划分为企业内部数据和企业外部数据。内部数据主要包括传统业务数据和企业生产的产品本身的数据;外部数据主要包括物联网数据、互联网数据,而互联网数据又进一步划分为企业购买的、免费获得的、共享的,以及通过网络抓取、大数据挖掘等技术搜集、整理、分析得到的数据。

企业数据资产价值测度可以借鉴无形资产的测度方法,主要包括收益法、市场法和成本法三种基本方法及其衍生方法。收益法是基于数据资产的未来预期应用场景,对数据资产预期产生的经济收益折现得出数据资产的合理价值。市场法是指参照市场上同类或类似数据资产的近期交易价格估计目标数据资产的价值。成本法主要是指通过加总数据生产过程中的各项成本来测度数据资产价值,包括数据生产过程中的劳动成本、中间消耗以及使用资本的服务成本。

因数据具有不同于传统无形资产特征,诸如时效性、价值融合增值、价值与应用场景有关、数据质量越高价值越高等特有属性,Gartner的数据分析师Laney(2018)在其《信息经济学:如何对信息资产进行定价、管理与度量》著作基于估值需求角度,建立了一个较为全面细致的数据资产价值测度方法分析与运用构架,将数据资产价值测度置于特定应用场景,提出了基础估值模型和财务估值模型。

基础估值模型用于改进组织内部数据资产管理效益,主要关注数据资产的内在价值、业务价值、绩效价值,通过使用“比率化”价值将数据的定性特征进行定量评估,主要包括内在价值法、业务价值法和绩效价值法。财务估值模型则聚焦于在商业模式中数据使用所带来的经济效益,基于对适用于传统的无形资产估值的成本法、市场法和收益法的转化,使用“货币化”价值来评估拥有、出售或使用数据资产所获得的业务收益,主要包括成本价值法、市场价值法和经济价值法。

因不同商业模式的多样化、非标准化,所需数据的质量及数据资产的经济效益不同,其适用的价值测度方法也不同。然而,生产成本可以作为任何类型数据资产的基准价值。

本研究提出采用考虑了数据基本特征(是否有应用场景、使用人次等)的“调整的成本法”作为数据资产价值的核算方法,并基于数据价值链对企业部门的数据生产活动成本进行解析。企业部门作为市场生产者,成本构成应包括劳动者报酬、固定资本消耗、中间消耗、其他生产税净额以及资本净收益。

对于企业数据,主要提出以下政策建议

一是进一步深入探讨数据资产统计与核算的理论研究。例如,数据生产活动相关职业分类研究。随着数据驱动的“三新”经济模式不断创新,标准职业分类需进一步细化,未来利用招聘网站等平台大数据,建立中国的数据相关职业分类。再如,数据支出资本化核算与现有研发、计算机软件资本化的重复计算问题,基于数据用途探索数据的使用寿命和折旧模式等基础理论问题。

二是进一步创新与完善基础统计资料的获取方法与来源,涉及会计核算制度与统计调查制度的顶层设计。为在企业会计核算、国民经济核算尤其是GDP核算中体现数据作为生产要素和新型生产资产的经济价值,应积极推进企业会计制度中“数据资产”科目的确认与计量,以及数据生产活动的统计调查制度的建立,最终实现会计核算基础资料与统计调查数据的有效链接与协调,为企业数据资产的价值测度提供科学、客观、准确可靠的基础统计资料来源。

三是税务部门应积极制订数据生产相关企业所得税税收优惠政策。类似于研发费用税前加计扣除的优惠政策,关于数据支出的税收优惠政策需要给予支持。为鼓励企业对数据的投资和有效管理,促进数据资产的流通增值,发挥更大经济和社会效益,应充分考虑企业所处的不同发展阶段或经营目标,合理制定扣除税率,有效引导企业对数据支出进行资本化处理,提升全社会的数据资产的投资回报率。

四是在企业管理制度方面,企业应设置专门的数据管理工作部门,在数据资源、数据分析技术和数据驱动模式方面,对内强化数据采集、传输、存储和融合分析能力,打通不同部门之间和不同业务系统之间的“数据孤岛”,对外积极推进开放共享或市场交易,开发新商业模式并创造新的商业价值,在企业生产经营过程中发挥更大作用。

五是借鉴国际经验。从数据的收集方式、产品或服务的提供形式、数据定价策略和收入模式等方面,学习、总结并吸收国际上数据交易或共享平台的商业模式和运营机制,比如美国的Factual、BDEX、Infochimps、Terbine,加拿大的Quandl、日本的Data plaza 等,加强企业间以及与高校、技术支持机构和数字化服务平台等主体开放共享或市场交易,从而激活数据要素,充分整合盘活数据资源,促进数据流转,培育并壮大多层次、多主体、多场景的数据要素市场,最终产生数据价值倍增效应。


三、加快政府数据开放的法律研究,建立全国统一的综合数据汇集和开放共享平台

政府作为经济社会各项活动的管理和服务者,掌握着大量的数据,这些数据涉及全社会的方方面面,对政府治理、企业生产和居民生活具有重要作用,具有极高的开发和利用价值。政府数据的开发利用离不开对政府数据资产价值的正确评估,只有测度好了政府数据资产的价值,开发利用才有尺度和抓手。

政府数据类型多样,划分标准众多,例如:按获取方式分类,可分为统计调查数据、监管和行政记录、互联网数据、物联网数据等,上述数据可进一步划分为主动获取的数据和被动获取的数据;按管控程度区分,可以分为公开数据,内部数据和涉密数据;此外,还可以按照数据所涉及的主题和行业对政府数据进行分类。政府数据与其他数据具有许多共性的特征,例如非竞争性、权属较难界定、非消耗性、时效性、融合增值等。与此同时,同其他数据相比,政府数据具有公共性,其价值密度和保密程度更高、数据体量也更大。

从数据价值链的视角,可将政府数据的价值形成过程划分为数据收集、数据存储、数据分析、数据公开和数据应用5个环节。进一步,对政府数据资产的范围进行界定:即那些经济所有权属于政府部门;完成了数据价值链全流程,并具有明确的使用场景,能够为政府部门带来收益或创造公共价值;在生产过程中被反复或连续使用一年以上的政府数据。可从政府数据价值链的每个环节入手,对价值链的不同环节分别采用成本法或收益法,并结合两者得出的价值进行政府数据资产价值的测算。

政府数据具有极高的开发和利用价值,但同时,政府数据的开发利用也面临较大风险和挑战:其一,政府数据的开放缺乏统一的权威法律进行规范;其二,数据在收集、存储和开放过程中具有安全风险;其三,缺少国家层面的、统一的、系统的政府数据开放共享和开发利用平台;其四,政府数据的挖掘深度和应用广度均有所欠缺。

针对政府数据开发利用时面临的挑战和困难,为完善政府数据应用和价值测度,建议:

1. 加快政府数据开放方面相关法律的研究与制定

积极探索政府数据立法,完善数据相关的法律体系,加强对数据采集、开放和使用的监管,规范数据采集、开放和处理流程。

其一,应建立健全保障数据安全及个人隐私的法律法规制度,明确数据采集、传输、存储、使用、开放等各环节保障信息安全的范围边界、责任主体和具体要求。

其二,加强公民隐私和个人信息保护的立法,并在立法的基础上,规范各类部门、机构对公民个人核心信息和数据的采集与使用,保护公民隐私不受侵犯。对信息泄露、过度采集、临时性采集和常规采集等情形予以规范,同时加强技术创新,保护居民隐私。

其三,加快制定数据权属方面的法律法规和监管机制,加快在法律层面厘清政府数据的权属问题,明确授权机制。

2. 强化技术支持,保障政府数据的安全

应明确政府数据的重点保障对象,加强对敏感和要害数据的监管力度,加快面向大数据的信息安全技术的研究,推动基于大数据的安全技术研发,培养大数据安全方向的专业人才,建立并完善大数据信息安全体系。同时,建立数据灾备、安全防护管理和应急处理制度,不断提升管理水平,及时进行安全评测、风险评估和应急演练。

3. 提升数据质量,建立全国统一的综合数据汇集和开放共享平台

在理清各级政府部门拥有的数据资源的基础上,通过建立统一的数据标准并出台相应的管理办法,规范数据的采集、存储、开放共享和使用过程,提升数据质量,推进数据融合,加快建立全国统一、融合各省和各行业的综合数据汇集和开放共享平台,使得政府数据能够应用在更多场景、发挥出更大的价值。

针对大数据平台重复建设和数据重复收集的问题,应加强对政务大数据中心建设项目的立项审批管理,不以建设政务大数据中心为硬性考核指标,减少不同部门重复建设、重复采集的情况。对已经建成的政务大数据中心,应进一步加强与其他部门的数据共享和交换,鼓励数据资源的创新应用,并定期对数据共享和使用情况进行考核。

4. 提升政府部门的数据开发应用能力,创新数据开发模式

人才是提升政府部门数据开发应用能力的关键。应加强大数据人才队伍的建设,引进大数据人才到相关部门就业,重点培养兼具大数据应用、管理技能和政府工作经验的人才,从而加强政府部门的大数据分析能力和数据深度融合能力,提高分析结果的质量和深度。同时,政府部门应加强与企业和高校的合作,推进政府数据资源向社会开放,在适当的范围内共同开发利用政府数据,拓宽政府数据的应用场景。


四、加强个人数据保护与监管,加快明确个人数据资产所有权与收益分配规则

个人数据是指能够直接或间接识别出个人有关信息的数据,可以按照内容、数据收集过程、数据供给与使用过程划分为若干种类。个人数据除了具有非竞争性、非消耗性、数据融合增值等数据具有的一般特征外,还具有产生者与使用者往往并非同一主体、不同个体对个人数据价值的评估不同、价值创造上具有外部性等特有的特征。

目前针对个人数据的估价,并没有一致公认的方法。OECD(2013)[1]指出,个人数据的估价方法包括基于市场交易的估价方法和基于个人主观的估价方法两大类。其中,基于市场交易的估价方法是根据市场信息来估测数据的价值,包括公司财务指标法(资本市场价值、营业收入、利润)、市场交易法、数据泄露的成本、黑市价格;基于个人主观的估价方法是指通过调查或实验的方法来估测个人对数据价值的购买意愿或保留价格,包括调查与实验法、对隐私保护的显示购买意愿法。

每种方法都有其优点与局限,由于个人数据的价值高度依赖使用场景,凭借单一的方法往往会产生有偏的估计。综合运用多种方法有利于确定一个价值区间,为揭示个人数据的价值提供有益参考。

➤ 个人数据使用中存在的问题

个人数据正在越来越多地被企业和政府利用从而创造价值,但个人数据的应用过程中存在许多问题与挑战。

1. 数据权属与分配规则模糊

一方面,个人数据产生价值的过程中涉及多个参与者,企业和政府投入大量成本收集、分析个人数据才能够发掘其中的价值,单一个体的数据往往没有价值或价值量很低,只有从大量数据中分析得到统计规律,数据才变得有价值(Li等,2019)[2],并成为资产。但是企业或政府是否完整地拥有该资产的所有权?个人是否也具备数据资产的部分所有权或收益权?这些问题目前尚未达成共识。

另一方面,企业运用个人数据创造了大量收益,且这些收益大部分被企业拥有,这主要是由于个人并不了解其提供的数据所创造的价值(Li等,2019)[3]。尽管个人数据被收集的同时享受了免费服务,增加了个人福利,然而正如前文所述,每个人对其数据价值的评估不同,免费服务与个人数据能否实现等价交换并不确定。企业运用个人数据创造的收益是否要被个人分享,以及个人能够从收益中分享的比例也是目前存在争议的问题。

2. 个人隐私泄露问题严重

在信息化、数字化迅速发展的情况下,大部分居民拥有智能手机等移动设备,并下载了各种应用程序。许多应用程序免费为用户提供服务,但是大部分居民并不知道,能够享受这些免费服务是因为他们提供了其个人数据(Spiekermann等,2012)[4]。而个人消费记录、位置记录、浏览记录、聊天记录等各种数据被企业或政府所掌握,这给个人隐私的保护带来威胁。

目前,尽管许多应用程序在新用户使用时会提供一系列阐释其隐私保护政策、获取个人数据的商业性质等条例,但是仍存在各种问题。首先,不同意其隐私保护政策便无法使用相关服务;第二,大部分居民并不会阅读与数据交换服务的商业性质相关的条款(Smithers等,2011)[5],不能理解其中一些复杂的专业术语具体表述的含义;第三,没有技术背景,居民并不了解授权条约中一些条目到底意味着平台将怎样使用其个人数据。

3. 过度采集个人信息

不管是企业还是政府,在收集个人信息时都应遵循必要原则、最小化原则,但是目前过度采集个人信息的现象并不少见。一方面,大量APP存在超范围收集个人信息的情况。另一方面,有些政府部门在收集个人信息时也未遵循最小化原则。

➤ 政策建议:

1、加快明确数据资产所有权与收益分配规则。

学界应该重视数据权属问题,加快推进相关研究,为相关法律的出台提供理论基础。结合数据资产的权利性质,学界也应该重视对数据收益分配规则的研究。政府应加快出台相关法律,明确数据资产的各项权利并加以保护,为完善数据交易市场提供基础。

2、完善保护个人隐私的相关法律。

我国目前针对个人隐私保护没有成熟的专门法律,对隐私保护的法律条款散落至各种法律中。应广泛征求全社会意见,重视互联网时代存在的各种个人隐私侵犯现象,细化相关条例的规定,加快完善并正式出台和执行该法律条款。

在加快出台《个人隐私保护法》的同时,应将《消费者权益保护法》、《网络安全法》和《个人隐私保护法》等与个人隐私相关的法律结合起来,共同保护个人隐私。《消费者权益保护法》主要关注消费者在产品和服务的交易中权利是否受到损害,而《网络安全法》和《个人信息保护法》主要关注个人数据被处理、应用过程中个人相关信息是否受到侵害。但是在当前信息化时代,个人在消费的过程中便伴随着数据的产生与被收集,两类法律已紧密相关。可以综合两部法律并试编“消费者数据保护条例”(Natali等,2017)[6]

未来,一方面,基础性法律需要持续提供关于人格权、隐私权、个人信息权益等要素的权利规范;另一方面,具体执行性条文及审判实践中应注重概括性权利与具体应用场景的结合,寻求当事人在特定场景下的合理隐私期待[7]

3、加强监管,规范数据采集、使用过程。

相关政府部门应继续提高对个人隐私保护的重视程度,协同监管,加强监管力度,采取多种措施整治不合法、不合规使用个人数据的现象。敦促企业明确告知用户其采集的数据类型、具体的应用方式,避免在隐私政策中隐瞒与个人隐私相关的重要信息,避免在隐私政策中使用大量艰涩难懂的术语,并严格遵守对用户作出的隐私保护承诺(OECD,2019)[8]。确保企业在采集个人数据时应充分尊重个人意愿,严格从源头上规范个人数据的使用。

4、注重区块链技术在个人数据开放、共享中的作用。

区块链技术具有去中心化、数据难以篡改和可塑性强等特点,如果将其运用到个人信息的保护中,能够有效降低个人信息泄露的可能。区块链技术能够实现在个人数据被广泛采集的情况下将个人信息内容决策权归还给个人,通过设置个人隐私保护可以只允许特别的人或企业浏览或删除个人数据。推进区块链技术应用于个人数据的管理,能够实现在推进个人数据开放共享的同时保障个人对数据的主动权力。

5、科学设计个人数据的隐私选项及权属。

可以考虑在用户需要提供其个人数据时,为用户提供更多隐私选项,例如用户可以选择付费使用某互联网服务但不允许对方搜集自己的数据、或者免费使用某互联网服务并允许对方搜集自己的数据,这可以满足不同用户的异质性隐私偏好。

同时,应赋予个人对其数据的访问权、被通知权、修改权。

访问权即居民有权访问其个人数据,企业或政府应为个人开通可访问其个人数据的渠道;被通知权即企业或政府在收集、存储、分析、应用个人数据时,应明确通知居民,为提高行政效率,可在数据收集阶段,以“知情同意书”的方式,告知居民其个人数据被收集和后续可能被应用的情况;修改权即为保证数据的准确性,居民在发现与其相关的个人数据存在问题时,有权对已被收集走的个人数据进行修改。且无论个人数据是否被企业、政府使用,个人始终保有对其个人数据的上述权利。

6、综合运用多种方法测度个人数据资产价值。

对于个人数据资产价值的测度需要坚持供给和需求相结合的原则,从供给端和需求端深入剖析影响个人数据价值创造的因素,进一步通过改革企业会计和统计调查制度,使得能够量化这些影响因素的数据可以被获取,进而建立基于数据价值链的个人数据资产价值测度框架。

注释:[1] OECD. Exploring the Economics of Personal Data: A Survey of Methodologies for Measuring Monetary Value[R]. OECD Digital Economy Papers,2013, No. 220.

[2] Li W C.Y., Nirei M, Yamana K. Value of data: there's no such thing as a free lunch in the digital economy[R]. RIETI Working Paper, No. 22, 2019.

[3] Li W C.Y., Nirei M, Yamana K. Value of data: there's no such thing as a free lunch in the digital economy[R]. RIETI Working Paper, No. 22, 2019.

[4] Spiekermann S, Korunovska J, Bauer C. Psychology of Ownership and Asset Defense: Why People Value Their Person-al Information Beyond Privacy[A]. Thirty Third International Conference on Information Systems[C], 2012.

[5] Smithers R. Terms and Conditions: Not Reading the Small Print Can Mean Big Problems[J]. The Guardian, available at:https://www.theguardian.com/money/2011/may/11/terms-conditions-small-print-big-problems, 2011.

[6] Natali H, Borgesius F Z, Reyna A. The Perfect Match? A Closer Look at the Relationship between EU Consumer Law and Data Protection Law[J]. Common Market Law Review, 2017,54(5).

[7] 参考陈天昊(2021)在清华大学服务经济与数字治理研究院召开的《个人信息保护与数据产业发展》专题研讨会上的发言。

[8] OECD. Good Practice Guide on Consumer Data[R]. OECD Digital Economy Papers,2019, No. 290.


版面编辑:潘潘责任编辑:鲁西 视觉:李盼 东子监制李俊虎 潘潘

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存