查看原文
其他

分类推进数据要素探索已成共识

中国信通院 CAICT数据要素
2024-09-16

数据资源是释放数据要素价值的“原材料”。随着数字经济的迅猛发展,各类主体在生产、经营、管理、服务、消费等过程中产生大量数据。在推进数据开发利用、释放数据价值过程中,不同类型数据面临不同的重点任务与关键问题,分类推进数据要素探索已成为当前共识。





(一)不同类别数据资源面临不同关键问题



数据分类存在多种维度和多种方法,适用于不同场景。按照数据资源存储的维度,可分为基础层数据、中间层数据、应用层数据等,不同层次对数据的集成性、灵活性等要求不同。按照对数据资源加工程度的维度,可分为原始数据、衍生数据、数据产品等,数据加工者在其中的劳动和贡献存在差异。按照数据安全的维度,可分为一般数据、重要数据、核心数据等,通过数据分类分级降低数据安全风险。数据分类的维度和方法多种多样,反映出数据在存储、加工、应用、安全等过程和场景中的复杂性。


国外主要根据公共利益或个人权利划分数据类型。例如,美国《开放政府数据法案》等按照数据持有者类型的不同,将数据分为公共数据、非公共数据两类,以区分数据是否具备公共属性及相应的流通导向与策略。美国《开放政府数据法案》确立公共数据可以被所有人公开使用、非公共数据需通过许可协议获得使用的原则,规定美国的所有政府部门都要向公众开放非敏感类的政府数据,从而加强公众、企业或其他组织对政府公开数据的利用。欧盟《通用数据保护条例》(GDPR)按照数据所描述对象的不同,将数据分为个人数据、非个人数据两类,凸显出因数据来源主体实际掌控数据能力不同,需采取差异化的数据相关权利措施。GDPR在个人数据方面赋予用户知情权、被遗忘权、携带权等权利。针对非个人数据,欧盟制定《非个人数据在欧盟境内自由流动的框架》《数据法案》等推进非个人数据的自由流动与跨境传输。

来源:中国信息通信研究院

图 1 公共数据、企业数据、个人数据的复杂关系


我国“数据二十条”在总述探索数据产权结构性分置制度时,提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,按照数据相关权益归属的不同,将数据分为公共数据、企业数据、个人数据三大类型,突出不同类型的重点关切,探寻相应的突破方向。从数据实际生成与持有角度看,三种类型的划分尽管存在复杂交叉(如图1),但有利于根据不同类型数据的特性建立细化的分类标准与流通使用规范,也有助于建立不同主体的权责利动态调整机制,促进相关探索向“深水区”推进。


公共数据的概念与范围仍处于不断讨论和迭代中。“数据二十条”总体描述了公共数据是在各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据,但并未明确划定公共数据的范围和边界。当前,来自政务体系的数据(部分文件中称“政务数据”)和来自公共事业的数据(包括科研、教育、文化、供水、供电、公交等公共事业)由于受公共财政支持或在履行公共管理或服务职能中产生,归属于公共数据基本不存在争议。但是,另有一类数据是企业在经营公共服务性质业务时收集、产生的关乎公共利益的数据,其是否属于公共数据仍存争议。在企业经营的复杂过程中,数据是否因提供公共服务而产生不易区分,讨论该类数据时务须审慎判断企业所持有数据与公共服务、公共利益的关系。逐步厘清公共数据的范围,有针对性地引导和促进公共数据开发利用,对提升公共治理与服务水平、发展壮大数字经济具有重要意义。对于来自政务体系的数据和来自公共事业的数据,一般认为,其归国家或全民所有,管理、开放等职责由政府或其他公共部门代为行使。本着“取之于民、用之于民、造福于民”的原则,在保障国家安全、商业秘密安全、个人信息安全的前提下,按用途加大供给使用范围将使公共数据价值更好回馈全社会。因此,如何加大供给规模、推动供给提质增效成为公共数据发展的关键问题。


企业数据来源广泛,有丰富的生成方式。由于企业的生产、经营、管理链条较长,企业的数据需求多元复杂,对数据需要进行不同形式和程度的加工、整理与分析,这一过程中形成的多种衍生数据也丰富了企业数据的表现形式。按照企业数据生成方式的不同,可将企业数据划分为三种主要类型:一是企业自行采集、记录客观现象所得到的数据;二是企业在生产经营活动中,采集与用户的交互记录所得到的数据;三是企业基于已产生的数据,在赋予数据全新价值过程中所得到的数据。在不同类型企业数据的生成过程中,企业尽管付出的资源和劳动有所不同,但为数据赋予了独特的业务价值,需要得到有效地评估与认定。因此,如何认定企业数据的业务贡献,促进数据价值“显性化”成为企业数据的关键问题。


个人数据大多由公共部门和企业实际持有。对于描述或标识特定自然人信息的数据,如自然人的姓名、身份证号码等,其承载的信息具有一定的客观性,即这类信息不依赖于数据持有者所搭建的业务系统或应用软件,但数据持有者掌握这类信息后,有可能出现隐私泄露、滥用等风险。对于自然人与数据持有者交互产生的描述行为痕迹信息的数据,其所承载的信息对人来说可读性较弱,一般依赖于数据持有者设计或搭建的表格、系统和软件。数据持有者汇集大量个人痕迹数据后,经数据挖掘与分析可将数据价值不断放大,但也可能出现“大数据杀熟”等风险。此外,自然人创作的各类信息也形成了大量数据。个人创作的作品一般用于其他目的,而随着数据挖掘的深入,尤其是人工智能大模型的迅猛发展,个人作品被数据持有者收集汇聚,成为特定场景中独具价值的数据。但这一过程中,个人相关权益可能被侵犯。总体来看,由于个人对不同类型个人数据的掌控能力均有限,保障个人的隐私、人类道德伦理乃至人的主体性等已成为大众关注的焦点,如何在加强相关个人权益保护的基础上开发利用仍是个人数据的关键问题。



(二)授权运营促进公共数据供给提质增效



各地各部门积极开展公共数据开放实践。近年来,各地方政府、部分行业主管部门以建立公共数据开放平台为抓手,积极推进公共数据开放,逐步完善公共数据开发利用体系。截至2022年10月,我国已上线208个省市公共数据开放平台。基于开放平台,各级政府开放大量公共数据集,覆盖市监、工商、交通、生态、公共设施等多个领域,并且多个地区建立了开放数据需求反馈机制,以便满足社会对公共数据的应用需求。此外,行业主管部门也通过建设平台开放高质量数据。例如,中国气象局通过中国气象数据网开放气象数据,在2023年2月、7月先后发布两批《基本气象数据开放共享目录》,共包含106项气象数据产品,在天气预报、农业指导、物流运输等场景发挥着极为重要的作用。


由于责任与激励机制缺乏,公共数据高质量供给受到制约。总体而言,我国公共数据仍然存在供给质量不佳、开发利用程度有限等问题。当前公共数据分布较为分散,同主题公共数据汇聚整理不便。公共数据开放范围仍然不足,且开放平台数据更新频率整体较低。各地组织公共数据创新利用活动持续性不强,有效成果数量有限。主要原因在于,公共部门履职以“三定”职责作为核心依据,大部分公共部门承担数据安全责任,但对公共数据进行治理和开放的职责则不明确,推动公共数据开发利用的激励机制不完善。因此,公共数据开放对于公共部门来说没有明确的动力,特别是对于从事非信息化领域的部门来说,也往往不具备足够的能力。以上原因导致仍有大量高价值公共数据“深藏闺中”,高质量供给受到制约。


各地、各行业开始探索公共数据授权运营,引入社会化力量进行开发利用,促进公共数据供给提质增效。当前,授权运营在公共数据领域的实践探索中具有关键意义,可以充分发挥社会力量,解决公共数据开发利用中开放质量不佳、供需匹配不足、应用挖掘不够等问题,是大量高价值、高敏感的公共数据开发利用的核心路径。国内各地区、各行业积极开展授权运营实践。各个先进地区纷纷落实试点举措,在机制、平台等方面均取得成效。


在机制探索方面,各地方推进探索各具特色的授权运营机制,以释放公共数据价值为核心,逐步形成了几类不同的发展模式。一是集中1对1模式,以浙江、安徽、贵州、成都、青岛等地为代表。地方政府集中统一授权某一机构承担该区域平台建设、数据运营、产业培育等公共数据运营相关工作。一方面,集中授权具有权威性,有利于通过地域数据整合实现价值最大化;另一方面,集中授权存在市场效率不够高的问题,单一运营主体响应市场需求变化的速度可能有限。二是分行业的1对N模式,以北京市的金融公共数据专区为代表(如图2)。地方政府授权不同的行业属性机构,按照行业特点开展公共数据运营工作,专业性更强,有利于充分发挥行业属性作用,但统筹协调的难度也随之增大。2023年7月,《北京市公共数据专区授权运营管理办法(征求意见稿)》发布,在金融场景的实践基础上推进专区制度体系建设,并深化交通、位置、空间、信用等各专区建设和应用。三是分散的1对N模式,以广东、上海、武汉等地为代表。地方政府根据不同数据与不同机构特点进行匹配,授权各类型市场主体分别开展公共数据运营工作。分散授权的灵活性更好,有利于发挥市场主体主观能动性作用,但一定程度上也容易出现混乱,对监管的要求更高。同时,由于地域数据未能完全整合,数据可发挥的价值有限。

来源:中国信息通信研究院

图 2 北京公共数据专区运营模式


在平台运营方面,部分地方通过建立统一的地域性公共数据运营平台探索公共数据产品或服务的应用与流通。一类是公共数据运营服务平台,例如贵州省的云上贵州平台,在明确授权统一平台对全省公共数据进行汇集、存储、共享、开放的基础上,依托全省资源打造数据产品及服务体系,与贵阳大数据交易所协同推动构建贵州大数据产业生态。成都市政府授权成都数据集团搭建公共数据运营服务平台,已于2020年上线。平台直接接入公共数据并作为供需对接桥梁,基于应用需求,经协调获取相应数源部门授权后,与应用方共同打造数据产品并接受数据使用监督。另一类是兼具公共数据加工与数据交易的综合服务平台,例如海南省的“数据产品超市”,以授权运营的思路搭建集数据归集、管理、加工、交易为一体的公共数据平台,将各类型参与主体纳入平台,由应用主体对公共数据进行加工增值后以数据产品的形式开放给市场。


此外,众多行业主管部门的公共数据也得到有效开发利用,通过授权运营的模式引入社会化力量推进数据价值的充分释放。相较于地方的公共数据,行业主管部门持有和控制的公共数据是纵向的数据归口,在行业领域内具有相对完整性和全面性,推进行业主管部门公共数据的应用与流通也是公共数据授权运营的关键工作之一。例如,司法数据作为来自各级司法体系履职和提供服务过程的公共数据,包含法条、立案、审判、裁判文书等多方面的司法相关数据,具有非常独特的应用价值。当前,司法数据由最高人民法院信息中心下属中国司法大数据研究院统一推进开发利用,应用主要集中在为政府及公共部门提供决策支撑、为金融领域产品提供服务依据、为企业或个人主体提供司法大数据服务等场景。此外,人力资源和社会保障部将社保数据授权金保信社保卡科技有限公司运营,人民日报社将人民日报历史数据授权人民网科技(北京)有限公司运营,中国气象局将气象数据授权北京天译科技有限公司等相关机构运营,这些均是行业公共数据授权运营的典型案例。



(三)会计入表推动企业数据价值“显性化”



近年来,虽然“将企业数据资源视为资产进行管理”逐渐成为众多企业的共识,但这里的“资产”往往只是经济意义上的资产,体现了企业数字化过程中数据资源的重要性。而对于数据能否真正成为会计意义上的资产、能否计入企业资产负债表,始终是各界讨论的焦点。今年8月21日,财政部正式发布《企业数据资源相关会计处理暂行规定》(以下简称《暂行规定》),并规定自2024年1月1日起施行。《暂行规定》的出台肯定了数据资源可具有资产属性,是数据要素市场发展的重要里程碑。作为报表意义上的“资产”,企业数据的市场价值与业务贡献将在财务报表中得以“显性化”。


《暂行规定》明确了企业数据资源在财务报表中进行会计确认和计量的思路。出台《暂行规定》的主要目的是,为消除相关企业实务中对“数据资源能否作为会计上的资产确认”“作为哪类资产‘入表’”等疑虑提供指引。因此,《暂行规定》在不改变现行企业会计准则的基础上,给出了将数据确认为无形资产、确认为存货和不确认资产三条入表思路。具体来说,《暂行规定》规定:企业使用的数据资源,符合《企业会计准则第6号——无形资产》(财会〔2006〕3号)规定的定义和确认条件的,应当确认为无形资产;企业日常活动中持有、最终目的用于出售的数据资源,符合《企业会计准则第1号——存货》(财会〔2006〕3号)规定的定义和确认条件的,应当确认为存货;企业出售未确认为资产的数据资源,应当按照收入准则等规定确认相关收入。


企业数据资源“入表”有利于内外部发现并确认企业数据的价值。在将数据确认为无形资产或存货进行会计计量的过程中,企业需要明确取得和持有数据资源过程中产生的各项成本或增减值,企业数据的产生成本或应用价值将得到更加完整、准确的列示,基于企业数据资产产生的收入进一步明确。继而,对于从事数据产品(或数据服务)供应的企业来说,有助于企业确定更为市场所认可的数据产品定价,促进企业参与市场化的数据交易流通;对于数据密集型企业来说,有助于投资者更好发现和理解企业整体的价值,提升企业的融资机会,扩大企业的发展空间。同时,针对企业如何贯彻实施《暂行规定》,财政部会计司表示,企业应当主动按照相关披露要求,持续加强对数据资源的应用场景或业务模式、原始数据类型来源、加工维护和安全保护情况、涉及的重大交易事项、相关权利失效和受限等相关信息的自愿披露,以全面地反映数据资源对企业财务状况、经营成果等的影响。因此,在实施“入表”的过程中,通过对数据资源相关情况的盘点和披露,企业将更加了解、重视和明确数据资源的分布、特点和应用价值,有利于企业进一步挖掘数据应用,释放数据要素价值。


需要注意到的是,《暂行规定》还不是真正意义上的“数据资产会计准则”。《暂行规定》目前只给出了“满足资产确认条件且价值确定的数据资源如何计入报表”的解决思路,但是没有解决“数据价值如何确定”的问题。由于数据具有未来经济利益难确定、经济寿命不确定、价值易变性等区别于传统要素的特性,成本法、收益法、市场法等估值方法均有其局限性。一些企业探索综合三种方法,基于收益法建立数据资产估值体系,通过评价数据资产业务经济贡献值指导形成数据资产价值基准。例如,浦发银行提出的数据资产价值评估框架,围绕数据资产潜能预测、效能评估和收益测算,将数据资产价值分为内在价值、成本价值、业务价值、经济价值以及市场价值五类,并给出了每类价值的价值因子及计算公式。2023年9月,中国资产评估协会印发《数据资产评估指导意见》,对资产评估机构按照成本法、收益法和市场法开展数据资产评估提供了进一步指导。然而,企业数据估值问题是个复杂的难题,当前全社会仍未完全取得共识,还需要企业、专业研究机构、资产评估机构、会计和审计事务所等进一步探讨。


总的来看,《暂行规定》的出台迈出了我国为发展数据要素而建立相关会计核算制度的第一步。《暂行规定》是在现行企业会计准则体系下的细化规范,在会计确认计量方面与现行无形资产、存货、收入等相关准则是一致的,不属于国家统一的会计制度要求变更型会计政策。现阶段,《暂行规定》只是将既有的会计处理规则迁移到“符合相应条件的数据资产”上,而并非从数据资产的特点出发来设计针对性的会计规则,也就是说,数据资产暂时将按照与传统资产同样的方法进行会计计量。从形式上看,只是在企业资产负债表的“存货”“无形资产”和“开发支出”三个报表项目下分别设置了“数据资源”子项目;对应的企业核算时将会在相应总账会计科目下面设置“数据资源”二级科目。但是,只按照这样的会计方式,数据要素区别于传统要素的特殊性或将无法从报表中得到充分体现,无法被适应。“数据入表”目前还只是一个试点的过程,真正建立适应数字经济发展需求、符合数据要素特殊属性的会计核算方法,未来仍将有很多复杂、挑战性的工作有待完成。下一步,如何与国际会计准则相协调,如何建立相适应的审计制度,如何厘清企业数据资产与信息资产的划分,企业是否会通过数据资产实现增值,银行是否会普遍接受数据资产作为质押等,这些问题仍然需要时间的检验。


(四)权益保护仍是个人数据开发利用主线


个人数据方面,《个人信息保护法》针对个人信息数据确立了保护原则。《个人信息保护法》是中国首部规范个人信息处理活动的专门立法,旨在保障公民个人信息安全,遏制个人信息泄露、滥用等现象的发生。该法规定了个人信息处理全过程中应遵循的原则和要求,明确了相关主体的权利和义务,健全了个人信息保护工作的体制机制。该法既通过个人信息处理规则、敏感个人信息处理规则、个人信息对外提供规则、单独同意规则等保障个人权益,又通过匿名化处理、个人信息处理者不需取得个人同意可以处理个人信息的若干场景等方面的规定保证个人信息数据可得到合理的开发利用。国际横向比较看,我国《个人信息保护法》在规则严厉程度上基本对标欧盟GDPR,两部法律文本均赋予个人全面、细致的权利,均对信息处理者施加了较高的合规义务。同时,我国关于个人信息违法犯罪相关罪名适用主体广泛,入罪门槛较低。因此,我国已建立起较为严格的个人信息数据保护原则。


个人对个人数据掌控能力有限,权益保护落地实践未达预期。由于个人数据主要由公共部门和企业实际掌控,个人数据相关的权利在具体场景和问题中又较为复杂,因而世界各国在操作层面都还未能完全适配个人信息、个人数据保护的法律要求,个人信息泄露时有发生、个人数据越权滥用仍然存在。例如,国外许多网民发现自己在网上分享的照片成为Flickr数据集的素材,自己此前既不知情,又很难将自己创作的照片数据从数据集中删除。2020年7月以来,工业和信息化部开展纵深推进APP侵害用户权益专项整治行动。截至2023年7月,工信部已发布关于侵害用户权益行为的APP(SDK)通报30批。通报并责令整改的APP、SDK中,违规收集个人信息、强制频繁过度索取权限、违规使用个人信息等问题仍然突出。


通过分级授权细化个人数据采集使用规范已有理论探索。个人数据开发利用所需的数据多样、场景多变,个人理应可以根据场景和需求,分级、分步骤进行个人数据的授权,也可以按照意愿撤回相应级别、步骤的授权。个人数据处理者则应严格遵守个人对数据开发利用场景、范围等要求,保护个人数据权益。在《个人信息保护法》施行前,大量收集、处理个人数据的过程属于“一揽子授权”,个人在使用服务过程中可能需要让渡许多与服务无关的数据。《个人信息保护法》规定了数据收集与处理的最小必要原则和单独同意原则,支付宝、微信、美团等平台逐步增加了新业务首次使用单独授权同意、广告权限管理、个性化推荐权限管理、第三方授权管理、清除历史行为等功能,实现了初步的个人数据分级、分步骤授权模式。“数据二十条”再次强调数据处理者应按照个人授权范围依法依规采集、持有、托管和使用数据,不得采取“一揽子授权”、强制同意等方式过度收集个人信息。学界和业界正在探索更加细化、完备的数据要素分级授权体系(如图3),以更简洁清晰的方式划分数据开发利用场景,用户既可以选择授权必要数据来使用基础服务,又可以授权更多数据享受改进服务乃至支撑数据流通,从而以较低成本实现个人对数据处理范围的控制。

 来源:《数据要素论》

图 3 数据要素分级授权体系示例


通过专业数据托管服务机构降低个人数据行权门槛已有国际实践。“数据二十条”提出探索由受托者代表个人利益,监督市场主体对个人信息数据进行采集、加工、使用的机制。个人数据管理机构作为受托人,可以根据用户的授权委托,代理大量用户进行个人数据集中存储与管理应用,在遵循相关法规和用户意愿、保护数据隐私和安全的基础上,以忠诚义务和专业水平帮助个人行使个人数据权利。通过受托人提供的平台,个人可以集中化管理自己的数据,自主决定每个机构、平台对自己数据的收集、使用和共享情况,自行携带、转移自己的数据。因此,个人数据统一托管可向个人赋予更多控制权,有效降低个人行权门槛。个人数据委托在国际范围内仍属于探索早期。韩国MyData服务于2021年开始落地,MyData运营商通过开展个人数据汇总整合工作,向个人提供一站式查询和管理服务,但这种模式的可持续性仍有待观察。



本文节选自中国信通院于“2023数据要素发展大会”上发布的《数据要素白皮书(2023年)》。


报告介绍及全文下载链接如下:

中国信通院发布《数据要素白皮书(2023年)》






中国信通院云大所长期深耕数据要素研究工作,深入数据要素理论体系、制度政策、市场培育、技术应用相关话题,持续编写并发布《数据要素白皮书》等研究报告;重点聚焦公共数据、企业数据、个人数据的合规可信流通实践;形成了可信数据流通、可信隐私计算系列评测与咨询服务体系。


联系人:

吕老师 

18526649944

lvailin@caict.ac.cn

王老师

13683085467

wangzeyu1@caict.ac.cn

往期推荐

01

公共数据授权运营八大发展趋势

02

《公共数据授权运营平台功能要求》标准解读

03

《可信数据流通网络(TDN)白皮书(2023年)》发布!附下载链接

继续滑动看下一个
CAICT数据要素
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存