其他
终于有人把数据资产目录给讲清楚了
1、数据资产的定义和分类
中国信息通信研究院在其发布的《数据资产管理实践白皮书》中将数据资产定义为"企业拥有或者控制的,能够为企业带来现实或潜在经济利益的数据资源"。这个定义强调了数据的所有权和经济价值,这在数据交易日益活跃的中国市场尤为重要。
在实践中,我们通常将数据资产分为以下几类:
结构化数据:如员工信息、财务报表,存储在关系型数据库中。 半结构化数据:如日志文件、XML文档,有一定的组织结构。 非结构化数据:如邮件、合同扫描件,占企业数据的80%以上。
另一种常见的分类方法是基于数据的来源和用途:
内部数据:企业自身生产的数据,如销售记录。 外部数据:从第三方获得的数据,如社交媒体评论。 主数据:描述业务实体的核心数据,如客户、产品信息。 事务数据:记录业务活动的数据,如订单、支付记录。
企业有多少数据? 企业有哪些数据? 企业的数据价值如何? 企业的这些数据分布在什么地方?最有价值的数据存储在什么位置? 企业数据的归属和责任人是谁?
下面介绍数据资产盘点的方法和步骤,主要归纳为6个阶段:构建数据标准、数据发现、数据定义、分类分级、明确归属、数据资产目录。
3、数据资产目录架构
再下一层是具体的业务对象,承载业务运作和管理业务的重要信息,是业务领域涉及到的重要的事、物、人。比如客户基本信息、报价单、产品数据。
业务对象下一层是对业务对象进行描述的数据项,一般也称之为数据实体,比如报价信息、机会点信息、合同信息。而且一般每个信息都包括两个数据项表头信息(出货单表头)和内容信息(明细行),反映数据信息实体的最小粒度。
最下一层是数据属性,是用来描述数据项的维度信息、属性信息和数据特征信息,反映数据管理的最小粒度。
数据资产目录是数据架构的基础,它列出了企业所有的数据资产,包括数据的来源、类型、格式、用途等。数据资产目录有助于企业清晰地了解自身的数据资源,为数据的利用和管理提供依据。
4、如何建立数据资产目录
数据资产目录是数据管理层面的输出,如果需要进一步将数据资产在应用系统或数据平台管理落地,再结合数据结构、表结构、数据存储的物理层级,形成数据字典。数据资产目录主要是面向业务人员和数据管理人员,数据字典一般面向数据管理人员和开发实施人员。
下面是数据资产目录实例:
L1~L2业务数据主题域
下面以最常见的研发和营销数据主题域为例,实例如下:
(1)研发数据主题域
(2)营销数据主题域
5、如何建立数据资产目录
数据资产目录管理包括目录维护及目录安全权限管理,目录应用场景有数据资产的可视化应用、数据资产目录服务、数据分析应用场景等内容。
所以帮助业务人员和数据分析师实现自助式数据生产是数据治理的根本,为此,要先实现数据的统一管理。
数据资产目录应该是企业唯一且统一的数据资产管理工具,也是企业单一可信的数据出口。所以,数据资产目录应该清晰、结构化地将所有的数据资产按类别或标签进行管理,让所有的用户能够在一套数据体系下、一个平台上获取、分析和利用数据,让数据更容易被理解,从而减少错误,降低风险,提高数据分析效率,从而实现数据自助服务和分析。
(2)自助式探索分析数据资产目录应该对不同角色的用户提供对应的数据探索、浏览和分析的功能,从而让用户方便地根据业务需要,用自己熟悉的方式浏览、查找、探索数据。
(3)安全合规保障数据资产目录对所有的数据、数据产品和服务进行分级、分类、分权限管理,根据不同的身份对用户授权,满足企业的数据安全合规的要求。
(4)高效协同生产数据资产目录是所有用户访问数据的唯一入口,要让所有用户能够高效协同,比如提供统一的知识库、数据自服务、数据标签以及协同开发等功能。
3. 数据资产目录优化企业数据生产全链路在没有数据资产目录的时候,企业的数据生产全链路如下所示。
在数据处理和数据分析阶段,相关人员如果需要更多的数据,就要寻找更多的数据文档和组织更多的沟通会议。从寻找数据开始,到数据分析结果出来,再到数据产品构建好,这个过程费时费力,并且新的数据分析结果和数据产品又变成了数据孤岛,当别人利用数据的时候依然需要沟通。这样的过程低效、随机性很大,并且很容易导致数据质量问题。
当企业构建起数据资产目录后,数据生产的全链路就形成了,如下所示。
数据资产目录的目标是提供快速且低成本的方式来盘点、分类和组织分散且杂乱无章的数据资产,让所有人用同一个工具进行数据的查找、访问和协作。数据资产目录帮助企业构建统一的一站式数据治理能力,是精益数据治理的典型实现方式。
参考:凯哥讲故事系列《史凯 | 企业为什么需要数据资产目录》傅一平:如何成为一名顶尖的数据管理专家? 2382
一文分清:数据要素、数据资源、数据资产、数字资产、数据管理、数据治理、数字资产入表 1898
国家数据局局长刘烈宏:数据要素论 4678
详解数据治理体系(值得收藏)2754
业务架构建模8步法指南及其成功关键要素 1471
数据安全100问(PPT) 2096