查看原文
其他

数仓深度 | 主数据管理

歪老师 BAT大数据架构 2022-11-29

导读:企业主数据指企业内一致并共享的业务主体。主数据管理,不仅包括硬件和软件,还是将数据作为重要资产管理的思想和办法,是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。


一、 企业数据类型

企业数据类型主要包括交易数据、主数据和元数据,如下图所示:

元数据是企业数据资产管理的基础,是关于“数据的数据”,例如数据类型、数据定义、数据关系等,相当于数据表格中的表头信息,是一个相对客观的概念。

主数据是从元数据中挑选出来的,表征公司业务运行的关键、通用型数据,是一个相对主观的概念。它不仅仅只是表头信息,而是包括实例数据。例如公司的产品列表、客户列表、分公司地址信息等。
交易数据也是基于元数据衍生而来的,反应公司实时业务记录的数据,同样是实例数据。
主数据是相对稳定的,静止不变或者是一段时间内静止不变的数据,而交易数据则是实时变化的数据,往往描述的是某一个时间点所发生的交易行为。


二、主数据

企业主数据指企业内一致并共享的业务主体。

  • 是各个系统(包括操作型系统、事务型应用系统、分析型系统)间一致并共享的数据
  • 是用来描述核心业务的实体,例如员工、组织机构、客户、供应商、会计科目等相关数据


主数据特点:准确性、一致性、集成性、共享性/可重用性和高价值。
它是能够在各个业务部门、业务系统中被重复使用的。目前很多行业的主数据甚至是动态和不完整的,例如:一家证券公司需要覆盖交易所、中登、银行间市场、证监会等相关数据,这些主数据往往需要采用人工和自动相结合的方式来进行维护和管理。
元数据:是定义数据的数据,是用来表示数据的相关信息,比如:数据定义、数据描述等,主要为数据交换提供一个规范和标准。
可以理解为The“who”,“what”,“where”,“How”,“Whose”of data。


三、主数据管理

(1)主数据管理

企业主数据管理是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。主数据管理的目标是提供一个准确、及时、完整、相应的主数据来源,以支持业务流程和交易。

(2)主数据管理不是数据仓库

  • 数据仓库会将各个业务系统的数据集中在一起再进行业务的分析,并且保存经过清理的数据;主数据管理系统不会把所有数据都管理起来,只是把需要在各个系统间共享的主数据进行采集和发布。

  • 数据仓库是单向集成的;主数据管理注重将主数据的变化同步发布到各个关联的业务系统中。主数据系统是双向的,不但需要从各个系统中获取、加工,还包括了最终数据的分发。

(3)常见的主数据管理问题

目前,主数据管理的问题在大多数行业、企业中普遍存在,主要表现为以下几点:
  • 关键信息孤岛,数据分布在多个孤岛,不能跨组织传播
  • 组织内不能就一个主数据源达成一致
  • 数据质量问题引发的业务流程和交易的失败
  • 不正确或丢失数据造成合规性和绩效管理的问题
  • 决策者做出基于错误数据的错误决定
对企业来说,业务系统的构建大多是以实际业务为核心,从下至上地构建系统,使得缺乏统一的规划,从而导致一些需要在各个业务中共享的主数据被分散到各个业务系统中。分散管理的主数据由于缺乏一致性、准确性和完整性,从而导致各个企业普遍存在的客户管理、供应商管理、产品管理等不力现象。
(4)主数据管理解决方案
  • 从多个业务系统中整合最核心的、需要共享并保持一致的主数据,即创建主数据的单一视图(主数据管理系统MDM)

  • 以服务的方式把统一、完整、准确的主数据发布给企业范围内需要使用这些数据的业务系统、业务流程和决策支持系统

  • 建立数据治理委员会,集中、定期进行主数据的清洗和丰富


(5)带来的业务价值
  • 基于完整、准确的信息增强企业管理和业务增长的能力

  • 加速新的服务和产品的推出,简化业务流程

  • 增强IT架构的灵活性,构建覆盖整个企业范围的数据管理基础

  • 提高业务分析的准确度和企业管理的水平,满足法规的要求,降低业务风险


四、主数据管理实施

(1)主数据管理如何实施
主数据管理项目需要持续的建设和运营,建设阶段更多的在于确定架构、流程和原则,运营阶段才是逐渐完善数据源,增加新的应用,并适时进行架构回顾并进行必要调整。主数据管理项目的建设过程中,要求决策人员、业务人员和开发者的共同参与和密切协作,要求保持灵活的头脑,不做或尽量少做无效工作或重复工作。
(2)项目实施过程
主数据管理的原始需求是不明确、且不断变化与增加的,建设者最初不能确切了解到用户的明确详细的需求,用户能提供的无非是需求的大方向以及部分需求,更不能较准确地预见到以后的需求。主数据管理系统一个经过不断循环、反馈而使系统不断增长与完善的过程。

(3)系统方案分享

方案一:数据转换映射

常见于大型、分散管理的企业集团,如GE、中石化等。

方案二:由应用系统承担主数据管理功能

常见于产品线差异较小,管理较集中的企业,如Apple、Boeing、华为等。

方案三:混合模式

企业分散程度介于方案一与方案二之间,对于不同类型的主数据,或利用相关业务系统或引入独立的主数据管理平台,如:GSK、海尔等。

方案四:集中管控

产业形态相对单一,企业快速发展(多收购、合并),集团管控和数据整合要求高的企业。


五、结语

在数据资产管理的领域里,主数据的管理是最为基础的部分,因为主数据是可以跨业务、跨组织、跨系统被重复利用的数据,通过构建准确、唯一、权威的数据来源建立企业主数据标准管理体系,是提高企业数据质量和数据资产价值的关键因素。

【END】


★ 数据模型:数据模型之维度建模

★ 数据标准:数据指标体系建设

★ 数据质量:数据质量:缺失数据处理

★ 数据服务:快手大数据平台服务化实践

★ 数据安全:大数据安全体系建设

★ 主数据:主数据管理(MDM)项目建设落地

★ 数据生命周期:数仓同步之道&ETL加载策略


回复:06,下载全部资料

扩展阅读:公众号回复「06」获取「The Data Warehouse Toolkit, 3rd Edition」维度建模权威指南、「阿里巴巴大数据之路」等6本经典电子书籍赠送。


关注不迷路~ 各种福利、资源定期分享!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存