查看原文
其他

10年前,IBM的数据治理统一流程,至今还适用吗?

石秀峰 谈数据 2022-05-15

作者丨石秀峰

全文共3768个字,建议阅读需15分钟


2010年,IBM发布了《数据治理统一流程》,对数据治理的内涵进行了定义,提出了企业数据治理的标准框架和数据治理成熟度评估模型,并给出了企业数据治理的14个标准过程。
10年过去了,IBM公司从当年的“蓝色巨人”,到现在业绩下滑不得不进行拆分,属于IBM的IT时代已经终结!
那,当年IBM提出的数据治理统一流程,至今还适用吗?

01
IBM:数据治理定义

IBM定义:“数据治理是一门将数据视为一项企业资产的学科。它涉及到以企业资产的形式对数据进行优化、保护和利用的决策权利。它涉及到对组织内的人员、流程、技术和策略的编排以从企业数据获取最优的价值。”
从一开始数据治理就在协调不同的、孤立的且常常冲突的策略可能导致数据异常的过程中扮演着重要角色。
与任何新兴学科一样,数据治理有许多定义但市场已开始围绕将数据视为资产的定义进行具体化。
传统的会计规则不允许公司在他们的财务负债表上将数据视为财务资产除非它是从外部实体购买的。尽管存在这种保守的会计方法,但企业现在认识到他们的数据应该视为类似于工厂和设备的资产。将数据视为战略性企业资产意味着组织需要建立其现有数据的清单就像建立物理资产的清单一样。
IBM数据治理委员会开发了IBM数据治理模型和数据治理统一流程,旨在为企业数据治理计划的参考,以及基于IBM工具和软件的最佳实践。

02
IBM:数据治理框架

IBM数据治理模型分为目标、支持条件、核心规程和支持规程四个层次,如下图:
目标。目标是数据治理计划的预期结果,通常致力于降低风险和价值创造。数据风险管理和规格性是用来确定数据治理与风险管理的关联度及合规性,用来量化、跟踪、避免或转移风险。价值创造是通过有效的数据治理,实现数据资产化帮助组织创造更大的价值。
支持条件。组织机构与意识,数据治理需要建立相应的组织机构(例如:数据治理委员会、数据治理工作组等),并安排的全职的人员开展数据治理工作,同时,需要建立起数据治理的相关制度并且获得高管的重视。管理工作,制定数据质量控制的规程和制度,用来管理数据以实现数据资产的增值和风险控制。策略,组织应在数据战略层面设置明确的目标的方向。
核心规程。数据质量管理,提升数据质量,保障数据的一致性、准确性和完整性的各种方法。信息生命周期管理,对各种类型数据,如:结构化数据、非结构化数据、半结构化数据全生命周期管理的相关策略、流程和分类。信息安全与隐私,在数据资产包含,减低数据安全风险的各种策略、实践和控制方法。
支持规程。数据架构,指系统体系结构设计,支持向适当的用户提供和分配数据。分类与元数据,通过元数据的技术,对组织的业务元数据、技术元数据进行梳理,形成数据资产的统一资源目录。审计记录与报告,指数据合规性、内部控制、数据管理审计相关的一系列管理流程和应用。

03
IBM:数据治理成熟度

IBM数据治理能力成熟度评估模型借鉴了,能力成熟度模型CMM(Capability Maturity Model),将数据治理的成熟度描述了五个等级的成熟度路径:

Level 1 初始化:工作通常是临时的,环境也不稳定,反映组织内个人能力,而不作为成熟度管理。该阶段尽管组织内会生成产品和服务,但往往会超出预算和项目时间;
Level 2 已管理基于项目或单业务职能的有效管理,能够跟踪成本和时间表,可以基于项目实践的计划和执行的经验开展复用,但仍缺乏组织内整体的管理,仍然存在预算超支和实践逾期等风险;
Level 3 已定义:组织内形成覆盖整个组织的标准、流程和规程管理,能够适应组织内业务职能或项目;
Level 4 量化管理:组织通过统计技术和量化分析,对所开展的质量目标进行量化管理;
Level 5 持续改进:量化的目标被明确建立且持续修订反映业务目标的变化。

04
IBM:数据治理流程

IBM 数据治理统一流程列出了这 14 个主要的10个必需步骤和 4 个可选专题,以及支持有效的数据治理计划的相关IBM 软件工具和最佳实践。
10 个必需步骤是为有效的企业治理计划奠定基础所不可或缺的。
 4 个可选专题是主数据治理、分析治理、安全和隐私以及信息生命周期治理。


(1)定义业务问题
数据治理计划失败的主要原因是:它们无法识别实际的业务问题。组织亟需围绕一个特定的业务问题,比如失败的审计、数据破坏或出于风险管理用途对改进的数据质量的需要,定义数据治理计划的初始范围。一旦数据治理计划开始解决已识别的问题􀒻业务职能部门将支持它将范围扩展到更多区域。
(2)获取高层支持
得到关键 IT 和业务高层对数据治理计划的支持很重要。获得此支持的最佳方式是以业务案例和“快捷区域”的形式建立价值。例如:业务案例可以专注于一客户名称匹配,改进数据的质量以支持客户中心性计划。
(3)执行成熟度评估
每个组织需要对其数据治理成熟度执行一项评估,最好每年执行一次。数据治理组织需要评估组织当前的成熟度水平,当前状态和想要的未来成熟度水平,这通常在12到18 个月后。这段时间必须长到足够生成结果,短到确保关键利益相关者的持续支持。
(4)创建路线图
数据治理组织需要开发一个路线图来填补 11 个数据治理成熟度类别的当前状态与想要的未来状态之间的空白。例如:数据治理组织
可以检查“照管”的成熟度空白,确定企业需要任命数据照管人来专门负责目标主题区域,比如客户、供应商和产品。数据治理计划也需要包含“快捷区域”——计划可带来近期业务价值的区域。
(5)建立组织蓝图
数据治理组织需要建立一种章程来治理其操作,确保它拥有足够的成熟度来在关键形势下担当决胜者。数据治理组织最好在一种 3 层架构下操作。顶层是数据治理委员会,它由依靠数据作为企业资产的关键职能和业务领导组成。中间层是数据治理工作组,它由经常会面的中层经理组成。最后一层由数据管理员组成,它负责每天的数据质量。
(6)创建数据字典
业务词汇的有效管理可帮助确保相同的描述性语言适用于整个组织。数据字典或业务术语库是一个存储库,包含关键词汇的定义。它用于在组织的技术和业务端之间实现一致性和达成一致。例如:“客户”的定义是什么,客户是某个进行购买的人还是某个考虑购买的人,前员工是否仍然分类为“员工”,词汇“合作伙伴”和“经销商”是否同义,这些问题可通过创建一个通用的数据字典来回答。一旦实现,数据字典可应用到整个组织,确保业务词汇通过元数据与技术词汇相关联,而且组织拥有单一、共同的理解。
(7)理解数据
有人曾经说过:“您无法控制您还未理解的东西。”如今很少有应用程序是独立存在的。它们由系统和“系统的系统”组成,包含散落在
企业各个角落但整合或至少相互关联的应用程序和数据库。关系数据库模型实际上使情况更糟了,它使业务实体的存储分散化。但是所有一切是如何关联的,数据治理团队需要发现整个企业中关键的数据关系。
(8)创建元数据存储库
元数据是关于数据的数据。它是有关任何数据工件,比如其技术名称、业务名称、位置、被认为的重要性和与企业中其他数据工件的
关系的特征的信息。在查询阶段,数据治理计划将从数据字典生成大量业务元数据和大量技术元数据。此元数据需要存储在一个存
储库中,所以它可以在多个项目之间共享和利用。
(9)定义度量指标
数据治理需要拥有可靠的度量指标来度量和跟踪进度。数据治理团队必须认识到当您度量某个东西时,性能就会改进。因此,数据治理团队必须挑选一些关键性能指标 (KPI) 来度量计划的持续性能。例如:一家银行将希望评估行业的整体信贷风险。在这种情况下,数据治理计划可以选择空的标准行业分类 (SIC) 代码的百分比作为 KPI跟踪风险管理信息的质量。
前9个步骤是企业数据治理的基本流程,第10步需要企业在 4 个可选的数据治理专题(主数据治理、分析治理、安全和隐私以及信息生命周期治理)中至少选择一个。
(10)治理主数据
企业内最有价值的信息(与客户、产品、材料、供应商和帐户相关的关键数据)统称为主数据。尽管它很重要,主数据常常是重复的并分散在整个企业的各种业务流程、系统和应用程序中。治理主数据是一种持续的实践,其中业务领导为实现业务目标而定义准则、策略、流程、业务规则和度量指标,管理他们的主数据的质量。
(11)数据分析治理
企业已投入了巨额资金建立数据仓库来获取竞争洞察。但是,这些投资并不总是得到了结果,导致企业越来越多地审查其对分析的投
资。“分析治理”专题定义为设置更好地协调业务用户与对分析基础架构的投资的策略和过程。
(12)管理安全和隐私
数据治理领导(尤其是向首席信息安全官报告的领导)常常必须处理围绕数据安全和隐私的问题采用相应的策略和措施。
(13)治理信息生命周期
非结构化内容占典型企业中的数据的 80% 以上。随着组织从数据治理转向信息治理,他们开始考虑这种非结构化内容的治理。
(14)度量结果
数据治理组织必须通过不断监控度量指标来确保持续改进。在第9 步中,数据治理团队设置度量指标。在此步骤中,数据治理团依据这些度量指标向来自 IT 和业务部门的高层利益相关者报告进度。
整个数据治理统一流程需要以持续循环的形式操作。该流程需要度量结果并循环回到高层支持者,以获得数据治理计划的持续支持。

写在最后的话
IBM的数据治理统一流程是在IBM公司大量的实践案例研究和总结出来的,其发布的最初驱动还是在于IBM数据治理产品和解决方案的推广。
但如今已经过去了10年,你认为IBM的数据治理框架、治理流程、或数据治理思路和方法,还能适用当前“ABCD新技术”环境下的企业数据治理吗? 
欢迎留言讨论!

  <END>  

参考资料:

IBM《统一数据治理流程》



分享、收藏、在看,三连、三连!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存