其他
数据治理体系之三-数据标准
01
—
数据标准的作用
建立数据标准体系的目标是通过制定和发布统一的数据标准,结合制度约束和系统控制等措施,实现企业内部数据管理的完整性、有效性、一致性、规范性、开放性和共享性,从而为数据治理工作奠定坚实的基础,并为数据资产管理活动提供规范有效的依据。
数据标准化的过程借助数据管理平台,通过对各个系统生成的数据进行清洗、转换,并加载到整合平台的数据模型中,从而实现数据标准化。
首先,通过要求数据语义遵循确定的规则,减少源数据的不确定性,降低数据交换的障碍。
其次,数据标准的兼容性为企业间的相互共享提供可能,使得在不同的场景和环境中使用数据产品或服务成为可能,使数据产品或服务能够正常流转和运行。
最后,数据标准是数据质量规则的基础,通过创建了数据标准之后,在创建质量规则的时间进行数据标准的引用和映射。
建立数据标准体系能够有效提升企业数据治理的效率,降低数据治理成本。
02
—
数据标准是什么?
序号 | 中文简称 | 英文简称 | 编码 |
1 | 阿富汗 | AFGHANISTAN | AF |
2 | 阿而巴尼亚 | ALBANIA | AL |
3 | ,,,,, | ,,,,, | ,,,, |
指标类型的数据标准主要是指的是指标名称的命名规范,通过统一的命名规范,让指标名称得到统一命名,每个指标有唯一性解释。指标的命名规范结合指标的特性以及词根管理规范,将指标进行结构化处理。
1. 基础指标词根,即所有指标必须包含以下基础词根:
2. 业务修饰词,用于描述业务场景的词汇,例如trade-交易:
4. 聚合修饰词,对结果进行聚集操作:
指标类型的分为基础指标、复合指标、派生指标、以及衍生指标。
基础指标,单一的业务修饰词+基础指标词根构建基础指标 ,例如:交易数量-trade_cnt。
复合指标:单一的业务修饰词+聚合修饰词+基础指标,如平均用户交易额usr_avg_tr_amt等。
派生指标,多修饰词+基础指标词根或者复合指标构建派生指标。派生指标继承基础指标的特性,例如:安装门店数量-install_poi_cnt。衍生指标,基于原子指标做二次多元计算的表达式。例如原子指标A和B,可以定义衍生原子指标C=A/B
。这种指标不做标准定义。03
—
数据标准如何使用
数据标准的使用可以分为三种用途1、作为数据共享的标准,业务系统在模型创建的时候进行引用标准。2、作为数据仓库模型设计的使用标准,数据仓库模型设计进行物理模型创建的时候引用标准。数据模型设计分为普通表设计和指标表模型设计,此时需要使用的是普通数据标准和指标标准。3、作为质量规则进行标准引用,在创建质量规则的时候也是需要分为普通数据的质量规则和指标的质量规则两个部分进行创建。
以数据加工流程来说明数据标准使用的过程:
1、数据建模 根据数据中台规范和标准,开展业务模型、数据模型的设计和管理,使开发落地与设计能更严谨的有机结合。2、指标体系 遵循指标体系的方法,定义各类业务指标(原子指标、派生指标等),明确的以业务需求为导向,同时也生成数据的语义定义,为数据的业务元数据提供基础。3、质量规范 在设计阶段对数据的一致性、准确性、完整性等制定规范要求,以便数据集成、加工过程中有明确的质量要求。
欢迎加入【数据行业交流群】社群,长按以下二维码加入专业微信群,获取最新的行业信息
往期历史热门文章:
基于DataOps的数据开发治理:实现数据流程的自动化和规范化