实践指南:数据标准在数据治理中的落地实现
如何制定数据标准?
数据标准的生命周期管理
数据标准如何落地实践?
01
—
如何制定数据标准?
主要包含数据项标准、技术标准,其中数据项标准包括:数据元标准、编码标准、词根标准、数据项分类标准。技术标准分为:数据映射标准、DDL模版标准。
数据元标准:数据元标准简单理解是数据字段的标准,一般可以分为业务属性、技术属性、管理属性、操作属性。不同行业,不同企业可能参考的标准不同,而对数据元的标准分类不同。
编码标准:可以参考《数据治理体系之三-数据标准》的定义。
词根标准:词根在数据治理中的应用和管理方法非常重要。它们可以用于标准化和统一命名,尤其是用于字段命名或其他资产的命名。企业可以根据自身的需求和积累,收集和整理词根,建立自己的词根库。当制定数据元或字典时,可以根据输入的中文名称,通过词根库自动翻译成英文名称。
一个完整的词根信息包括英文简称、英文全称和中文全称三个部分。中文全称可以支持多个,这样可以确保在使用词根翻译时,具有相同含义的字段能够得到相同的英文简称。为了方便统一管理,还需要对词根进行编码和指定词根的来源。这样可以确保词根信息的完整性。
数据项分类标准:在数据治理中,数据项分类类似于数据目录,其目的是满足不同场景下对不同对象的分类需求。数据项分类是对字段级别进行分类。
而大家在制定不同的数据标准的时候,需要根据不同的行业和企业参考相关的国家、行业标准,例如:
或者是:
大家在规划标准的过程中,可以去收集这些国家或者行业标准,从全局到局部,逐步去完善标准,标准的制定不是一蹴而就的,而是一个逐渐完善的过程。
02
—
数据标准的生命周期管理
数据标准的建立可以帮助组织确保数据的一致性、准确性和可信度。以下是数据标准的常见步骤,可以作为组织进行数据标准化的指南。数据标准的建立一般是6个步骤:
1、数据标准规划
2、数据标准制定
在这一阶段,组织需要定义和制定数据标准的具体要求和规范。也可以参考相关的国家标准和行业标准来制定具体的要求,这可以包括数据格式、数据命名约定、数据定义和分类、数据质量规则等等。制定数据标准应该通过与利益相关者的沟通和合作来确保其适应和可执行性。
3、数据标准发布
在这一阶段,将制定文档化的数据标准,落地到数据标准产品模块中,可以在数据中台或者数据平台中发布数据标准,通过审核之后发布。
4、数据标准执行
数据标准的执行,对于在数据中台或者数据平台中落地实践主要包含如下几个方面:元模型的定义、数据资产分类、数据质量的质量规则的建立、数据安全分类的依据项、模型设计对数据标准的引用、数据传输过程中对数据映射标准的引用。数据开发中对DDL模型标准的引用。
5、数据标准检查
数据标准执行后,需要进行落标检查,确认标准执行的情况以及效果。可建立相关指标,从标准侧进行标准的引用统计、标准化率统计,从质量侧统计表及字段质量评分,多角度去判断指标执行情况及应用效果。
03
—
数据标准如何落地实践?
从数据开发的整个流程来介绍数据标准的落地实践,数据开发流程分为需求阶段、设计阶段、开发阶段和治理阶段。
1、通过标准的设计,完成指标的设计,包含例如,通过数据项分类,完成主题域分类,通过数据元定义指标的计算公式、通过元模型指导指标元模型的设计等。
2、通过标准的设计,完成模型的设计、模型设计需要引用元模型,根据词根定义字段和表的命名规范,添加数据元,完成表的字段定义,通过引用数据字典,完成字段的取值范围的定义,通过数据项分类,完成主题域和数据安全的分类分级,通过标准映射完成模型创建的字段类型的定义。
3、在数据同步的过程中引用标准映射可以快速建表。在建立传输任务时,可根据映射关系快速生成目标表结构,达到快速建表、一键建表的能力。
4、在数据开发中,通过引用DDL标准,规范开发过程中的建表。SQL编辑时根据选择的输入输出表,通过表字段关联的数据元信息,将相同含义的字段自动进行映射,快速生成SQL,用户只需对生成的SQL进行确认即可。
5、在数据治理的过程中,数据标准是数据质量稽核规则的主要参考依据,通过将数据质量稽核规则与数据标准关联,一方面可以实现字段级的数据质量校验,另一方面也可以直接构建较为通用的数据质量稽核规则体系,确保规则的全面性和可用性。
欢迎加入【数据行业交流群】社群,长按以下二维码加入专业微信群,商务合作加微信备注商务合作,AIGC应用开发交流入群备注AIGC应用
往期数据平台历史热门文章:
基于DataOps的数据开发治理:实现数据流程的自动化和规范化
往期AIGC历史热门文章: