其他
漫谈数据治理之二:思想上的体系化
漫谈数据治理之二:思想上的体系化
数据的滚雪球效应
数据暴增带来的系统风险
数据计算链路越来越复杂,带来了很高的数据质量风险,高危风险数据开始增多; 组织协作难度增加,跨部分的协作周期增加至原先的数倍,对于企业研发效能而言是一种巨大的损失; 数据孤岛逐步增多,安全合规的风险被放大,数据计算链路难以被完整的追踪。
数据治理的核心目标
数据治理的核心规则
一种是研发协作机制:产品的需求评审中不仅要有交互评审,也要有数据评审;多部门协作时,要按照专业归属的原则,将能够沉淀的数据放到一起,避免多方维护的情况;针对复杂的数据需求,学习拆解需求的方法论,沉淀可靠的数据模型。 一种是部门协作机制:跨部门会增加数据的链路长度,对于指标的统一不容易把握,因此要明确各个链路所承担的职责,例如分析部门就不要去插手数仓的工作;针对可能存在的违规和安全问题,制定一个统一的标准,通常是表级别的,有余力也可以做到字段级别。
数据治理的根本保障
第一件事是有一份能够阐述业务概念和数据定义的文档,从业务角度讲明白数据的定义; 第二件事是有一个平台能够支持分析数据的血缘关系,做到知晓数据的来龙去脉; 第三件事是能够有一份清晰的数据流程图,对于数据的做出模型上的可靠分类。
一种是数据治理战役:虽然从思想上我们能够将数据治理的工作体系化,但是它的落地需要一系列工作的支持,像数据血缘分析,没有平台的支撑,很难做下去。因此梳理清楚有哪些前置的条件要做,把这些事当作战役来执行,不求毕其功于一役,但求能够持续的推动问题的改善。 一种是数据治理运营:由于数据治理归根结底不能是部门的长期任务,而是作为个人日常的修养习惯,所以我们还需要通过一系列的运营活动,来不断强化每个人的意识。例如数据治理标兵评选、数据问题团队公示等,让运营手段也能够参与到工作中。