其他
从0到1,聊聊货拉拉如何搭建数据指标体系
导读 本文分享的主题是指标体系的构建与应用。
围绕下面 5 个部分展开:1. 背景
2. 指标体系搭建
3. 指标标准化建设
4. 指标元数据管理
5. 指标应用&未来发展
分享嘉宾|黄永强 货拉拉 大数据技术与产品部
编辑整理|王丽燕
内容校对|李瑶
出品社区|DataFun
背景
可信任性:业务口径不一致,导致指标数据不一致,影响到业务部门对数据的信任感;
可理解性:业务术语不一致,导致不同人对业务的理解不一致,从而导致数据存在略微的差异,增加沟通成本;
可衡量性:指标与业务的真实相关程度,能否准确衡量业务的变化,指导目标的达成;
可追溯性:随着业务的发展,业务及数据口径的变更历史较难回溯。
2. 技术视角
数据稳定性:数据的产出是否稳定及时;
数据质量:数据是否准确,完整、一致。
3. 产品视角
可访问性:数据是否易于访问;
合规性:使用是否安全合规,如何防止数据泄漏的风险等。
指标体系构建
解决业务痛点:在指标设计时首先选取核心业务成体系化的来搭建指标体系,并将整个建设流程标准化; 解决技术痛点:将数据研发流程规范化,把握好数据模型的业务扩展性及 ETL 的性能问题,并做好数据链路及质量监控; 解决产品痛点:将建设的元数据产品化,数据的使用做到服务化。
首先公司会制定业务的主要目标,然后依据参与人的业务轨迹梳理核心的业务过程; 然后拆解负责各个核心业务的相关部门的具体目标,接着业务部门依此制定落地的方案或策略; 最后为了指导目标达成,再梳理各业务具体的衡量指标。
遵循 MECE原则,尤其是在底层数据模型的设计过程中,最好将维度和指标拆解地互斥且不交叉,这样有利于保证上层应用层维度及指标组合的灵活性、同时也有利于提升复用率、降低整体的计算及研发成本;具体的拆分方法参考如上图所示,二(多)分法、流程法等。 需要深入理解各核心业务场景的常用数据分析模型(比如上图中 AARRR 等模型),结合自己公司的业务特点,选取合适的业务数据模型来搭建部门内部的指标体系。
指标标准化建设
数据需求准入评审:为了解决业务口径描述不一致、业务口径转换为数据口径的质量问题,一定要成立一个指标评审组织,至少由业务方、数据分析人员、数仓研发人员这三部分组成,此项工作人力投入价值最大,直接影响后续数据研发的效率、交付质量及是否返工修复数据口径等工作量。 数据研发的标准化:为了数据模型设计工作的高质量开展,需要梳理好数据口径;核心工作内容是数据的维度及指标梳理,落地为指标维度矩阵,再进一步拆解到事实层(DWD)的维度及原子指标,这样可以更准确地评估后续数据研发的工作量。
指标元数据管理
首先管理好指标建设流程;前期可以先采用 SOP 等文档落地,后续再产品化; 其次管理好数据模型,包括偏向技术的物理模型和偏向业务的逻辑模型; 然后管理好指标及维度的元数据信息,包括业务数据域、业务口径、数据口径、血缘关系等; 最后将数据封装成服务,并将业务应用方的使用和调用信息登记管理起来,以便后期的服务稳定性分级管理及指标体系建设的业务收益回收等。
数据需求=时间+维度+指标 指标=时间+修饰词+原子指标 维度=通用维度+个性化的业务维度
指标应用&未来发展
自然语言快速取数及简单可视化,在货拉拉已经接近落地,相关云厂商或者头部互联网公司也基本都有相关产品。这个场景的主要挑战是如何降低错误率,个人理解在这个场景中可以拒答,但是不能给出错误数据。 诊断归因,则处于探索逐步落地阶段,前期主要先基于业务部门的分析经验来配置归因的逻辑来实现,后续再探索如何让大模型通过对行业业务的理解学习,结合数理统计分析算法来自主归因。 智能运营场景,为了提高运营效率,进一步对 AI 大模型提出了更高的定制化能力要求。传统运营早已深入各行业公司的具体业务,主要是基于个人经验和历史沉淀的经验知识等,因此需要更深入理解行业及公司业务的运营知识。同时由于涉及到具体的运营策略及业务数据,对于这部分的数据安全性也是一个挑战。为了这个场景能更好地落地及推广,还要求相关产品能具备通用化且安全的行业知识学习及更新能力,并最好将大模型行业知识的学习流程产品化,降低大家的学习使用成本,在保证运营效果的同时,大大减少公司的运营人力投入成本。
分享嘉宾
INTRODUCTION
黄永强
货拉拉
大数据技术与产品部
黄永强,货拉拉大数据技术与产品部,主要负责数据资产的建设工作,在数仓及大数据平台建设都有比较丰富的经验。
往期推荐
领域模型生产指南
腾讯视频指标中台驱动湖仓一体建设实践
奇富科技朱杰:金融风控技术成熟度曲线全面解读
快手大数据安全治理实践
瓴羊董芳英:大模型时代下的数据分析
智能化转型的基石:构建有效的数据治理体系
ByteHouse如何将OLAP性能提升百倍?
第三代指标平台定义、能力与技术详解
ChatBI:基于文心一言的生成式数据分析技术探索
点个在看你最好看
SPRING HAS ARRIVED