查看原文
其他

如何正确的解读数据指标?

数据学堂 2022-11-08

The following article is from 网易有数 Author 九饼

标的解读,包括日常看数,目标的达成情况监控,异常问题定位等等。指标对业务的执行进行好坏衡量或是建议指导,最关键就是指标的解读。指标的解读,并不等同于汇报指标的值+同比环比,更多的是需要反馈指标背后的业务问题或者流程问题,对于业务操作能有问题的发现和解决问题的建议。


(阅读本文之前,建议先看此文效果更佳:数据指标设计方法


指标解读,大家第一感觉就是对于指标的数据进行波动汇报,认为不需要训练能直接上手,并且在短期之内还感觉解读的不错。但是长远下来会进入到一些误区当中,这里列举三种误区:

第一种是会发现自己解读的数据,跟让听众自己去看数据效果差不多,解读的内容带不来听众任何惊喜感。其本质原因是,解读的方式,是“观察式解读”,缺少对于指标背后业务本质的理解。

第二种是没有弄清楚相关关系和因果关系,这种解读极易引发大家的逻辑争议,甚至会引导出错误的决策判断,属于数据分析里面所谓的dangerous areas。

第三种是指标解读的节奏,抓不住重点。往往全盘解读,有点低效,个别解读,又害怕漏了重点。

以下我们便针对这三个数据解读的误区进行详细的说明。


1

走出“观察式解读”误区



所谓观察式解读,是指只从指标的表面信息去分析指标的情况和定位指标的问题,看起来很合理,也很高效,但是其实并没有get到指标背后真实的情况,这种解读方式,是数据分析中最常见的数据分析误区。


以下讲述一个模拟的案例来帮助大家走出这个误区。


背景介绍:用户在严选下单后,严选会从仓库打包好包裹发送给用户,我们会针对不同的线路,不同的订单类型,进行承运商的选择,我们的承运商主要是三种:顺丰,京东和中通,三种承运商报价不一样,服务水平不一样,因此单量占比也不一样。


基于以下的数据,解读为什么单均运费从8.7元下降到了8.2元?



备注:1.本文的数据皆为杜撰信息,请勿传播和使用;2.报价10+2表示包裹3kg以内都是10元,每续重1kg增加2元。


单均运费,跟单量占比有关,也跟报价有关。读到这里,大家可以先尝试解读一下试试。


我猜测,有不少的人会有如下的解读解读:


“单均运费从9月8.7元下降至10月8.2元,原因是价格相对比较便宜的中通的单量占比上涨5%,京东单量上涨10%,以及京东的续费价打9折”


这种解读很常见,就是标准的“观察式解读”,一般数据分析新手很容易陷入到这种解读习惯中。这种解读有如下几个问题:

  • 中通单量上涨或者顺丰单量下降的原因没有说清楚;
  • 京东单量上涨和打折其实是一个原因,因为系统会基于报价情况来选择更低价格的配送商;
  • 几个原因之间的影响没有量化;
  • 是否存在数据外的影响因素没有评估。



这里直接给出更精准且有效的解读方式:
第一句:“10月单均运费从8.7元下降至8.2元,表现向好”——说明现象
第二句:“原因是淘系活动带来渠道单量比例上涨6%,渠道70%发中通,引起中通整体的单量占比上涨5%,”——中通变化的原因
第三句:“渠道发中通引起的客诉问题可控”——对于业务的影响
第四句:“这部分影响0.4元”——量化影响
第五句:“京东续费打折,选仓选配优先级提升” ——另外的原因
第六句:“以及业务主动调整江浙沪京东比例”——所给的数据范围外的原因

第七句:京东单量上涨10%,影响0.1元” ——量化影响


这种解读方式,也是听众,特别是业务方高层更愿意听到的信息,以及基于这些信息,可以做进一步的决策升级等。


简单的总结一下,非“观察式解读”的要点:

  • 先说明指标现象
  • 研究透指标变化的【本质】原因
  • 原因的影响进行量化
  • 其他影响的说明


到这个层面之后,可以再加上针对这个指标未来的规划,那么就很完整了。


2

理清相关关系和因果关系



我们在解读数据时,往往需要理清楚事情背后的真实原因,我们需要的是指标现象和原因之间的“因果关系”,但是太容易出现解读出的“原因”是“相关关系”了。


举例1:如上面的那个案例,“单均运费变高的原因是京东和中通的单量占比增加”


“单均运费变高” 和 “京东和中通的单量占比增加” 其实都是现象,后者并不是前者的“因”


举例2:“上周GMV的增加是因为人均arpu值增加”


举例3:“昨日新进人数增加是因为曝光转换率增加”


举例4:“30日留存比较高的那一批用户,发现他们的特点是7日留存比较高”


相信很多人都能看出这些解读,其实很多都是指标之间的相关性影响,并没有给出背后的本质原因。其实当我们真的花时间多琢磨一下,这些背后的原因其实都是不难被挖出来的。那么如何能够避免出现这种情况呢?我觉得主要在于解读习惯。

这里我分享一下我是如何避免陷入这个坑的:解读时,不断问自己为什么?问到不能再问的时候,就是最终的答案了。


我们拿上面的案例2来举例:为什么GMV增加了?我们可以通过杜邦分析定位到是人均arpu值涨了。


那么下一步就是问自己,为什么人均arpu值涨了?答案是用户购买商品的件数增加了?


继续问自己,为什么购买商品件数增加了?发现是因为对xx商品新加了满赠的营销活动。


似乎是问到底了,其实不然,我们可以分析一下这个活动的影响,是不是对全局影响的主要原因,那么我们可以继续发问,为什么这个活动没有造成付费人数的上涨?


然后发现活动里面有限制,必须是超过一定购买金额,才有这个优惠。因此还是只有少部分的用户参与了这次活动。这样结论和数据表现,就能够完全对应上了。


当然有的人还会问,为什么要上这个活动?嗯嗯,这个就问业务方好了,可能这个问题,听众比我们分析人员更清楚~


3

指标解读的节奏



这一部分,我们需要重点解决一个问题:在什么时候,解决什么指标?


当只负责单一指标的时候,日常观察指标的波动就好了。我们可以定义一个预警条件,比如说收入波动超过10%就需要去解读分析一下,或者达成率不足99%的时候去分析原因。或者距离目标值完成的很好,或者很不好的时候,可以去复盘一下原因。


但是当面对一个指标体系的时候,我们什么时候去关注什么指标呢?核心的思路,分两步:

  • ①对业务节奏分段;

  • ②不同的时期,业务操作层面更关注什么?


业务分段,可以先分为【日常】和【活动】两部分,然后看日常需要关注什么,活动需要关注什么。以及日常和活动里面,寻找一些周期性的规律。以严选来讲,其实业务操作具有很强的周期性,就是围绕几个大促(618,双11,双12),进行平销期和大促期的切换,以及大促期,又分为促前、促中、促后,不同的阶段,哪些指标更重要,就很清晰了。


以供应链为例,我们分为促前、促中和促后。

促前:缺货风险,到货及时率,逾期率,仓库存储风险,分仓平衡性等

促中:生产及时率,配送及时率,配送时效等

促后:退货率,客诉率


除了大促,日常也可以有规律的、阶段性的去解读一些核心指标,比如库存情况,成本情况,客诉情况,等等。当然,如果遇到很重要的指标,需要做突破或者深入的分析,可以启动指标的专项分析,这个后续再介绍。


4

总结



指标解读是做好数据分析的第一步。同样的指标数据,在不同的人眼里,会呈现完成不一样的意义和价值。我们传颂啤酒与尿布的故事,谷歌基于关键词预测流感的故事,这些事情的基础就是深入理解指标。


如何能做到更高效的吸收数据知识,这个需要不断的训练和沉淀方法。希望人人都是分析师,这个时代下数据量级爆发的同时,数据价值也能爆发。



作者简介

九饼,网易严选数据分析师,数据爱好者,认为数据可以改变世界。现负责严选主站和供应链的分析工作。


<END>



大家都在看:
1、一文读懂DAMA数据治理工程师认证考试(内含福利)
2、标签体系构建思路(附项目实战模板文档)3、企业数据质量管理三步法
4、大数据平台数据管控整体解决方案(PPT)
5、SAP:什么是数字化转型?6、元数据管理在数据仓库的实践应用7
搭建数据管控体系,重构数据治理框架8数据中台能解决什么问题?什么样的企业适合建设数据中台?
9、
数据治理连载漫画:什么是数据资产管理?
10、
企业数据管控、运营、服务平台建设方案(PPT)
11、
通透!全面剖析什么是数据仓库
12、
企业级数据资产管理平台规划建设方案
13、8000字详解数据仓库建设中的数据建模方法14、华为数据分类管理框架及数据治理方法15、企业数据资产盘点与数据标准梳理方法



数据学堂


欢迎扫码添加歪老师个人微信(data-school),邀请加入数据学堂数据治理专业微信群,与业内大咖一起识数据、存数据、管数据、治数据、用数据!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存