如何正确的解读数据指标?
The following article is from 网易有数 Author 九饼
(阅读本文之前,建议先看此文效果更佳:数据指标设计方法)
走出“观察式解读”误区
所谓观察式解读,是指只从指标的表面信息去分析指标的情况和定位指标的问题,看起来很合理,也很高效,但是其实并没有get到指标背后真实的情况,这种解读方式,是数据分析中最常见的数据分析误区。
以下讲述一个模拟的案例来帮助大家走出这个误区。
背景介绍:用户在严选下单后,严选会从仓库打包好包裹发送给用户,我们会针对不同的线路,不同的订单类型,进行承运商的选择,我们的承运商主要是三种:顺丰,京东和中通,三种承运商报价不一样,服务水平不一样,因此单量占比也不一样。
基于以下的数据,解读为什么单均运费从8.7元下降到了8.2元?
单均运费,跟单量占比有关,也跟报价有关。读到这里,大家可以先尝试解读一下试试。
我猜测,有不少的人会有如下的解读解读:
“单均运费从9月8.7元下降至10月8.2元,原因是价格相对比较便宜的中通的单量占比上涨5%,京东单量上涨10%,以及京东的续费价打9折”
这种解读很常见,就是标准的“观察式解读”,一般数据分析新手很容易陷入到这种解读习惯中。这种解读有如下几个问题:
中通单量上涨或者顺丰单量下降的原因没有说清楚; 京东单量上涨和打折其实是一个原因,因为系统会基于报价情况来选择更低价格的配送商; 几个原因之间的影响没有量化; 是否存在数据外的影响因素没有评估。
第一句:“10月单均运费从8.7元下降至8.2元,表现向好”——说明现象
第二句:“原因是淘系活动带来渠道单量比例上涨6%,渠道70%发中通,引起中通整体的单量占比上涨5%,”——中通变化的原因
第三句:“渠道发中通引起的客诉问题可控”——对于业务的影响
第四句:“这部分影响0.4元”——量化影响
第五句:“京东续费打折,选仓选配优先级提升” ——另外的原因
第六句:“以及业务主动调整江浙沪京东比例”——所给的数据范围外的原因
第七句:京东单量上涨10%,影响0.1元” ——量化影响
这种解读方式,也是听众,特别是业务方高层更愿意听到的信息,以及基于这些信息,可以做进一步的决策升级等。
简单的总结一下,非“观察式解读”的要点:
先说明指标现象 研究透指标变化的【本质】原因 原因的影响进行量化 其他影响的说明
到这个层面之后,可以再加上针对这个指标未来的规划,那么就很完整了。
理清相关关系和因果关系
我们在解读数据时,往往需要理清楚事情背后的真实原因,我们需要的是指标现象和原因之间的“因果关系”,但是太容易出现解读出的“原因”是“相关关系”了。
举例1:如上面的那个案例,“单均运费变高的原因是京东和中通的单量占比增加”
“单均运费变高” 和 “京东和中通的单量占比增加” 其实都是现象,后者并不是前者的“因”
举例2:“上周GMV的增加是因为人均arpu值增加”
举例3:“昨日新进人数增加是因为曝光转换率增加”
举例4:“30日留存比较高的那一批用户,发现他们的特点是7日留存比较高”
相信很多人都能看出这些解读,其实很多都是指标之间的相关性影响,并没有给出背后的本质原因。其实当我们真的花时间多琢磨一下,这些背后的原因其实都是不难被挖出来的。那么如何能够避免出现这种情况呢?我觉得主要在于解读习惯。
这里我分享一下我是如何避免陷入这个坑的:解读时,不断问自己为什么?问到不能再问的时候,就是最终的答案了。
我们拿上面的案例2来举例:为什么GMV增加了?我们可以通过杜邦分析定位到是人均arpu值涨了。
那么下一步就是问自己,为什么人均arpu值涨了?答案是用户购买商品的件数增加了?
继续问自己,为什么购买商品件数增加了?发现是因为对xx商品新加了满赠的营销活动。
似乎是问到底了,其实不然,我们可以分析一下这个活动的影响,是不是对全局影响的主要原因,那么我们可以继续发问,为什么这个活动没有造成付费人数的上涨?
然后发现活动里面有限制,必须是超过一定购买金额,才有这个优惠。因此还是只有少部分的用户参与了这次活动。这样结论和数据表现,就能够完全对应上了。
当然有的人还会问,为什么要上这个活动?嗯嗯,这个就问业务方好了,可能这个问题,听众比我们分析人员更清楚~
指标解读的节奏
这一部分,我们需要重点解决一个问题:在什么时候,解决什么指标?
当只负责单一指标的时候,日常观察指标的波动就好了。我们可以定义一个预警条件,比如说收入波动超过10%就需要去解读分析一下,或者达成率不足99%的时候去分析原因。或者距离目标值完成的很好,或者很不好的时候,可以去复盘一下原因。
但是当面对一个指标体系的时候,我们什么时候去关注什么指标呢?核心的思路,分两步:
①对业务节奏分段;
②不同的时期,业务操作层面更关注什么?
业务分段,可以先分为【日常】和【活动】两部分,然后看日常需要关注什么,活动需要关注什么。以及日常和活动里面,寻找一些周期性的规律。以严选来讲,其实业务操作具有很强的周期性,就是围绕几个大促(618,双11,双12),进行平销期和大促期的切换,以及大促期,又分为促前、促中、促后,不同的阶段,哪些指标更重要,就很清晰了。
以供应链为例,我们分为促前、促中和促后。
促前:缺货风险,到货及时率,逾期率,仓库存储风险,分仓平衡性等
促中:生产及时率,配送及时率,配送时效等
促后:退货率,客诉率
除了大促,日常也可以有规律的、阶段性的去解读一些核心指标,比如库存情况,成本情况,客诉情况,等等。当然,如果遇到很重要的指标,需要做突破或者深入的分析,可以启动指标的专项分析,这个后续再介绍。
总结
指标解读是做好数据分析的第一步。同样的指标数据,在不同的人眼里,会呈现完成不一样的意义和价值。我们传颂啤酒与尿布的故事,谷歌基于关键词预测流感的故事,这些事情的基础就是深入理解指标。
如何能做到更高效的吸收数据知识,这个需要不断的训练和沉淀方法。希望人人都是分析师,这个时代下数据量级爆发的同时,数据价值也能爆发。
作者简介
九饼,网易严选数据分析师,数据爱好者,认为数据可以改变世界。现负责严选主站和供应链的分析工作。
<END>
1、一文读懂DAMA数据治理工程师认证考试(内含福利)
2、标签体系构建思路(附项目实战模板文档)3、企业数据质量管理三步法
4、大数据平台数据管控整体解决方案(PPT)
5、SAP:什么是数字化转型?6、元数据管理在数据仓库的实践应用7
9、
数据学堂