发现数据异常的分析逻辑
【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群。新开招聘微信群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。
正文开始
数据分析除了找规律、看趋势外,发现数据异常也是分析中的常态内容。在我们平常的经营数据分析中,各种的销售营运、库存管理、会员分析的过程中都会发现很多异常数据,在你的工作中以下场景是否很常见:
1、为什么上个月的销售下滑了5%?
2、为什么东北区上周的会员流失率升高了?
3、为什么XX店铺的完成率是最后一名?
4、为什么XX店铺上个月的客单价下降了?
……
以上场景,都是发现了有数据异常的情况,那我们要怎样去分析?怎样回答这些问题呢?
大部分人可能的思维逻辑,都是直奔主题去找原因,直接就分析异常的原因,异常在哪些地方?其实这样的思维就不够立体化,得出的结果就可能是很片面的,甚至还可能会踩雷。以下就跟大家分享,发现数据异常后,应该用怎样的思维去进行分析:
为方便理解,这里先假设遇到的数据异常问题是:为什么XX店铺上个月的客单价下降了?
为了立体、全面地去分析一个问题,我们应该严格按照一种思维路径来走:
01、数据源是否有问题?
这一步十分关键,发现数据异常,一定要先问:数据源是否有问题?还记得我之前文章讲的,解读报告前也要先判断数据!如果数据源有问题,那就重新做数据源,重来!千万别急着往下分析,不然分析到最后才发现是数据源错了的话,那就尴尬了,时间也浪费了……
还有一种情况,指标的计算也要考虑业务场景。别小看客单价这么简单的这样一个指标,也是会容易算错的。我指的不是那种算器的这种算错,而是业务背景的算错:
我之前就遇到一个这种情况,某公司的一个区域市场,去年3月份的客单价2000块,今年3份的客单价1800元。也就是说客单价同比下滑了200元,于是大家开会讨论,七嘴八舌地就在找原因。而我那时候就先问了一句:“你这个数据有没有算错?”
当时就把那个做数据整理分析的助理给问懵了,他说客单价计算很简单:用3月份的成交金额/成交客户数。这是标准定义,非常清楚,怎么可能算错?然后我继续问他,在算这个指标,有没有考虑到业务场景?然后就把他给问住了,他不知道我说的业务场景是什么?
其实,在算这个客单价过程中,哪些场景因素可能会要影响到客单价算的正确性呢?假设去年同期发生过团购或者大宗购买,这种情况就会拉高你的客单价,那是非正常的一种销售行为。所以你在算客单价的时候,你需要把这种异常的销售数据剔除之后,我们才去算客单价,这样你算出来才是一种客观的数据。否则如果去年有团购,今年没有团购,这样的对比就是不对等的、没意义的!
最后重新整理数据源,把团购因素剔除后,结论居然还直接逆转了!去年的客单价还没今年的高,所以有的时候第1步很重要,大家务必要记得在分析前先判断数据,特别是要结合业务场景的方式,来判断数据尤其重要!
接下来就开始一步一步的界定问题了。
02、本品牌其他店铺有此问题吗?
假设数据源没任何问题,数据也没算错,去年客单价2000,今年客单价1800,这时我们能不能马上用人货场去分析原因呢?还不要急,继续要看本品牌其他门店有没有此问题?
拿出数据来看看......
现在是A品牌的001店出现客单价下降!你要先了解下,A品牌的其他店(如002、003、004…等店铺),看他们的客单价有没有下滑?如果其他店铺也有客单价下降的情况,这说明是一个品牌共性的问题。整个品牌的所有店铺的客单价都在下降,就不是某个店铺的问题了,这是需要将问题升级,去分析整个品牌出的问题。
所以分析要不断地去界定问题!还没有完,继续问:
03、本区域其他对手有此问题吗?
假设对比了本品牌旗下的其他店铺,发现其他店铺的客单价都没下降,就只有你这个店铺客单价下降了,这时还不能马上就用人货场分析。还继续要问:本区域其他对手有此问题吗?
首先你要明确竞争对手是谁?例如星巴克,它的对手可能就是太平洋咖啡、漫咖啡等等。这时要了解他们的客单价有没有下降的问题?
如果他们也下降,这说明什么?就说明是区域(商圈)出问题了,有可能是修地铁、装修呀等等原因。(具体原因要其他数据才能分析)反正就是界定了是区域共性的问题,而不单单是本品牌的问题。
这里注意如果第2步中界定问题是品牌共性,然后第3步又界定是区域共性,即这时的问题就升级了:品牌共性+区域共性 = 市场共性
如果是市场共性问题,这时就要导入PEST的分析逻辑,分别从政治(politics),经济(economy),社会(society),技术(technology)四方面去导入数据判断趋势,最终找到原因了。(PEST是一个宏观分析的理论,这里不展开解释了,有兴趣的朋友可以自行百度学习)
04、导入人货场的分析逻辑
这里假设不是市场共性问题,同时如果竞争对手客单价没下降,本区域中也只是你品牌的客单价下降,这时我们就可以很确定地界定:就是你这个店铺出问题了!然后就可以导入人货场的分析逻辑了。
05、导入数据判断趋势
分别按人货场的逻辑,然后加入更多的数据进行辅助分析,界定问题。如你要加入各员工3月的销售数据,每个员工这几个月销售的趋势是如何……或者商品方面,TOP10商品是什么,和以往销售的商品有什么不一样?……
前一步(4)只是思维,这一步是根据这个思维用数据来量化处理,总之是用数据说话。
06、找到异常产生的原因
有了数据,很容易找到具体的原因。最后,通过比较了人货场各因素,结合了其他的数据判断趋势后,也许原因有可能是这样的:
1、老员工都离职了,新员工技能跟不上导致客单价下降
2、高质量的老顾客流失不少
3、畅销品,高价位货品缺货?
……
找出具体的原因后,然后就形成一种PDCA的管理闭环解决方案,就是针对具体的原因,按以下步骤开展工作:P (plan) 计划,D (Do) 执行,C (check) 检查,A (Action)调整。(这里不展开,具体大家可以百度学习)
如果把以上的步骤画成图的话,就是下图的这种效果了:
我们这次只是用一个零售店铺举例,对于其他行业、场景,如生产线、物流等都可以按这个流程来解读数据异常。提醒大家,发现数据异常绝对不可以不界定问题,直接去找结论。
大家可能会觉得很复杂,要耗费很多的时间,其实大家不需要担心。刚开始大家还没有形成自己的思维模式之前,一定要按照上图的思维模式一步一步往下去走。当你形成了自己的思维路径之后,其实有些步骤就可以节省很多时间的,有些步骤在你心里面一闪而过,你就大概知道是什么情况了。
最后给大家的建议,就是一定要多练,练得越多,这东西就越容易变成你自己的思维的一部分。这种思维逻辑会让你的思维变得更立体、全面,滴水不漏,而且深入业务,同时你解构业务问题也就上升到一个新的Level !
大数据也是个江湖:关于腾讯大数据“购买iPhone人群普遍无房无车学历低”的一地鸡毛