河南南阳收割机被堵事件:官员缺德,祸患无穷

极目新闻领导公开“记者毕节采访被打”细节:他们打人后擦去指纹

突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

退休后的温家宝

突发!北京某院集体罢工!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

用户分析与RFM模型实战|一个可以写在简历上的项目(下)

The following article is from Follow A Select Author 俩南


哈喽大家好,我是可乐。置顶本公众号,可以更快速地接收每日消息哟
今天给大家带来Python数据分析实战项目,对用户进行RFM分析,小伙伴们可以看看,文末还有抽奖送可乐活动。




正文




接上文:用户分析与RFM模型实战|一个可以写在简历上的项目(上)


本篇会继续对此数据对产品维度和用户分层维度进行分析。


依然结论先行:


重要结论🏅

3、产品维度分析

  • 销量和销售额表现较好的产品为手机和电脑,其中手机产品表现极为突出;

  • 手机产品中,表现最好的品牌为三星

  • 三星产品对应的人群年龄和性别分布都较为均匀,广东上海北京占据了50%以上的销量;

4、用户分层

  • 通过用户生命周期模型将用户分成新用户、活跃用户、不活跃用户和回流用户;由于产品本身特性,大多用户在购买之后长期不活跃;

  • 用户符合帕累托法则,33%的用户贡献了90%的销售额;

  • 构建RFM模型区分重要客户和一般客户,并采取不同的维护客户的措施;



# 3  产品维度分析 #


产品维度分析中重点关注在销量和销售额方面表现较好的产品及产品类别,以及表现最好的产品对应的人群特征;在销量和销售额方面表现较差的产品及产品类别同时需要我们关注~


3.1 销量前10的产品


由于原数据只有product_id,因此这里无法直观获取销量前10的产品是什么~


3.2 销量前10的产品类别

销售额前10的产品分别为手机、笔记本电脑、耳机、鼠标、相机等产品,其中表现最好的产品为手机,销售额为第二名的几乎4倍;


3.3 销售额前10的产品及类别

销售额与销量类似,表现最好的产品为「手机(smartphone)」,且代码也非常类似,因此这里只阐述结论,感兴趣的朋友可以去代码里看~


3.4 手机销量表现最好的品牌

销量最好的五个手机品牌为:三星、苹果、小米、华为和oppo,比较符合我们的认知~ 


3.5 三星品牌对应的人群画像


通过对三星品牌购买记录的人群特征进行分析,发现表现最好的三星品牌具有如下特征:

  • 年龄分布比较平均(仍然是35-40岁的人群略少);

  • 性别分布比较平均;

  • 广东、上海、北京占据了50%以上的销量;


相关代码如下:


# 4  用户分层 #


在用户分层方法论篇(指路👉用户分层方法论总结),我们介绍了集中用户分层常用的方法,分别为:帕累托分析法、RFM模型、AARRR模型与RARRA模型,在这里,我们用帕累托方法和RFM模型结合用户生命周期模型对用户进行分层~


4.1 用户生命周期模型

由于数据有限,这里生命周期仅仅用每个月的新用户、活跃用户、不活跃用户和回流用户来简单替代~


判断新用户、活跃用户、不活跃用户和回流用户的逻辑为:

1)找到用户记录的第一个月,为该用户的注册月,在该月之前该用户都是「未注册」的状态,在该月该用户为「新用户」; 

2)用户注册之后,根据每个月的消费记录用户在该月是否活跃; 

3)如果用户在注册之后有段时间不活跃,但是之后又活跃则为「回流用户」


逻辑判断的代码如下:


基于此逻辑统计每个月不同生命周期的用户数量,并将其可视化:



从上表和图可以发现:大多数用户在购买之后就呈现不活跃状态,回流和活跃的情况较差,个人认为是由于电子产品本身就是长期消耗品,非用户生活刚需,所以在购买之后很长时间内不会有相似产品的需求导致。


4.2 帕累托分析

还记得什么是帕累托分析吗,简单的说就是20%的人贡献了80%的销量~



上图横轴为用户数,纵轴为累积销售额,从图中可以看出,在横坐标为3w左右时,销售额曲线增速放缓,3w/9w约为33%,即33%的用户贡献了90%左右的销售额,呈现比较明显的28法则~


4.3 RFM用户分层

先来回忆一下RFM模型的定义:R(Recency):最近一次消费;F(Frequency):消费频率;M(Monetary):消费金额


构建RFM分层模型需要四步:

1)计算每个用户的R、F、M值;

2)根据整体分布分别对RFM打分;

3)计算RFM打分后的均值,然后判断RFM是0或是1;

4)根据结果对用户进行分层;


1、计算每个用户的R、F、M值




2、对R、F、M分别打分

注:打分的情况其实没有固定的标准来衡量是否准确,所以可以依据数据的真实情况和自己判断来进行选择~


这里使用的打分情况为:

打分
R
F
M
5
[0-30]1次
[0-200]
4
(30-60]2次
(200-500]

3

(60-90]3次
(500-1000]
2
(90-120]4次
(1000-2000]
1
120以上5次及以上
2000以上

3、计算RFM均值并判断各个值是0还是1




4、根据结果对用户进行打标签



并将其可视化:


其中:

  • 重要价值客户约2w人,约占总体客户的22%,需要对该类客户重点运营,给予他们更私人定制化的服务并及时关注他们的反馈;

  • 重要发展客户为4415人,这类客户消费频次较低,需要通过优惠券等方式刺激该类用户消费;

  • 重要保持客户为1w人以上,这类客户上次购买时间较长,可能面临流失风险,需要及时采取召回政策;

  • 重要挽留客户有8000多人,这类客户可能随时会流失,需要及时予以召回;

  • 对于一般价值、一般发展、一般保持的客户,在处理好重要客户的情况下,可以酌情去发展维系这批客户;

  • 其中一般挽留用户有26843人,这类客户是要流失的,所以在没有多余资源的情况下,就让他们走吧,反正也不会带来特别大的损失;

抽奖送可乐活动在此->如何利用数据分析买到好房子(文末送可乐),目前参加的人数还比较少,中奖几率很大哦

文章有问题?点此查看未经处理的缓存