Python数据分析与数据化运营:会员数据化运营2-应用场景与分析模型
本文来自《Python数据分析与数据化运营》配套书籍第5章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 50个数据工作流知识点,14个数据分析和挖掘主题,8个综合性运营案例。涵盖了会员、商品、流量、内容4大数据化运营主题,360°把脉运营问题并贴合数据场景落地。
课程学习链接:网站数据分析场景和方法——效果预测、结论定义、数据探究和业务执行https://edu.hellobi.com/course/221
前文传送门:
Python数据分析与数据化运营:会员数据化运营1-概述与关键指标
5.3 会员数据化运营应用场景
会员数据化运营主要应用于会员营销和会员关怀两方面。
5.3.1 会员营销
数据化运营应用于会员营销主要体现在以下几个方面:
以信息化的方式建立基于会员的客户关系管理系统,促进所有会员数据的信息化
通过特定方法将普通用户拓展企业会员,并提高新会员留存率
基于用户历史消费记录,挖掘出用户潜在消费需求及消费热点
基于历史数据,为会员营销活动提供策略指导和建议,促进精准营销活动的开展
从会员营销结果中寻找异常订单或转化,作为黄牛或VIP客户识别的参考
挖掘会员传播关系,找到口碑传播效应的关键节点
5.3.2 会员关怀
数据化运营应用于会员关怀主要体现在以下几个方面:
为预警事件设置阀值,自动触发应急处理机制
分析会员行为,为会员提供个性化、精准化和差异化服务
通过会员喜好分析,提高客户忠诚度、活跃度和粘性
通过会员分析,预防会员流失并找到挽回已经流失会员的方法
基于会员群体行为,更好的划分会员群体属性并挖掘群体性特征
基于群体用户和内容相似度,发现有价值的会员互动方式
基于会员生命周期的关怀管理,促进用户终生价值最大化
5.4 会员数据化运营分析模型
在会员数据化运营分析模型中,将主要介绍会员细分模型、会员价值度模型、会员活跃度模型、会员流失预测模型、会员特征分析模型和营销响应预测模型。
5.4.1 会员细分模型
会员细分模型是将整体会员划分为不同的细分群体或类别,然后基于细分群体做管理、营销和关怀。会员细分模型常用于在整体会员的宏观性分析以及探索性分析,通过细分建立初步认知为下一步的分析和应用提供基本认知;会员细分也是做精准营销的基本前提。
常用的细分模型包括:基于属性的方法、ABC分类法、聚类法等。
基于属性的方法
会员细分可以基于现有会员属性,常用的细分属性包括:会员地域(例如北京、上海、武汉等)、产品类别(例如大家电、3C数码、图书等)、会员类别(例如大客户、普通客户、VIP客户等)、会员性别(例如男、女、未知)、会员消费等级(例如高价值会员、中价值会员、低价值会员)、会员等级(例如钻石、黄金、白银)等。这种细分方法可以直接利用现有会员数据库数据,无需做二次开发和计算,是一种比较简单且粗犷的方法。
ABC分类法
ABC分类法(Activity Based Classification)是根据事物的主要特征做分类排列,从而实现区别对待、区别管理的一种方法。ABC法则是帕累托二八法则衍生出来的一种法则。不同的是,二八法则强调的是抓住关键,ABC法则强调的是分清主次,并将管理对象划分为A、B、C三类。
在ABC分析法中先将目标数据列倒叙排序,然后做累积百分比统计,最后将得到的累积百分比按照下面的比例值划分为A、B、C三类:
A类因素,发生累计频率为0%~80%,是主要影响因素。
B类因素,发生累计频率为80%~90%,是次要影响因素。
C类因素,发生累计频率为90%~100%,是一般影响因素。
下面以示例数据说明如何使用ABC分类法对会员做细分。
步骤1 先建立一个二维表格数据,数据中包括会员ID和订单金额(或其他关键指标)两列。
步骤2 二维表格数据按照订单金额做倒叙排序。
步骤3 对订单金额列做累积百分比统计。
步骤4 按照A、B、C划分标准将会员划分为不同的分类,得到如表5-3所示数据。
聚类法
使用聚类法做会员分群是常用的非监督式方法,该方法无需任何先验经验,只需要指定要划分的群体数量即可。有关聚类分析的具体操作方法,请查看“4.1.6 代码实操:Python聚类分析”。
5.4.3 会员价值度模型
会员价值度用来评估用户的价值情况,是区分会员价值的重要模型和参考依据,也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生,衡量的是有实体转化价值的行为。常用的价值度模型是RFM。
RFM模型是根据会员最近一次购买时间R(Recency)、购买频率F(Frequency)、购买金额M(Monetary)计算得出RFM得分,通过这三个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分。该模型常用于电子商务(即交易类)企业的会员分析。
RFM模型基于一个固定时间点来做模型分析,因此今天做的RFM得分跟7天前做的结果可能不一样,原因是每个客户在不同的时间节点所得到的数据不同。以下是RFM模型的基本实现过程:
步骤1设置要做计算时的截止时间节点(例如2017-5-30),用来做基于该时间的数据选取和计算。
步骤2 在会员数据库中,以今天为时间界限向前推固定周期(例如1年),得到包含每个会员的会员ID、订单时间、订单金额的原始数据集,一个会员可能会产生多条订单记录。
步骤3 数据预计算。从订单时间中找到各个会员距离截止时间节点最近的订单时间作为最近购买时间;以会员ID为维度统计每个用户的订单数量作为购买频率,将用户多个订单的订单金额求和得到总订单金额。由此得到R、F、M三个原始数据量。
步骤4 R、F、M分区。对于F和M变量来讲,值越大代表购买频率越高、订单金额越高;但对R来讲值越小代表离截止时间节点越近,因此值越好。对R、F、M分别使用五分位(三分位也可以,分位数越多划分的越详细)法做数据分区,需要注意的是,对于R来讲需要倒过来划分,离截止时间越近的值划分越大。这样就得到每个用户的R、F、M三个变量的分位数值。
步骤5 将三个值组合或相加得到总的RFM得分。对于RFM总得分的计算有两种方式,一种是直接将三个值拼接到一起,例如RFM得分为312、333、132;一种是直接将三个值相加求得一个新的汇总值,例如RFM得分为6、9、6。
在得到不同会员的RFM的之后,根据步骤5产生的两种结果有不用的应用思路:
思路1:基于三个维度值做用户群体划分和解读,对用户的价值度做分析。例如得分为212的会员往往购买频率较低,针对购买频率低的客户定期发送促销活动邮件;针对得分为321的会员虽然购买频率高但是订单金额低等,这些客户往往具有较高的购买粘性,可以考虑通过关联或搭配销售的方式提升订单金额。
思路2:基于RFM的汇总得分评估所有会员的价值度价值,并可以做价值度排名;同时,该得分还可以作为输入维度跟其他维度一起作为其他数据分析和挖掘模型的输入变量,为分析建模提供基础。
提示 上述示例中模型的三个维度权重是相同的,可以根据不同企业的需求为RFM设置不同权重值,然后通过加权的形式得到符合运营需求的得分。
5.4.2 会员活跃度模型
会员活跃度用来评估用户的活跃度情况,是会员状态分析的基本模型之一。在“5.2.3 会员活跃度指标”中的整体活跃度指标中介绍了一种基于加权统计的方法,在此再介绍另一种活跃度模型——RFE模型。
RFE模型基于用户的普通行为(非转化或交易行为)产生,它跟RFM类似都是使用三个维度做价值评估。RFE模型是根据会员最近一次访问时间R(Recency)、访问频率F(Frequency)和页面互动度E(Engagements)计算得出的RFE得分。其中:
最近一次访问时间R(Recency):会员最近一次访问或到达网站的时间
访问频率F(Frequency):用户在特定时间周期内访问或到达的频率
页面互动度E(Engagements):互动度的定义可以根据不同企业的交互情况而定,例如可以定义为页面浏览量、下载量、视频播放数量等。
在RFE模型中,由于不要求用户发生交易,因此可以做未发生登录、注册等匿名用户的行为价值分析,也可以做实名用户分析。该模型常用来做用户活跃分群或价值区分,可用于内容型(例如论坛、新闻、资讯等)企业的会员分析。
RFM和RFE模型的实现思路相同,仅仅是计算指标发生变化。对于RFE的数据来源,可以从企业自己监控的用户行为日志获取,也可以从第三方网站分析工具获得。
在得到用户的RFE得分之后,跟RFM类似也可以有两种应用思路:
思路1:基于三个维度值做用户群体划分和解读,对用户的活跃度度做分析。RFE得分为313的会员说明其访问频率低,但是每次访问时的交互都非常不错,此时重点要做用户回访频率的提升,例如通过活动邀请、精准广告投放、会员活动推荐等提升回访频率。
思路2:基于RFE的汇总得分评估所有会员的活跃度价值,并可以做活跃度排名;同时,该得分还可以作为输入维度跟其他维度一起作为其他数据分析和挖掘模型的输入变量,为分析建模提供基础。
注意 无论是RFM和RFE都不要忽略不同的消费频率、品类和周期对于结果的影响性。例如大家电的更换周期可能是2年、手机的更换频率是1年、日用消费品的周期却是7天,由于不同品类的差异性很大,最终得到的得分结果没有必然的可比性,例如偏向于购买大家电品类的RFM得分为113属于“正常现象”,因为大家电的购买属性决定了这就是一个长周期、低频、大金额的行为。
5.4.4 会员流失预测模型
会员流失预测模型用来预测会员是否流失,是做会员生命周期管理的重要预防性应用。做会员流失模型的关键因素之一是要定义好“流失”,即处于何种状态、具备哪些特征的会员属于流失会员;另外,流失也可能区分是永久性流失还是临时性流失。常见的属于流失的状态定义示例:
会员已经退订公司的促销活动
会员打电话要求将自己的信息加入通知黑名单
会员已经连续6个月没有登录过网站
针对会员发送的关怀激励活动中没有任何有效反馈和互动
会员最近1年内没有任何订单
上述流失状态可以归为两类:一类是会员有明确的表达,不再希望接收到公司的相关信息;一类是会员没有明确的表示,但是在业务关注的主要领域内,没有得到有效反馈。
会员流失预测模型的实现方法属于分类算法,常用算法包括逻辑回归、支持向量机、随机森林等,有关这些算法的具体选择问题,请参照“4.3.5 如何选择分类分析算法”。
在做会员流失预警模型时,需要注意以下几个问题:
流失会员的样本分类一定是少数类,需要注意处理样本不均衡问题。
对于流失会员的预测结果,得到概率性的输出可以结合流失预测标签一起应用,因为业务方可以基于概率再结合业务经验做判断。
对于参与训练模型的维度变量的选择,一定要结合业务经验,因为业务方对于特定场景的判断是影响训练模型和应用结果的关键因素之一。
输入的维度变量中一定要包含发生转化前的行为数据,假如业务定义为最近6个月没有订单的客户为流失客户,那么在做预测模型时需要将用户的匿名访问、登录、页面浏览、搜索、活动咨询等转化前的数据考虑在内,而不能只考虑订单转化本身。
会员流失预警模型不是一次性的,而是周期性监视和运行的,例如每天、每周或至少是每月。
通过会员流失模型得到每个会员是否属于流失标签后,可以将该结果给到会员运营人员,运营人员一般会根据业务经验做二次审查和确认,然后再通过会员挽回、激励等机制提升会员的忠诚度,延缓或防止会员流失。而关于如何挽回以及激励的问题,通常也是需要数据参与来帮助运营人员制定相应的策略,例如在合适的时间、以恰当的方式提供个性化的内容给特定会员,这些都需要数据的支持。
5.4.5 会员特征分析模型
会员特征分析模型是针对现有会员做特征分析。会员特征分析模型提供的结果可能是模糊的,也可能是明确的。例如:
明确的特征,它提供了业务所要行动的细节要素,是一种具有极高落地价值的数据分析工作。
模糊的特征,它指数据分析结果未提供详细的动作因素,仅指明了下一步行动方向或目标。
会员特征分析主要应用于以下两种业务场景。
第一种是在没有任何前期经验或特定目标下触发,希望通过整体特征分析了解会员全貌。在这种模式下,可以通过一定方法先将用户划分为几个类别,然后再做基于类别的特征分析,常用实现方法和应用包括:
聚类:通过聚类将用户划分为几个群组,然后再分析不同群组的典型特征和群组间的差异性。例如:公司的总体会员具有哪些特征?模型结果:通过聚类方法将会员划分为3类,然后每个类别都有各自显著性特征,会员部门可根据不同类别做特定分析并指定群体性策略。
统计分析:先将整体用户做统计分析,包括描述性统计、频数分布等,了解整体数据概括。
第二种是有明确的业务方向,希望找到能达到事件目标的会员特征,用于做进一步的会员运营。对于这类分析模型,常用的实现方法和应用包括:
分类:利用分类规则例如决策树找到符合目标的关键变量以及对应的变量值,进而确定会员特征。例如:收入>5400元,最近购买时间是5个月之前,总订单金额在4300元以下的会员最可能购买商品。
关联:使用关联规则找到不同属性、项目间的关联发生或序列发生关系,然后将会员的属性特征(频繁项集)提供给运营。例如:购买X商品的客户一般是来自于上海、购物频率为1周3次、客单价为100元以下。
异常检测:使用非监督式的异常检测方法,从一堆数据中找到异常数据样本,然后将这些数据样本特征提供给运营做进一步确认和审查。例如:异常客户的特征往往是每次订单的商品数量超过4件、地域集中在江苏和浙江、一般拥有超过3个以上的子账户。
会员特征分析模型输出的上述两类结果,第一类结果往往作为辅助于、启发性和提示性结果,用于为运营提供进一步业务动作的思考,这种一般开始于数据工作项目的开始或业务方对数据主题的先验经验不足的情况下;第二类结果则可以作为运营下一步动作的直接“触点”。
5.4.6 营销响应预测模型
营销响应预测模型是针对营销活动展开的,通常在做会员营销活动之前,通过营销响应预测模型分析找到可能响应活动的会员特征以及整体响应的用户比例、数量和可能带来的销售额。这在会员营销之前的有关策略制定的辅助价值非常明显。
营销响应预测模型的实施采用的一般是分类算法,常见算法包括,常用算法包括逻辑回归、支持向量机、随机森林等,有关这些算法的具体选择问题,请参照“4.3.5 如何选择分类分析算法”。
在做营销响应模型之前,需要先收集训练所需的数据集。
步骤1 从所有会员上随机选择一定量的会员样本,具体数量要根据企业实际情况而定,一般情况下,至少要有1000条数据以上(同时要兼顾总体会员数量)才能满足模型训练的需要。
步骤2 然后针对选择的会员样本通过一定媒介和渠道发送营销活动信息,例如手机短信、电子邮件等。需要注意的是,一定要记录好营销活动发送的时间、频率、信息等关键运营要素,这些需要跟后期的实施保持一致。
步骤3 收集营销活动数据。在收集数据时需要注意数据收集的周期,通常情况下,一般电子邮件的有效周期为1~7天左右,时间过短可能无法被用户看到;手机短信的有效期一般是1天左右,时间太长用户一般会忽略。
经过上述步骤收集到分类所需的样本集之后,接着就需要通过分类模型做营销响应预测,这是典型的二分类问题。在做营销响应模型训练时,也需要注意在“5.4.4 会员流失预测模型”提到的问题,二者在很多方面都有共通性。
通过营销响应预测模型得到的结果一般包括两个方向:
一是:基于模型找到最可能产生购买转化行为的会员规则特征。例如最近一次购买时间在3个月以内、会员等级为3级以上、总订单金额大于3000、订单量大于10的客户。通过这些条件直接从数据库中筛选对应的会员列表,并可以对该会员列表发送营销活动。
二是:基于模型预测可能产生的订单转化数量、转化率(例如选择10000个客户,会有4000个客户产生转化),以及有转化客户的客单价(通过训练样本集选择有转化客户,然后用订单金额/会员量计算得到)大体计算出此次发送会员能得到的营销收入。这些信息可以作为此次营销活动计划提报的数据量化指标和资源申请的数据支持。
作者好书推荐:《Python数据分析与数据化运营》,小编看过,觉得很不错,难得的技术+业务的好书!
点击阅读原文,立即购买宋天龙老师《Python数据分析与数据化运营》秘籍。
Python爱好者社区历史文章大合集:
Python爱好者社区历史文章列表(每周append更新一次)
关注后在公众号内回复“课程”即可获取:
小编的Python入门视频课程!!!
崔老师爬虫实战案例免费学习视频。
丘老师数据科学入门指导免费学习视频。
陈老师数据分析报告制作免费学习视频。
玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。
丘老师Python网络爬虫实战免费学习视频。
点击阅读原文,立即购买宋天龙老师《Python数据分析与数据化运营》秘籍