查看原文
其他

做用户,绕不开画像!

The following article is from DataFunTalk Author 姚凯飞


分享嘉宾:姚凯飞 句逗科技 联合创始人

编辑整理:刘璐

出品平台:DataFunTalk


导读:做用户,绕不开画像!画像不仅可以提升对用户的认知,还可以通过落地赋能业务。今天我们聊聊用户画像在用户生命周期中的应用,主要介绍用户画像在电商场景下如何驱动产品链路优化。将按照用户生命周期,对用户进行划分并采取相应的措施;通过逆向的顺序介绍用户画像在用户的不同阶段,如何在认知定位、渠道优选、个性化服务、再触达以及营收中发挥作用。

Tips:文末戳"阅读原文"回复关键词:画像源码、画像ppt、用户画像,都可获取宝贵干货资源与资料


01
理解用户的两条路径

1. AARRR与RARRA

宏观上,AARRR模型,也称海盗模型,是业内常用的模型,能够有效推动业务发展与迭代,可以对用户各个生命周期内的行为进行干预。

微观上,根据RARRA模型,落地到用户侧,则可以从认知定位、渠道优选、个性化服务、再触达和营收这五个维度内对用户的各个阶段进行认知、分析、挖掘和干预。下面将围绕上述几点进行案例展开。

2. 触达手段

在用户来之前可以进行渠道优选与新客引流,用户来了之后可以对用户进行精准推荐、展示,用户来过走了之后可以对用户进行复购引流,在每个阶段,画像都可以发挥重要作用。

3. 打通技术与业务

为了促使用户画像在业务中有更大的效能,必须同时具备技术思维和业务思维。目前,在画像的业务应用中面临的问题是:技术人员对业务不够了解,只是单方面的了解画像的技术实现,因此对于画像应用方面会有思维局限;而业务人员有强烈的业务提升需求但是不清楚画像在业务中能发挥何种作用,因此同样思维受限。所以,要充分发挥画像的业务效能就必须打通业务和技术。下面我们分别按阶段展开,进行应用的介绍。

02
来过走了

1. 走了以后:找漏洞,花钱测试买数据

逆向观察RARRA模型,从用户"走了以后"出发,对全链路业务进行复盘,分析目前的产品是否存在问题,并对问题进行定位和优化。根据问题在细粒度的划分之后,再针对不同用户开展不同工作,如高价值客户寻找、自定义客户放大 ( 用户look-like相关的工作 )、针对不同客户群体采取不同营销和消费激活策略、根据客户群体分发优惠券、激活休眠客户和挽留流失客户。对于已经走了的用户,一部分还会回来,还有一部分不会回来,对于这一部分不会回来的用户,可以充分使用他们所留下的数据,帮助我们未来的业务发展给予指导作用;比如后续的召回操作无法挽回的用户,对其在站内的行为与被召回或未流失用户进行比对,可能可以洞察他们消费的内容是否符合其需求 ( 可以与搜索行为结合一起来看 ) 等。

2. 维度与拆分

刚刚说到,要对用户群进行拆分,可以从多种不同维度出发,例如对现状的统计,有PV、UV、GMV、回访、留存等,对趋势的统计如环比、同比、流动趋势等。具体的如何对用户进行拆分,要从业务出发,做到逻辑自洽,业务可解释,比如根据性别、年龄段、设备平台对用户进行拆分,这就涉及了粒度问题,比如年龄段是将15~25岁还是将15~30岁划分为一个区间,安卓或iOS版本号如何划分区间。

以一个例子说明如何实现逻辑自洽:对于推荐系统中用户冷启动问题,我们会分析不同用户群在冷启动过程中,如男性与女性用户或者iOS与安卓用户,偏好的商品类目或者购买的商品类目是否有大的不同。比如我们在业务中发现男性和女性存在不同,喜欢用订单或者转化率来定义,则统计之后发现男性和女性最喜欢的1000个商品中有60%是不同的,换言之,性别粒度的划分对于当前的统计维度有明显的区分度,因此使用性别标签是在实际业务中是具有可解释性的。粒度的划分同样可以采取此类的思路来进行决策。除了性别、平台,还可以使用机型、地域、新老用户标签、活跃度 ( 用户活跃的天数 ) 等维度进行拆分。对用户进行划分后可以继续就具体问题进行分析。

3. 画像在投放业务中的应用

以一个投放业务中的例子说明。有两个系列,一个是前一个月,一个是近30天的,统计投放的数据可以发现扩量之后留存变差,用户流失变得明显。根据上文提出的思路,我们选择按照平台和年龄对用户进行划分,划分之后,在系列1、系列2比较中可以发现Android的用户占比下降,iOS用户占比上升,且20~30岁之间的用户占比变高,我们猜测20~30岁的用户/iOS用户本身自然的留存情况会更好,这部分用户占比的下降会带来整体留存的下降。用户流失的主要原因是用户体验不够好,用户的需求没有得到满足。针对这一猜想,进一步分析用户的意图。我们在搜索场景下对用户意图进行分析,比如分析不同用户群体Query匹配结果量的环比数据,统计搜索无结果出现的次数,分析不同全体对搜索词的偏好,群体间的差异,以及搜索词下行为的次数。分析之后发现两个现象:一是在用户留存率低的这部分用户中搜索无结果的量增加了,二是出现了一些奇怪的Query如BTS,这类词匹配不到搜索结果。进一步在推荐场景线下排查用户行为情况,统计之后我们发现用户在推荐结果的类目展现维度上与大盘接近,说明用户的偏好改变,但是在主动意图场景和非主动意图场景下的用户需求都没有得到满足。依据观察到的现象,我们进行了一个实验,针对低流存用户的意图或者偏好进行了专门的补货,比如针对BTS ( 防弹少年团组合 ) 进行了周边产品的补货以及聚合触达,之后用户的转化率有明显提升,说明当用户找到需要的商品时,所能达到的转化率比大盘要高。

4. Query主动意图

分析Query场景是分析用户意图的有效方法。在业务方面,通过统计Query场景下的流量和业务趋势,可以发现用户对于明星、品牌、品类的偏好,流量的集中程度可以有效的反映出用户的偏好程度。同时用户流量的集中程度可以驱动我们去发现供给端是否有问题,例如热搜内容无结果就属于供给端出现问题。在用户需求上,可以进行环比的比较,如每周搜索量环比比较,例如连衣裙在搜索量环比增长明显,那么可以进一步进行某些梳理,判断潜力品类在推荐等场景下进行潜力产品推送。对于平台商家、商品,结合用户画像标签,可以根据用户搜索词分析平台内商家、商品的影响力,对商家进行划分,找出比如特色商家、优质商家、黑产商家等,进一步去分析平台是否将优质的流量分配给了优质的商家。

5. 画像在渠道优选中的应用

在渠道优选中画像可以用于解决引流问题和商品定位问题。进入站内的用户都可以称为大盘用户,其中有购买行为的用户称之为成交用户,成交量达到一定量级、留存高的用户称之为高价值用户。以性别来对3类用户进行划分,可以发现从下到上三类用户中女性占比越来越高,对于平台收益而言最重要的是高价值用户,那么在用户引流过程中我们期望结合用户划分分析结果能引流到更多的高价值用户,如果当前的高价值用户中女性占比更高,那么在引流时,优先考虑女性用户更多的渠道进行投放。同时可以进一步分析商品定位是否有问题,如男性用户比例降低是否是由于男性用户被男性商品吸引进入平台,但在平台内男性商品占比很少或者是价格段不理想,结合画像标签可以对站内商品定位问题进行进一步的分析。

03
没来之前

根据已有用户的数据,去指导对于新用户的策略制定。

结合已有的画像标签数据结果,和运营、投放或市场专家一起可以进行渠道或者标签的优选,例如对比Google和Facebook两个不同渠道的投放效果,或对比Google和Facebook的各自男性标签的投放效果,根据对比结果选择更优渠道。通常情况下,一个渠道的用户群体不可能全部优于另一渠道,不同渠道往往在不同的用户群上各有优势。数据分析的结果可以给投放师一定的指导,目前的AI在应用中会面临各种对接,如API对接等问题,实际的体验不够好,但是AI在规模化上具有明显优势,作者认为AI+运营+市场专家能够达到更好的效果。一方面可以根据站内高互动率内容标签、竞品、热卖商品、以及站内热搜等去洞察用户的需求,进而驱动平台对于品类规划的优化。另一方面可以在投放前优化用户群体以及对应商品的圈选,根据渠道内用户需求针对性的进行投放,而非海量投放。

04
来了之后

1. 做好服务与用户洞察

用户来了之后,需要快速反馈,不能只对已有用户群体做文章,当扩展到某一个新的用户群体,必然会有第一个用户,第二个用户,算法无法根据少量用户给出结论,但是当用户达到1万,100万时需要快速的反馈出用户体验不好或用户流失的原因。

新用户来了之后,需要做好服务和用户洞察。新用户面临着推荐中的冷启动问题,首先要帮助新用户做好定位,选择有区分度的标签对新用户进行划分,区分度可以用不同群体偏好的交集来衡量,如男性女性最喜欢的1000个商品的交集,然后根据划分的用户群给新用户推荐该用户群体最喜欢的商品,再根据用户实时行为获知用户的意图,对推荐结果进行调整。用户进入平台后,有过搜索行为的用户可以分为两类,一类是强意图用户 ( 用户搜索词是某一个品牌具体的型号,具有明确的属性信息,如iPhone 11 256G黑色 ),一类是弱意图用户 ( 搜索词比较简单,如裙子 ),强意图用户进入站内后同类目商品的点击比例衰减明显慢于弱意图用户,弱意图用户则接近大盘用户。根据这一标签可以去干预用户推荐结果,更好的做好用户服务,使用户体验更好。

2. 做好内容区隔

做好新用户服务的同时,要保证老用户的体验不会变差。在内容平台的推荐场景下中,这类问题变得尤为明显。在产品覆盖用户非常大的情况下,平台必然会出现兴趣偏好差异非常大的群体,针对不同群体,要考量其不同需求,在内容上做好区隔。

05
复盘

刚刚介绍了用户画像在用户没来之前、来了之后、来过走了各个阶段的作用,进一步来对整个流程进行复盘。

1. 花钱买数据高效测试,圈层外扩

引流的用户中总是存在低留存的用户,原因可能有多种:供给侧没有满足用户需求的商品,推荐没有展现给用户他所需要的商品,没有做好内容区隔等。使用这部分用户在站内的行为数据,如搜索数据,比如对二次元商品感兴趣的用户中同时具有搜索行为的用户比不具有搜索行为的用户的留存率是否更高,根据具体的点来对推荐进行迭代。根据分析得到的结果,可以对这些低留存用户进行二次冷启动。

2. 全局优化/多目标问题/1+1>2

从全局优化来讲,构建人群画像体系可以获知群体的需求,进而优化供需之间的匹配;进一步可以在个性化层面进行优化,实现流量分发以及利润最大化,更优的个性化也会带来用户体验的最大化;用户画像可以自动化/智能化的实现物料投放和供需匹配结果;结合用户画像可以优先去拓展与大盘群体相似的群体,能更好的实现规模化,这里补充一点:电商场景下用户具有长尾效应,但是平台更希望流量具有一定的集中度,以便更好的优化成本。

3. 闭环&飞轮

使用闭环和飞轮的思想更好的迭代用户画像和整个系统。首先是以技术赋能解决冷启动,分析其他平台上热销的商品,结合市场运营的指导来做初步的投放,根据初步的投放效果分析用户的偏好用于指导站内的需求预测,使得预测更精准,有了初步的流量之后就可以不断的进行迭代。

06
总结

根据以上内容可以总结出几个点:

  • 拆着看:根据不同标签对用户进行拆分,拆分结果可以进一步结合行为数据进行分析;

  • 不要只看均值:拆分之后还要进一步分析同一群体内的方差,分析该群体内是否仍存在较大差异,如果存在明显差异,还需要继续拆分;

  • 用户和商品联动:分析结果要将用户和商品联动,关注供给侧是否满足了用户的需求,推荐展示是否满足了用户的需求,根据用户画像驱动供给侧、前端的优化;

  • 结合业务场景去分析:不同场景对于分析维度、用户画像标签的需求不同,要保证逻辑自洽与业务可解释;

  • 不要简单看画像,一定要做对比:单纯看分布是没有太多信息含量的,要结合具体问题进行对比,找出差异;

  • 环比的对比:漏斗的每个环节都需要进行环比分析;

  • 数据闭环:一定要形成数据闭环,驱动整个链路的优化。

今天的分享就到这里,谢谢大家。


在文末分享、点赞、在看,给个3连击呗~


嘉宾介绍:

姚凯飞

句逗科技 | 联合创始人

姚凯飞,句逗科技联合创始人。前 Club Factory 推荐&风控算法负责人,前阿里推荐算法工程师,硕士毕业于上海交通大学,毕业至今一直从事推荐、搜索、风控、画像相关的算法工作。

文章推荐:

浅谈 Apache Kylin 与 ClickHouse 的对比

2020-11-27

数据治理:90%的人搞不清的事情

2020-11-26

从美团外卖的数据仓库建设中,我学到了什么?

2020-11-25

你为什么从java开发转大数据?大数据方向能走的更远吗?

2020-11-23

数据治理:基于数据架构和数据模型

2020-11-22

ClickHouse安装部署与SQL实战

2020-11-21

社群推荐:

更多精彩,请加v:iom1128,备注:数仓|大数据,两大好处:1.可以入群 2.宝藏朋友圈
▼ 福利时刻 ▼ 


01. 扫码后台回复「经典」,即可领取大数据数仓经典书籍。

02. 扫码后台回复「中台」,即可领取大厂中台架构高清ppt。

03.扫码后台回复关键词:画像源码、画像ppt、用户画像,都可获取宝贵干货资源与资料


Q: 关于数据仓库,你还想了解什么?

更多精彩,请戳"阅读原文"到"数仓之路"查看

  

关注不迷路~ 各种福利、资源定期分享


你也「在看」吗?👇

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存