查看原文
其他

详解用户画像的标签体系

涤生-稳哥 涤生大数据
2024-12-05


1.概述

标签体系是用户画像建设的核心点,某种意义来说,标签体系甚至决定了用户画像建设的好坏,最近很多同学在用户画像的项目学习上遇见不少问题,这些问题也是以后面试过程中最常见的问题,其中有个标签体系的问题,被反复多次问题,今天就来给大家深度讲解一下用户画像中的标签体系。

2.标签的定义

在讲标签体系之前先了解一下标签,相信对用户画像有一定了解的人都知道,建设用户画像,标签开发就是非常重要的工作,标签是根据特定的业务场景需求,对目标对象:也就是“人”,使用一定的算法得到的高度精炼的特征描述。由原始数据,经过整理、加工、分类所得一个抽象的符号代表一类人/物的特征。用来描述商品的,就是商品标签;用来描述业务的,就是业务标签;用来描述用户的,就是用户标签了。比如“男”、“女”这类特征进行抽象概括,统称为“性别”,“性别”即一个标签。

3.标签体系

一个比较成熟的用户画像系统会有成百上千的标签,这些标签的生产不是一次完成的,而是随着业务的发展需要,逐步补充完善,最终呈现在大家眼前的就是一棵庞大的标签树。

跟自然界的树木一样,标签树要想长得茁壮参天,也必须有一个稳定的根基和合理的结构。在用户画像的构建前期,最重要的是搭好画像骨架,确保后续的发展过程中,依然保持清晰的结构和高延展性。相反,如果一开始为了抢时间,将大量标签无序地堆在线上,后期管理和使用的难度会迅速凸显出来,重构的代价巨大。这个时候我们就需要一种分类的方法来划分成千上百的标签。

那么什么是标签体系呢?简单说就是你要把用户分到什么类别里面去。当然,每个用户是可以分到多个类别上的。这些类别都是啥,彼此之间有何联系,就构成了标签体系。所以说我们再给用户打标签的同时,需要有一个分类标准,这个标准就是标签体系。我们也有不同的角度来划分标签体系,以便于不同的场景中管理,比如,按用户数属性划分、按开发角度划分等。

1)按维度划分体系

此划分是企业实战用的最多的体系,标签毕竟是描述人的,从人的属性角度,相关于把一个人的业务轮廓描述出来,从建立的标签维度来看,可以将其分为用户属性、用户行为、用户消费、风险控制、社交属性等常见类型。如下图展示了具体的按维度划分的画像标签应用场景划分。

2)统计方式分类

统计方式分类的3类标签通常面向研发人员,意指标签是按何种方式计算而来,其复杂程度、产研成本由低至高。按统计方式分类的标签可分为统计类标签、规则类标签、挖掘类标签、预测类标签。

3)按时效分类

按时效分类,可分为静态标签、动态标签,方便业务人员在需求提出时做好时间维度的限制,同时方便开发人员在标签更新时,设置静态标签的更新时间更长,提升数据产出效率。

4.标签体系的设计步骤

既然知道了标签体系的划分,我们还要来构建标签体系,标签体系的设计有两个关键的要求,一是要便于检索,二是使用效果显著。当然在不同的业务场景下,对这两点的要求重点也是不同的。很多企业在构建用户标签体系时,将用户按照用户的属性打标签,例如根据学历、年龄、工作等来判断用户的消费水平,进而推测用户需要什么样的产品/服务,最后基于此为用户的标签进行个性化推荐。因此,从业务的视角出发,打造真正和业务场景相匹配的用户标签体系。当然这个也是有前提的:

有需求:必须存在明确的业务场景、有明确的业务目标,如精准推送、精准运营等

有材料:就是要有基础数据。要能采集到用户的行为数据,且用户数剧量不能太少。

有加工:企业有数据采集和加工的能力。如通过原始的日志数据,对日志数据进行得到可用的标签数据。

有了签体以后,我们就可以根据以下几个步骤进行设计:

1)梳理业务的核心流程

梳理整体的业务流程至关重要,我们能知道用户在我们产品上是什么样的生命周期以及用户怎么使用我们的产品的?尽可能地去了解用户,我们也知道在每个环节我们最关心的是什么?

2)核心目标拆解

梳理各个关键环节的核心目标。例如下载我们的app,这里的关键行为就是用户的获取,核心目标是下载成本和下载数量,也就是我们投了多少钱,获得了多少的下载量。

3)推导标签需求

上述定下来,核心指标和目标,我们通过分析关键的指标或者目标,拆解出影响因素,从而推导出对于标签需求。我们拿最常见的电商场景为例,影响用户购买的因素有用户购买能力、用户购买偏好、购买行为以及用户app行为(收藏、关注等)。基于上述所说,我们就可以做出一个针对购买的标签体系。如下图所示:

基于这种方法,最后将每个业务需要的标签汇总并明确产生方式,构建出整体的标签体系,如下图所示:

4)标签体系的应用

建立标签体系后,也就意味着我们给每个用户打上标签,这时候业务就可以使用标签了,业务根据运营的需求通过标签去选择用户,选择不同群体用户,制定不同的运营策略。

5)业务促进迭代

当然标签体系也是不断迭代的过程,以业务场景来倒推标签需求,以业务能用起来作为我们的最终目标,让标签系统价值得以实现;当然后续也会出现不同的标签需要场景的出现,我们在新的业务需求驱动下,不断的迭代自己的标签体系,让建立的标签体系可持续性地优化下去和可持续的使用下去。总之,用户标签体系的设计不是一劳永逸地做好。实际上,这是一项持续进行的、不断迭代的过程。

5.总结

现实企业用的标签体系,大多数的标签体系都是开放的,并且不存在一劳永逸的列举结果。我们最常见的电商就是一个例子,有新的商品、新的产品类别不断产生,也会有新的业务产品,同时也会有业务逐渐被淘汰,所以不断地研究和调整也就必不可少。其次,每家公司所拥有的客户群都有自己独特的特点,再加上每个公司都拥有不同的数据源,只有根据这些变动,灵活调整标签体系,才可能取得最好的效果。

涤生大数据往期精彩推荐

1.企业数仓DQC数据质量管理实践篇

2.企业数据治理实战总结--数仓面试必备

3.OneData理论案例实战—企业级数仓业务过程

4.中大厂数仓模型规范与度量指标有哪些?

5.手把手教你搭建用户画像系统(入门篇上)

6.手把手教你搭建用户画像系统(入门篇下)

7.SQL优化之诊断篇:快速定位生产性能问题实践

8.SQL之优化篇:一文搞懂如何优化线上任务性能,增效降本!

9.新能源趋势下一个简单的数仓项目,助力理解数仓模型

10.基于FlinkSQL +Hbase在O2O场景营销域实时数仓的实践

11.开发实战角度:distinct实现原理及具体优化总结

12.涤生大数据实战:基于Flink+ODPS历史累计计算项目分析与优化(一)

13.涤生大数据实战:基于Flink+ODPS历史累计计算项目分析与优化(二)

14.5分钟了解实时车联网,车联网(IoV)OLAP 解决方案是怎样的?

15.企业级Apache Kafka集群策略:Kakfa最佳实践总结

16.玩转Spark小文件合并与文件读写提交机制

17.一文详解Spark内存模型原理,面试轻松搞定

18.大厂8年老司机漫谈数仓架构

19.一文带你深入吃透Spark的窗口函数

20.大数据实战:基于Flink+ODPS进行最近N天实时标签构建

21.数仓面试高频-如何在Hive中实现拉链表

22.数仓面试还不懂什么是基线管理?

23.传说中的热点值打散之代码怎么写? 

24.列转行经典实现,细谈hive中的爆炸函数

25.玩转大厂金融风控体系建设

26.实际开发中:如何有效运用Spark Catalyst的执行流程

27.Doris企业架构选型总结:存算分离与一体化的对比与应用场景分析



继续滑动看下一个
涤生大数据
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存