其他
字节用户画像标签分析及业务场景应用
导读 随着企业数字化转型的深入发展,对用户深层理解的渴望日益迫切。在此背景下,本次分享精心剖析了用户画像标签的精髓及其在多变业务场景中的关键作用。从基础属性标签到策略上的标签,不仅系统性地介绍了各类型标签的构建与应用,还着重强调了在快节奏的数字化时代中,如何通过高效的异常值处理、时间衰减考量及数据区分度提升等手段,确保标签的准确性和实用性。并且深入讨论了如何长期评估和追踪用户画像的内聚性和稳定性,为数据产品经理提供了一把锐利的工具,助力其在激烈的市场竞争中准确把握用户需求,不断提升产品和策略的效能。
下面的介绍分为三个部分:1. 画像标签介绍
2. 画像特征的处理与标签的评估
3. Q&A
分享嘉宾|吴梓华 字节跳动 数据科学
编辑整理|胡回
内容校对|李瑶
出品社区|DataFun
1. 基础属性画像标签
用户填写:注册时提供的个人信息。 埋点采集:在 APP 上设置埋点收集用户数据。 模型预测:对缺失或采集不到的数据使用模型进行预测和补充。 第三方数据源获取:购买或获取第三方数据源,或是大公司如腾讯、阿里等通过集团内部其他部门获取信息。
日常分析:用于大致了解用户的属性分布,以及新场景分析、业务发展、异动归因下钻等场景,例如通过标签分析点击率下滑原因,确定是否存在超预期的降幅。 建模用:作为复杂画像的输入特征,用于提高业务操作的精确度。例如搜索排序、用户行为预测等场景。
2. 业务向画像标签
KPI 强关联(以 MAU 为 KPI 时):高活/低活用户(基于活跃天数),直接反映了用户与 KPI 的关系,如月活跃用户数、首次月活用户、流失用户、沉默用户等。 KPI 弱关联:高中低活跃用户、场景活跃偏好用户(TGI),通过复杂的计算和用户行为的综合评估得出,提供更细致的用户分类。
基于 KPI 按照距离目标远近定义用户:直接根据 KPI 的具体要求对用户进行分类。 基于用户行为进行复合计算:综合考虑用户在平台上的多种行为进行用户分类。
了解运营目标进度:利用画像标签进行深入分析,了解符合条件的用户数量和接近 KPI 目标的用户。以及通过标签下钻进行 KPI 的预估,并找到实现路径的拆解,帮助预测达成 KPI 的可能性,特别是对难以运营的用户群体进行更深入的分析。 锚定主要的目标人群,便于整体的差异化策略:利用不同的用户群体标签(如高活、中活、低活用户或具有不同购买力的用户)实施差异化运营策略。根据用户特征在搜索结果中展示不同价格的商品,或根据用户活跃偏好将他们引导至不同的场景。
3. 策略向人群
增益人群:红包敏感的人群,发放红包后 ARPPU 值提升高。
与权益干预相关的标签,可以帮助我们识别那些在接受红包或全域干预后会显示出显著提升的用户群体。通过 AUUC 图的分析,可以预测特定用户群体干预前后的增量以及预期的投资回报率(ROI)。这种预测性的分析可以为策略决策提供坚实的数据支持。
复购人群:在特定类目、特定购买间隔下有高复购倾向的用户。
未来预测人群:通过模型预测用户未来的行为/流失概率。
画像特征的处理与标签的评估
异常值检测 这一步骤的重要性常被忽略,但其对提升标签准确性至关重要。检测方法已比较成熟,通常使用箱形图和 AVF,前者主要用于数值型特征,后者主要用于类别型数据。 异常值填充 检测得到的异常值处理方式,一种是丢弃包含异常值的记录,另一种是使用 cap 分位点或 floor 分位点的值替代异常值(例如,用 97% 分位数代替异常大值)。 空值填充 根据指标的定义选择最大值或最小值填充(如 Recency 类指标选择最大值,Frequency 类选择最小值)。
Recency(近度):用户最近一次登录距今天数 Frequency(频率):用户最近 90 天登录天数 Monetary(消费金额,这里引申为强度):用户最近 90 天 APP 内停留时长
目标:确保同一分层的用户相互间比较相似,而不同分层的用户存在较大的差异,实现高内聚、低耦合的聚类结果。 衡量指标:轮廓系数(Silhouette Coefficient),这个指标能同时衡量类内聚合度和类间分离度。指标越大,表明分层结果越好。 计算方法:对于每一个样本,计算其轮廓系数,然后对所有样本求均值以评估总体的分层结果。这是一个相对指标,适合用于比较两种分层结果的优劣,而不是单一分层的质量绝对评估。
稳定的定义包括两个方面: 分层标准的稳定性:在引入新数据或用户群体增加后,分层标准保持不变,表明分层标准的稳定性。 分层结果的稳定性:不同分层的用户表现应该是稳定的,例如,活跃用户的次留率不存在过大的波动,表明分层结果的稳定性。 稳定性衡量指标:离散系数(Coefficient of Variation),即样本的标准差除以均值。离散系数的值越大,代表波动越大、稳定性越低。
Q&A
分享嘉宾
INTRODUCTION
吴梓华
字节跳动
数据科学
毕业于浙江大学,曾就职于货拉拉、阿里巴巴,从事用户增长、流量策略方向的工作。
活动推荐
往期推荐
点个在看你最好看