查看原文
其他

如何校验用户画像的准确性?

2017-08-02 Lin数君 联璧大数据

Hi!话题

用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。


Go!探讨

用户画像开发中

交叉验证

用户画像上线后

用户画像更新

在用户研究的课题中,用户画像是几乎每个公司都会去做的,浅层的包括统计类的:上月购买量,上周活跃天数等;深层的包括洞察类的:潜在需求偏好,生命周期阶段等;前者的校验简单,后者的校验需要通过一些特别的方式。本文就洞察类画像校验做一系列的梳理。

省略掉预处理设计的过程,画像校验的步骤主要集中在画像开发,画像上线,画像更新中,并且三个阶段中,每个阶段的校验方式不尽相同。

用户画像开发中

当我们所开发的用户画像是类似于用户的下单需求、用户的购车意愿、用户是否有注册意愿这一类存在历史的正负样本的有监督的问题,我们可以利用历史确定的数据来校验我们的画像准确性。比如,银行在设计用户征信的画像前,会有一批外部购买的坏样本和好样本,其实画像问题就转化为分类问题去解决评估了。

Recall、Pecision、K-S、F1曲线、Roc曲线、Confusion Matrix、AUC

针对这类问题,已经有较为成熟的理论基础,直接利用测试样本判断的准确程度判断画像是否准确。

这张图是一张非常常见也是有效的来总结Recall、Pecision、Lift曲线、Roc曲线、Confusion Matrix的图。

FPR = FP/(FP + TN)

Recall=TPR=TP/(TP+FN)

Precision=TP/(TP+FP)

F1曲线:

2*Precision*Recall/(Precision+Recall)

Roc曲线:

TPR vs FPR,也就是Precision vs Recall

Auc:area under the roc curve ,也就是roc曲线下面的面积,积分或者投点法均可求解。

交叉验证

并不是所有画像都是有监督训练的画像,举个例子,用户的性别画像,是一个无监督的刻画,当你无法通过app端资料填写直接获取到的时候,你只能够通过其他数据特征的对用户进行分群。

首先,我们在总的数据集中筛选出所有关键影响特征,每次将筛选出的特征分为两块,测试特征训练特征,利用训练特征建立模型,再利用测试特征去判断模型是否合理(比如女鞋用户群的女鞋购买次数小于男性用户群,则次模型异常,删除),最后集成所有合理模型。

这样的逻辑中,我们将所有异常不合理的模型全部剔除,训练过程中就校验了用户画像的准确性。

用户画像上线后

1. ABTest

不得不说,abtest是用户画像校验最为直观有效的校验方式。

用户分流模块:

一句话解释,就是A1=A2保证分配随机,A3好于A1+A2的效果检验画像是否准确?多准确?

用户画像更新

用户回访

在画像刻画完成后,必然会存在画像优化迭代的过程,客服回访是非常常见且有效的方式。

比如,我们定义了一波潜在流失用户10万人,随机抽取1000人,进行回访,根据回访结果做文本挖掘,提取关键词,看消极词用户的占比;

机制检测

再比如,我们定义了一波忠诚用户10万人,随机抽取100人,后台随机获取用户安装app的列表,看用户同类app的下载量数目的分布;

横轴为用户手机中同类竞品安装量的个数,纵轴为对应的随机抽样的100人中的个数。

  • 人群1分布为忠诚用户画像最准确的,同类app下载量集中在1附近,定义的用户极为准确

  • 人群2分布杂乱

  • 人群3分布在下降量异常高的数值附近,定义人群不准确

DinG!结语

用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。

联璧大数据,作为联璧科技的一级市场分析大脑,在各商业场景中提供专业的分布式各类数据挖掘场景化的算法调优,全方位覆盖各行的应用需求。针对大客户群提供量化定制化的行业解决方案及多维度的分析,深度满足不同行业的客户在不同场景下的商业需求,快速帮助企业实现以“数据驱动增长”的愿景。

Hey!推荐

Hello!热门

[1]数据如何驱动网站页面设计和优化

[2]T级数据量下的划分聚类方法CLARANS+

[3]如何走出大数据的“大”的误区?

[4]什么是变量? | 数据百科 #006

[5]线下数据难道只能用在热力图么?

[6]从5大行业看大数据场景应用当前进展

[7]什么是标准误差?| 数据百科 #008

[8]互联网洪荒之力背后的那些事儿

[9]星巴克花13亿美元收购江浙沪,都是大数据的功劳

❖ 欢 迎 分 享 到 朋 友 圈 哦 ❖

编辑 ✎ Lin数君

 联璧大数据出品   未经授权禁止转载

一键置顶公众号   从此划船不用桨 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存