指标归因在互联网平台的应用
导读 今天分享的主题是指标归因在互联网平台的应用。
主要分为四个部分来做介绍:1. 什么是指标归因
2. 指标归因的基本方法
3. 指标归因的案例介绍
4. 指标归因的工具应用
分享嘉宾|林卓楹 高级数据科学家
编辑整理|汪维
内容校对|李瑶
出品社区|DataFun
什么是指标归因
指标归因的基本方法
第一类是短期波动,表现是指标暂时性的异常,通过环比的突增/突降点体现出来。从上图可以看到非常明显的突降点,短期波动一般会快速恢复到原来的水平。一般这种情况常见的因素是碰到了比较大的事件,比如突发事件等对经营做调整,会带来一个突变点。
第二类是长期波动,体现为中长期的持续上升或下降。这种类型没法快速看到明确的突变时刻,也没有办法和某一个时刻的具体事件做关联,这种情况可能预示了潜在的风险,特别是如果这样的波动不在预期之内,或者说是未知原因的波动,就需要进一步通过归因分析来找到问题所在。
第一类是确定性判断。例如互联网平台,在手机、电脑以及电视端都可以使用,总的收入来源于这三个终端。如果发现收入下降了 10%,那么希望知道每一个终端的影响是多少,这就是确定性判断。
第二类是可能性判断。继续上面的例子,通过确定性判断已知移动端带来了 80% 的下降,那么下一步可能会想知道移动端的下降主要受什么因素的影响,是因为用户行为发生了改变,还是因为策略调整带来的负面影响,这就是可能性判断。
第三类是猜测性判断。假设已知是用户行为变化带来的收入下降,接下来可能会去猜测用户行为为什么发生了变化,是受竞品的影响,还是因为政策调控的影响。
第一类是大家比较熟悉的机器学习。机器学习的好处是对相对简单的建模效率较高且可解释性较强。
随着模型越来越复杂,机器学习模型的可解释性就会有一定的下降,这时候就需要在机器学习的基础上加 SHAP 值来计算,通过 SHAP 值来计算特征的目标指标贡献。SHAP 值的优点是不管机器学习的模型有多么复杂,都能计算出贡献值,能帮助解释各个特征的贡献度。
不论是机器学习还是 SHAP 值都是在解释相关性,这是比较大的一个局限。如果在归因的时候,对因果关系有非常强的需求,则可以考虑因果推断或者贝叶斯网络。
指标归因的案例介绍
指标归因的工具应用
分享嘉宾
INTRODUCTION
林卓楹
高级数据科学家
硕士毕业于杜克大学,主要负责广告商业化相关的数据工作。
往期推荐
弱监督建模技术在蚂蚁风控场景中的探索与应用
京东RaftKeeper2.1发布,让CK告别ZooKeeper!
Apache SeaTunnel——OLAP 引擎的数据动脉
DataFunCon北京站精彩回顾|附PPT 下载方式
数据在零售供应链领域的应用
在交叉小径的花园随机漫步
StarRocks 数据湖查询和迁移实践
基于大模型的群体智能解决方案
阿里妈妈获 NeurIPS 2024 比赛主办权,全球参赛选手报名启动!
RAG 标准和腾讯云 ES 的技术实践
点个在看你最好看
SPRING HAS ARRIVED