其他
一、背景目前我们能看到因果推断相关的资料更多的聚焦在逻辑方法本身,公式非常繁杂导致较难理解与应用。有的时候虽然看似理解了一些,但是真正应用的时候还是不太清楚什么场景应该选择什么方法。基于此种背景,笔者梳理一些目前业界的通用业务问题场景,按照不同分析场景类型分为四大类,分别对应不同的适用因果推断解决方法,并辅以通俗易懂的语言去解释其原理与案例。当遇到某类问题的时候,我们能快速明确的知道用什么方法可解此类问题。二、四类分析场景与对应解决方法概览三、分析场景与适用方法场景一:非实验场景策略效果评估策略、功能以及活动的效果评估,几乎是每个产品、运营、分析师日常工作的一大重点。大到重要功能上线,小到一个文案修改,都可以去衡量这个策略的效果,比之前提升了多少,对整体数据贡献了多少。不仅衡量了工作产出,也为之后的优化方向提供沉淀与依据。AB实验是回答这个问题的最优解,但是当无法做实验时,研究如何利用历史数据进行因果分析评估也变的非常重要。非实验场景的策略评估方式的核心思想就是:人为创造一个虚拟对照组与策略上线数据做比较估计策略真实效果。效果回归本质上属于统计学中的因果推断问题。在统计科学中,因果推断要解决的问题本质是剥离我们所不关心的外部变量对结果的影响,从而精准估计到我们所关心的策略因素对结果的单一影响。在不能做AB实验的场景下,通常有两种完成这件事情的思路:构造相似群体(Matching):这种思路假设在未被实验策略影响的样本中存在一些样本和被实验策略影响的样本存在同质性。只要我们想办法找到这些相似的样本作为虚拟对照组,就可以控制外生因素。这种思想最经典的方法是PSM(倾向得分匹配法);构造虚拟现实(Synthetic