沙龙回顾 | 张俊妮:商务分析中的因果推断
2020年12月26日下午,北京大学光华管理学院2020级商业分析硕士班学术沙龙委员会举办了本学期第五期学术沙龙活动,活动荣幸邀请到北京大学国家发展研究院统计学副教授张俊妮教授,为同学们带来了主题为“商务分析中的因果推断”的学术分享。
01
为什么因果推断对商务分析
而言重要?
张俊妮教授提到因果推断的洞察力可以帮助识别客户的痛点,为产品开发提供信息,并提供更个性化的体验。例如我们知道用户提交客户支持通知单是因为对如何使用新功能不清楚,而不是对该功能本身不满意,那么我们可以集中精力改善关于如何使用该功能的沟通,而不是更新或停用该功能。在更精细的层面上,因果推断使数据科学家和产品分析师能够根据观测数据回答因果问题,尤其是当A/B测试不可能时,或者从设计良好的实验中获得更多的见解。她以Uber作为例子,指出在高层次上,因果推断帮助我们在Uber平台上为客户提供更好的用户体验。
如何分析基于观察性研究
获得的数据?
在现实生活中,很多时候我们是基于观察性研究获得的数据。观察性研究(Observational Study)是指研究对象属于处理组还是控制组不是由随机化而定的,研究者在自然状态下对研究对象的特征进行观察、记录。因此,相比于随机试验,我们不能基于处理变量对观察性数据直接划分为观察组和处理组,来研究因果效应。针对观察性研究的因果推断方法包括倾向分方法、断点回归、双重差分、工具变量等不同的方法。其中,张教授向我们重点介绍了倾向分方法。
如何使用倾向分方法分析
观察性数据?
张教授介绍倾向分是给定已观测的自变量,个体属于处理组的概率。对处理分配机制的关键假设是给定已观测的自变量,个体属于处理组还是控制组不依赖潜在结果。倾向分将多维的自变量总结成了一维,很容易根据它对自变量进行匹配或分层(stratification),使观察性数据看起来像通过随机实验获得的数据。接下来,张老师以某大型多玩家在线角色扮演游戏的数据作为例子。其中处理变量为有没有朋友一起玩,结果变量是在处理时点之后某段时期内有现金消费,利用倾向分方法匹配处理组和控制组后,分析处理组和控制组的消费金额引出相应的因果效应大小,从而得出对业务改善有启发的改善。
随机实验的重要性
最后,张俊妮教授再次提到随机实验的重要性,她说由于在实际生活中有太多混淆因素,且观察性研究的因果推断方法未必能去掉混淆因素的影响,因此需要使用随机实验来解决。而A/B测试是最简单的单因素实验设计,她提到更好的实验设计是,同时考虑多个因素,并寻找它们最好的组合。
往期回顾
01 |
02 |
03 |
持续关注北大光华商业分析
第一时间掌握项目信息