多触点归因(MTA: Multi Touch Attribution)是一种基于数据驱动(Data-driven)的归因技术,着重还原用户触点轨迹并公平分配贡献,帮助商家优化广告资源投放,从而优化提升整体营销收益。多触点归因是预算分配与智能广告投放的基础,现有方法多采用历史数据训练一个模型以预测广告触点路径的转化概率,然后根据合作博弈理论Shapley Value基于反事实预测结果公正分配每个触点的贡献。这类方法的一大假设是转化预测模型需是无偏的,假定在计算Shapley Value枚举的浏览路径上做到精准预测,这些浏览路径包含真实存在与非真实存在两种情况。然而广告系统的投放与用户的转化行为都受到用户偏好的影响,不同广告触点背后的人群画像存在明显的差异,导致上述假设并不成立,即混淆偏差问题与反事实预测中的OOD(out of distribution)问题。本文提出了基于因果推断技术的无偏广告多渠道归因模型 MTA,消除了用户静态与动态混淆偏差的影响,从而训练无偏的转化预测模型,通过理论分析论证了CausalMTA在给定充足广告路径下的有效性。在仿真数据集、Criteo公开数据集以及阿里妈妈真实数据集的大量实验结果表明,CausalMTA不仅在预测转化率上超过其他SOTA方法,同时还能为不同广告渠道产生有意义的归因值。该项工作由阿里妈妈SDS团队和中科院计算所毕经平研究员与姚迪博士团队合作完成,基于该项工作整理的论文已被KDD 2022接收,欢迎阅读交流。论文:CausalMTA: Eliminating the User Confounding Bias for Causal Multi-touch Attribution下载:https://arxiv.org/abs/2201.00689
根据独立性假设,可以把总体混淆偏差分解为由静态用户属性引入的偏差以及由动态用户偏好引入的偏差,即。CausalMTA的目标是得到无偏的预测模型,即。本文在文中证明了静态混淆偏差可以通过用样本权重对用户路径重加权的方式加以消除。无偏预测模型的优化目标是反事实预测误差,然而无法在观测数据中被度量。但静态混淆偏差与反事实预测误差的上界都可以通过以下方式确定:其中,代表在重加权的数据集上的预测误差,IPM即Integral Probability Metric。特别地,当时,等式成立,有。
阿里妈妈SDS(Strategic Data Solutions)团队致力于用数据让商家和平台的增长战略更加科学有效。我们为阿里妈妈全线广告客户提供营销洞察、营销策略、价值量化及效果归因的技术服务。我们将持续在数字营销领域MTA、MMM等方向进行探索和落地,欢迎各业务方关注与合作。同时,真诚欢迎感兴趣的同学和我们取得联系、互相交流。联系邮箱:alimama_tech@service.alibaba.comCausalMTA是阿里妈妈SDS和中科院计算所毕经平、姚迪老师团队多年合作的共同成果。双方不仅在MTA学术领域做出了创新成果,也根据阿里独特的电商业务场景做了针对性的适配和优化,最终在学术研究与实际业务都取得满意的结果。毕老师的课题组围绕时序数据智能、网络智能、AI算法安全等领域开展研究,面向国家权益保障、国家网络与信息安全等国家重大战略需求,承担了多项国家科技重大专项、国家自然科学基金、国防预研项目和研制项目等重大项目。近三年来,课题组在KDD、WWW、ICDE、TKDE、TON等期刊会议上累计发表CCF A类论文十余篇。欢迎感兴趣的同学合作交流。联系邮箱:yaodi@ict.ac.cn
Reference
[1] Judea Pearl. 2009. Causality. Cambridge university press.
[2] Hao Zou, Peng Cui, Bo Li, Zheyan Shen, Jianxin Ma, Hongxia Yang, and Yue He. 2020. Counterfactual Prediction for Bundle Treatment. NeurIPS’20 33 (2020).
[3] Ioana Bica, Ahmed M. Alaa, James Jordon, and Mihaela van der Schaar. 2020. Estimating counterfactual treatment outcomes over time through adversarially balanced representations. In ICLR’20. OpenReview.net.
[4] Xuhui Shao and Lexin Li. 2011. Data-driven multi-touch attribution models. In KDD’11. ACM, 258–264.
[5] Brian Dalessandro, Claudia Perlich, Ori Stitelman, and Foster Provost. 2012. Causally motivated attribution for online advertising. In Proceedings of the sixth international workshop on data mining for online advertising and internet economy. 1–9.
[6] Ya Zhang, Yi Wei, and Jianbiao Ren. 2014. Multi-touch attribution in online advertising with survival theory. In ICDM’14. IEEE, 687–696.
[7] Sai Kumar Arava, Chen Dong, Zhenyu Yan, Abhishek Pani, et al. 2018. Deep neu- ral net with attention for multi-channel multi-touch attribution. arXiv:1809.02230 (2018).
[8] Kan Ren and etc. 2018. Learning Multi-touch Conversion Attribution with Dual- attention Mechanisms for Online Advertising. In CIKM 2018. ACM, 1433–1442.
[9] Dongdong Yang, Kevin Dyer, and Senzhang Wang. 2020. Interpretable Deep Learning Model for Online Multi-touch Attribution. arXiv:2004.00384 (2020). arXiv:2004.00384
[10] Ruihuan Du and etc. 2019. Causally driven incremental multi touch attribution using a recurrent neural network. arXiv:1902.00215 (2019).
[11] Sachin Kumar, Garima Gupta, Ranjitha Prasad, Arnab Chatterjee, Lovekesh Vig, and Gautam Shroff. 2020. CAMTA: Causal Attention Model for Multi-touch Attribution. In ICDM’20. IEEE, 79–86.