查看原文
其他

统计计量 | 因果推断理论的商业应用遐想

数据Seminar 2022-12-31



本文转载自公众号经管学苑

来源:山区小老板的杂货铺


“你相信因果报应吗?”

每当听到这样的句子时,大家大概都会回想到街角拉二胡的某位大师,扯一些让人不明觉厉的话。但是现在,正有一群科学家正在积极地研究这个支持了人类发展进步几千年的逻辑问题——因果关系。

本文将涉及0数学的因果推断理论科普、因果推断理论的商业潜力和该领域的市场机会。

Part1因果关系是可以被人类科学探知的吗?

要回答这个问题,我们要先对因果关系下个定义。百度百科是这么解释的 “因果关系是一个事件(即“因”)和第二个事件(即“果”)之间的作用关系,其中后一事件被认为是前一事件的结果。“ 总结下来是两点:1. 两件事具有相关性2. 一前一后,因在前,后为果

比如,我们观测到某公司2020年年报营业收入下降了20%,我们又观测到它是一家外贸公司,然后一想今年2020年是疫情年,便会下个结论说:可能是疫情让这家公司在海外业务收缩。先发生了疫情,后发生了营业收入下降。所以疫情为因,营业收入下滑为果,这符合逻辑,更符合因果关系的定义。

我们相信因果关系是可以被探知的,并且所有行业都在坚定不移地寻找稳定的因果关系。可遗憾的是,世间万物,众多因众多果同时发生,混淆因素太多,信息太杂,如果草率归因,我们会忽视了重要的显著因果关系。例如,企业营业收入下降可能是因为他们家前卫设计师被其他公司挖走了,导致只能设计出一些迷之联名款,大家不喜欢。

所以究竟是疫情还是设计师的原因呢?他们又分别导致(cause)了多少业绩下滑呢?这正是统计学的因果推断理论想要研究的问题。学过统计学的朋友们一定知道,统计学是无法断定因果关系的,而只能断定相关性。确实,如果缺少了时间维度,因果关系本身就可能只是人类对相关性的过度认识罢了。

但是,总有一群不相信人类局限的人,希望用数学表达因果关系,接下来就为大家用0数学的大白话介绍一下目前因果关系理论的两大流派。

Part2两大因果推断流派

Donald Rubin。美国哈佛大学的教授,目前在清华大学丘院任教。Rubin流派关注于如何用数学去详细地计算某件“因”能带来多少“果”。例如我们发现Airbnb上的用户每进行一次旅行,就会平均对平台的信任度提高1%,95%置信区间[-1.3%, -0.4%],(Zhu et al. 2020)。Rubin流派非常切合商业世界,因为我们根本不想浪费时间知道今天下雨会带来多少营业收入增长这种无意义的因果关系。使用Rubin流派的企业,需要清晰知道企业对什么事情感兴趣,只想对这一件事儿带来的果做出因果关系估计。Rubin学派相比于A/B Testing,强在无需通过实验设计,而可以使用历史数据直接推断因果关系。Rubin流派的未来研究重点在于如何撇除无意义的混淆变量,从而获得最统计上有效的估计。

Rubin流派的技术可以:1. 【互联网】加速甚至取代 A/B Testing;2. 【医药】使用更少的样本但更好地帮助我们理解新药的价值和风险;3. 【金融科技】理解一/二级市场因子究竟会对价格或市场产生多大的因果影响。这一部分属于原先数据分析的存量市场,预期各领域的渗透率将在5年内达到30%左右。

Judea Pearl。Pearl是UCLA的计算机系教授,他也是因果推断领域的奠基人之一。他的理论聚焦自动从信息的相关关系中分析出因果关系。该领域的模型在使用时会动辄使用上百/上千的变量,并从大规模的信息中自动分析得出因果链条,例如A→B←C←D。因此Pearl的模型更关注因果链条(性),而不是Rubin领域关注的量,这也让Pearl的模型非常适合万物互联的网络结构。最黑科技的是,Pearl的算法其实根本无需人为控制,所有因果关系都在自动化中找到!不过,这也意味着机器会给我们下雨会导致营业额下降这样无用的知识。

Pearl流派的技术可以:1. 【IoT】应用于千千万万的边缘节点,帮助人们认识和理解各个边缘节点间的作用关系,应用范围在:移动互联网、工业互联网、智能家居等等;2. 【AutoML】自动建模寻找因果因子。技术是上个世纪的老技术,而且因为在学术界已经存在许久,现在的学生也已经比较少了,但是应用场景是新场景,是一个被低估的市场。这一部分属于把盘子做大的市场,在未来五年估计有小十亿元人民币的市场容量。

Part3商业判断

总体而言,因果推断技术属于分析类技术,就和经济学、统计学一样,其商业价值是帮助人们更好地理解系统中复杂变量的运作关系,而非像计算机技术那样拥有改造世界的强商业潜力。最有可能出现的业态是开源项目、成熟的产品化公司、和技术落地公司的模式呈现。其中我最看好因果推断带来的产品。近期,学术界对于因果推断的研究有显著加速的趋势,期待在接下来的5年内看到更多的独立项目。

美国的ClearBrain公司于2016年成立,第一轮种子轮融资$3.2M,是通过因果推断理论帮助快速地产品研发和迭代。该公司于2020年3月被一家做产品设计的SaaS Amplitude公司收购,投前估值是$12.6M,而后者由Sequoia投资。另外做因果推断的公司包括Causality Link等.

即便如此,我认为因果推断其学术价值却是无价的。得益于因果推断理论,我们能够定量地分析种族问题、全球贫富分化问题,在我们的时代,没有任何问题比公平问题更值得深入探讨了。而因果推断理论让人们可以关注在真正需要的问题上。因果推断也加速了新药的研发,通过工具变量等方式,让新药研发更加灵活、也解决了传统对照组实验的局限性。

Part4因果推断走向何方?

数字化,是21世纪的主题。我们不断把图片、文字数字化、逻辑数字化,接下来的课题是把因果关系数字化。当我们能够用数学模拟因果关系的时候,我们能否制造一个万能的机器呢?这个机器能否通过历史和现在,准确地估计将来呢?而一旦我们的预测不再基于相关性,而是因果性后,我们的世界又会发生什么变化呢?

这些都是非常值得期待的未来。






星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


统计计量 | 计量经济学前沿理论与方法

统计计量 | 如何确定因果关系?四种理论分析模型

数据可视化 | Python数据可视化:平凡的世界

数据资源 | 哪里可供经济学论文复制的数据和代码?

新世野 | 不可错过的最新数据可视化案例,建议先码后看!!!

数据治理 | 浅谈数据治理、数据管理、数据资源与数据资产管理内涵及差异点







数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 杨奇明


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存