查看原文
其他

图灵奖得主Pearl的因果推断新科学, Why?

因果推断研究小组 计量经济圈 2021-10-23


凡是搞计量经济的,都关注这个号了

箱:econometrics666@sina.cn

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

下面这本书籍的中文版本是由 中信出版社出版的来自图灵奖得主新书《The book of Why: the new science of cause and effect》。之前,中信出版社找到计量经济圈,希望能够宣传一下该书籍,从而提高其销售量。但遭到咱们的委婉拒绝,理由是中信出版社只能给咱们圈子提供三本样书,难以在圈子众多学者间有效分配。这次,咱们完全是出于Pearl的因果推断思路对计量经济学影响的动机,将这本书籍引荐给咱们圈子众多社科学者(没有样书)。读完之后,你会发现,很多内容是与咱们讲解的一致,当然,也有不少全新内容。

1.用"因果关系图"来进行因果推断的新技能

2.confounder与collider啥区别? 混淆 vs 对撞

人工智能之所以足够智能,很大程度上要归功于Judea Pearl。在20世纪80年代,他带头推动机器以概率的方式进行推理。但是现在,他却成为了该领域最尖锐的批评者之一。他在自己的新书《The Book of Why:The New Science of Cause and Effect》中指出,人工智能的发展已经受到阻碍,因为它不能完全理解智能的真正含义。

30年前,人工智能研究的一个主要挑战是如何对机器进行编程,从而把潜在的原因与一系列可观察到的条件联系起来。Pearl想出了一个办法,使用一个叫做贝叶斯网络的方案解决这个问题。贝叶斯网络使机器能够回答问题,比如给出一个从非洲归来的、出现发烧和身体疼痛征兆的病人,那么最有可能的解释是疟疾。2011年,Pearl获得了图灵奖,这是计算机科学的最高荣誉。他能获得这一荣誉在很大程度上是归功于这项工作。

但Pearl认为,人工智能领域已经陷入了概率关联的泥潭。最近,大量的头条新闻都是关于机器学习和神经网络的最新突破,我们能够读到计算机掌握古老游戏、驾驶汽车的消息。而这些对Pearl来说毫无吸引力。正如他所认为的,人工智能领域的最新技术只不过是上一代机器已经做过的事情的强化版:在大量数据中找到隐藏的规律。他最近表示:“深度学习所取得的所有令人印象深刻的成就都只是曲线拟合。”

在他的新书中,现年81岁的Pearl阐述了一个关于真正的智能机器如何思考的愿景。他认为,关键是用因果推理来代替关联推理。这不仅仅是将发烧和疟疾联系起来的能力,机器需要有推断出“疟疾引起发烧”的能力。一旦这种因果关系框架就位,机器就有可能提出反事实的问题,也就是询问因果关系在某些干预下会如何变化。而Pearl认为这正是科学思考的基础。Pearl还提出了一种正式的语言,使这种思维成为可能,这是一个21世纪版本的贝叶斯框架,能够让机器进行概率性思考。

Pearl认为,因果推理可以使机器具有人类水平的智能。他解释说,这样它们就能够更有效地与人类交流,甚至能够获得道德实体的地位,同时具备自由意志和作恶的能力。

Quanta Magazine杂志最近在圣地亚哥的一次会议上对Pearl进行了访谈,随后又通过电话对他做了后续采访。以下是经过编辑和精简的采访对话:

问:为什么您的新书起名为《The Book of Why》?

Judea Pearl:这本书代表了我在过去的25年里做的一份关于因果关系的总结,它在一个人的生命中意味着什么,它的应用,以及我们如何解决那些固有的因果关系的问题。奇怪的是,这些问题已经被科学抛弃了。所以我的目的是弥补科学对它们的忽视。

问:有一个戏剧性的说法是,科学已经放弃了因果关系。但这不正是科学所要研究的吗?

Judea Pearl:当然是的,但是你不能在科学方程式中看到这种崇高的愿望。代数的语言是对称的:如果x告诉我们关于y的信息,那么y就能够告诉我们关于x的信息。这是确定性关系。

在数学中没有办法写出一个简单的事实。例如,即将到来的暴风雨会使气压计下降,而不是上升。数学还没有发展出一种非对称的语言,即x引起y并不意味着y会引起x。我知道,反对科学听起来像是一件可怕的事情。但科学更宽容:鉴于我们还没有关于不对称关系的微积分,科学会鼓励我们去创造一个。这就是数学的用武之地。我很高兴看到,一个简单的因果关系演算可以解决我们那个时代最伟大的统计学家认为不确定或无法解决的问题。所有这些都能在高中几何中找到证明,这是非常轻松和有趣的。

问:几十年前,你通过使机器实现概率推理而在人工智能领域名声大噪。可否解释一下当时人工智能的情况?

Judea Pearl: 20世纪80年代初出现的问题具有预测性或诊断性。医生从病人身上观察到一系列症状,并希望找出病人患有疟疾或其他疾病的概率。我们希望自动系统、专家系统能够取代专业人员——无论是医生,还是矿物资源的勘探者,或者其他的有偿专家。基于这一点,我提出了通过概率来实现这些的想法。标准的概率计算需要指数空间和指数时间,这使问题变得非常复杂。我提出了一个叫做贝叶斯网络的方案,它能够多项式时间内完成,而且过程非常透明。

问:但在你的新书中,你把自己描述成当今人工智能社区的叛徒。这是为什么呢?

Judea Pearl:我们开发出能够让机器以不确定性推理的工具后,我就离开了AI社区去追求一项更具挑战性的任务:因果推理。而我的许多人工智能领域的同事仍然在研究不确定性。有一些研究小组在继续研究诊断问题,而不用担心问题的因果关系。他们想要的只是更好地预测和诊断。我可以举个例子。我们今天看到的所有机器学习工作都是在诊断模式下进行的,例如,将对象标记为“猫”或“老虎”。他们不关心干预,他们只是想要识别一个物体并预测它将如何随时间变化。

当我为预测和诊断开发出强大的工具,并意识到这只是人类智能的一小部分时,我感觉自己像个叛徒。如果我们想让机器来解释干预措施(“如果我们禁止吸烟怎么办?”)或者反省(“如果我高中毕业了怎么办?”),我们就必须使用因果关系模型。仅仅有关联是不够的。这只是一个数学事实,而不是观点。

问:人们对人工智能所带来的的可能性感到兴奋。你会有这种感觉吗?

Judea Pearl:我在研究深度学习的过程中,我发现研究人员都被困在了关联级别的问题上——曲线拟合(Curve fitting)。那些认为深度学习所取得的所有令人印象深刻的成就都是为了适应数据的曲线,这样的想法听起来是一种亵渎。从数学层级的角度来看,无论你如何巧妙地操纵数据,以及当你操纵数据时你能获取什么信息,它仍然是一个曲线拟合的过程,尽管是复杂且繁琐的问题。

问:你谈论曲线拟合的方式似乎表明,你对机器学习不太感兴趣。

Judea Pearl:不,我对机器学习印象很深刻,因为人们通常不认为仅仅通过曲线拟合就解决那么多问题。事实证明它们可以。但我关心的是未来——接下来会怎样呢?你能让一个机器人科学家来计划实验,并为悬而未决的科学问题找到新的答案吗?这是机器学习下一步要解决的问题。

我们还希望能与机器进行一些有意义交流。“有意义”的意思是,与我们的认知相匹配。如果机器人不具备对因果关系的认知,那么就永远不会有意义的交流。机器人不能像你和我一样,说出“我本应该做得更好”。因此,我们失去了一个重要的沟通渠道。

问:拥有人类的因果关系认知的机器,前景是怎样的?

Judea Pearl:我们必须给机器配备一个环境模型。如果一台机器没有现实的模型,你就不能指望机器在这个现实中表现出智能。第一步就是由人类编程的现实概念模型,这可能在10年之内出现。下一步,机器将自己假定这些模型,并将根据实证证据对它们进行验证和改进。这就是科学领域一直在发生的事情:我们最初认同地心说,认为一切都在围绕地球转动,而最终通过日食发现了日心说。机器人也将相互交流,并将把这个充满隐喻模型的假想的世界和狂野的世界翻译成它们的语言。

问:当你和今天在人工智能领域工作的人分享这些想法时,他们会作何反应?

Judea Pearl:人工智能目前是分裂的。首先,有一些人沉醉于机器学习、深度学习和神经网络的成功。他们不理解我在说什么,他们想要继续做曲线拟合。但是,当我和那些在统计学习范畴以外的人工智能领域工作的人交谈时,他们会立即理解我。在过去的两个月里,我读了几篇关于机器学习的局限性的文章。

问:你是在暗示有一种远离机器学习的趋势吗?

Judea Pearl:不是一种趋势,而是一种严肃的自我反省,包括这些问题:我们要去哪里?下一步是什么?

问:那是我最不愿意问你的问题。

Judea Pearl:我很高兴你没有问我关于自由意志的问题。

问:那么,你对自由意志有什么看法?(智能菌标注:好尴尬,提问者机智如我~)

Judea Pearl:我们绝对会开发出具有自由意志的机器人。我们必须了解如何对它们进行编程,以及从中我们能获得什么。由于某些原因,对于进化来讲,这种自由意志是可以被计算的。

问:以什么方式呢?

Judea Pearl:你具备自由意志,进化使我们有了这种感觉。显然,它提供了一些计算功能。

问:机器人出现自由意志的时候会很明显吗?

Judea Pearl:我认为第一个证据是,如果机器人开始反事实地相互交流,比如它们说出“你应该做得更好”。如果一个机器人团队开始用这种语言进行交流,那么我们就将知道他们具备了自由意志。“你应该把球传给我——我在等你,而你没有!”“你应该做某件事”意味着你可以控制做或者不做某件事。所以第一个迹象是交流,第二个是能够踢更好的足球。

问:既然你已经提出了自由意志,我想我应该问你关于作恶能力的问题,我们通常认为这取决于做出选择的能力。那么什么是邪恶呢?

Judea Pearl:邪恶就是,相信你的贪婪或不满取代了社会的所有标准规范。例如,一个人具备一个类似于软件模块的东西,上面写着:“你饿了,所以你有权采取行动来满足你的贪婪或不满。”但是又有其他的软件模块可以指导它遵循社会的标准规范。其中一种叫做同理心。当你把你的不满提升到社会的普遍标准之上时,那就是邪恶的。

问:那么我们怎么知道人工智能有能力作恶呢?

Judea Pearl:当我们很明显地看到机器人忽略软件组件时,并且总是忽略它。或者是机器人只遵循某些软件组件的建议,而不遵循其它组件的建议时。或者机器人忽略那些来自控制行为规范的组件的建议时,这些规范是被编程在其中或者根据过去的学习生成的。而机器人不再遵循这些规范。

source: 网易智能

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2年,计量经济圈公众号近1000篇文章,

Econometrics Circle

数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 |

计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 

数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |


干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 |

计量经济圈因果推断研究小组,这里只讨论因果识别技巧和相关文献阅读。如果你对因果推断研究感兴趣并且有基础,可以考虑加入。当然,这个小组只讨论specific问题,而不能讨论其他主题相关的问题。加入之前务必对因果推断计量有一些基础,实在没有基础的伙伴请先学习计量经济圈公众号推送的系列文章。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存