珀尔:数据非常愚蠢,领会因果关系才是理解世界的关键
算法数学俱乐部
日期:2020年01月17日
正文共:2227字1图
预计阅读时间:6分钟
来源:第一财经
珀尔认为,这是一个可实现的目标,而且并不需要担心“强”人工智能会损害人类利益,“因为因果推理模型将使AI能够反思它们自身的错误,找出软件的弱点,充当道德实体,帮助我们作出决策”,通过在AI上模拟人类的思维方式,可以让我们更加了解自己。
2016年,在大数据的帮助下,人工智能(AI)围棋软件AlphaGo在系列赛中以4:1战胜了世界围棋顶尖高手李世石,震惊了全人类。
当时网络上有人戏谑道:“人工智能赢了不可怕,至少说明它还不懂得韬光养晦,如果它假装输给人类,那才更加可怕。”这句看似戏言的话,却暗藏了人工智能当前最大的发展瓶颈:只会学习和处理数据,却不懂得像人类一样去思考和模拟存在于数据之外的其他可能性。
正因如此,人工智能领域先驱、2011年图灵奖得主朱迪亚·珀尔在本书中直言不讳地写道:“数据非常愚蠢。”珀尔认为,当前的人工智能学习系统几乎完全以统计模式运行,这在理论上严重限制了AI的发展。
作为本书的核心内容之一,作者把认知能力分为三个等级,而统计行为仅处于最底层的“观察”级别。所谓“观察”即是根据数据(经验)积累来寻找不同变量之间的相关性,同时观察者无需对变量施加任何影响。例如,AI只需分析销售数据即可得出超市中饼干与巧克力之间的销量存在一定相关性,这就是最基础的认知能力。
但如果将饼干的售价提高一倍(假设之前从未发生过),巧克力的销量会发生什么变化呢?基于大数据分析的AI并不能准确地回答这个问题,因为从过往的销售数据中无法得出客户见到饼干涨价后的行为。这时候想要了解涨价后的销售情况,AI就必须主动对变量进行“干预”,进行分组测试,根据测试结果来预判饼干涨价对巧克力销量的影响。“干预”能力是AI摆脱被动接受数据,转而主动创造数据的关键一步。
最高级别的认知能力则是“想象”,即设想一个与现实不同的情景,比如假如昨天把巧克力的售价降低一半,饼干的销量会发生什么变化,然后预测它的结果。“想象”能力是如此重要,在人类简史作家尤瓦尔·赫拉利眼里,数万年前正是这种想象不存在事物的能力,引发了人类的认知革命,从而创造了今天的人类文明。
在珀尔眼里,人类的认知能力之所以能超越“观察”,达到“干预”和“想象”的级别,是因为我们天生拥有一颗善于发现并理解“因果关系”的大脑,这也是我们目前仍领先AI的地方。不过严格来说,如同对“时间”或“意识”的理解一样,在哲学、科学界对于什么是“因果关系”至今仍未有一致的定论。
幸运的是,作为一名计算机科学家,珀尔并不需要挑战“因果关系是什么”这一世纪难题,他只需用计算机能理解的语言描述在哪种情况下,不同变量之间可以被认为存在“因果关系”而不仅仅是相关性即大功告成。简而言之,作者的雄心在于破解因果关系背后的数学逻辑,然后建立一个可算法化的因果推理模型,并让计算机学会这个模型,由此即能创造出懂得如何思考和推理的“人工智能科学家”。这个AI科学家将如同超级加强版的爱因斯坦一样,了解如何设计新的实验,发现未知现象,找到悬而未决的科学困境解释,并不断地从学习中提炼出更多崭新的知识。
书中提到的“结构因果模型(SCM)”正是珀尔想要与我们分享的最新研究成果,该模型由概率图模型、结构方程模型(SEM)和反事实算法组成。概率图模型是SCM主要的数学基础,由作者于1985年提出的贝叶斯网络构成。贝叶斯网络又被称为信念网络,用以计算多个变量间的联动概率,有助于理解数据之间的内在联系。比如,当你想分析气温和饼干、巧克力销量三者有何关联时,贝叶斯网络就能派上用场。
想要进一步确认因果关系,仅靠贝叶斯网络是不够的,需要用反事实算法进行干预,控制其中一个或多个变量,再去观察结果,这也是科学研究的开端。除了直接干预之外,反事实算法还可以预测干预及模拟未干预时的结果,而结构方程模型则以清晰的语义将概率图模型与反事实算法相关联。
在现实世界里,一个变量周边可能存在着无数混淆因素,想要抵消这类因素的影响必须做随机对照试验(RCT)。作者为此设立了判断规则,规定哪些变量应该被控制,哪些可以被无视。
珀尔的研究成果在于,只要你将两个变量置入他的结构因果模型,并列出模型要求的所有相关因素,而又根据规则排除了其他混淆因素,此时如果两个变量之间依然存在协同变化,那你就有充分的权利得出结论,两者之间存在因果关系。
作者此书的目的是描述如何构建“强”人工智能,一个可以理解因果关系、懂得思考并能和我们直接无障碍交流的,甚至可以说是拥有自由意志的智能机器人。珀尔认为,这是一个可实现的目标,而且并不需要担心“强”人工智能会损害人类利益,“因为因果推理模型将使AI能够反思它们自身的错误,找出软件的弱点,充当道德实体,帮助我们作出决策”,通过在AI上模拟人类的思维方式,可以让我们更加了解自己。
对于一艘没有目标的船而言,所有风向都是逆风,在这本书里,珀尔凝聚了毕生的研究成果,用相对通俗的语言,在层层迷雾中为人工智能的未来发展指明了方向。
任何对人工智能发展、大数据分析、深度学习等话题感兴趣的阅读爱好者,都不应该错过这本人工智能大师珀尔的集大成之佳作。
(作者系第一财经编辑,本文是《The Book of Why: The New Science of Cause and Effect》一书概要,该书获评2018“第一财经·摩根大通年度金融书籍”年度英文书籍奖)
— THE END —
☞本硕皆数学专业,博士转行生物后,他发表了学校首篇Nature☞杨振宁讲(经典)数学笑话兼论数学和物理的关系☞82岁江泽民在2008年发表论文指出:发展智能化,机器学习将有所作为……☞一种节点组重要性排序方法☞图论的各种基本算法