“卖糖人”泛滥的时代和第一性原理
ps:4100字
引子
说起第一性原理,不得不提埃隆-马斯克,最近这个词是因为他重新流行起来的,他认为,
我们运用第一性原理,而不是比较思维去思考问题是非常重要的。我们在生活中总是倾向于比较,对别人已经做过或者正在做的事情我们也都去做,这样发展的结果只能产生细小的迭代发展。
这段话对认识和思考世界的方法做了一个很有意思的区分:第一性原理的思考方法和类比的思考方法。
从马斯克的字里行间,不难发现,所谓的第一性原理思维方式就是演绎法。为了准确地理解马斯克的对比,我们可以借用数学的“公理-定理”框架。
公理是命题推导的起点,它不能被其他公理证明,只能来自于长期的经验归纳。能被其他公理和定理推导出来的命题,叫做定理。假设这个世界的本质是一系列公理+定理,那么,认识现象的方法有三类:
1、现象和现象之间类比,只能发现相似性,无法总结出规律;
2、对每一类现象都运用归纳法,总结出一系列规律;
3、以少数经过反复验证最靠谱的经验观察为起点,从公理到定理——通过演绎法来认识这个世界;
这三个方法分别叫做类比、归纳和演绎。
这三个方法并非割裂的,而是分层次的,类比是归纳的基础,归纳又是演绎的基础,演绎统领这一切。
基于这样的层次划分,我们就能更清楚地表述马斯克的这段话了,不要把认知局限在类比或归纳的层次,要升维至演绎的层次。
由于类比和归纳都与现象有关,我们把这两种方法统称为经验思考。这篇文章的主旨是探讨经验思考的局限性。
类比的局限
侯世达是公认的认知科学大家,他在《表象与本质》一书中,花费了巨大的篇幅讨论类比。
他认为,类比和归类是人类思考过程中非常重要的工具,但是一般是下意识进行的,而且,人们的归类是模糊的,经常可以有一些偏移滑动。
尽管类比是人类思考的工具,但是,下意识进行和模糊性使得我们对这一工具的操纵是极其有限的。因此,他不无深意地说了下面两段话:
类比从头到脚侵入了我们的思维,控制着我们与世界交互的方方面面。它如此紧密地控制着我们,以至于我们只能以某种已知的方式进行思考。
尽管我们告诉自己,我们才是对类比发号施令的人,但事实刚好相反——我们处在自己拥有的大量无意识类比的股掌之中。这就像是一个有权有势的统治者,实际上是在顺从民心。
从侯世达那里,我们至少可以发现类比思考的三个局限:1、无意识性;2、模糊性;3、场景依赖。因此,类比思考仅仅适用于作为思考的开端,并不适用于做出最终的结论。
但是,我们人类又的的确确是一台台类比机器,时时刻刻都在匹配,我们痴迷于各种相似性,所以,对于类比工具一定要警惕。
人类推断的局限
丹尼尔-吉尔伯特是另外一位认知科学的大家,他在《哈佛幸福课》中讨论了人类想象未来的局限,他认为想象力有三个缺点:
1、下意识地填补或遗漏信息;
2、将现在投射到未来;
3、不知道一旦事情发生了,我们对事情的看法也会改变;
第二条缺陷的作用十分巨大,以致于我们的想象只能被牢牢地拴在以现在为中心的轨道上,永远无法真正的逃离。
文中,丹尼尔-吉尔伯特提了一个十分重要的命题,人类是唯一会思考未来的动物。在这里我擅自对这个命题做一个小小的拓展,
人类是唯一会思考未来的动物,但这种未来离“现在”很近。
事实上,思考未来和即时预测有十分大的区别。猴子的大脑和婴儿的大脑都能够将它们已经知道的东西(过去)同它们此时此刻看到的东西(现在)结合起来,并对即将发生的事情(未来)进行预测。
但是,猴子和小孩都无法思考未来——前者没有能力,后者还没学会。
我们经常会问小孩一个问题:你长大后想要干什么?小孩子常常被这个问题搞糊涂,他们可能会给出“卖糖人”、“攀树人”之类的答案。成年人为此窃笑不已。
事实上,这帮小孩子很鸡贼地去回答了另一个问题“你现在想干什么”。小孩子不知道自己以后想干什么,因为他们根本不懂“以后”是什么意思。然而,提问的成年人并不清楚这一事实。
当大人面临这一问题时,他想的是他毕业后要干嘛,跟一个什么样的人结婚,退休后住哪里。
小孩子还没有形成这个能力。这也就造成了另一个现象,我们总认为,自己小时候很开心,无忧无虑,成年之后多了很多忧愁。表面上看,这个描述符合事实。但背后原因十分反直觉,小孩子不具备思考未来的能力,也就还不具备忧愁的能力——不是缺乏忧愁的刺激因素,而是,缺乏忧愁的能力。
更进一步,按照所能思考未来的远近,我们能对各种智能体进行某种分类,如下图所示,
猴子可以预测十分近的未来,小孩子更远一些,成年人再远一些,更远就要借助宇宙飞船了。
“现在”就像地心引力一样,牢牢地抓住了各种智能体的想法,只不过成年人能稍微跳得高一些。
我们看似在预测未来,实际上在描述现在。
数据善于撒谎
前面两节主要讲了认知主体的缺陷——类比的局限和推断的局限,现在我们再讲一下认知的客体——现象——所能制造的麻烦。
暂且抛开现象的观测和收集问题不说,即便是我们把现象抽象为数据,我们也可能被数据愚弄。
在统计学中,有一个很著名的数据现象,叫辛普森逆转。
有一个很有意思的例子。一个观察者发现,在某一段时间有一个地方的高端住宅和普通住宅的平均价格都上涨了,但是,这个地方的总体平均成交价格却下降了。表面上看,这个反转看起来不可思议,实际上,它是因为在t+1期成交了更多的普通住宅,拉低了总体平均成交价格。
当然,辛普森逆转只是一个数据现象,所反映的是抽样的问题。还有一个更高阶的现象,叫辛普森悖论。这个悖论来自于分组数据。
我们都知道运动有益于健康。如果按照20、30、40、50的年龄段分组抽样,我们会看到运动时间和胆固醇水平存在明显的负相关关系。但是,如果我们把这4组数据混合在一起的时候,奇怪的事情发生了,我们会发现,运动时间越长胆固醇水平越高。
分组数据和混合数据得出的结论不一致!为什么如此呢?因为年龄同时影响运动时间(年龄越大的人运动越多)和胆固醇水平(年龄越大的的人胆固醇水平越高),制造了运动时间和胆固醇水平的正相关性。所以,年龄是胆固醇水平和运动时间之间的混杂因子。
要知晓运动时间和胆固醇水平之间的确切因果关系,必须控制住年龄。因此,分组数据得出的结论是对的,但混合数据得出的结论一定是错的,因为年龄制造了正相关性。
关于辛普森悖论还有一个著名的例子——人类颅骨长度和宽度的相关性。把男性和女性数据分开来看,颅骨的长度和宽度没有相关性,但是,把二者的数据混合到一起,二者就具备了微弱的相关性。
事实上,这个例子和运动量vs胆固醇的例子类似。性别是一个混杂因子,男的颅骨长度和宽度都较大一些。所以,性别会制造微弱的相关性。
按照分组数据,颅骨长度和宽度没有相关性;但混合数据灾难就出来了,我们会得出颅骨长度和宽度存在相关性的结论。
在这个言必称大数据的时代,人们倾向于认为数据万能,但事实并非如此。图灵奖获得者朱迪亚-珀尔在《为什么——关于因果关系的新科学》的导论里说道,思维胜于数据。
每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。
——奥古斯都-德-摩根
尽管丹尼尔-吉尔伯特列举了人类想象能力的种种缺陷,但是,珀尔认为想象能力的层次远远高于观察能力的层次——数据挖掘。
为了真正地驯服数据,我们必须升级到反事实的层次,掌握因果关系,而不是永远地在相关性里打转儿。
只有真实地掌握了因果关系,我们才能画出因果图,辨别出性别是颅骨长度和宽度的混杂因子,知道我们应该信任分组数据而不是混合数据。
否则,我们将会被别有用心的人愚弄,想让我们相信相关性的时候用混合数据,不想让我们相信的时候用分组数据。
结束语
综上所述,我们就知道了经验思考的一些重要局限:
1、思考的主体,存在类比局限和推断局限;
2、思考的客体,实际结构可能极其复杂,难以被简单的归纳法把握;
这时候,基于演绎法的理论就变得极其重要。
一方面,它基于经验领域最可靠的事实——公理,演绎出一系列命题——定理,这些命题可以作为经验思考的一个重要参照,我们比对演绎命题和经验观察的过程就是证伪,这是科学过程的根基。
另一方面,我们收集的数据需要加工。这是因为我们要么面临抽样的问题,要么面临复杂数据结构的问题。这些问题都无法通过简单的归纳法——回归——来解决,我们必须提出因果理论,在因果理论的指导下加工数据。否则,我们一定被数据玩死。
主体的缺陷和客体的特点,都要求我们借助理性,诉诸第一性原理,跨越茫茫的现象之海。
我记得我刚入行的时候,有位前辈告诫我,要多思考,不要成为数据收集器。那个阶段,我对这句话的理解还不深;现在,从业多年,我也终于理解了那个词——数据收集器。
缺乏完整理论的指导,囿于片面的数据或现象,要么总结的规律是破碎的,相互矛盾的;要么总结出来的规律是不稳健的,不同分组方式结论相反;要么推导出来的结论被“现在”牢牢捆住,是些类似于“卖糖人”和“攀树人”的答案。
说实话,我们真的很需要理论,鲜活的跟得上时代的理论,但是,我们听到的大部分观点都是现象类比和数据归纳。诚然这些东西易于生产和传播,但是,缺乏理论的支撑,再多现象和数据都无法让我们直达问题的本质,看到真相。
这是一个信息爆炸的时代,也是一个数据过剩的时代,更是一个“卖糖人”泛滥的时代,理论或者第一性原理思维才显得尤为珍贵。
ps:图片来自网络
ps:参考文献
1、《为什么——关于因果关系的新科学》朱迪亚-珀尔
2、《哈佛幸福课》丹尼尔-吉尔伯特
3、《表象与本质》侯世达
End
苹果用户请扫二维码,安卓用户可点击链接:
本号唯一的知识星球号
进行每天市场点评和热点事件点评
分享每一篇文章背后的想法和思路
发表一些最新想法的小短文
解答读者提问,欢迎参与讨论
目前星球成员已达1600+