查看原文
其他

当概率遭遇现实生活:逻辑远比直觉靠谱

知社 知社学术圈 2019-03-29

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

导 读

如果我们的大脑对数学推理没有很好的觉察力,那么明确的概率思维可以改进我们的决策力。

 

当遇到难以决策的事时,你是凭直觉做决定,还是对风险进行概率计算呢?或许有时候你的直觉是准确的,但,总是如此吗?

看完文中这三个问题,你就会明白,明确的概率计算比直觉靠谱多了。


问题一


第一个问题摘录自一个异想天开的儿童故事。


一个男人去坐飞机。


不幸的是,飞机出了故障。


幸运的是,他有一个降落伞。


不幸的是,降落伞打不开。


幸运的是,他如果往下跳,掉落点有一个草堆。


不幸的是,草堆上有一个铁叉,很可能会刺中他。


幸运的是,他跳下去后避开了铁叉。


不幸的是,他连草堆也避开了。


在网上搜一下,确实有很多飞机失事后跳下来掉到草堆上、树上乃至灌木丛中得以幸存的例子。所以大概这个男人脑子里一直交替出现“我会死”和“我会活”两种想法,直到坠地的时候才知道结果。——在很多次看似惊喜的逆转之后,我们的故事还是以悲剧收尾了。那么风险评估的原则性方法可以用在这里吗?也就是说,我们能否在已知的信息条件下,计算他在每一个转折点的存活概率?

 

Douglas Felix 很好地解答了这个问题。他指出,在这个故事中,每个转折点的生存几率都要么无限接近于0,要么无限接近于1,所以很难用简单明了的语言阐明这种绝对或相对的风险。



斯坦福大学的Ronald Howard是一名风险分析方面的专家,他专门为此发明了一种方法,叫做“micromort”。1 micromort 指的是一个百万分之一的死亡几率,你可以用普通的公制前缀来表示这种趋近于零的结果,例如nanomorts 和picomorts 这样的词。对于我们的问题而言,我们把每一次死亡几率接近于0的对立情况命名为“microvivé”。此时,1 microvivé意味着一百万分之一的存活几率,micromorts和 microvivés的和恒定在一百万。基于以上假设,我们再回头看这个故事中的风险,并假定它就发生在此时此刻。作为参考,每个中年男人每天自然死亡的概率大概是1 micromort。

 

一个男人去坐飞机。

 

因为我们不知道更多信息,所以假设本次飞行是普通客机出行。这种情况下,不加正常死亡率的话,事故致死率大概是每百万分之0.2—0.4,也就是0.2—0.4 micromorts。但是故事中描述主人公还随身背了降落伞,那么本次航班很可能就不是一次简单的旅行,而是一次高空跳伞之旅或者是有军务在身了。这种情况下,我们需改用另一个通用航空死亡人数数据,根据官方数据表明,这个数字大概是10 micromorts。

 

不幸的是,飞机出了故障。

 

飞机坠毁后还能幸存的概率我们很难估计,只是应该比我们想象的低很多。不过,即使我们假定他没有降落伞,也尚不能断言他一定会死,毕竟也有少数人坠机后还能幸免于难。根据公布的空难死亡数字,历史上飞机坠落且没有降落伞的人数可能在10万至30万人之间。这样,没有降落伞的生存机会可能从1万分之一到3万分之一,也就是30到100  microvivés(死亡概率是999,900到999,970 micromorts)。

 

幸运的是,他带了降落伞。


根据官方数据,跳伞死亡的概率大概是8 到 9 micromorts。相比没有降落伞,死亡率已经被大大降低。

 

不幸的是,降落伞打不开。

 

生存几率又回到了前述的30到100 microvivés。

 

幸运的是,降落点上有一个草堆。

 

不能否认有很多人掉到灌木丛或者草堆上后得以幸存的情况,可能会受伤,但毕竟还是活下来了。这样的话就很难估计存活率了,可能在千分之一到百分之一之间,也就是1,000 到10,000 microvivés。

 

不幸的是,草堆上有一个铁叉。

 

啊!尽管令人绝望,但是这种情况还是比什么都没有好很多,生存率估计在50 到 500 microvivés之间。

 

幸运的是他躲过了铁叉。

 

生存率又回到了1,000 到 10,000 microvivés之间。

 

不幸的是,他也避开了草堆。

 

在两个情节转折后,生存率跌回30到 100 microvivés,即99.990 %到99.997%的死亡率。

 

如果要得到准确的概率,我们需要很官方的数据来计算。即使没有,我们也可以给出一些宽泛合理的估计。一旦习惯使用这些单位,你看待事件就更加清晰,并能更好地作出判断,而不是简单地说:“几率接近于0,或是接近于1.”

 

(在其他情况下,使用单位也能使事件变得更加明晰:比如,我们把一个发生概率为百万分之一的假新闻定义为1 microvérité 或 1 microvér,算是当代对假新闻的一个简称。)


问题二


普通客机的死亡率是每100亿飞行里程约0.2人死亡,汽车的死亡率是每100亿英里约150人死亡。尽管汽车的死亡率比飞机高出750倍左右,但由于汽车的绝对风险更小,我们依然更倾向于选择汽车。


现在,我们来用两个不切实际的假说来做一个思想实验。


首先,假设你能活到100万岁;其次,上述的风险在这100万年里保持恒定。这样你就能每年坐飞机或者驾车行驶10000英里,不用担心时间问题,反正你能活100万岁。在这种情况下,如果你每次出行都只开车不坐飞机,你的寿命可能缩短几岁?


如果假设变成你只能活100岁呢?

 

我们知道,在乘坐飞机时,平均每500亿飞行里程会有一次死亡事故。在你100万年的寿命里,即使你每天飞行10000英里,最后也只有100亿英里。即,有80%的可能,你可以平安终老,所以你的生命仅仅缩短了20万年。在这种情景下,随机选择五个这样的人来过上述生活,预计有4个可以活满100万岁,一个可能会死于飞机失事,这个人的平均寿命是50万年。这样算的话,整个组的平均寿命就是90万岁,即,缩短了原本寿命的10%。


而在开车时,平均每6667万英里就会有一个死亡事故,这段驾驶距离在你6667岁的时候就能实现。所以你的平均年龄将缩短到6667岁,也就是说缩短了原本寿命的99.33%!


使用相同的办法计算100年寿命下的情况,结果是飞行状态下,你的寿命会缩短0.001年,也就是8个小时,约为原本寿命的0.001%。而开车状态下,你的寿命会缩短0.075年, 也就是一个月左右,约为原本寿命的0.075%。

 

这说明活100万岁的人,一定更容易有厌恶风险的倾向。一个更务实的结论是,重复选择风险“略”大的方案,日积月累下来,会显著增加风险。


问题三

 

这里有两个很相似的情境请你做出概率判断。在你做出精确的计算之前,可以先用直觉猜测一下。

 

情境A:有个城镇里住了两个民族,民族O和T。O族占了人口数的80%,医院对这两个民族中都存在的一种罕见疾病进行了完全一样的测试。他们收集了100个血样,其中80个来自O族,20个来自T族。经过严格的测试,只有一个血样对该疾病呈现阳性结果。根据HIPAA原则,研究人员在不知道样本构成的情况下经种族测试得出该阳性血样来自T族。但是,这种种族测试方法的准确率只有75%。那么,该阳性血样来自于T族的可能性是多少?


情境B:在该情境中,O族和T族都占了总人口的50%,但是O族更可能得这种罕见疾病。通过与情境A中相同的程序筛选出100个血样,同样80个来自O族,20个来自T族。剩下的数据都相同。那么此时这个阳性血样来源于T族的概率是多少呢?

 

哪一个情境中你的直觉更准确呢?


在这两种情境中,其实概率都是3/7或 42.9%。这在概率论中是一个经典问题,可以用标准贝叶斯条件概率公式P(A | B)= P(B | A)×P(A)/ P(B)来解决。下面是一个简单的逻辑计算过程。


我们从情境A开始计算,100个样本中有80个属于O族,种族测试的准确率是75%,则我们可以理解为,原本的80个O族样品中有60个来源于O族,20个来源于T族。同理,来自T族的20个测试准确率也是75%,那么我们可以等价为15个来自于T族,5个来自于O族。那么种族测试的系统就会“误认为”有35个样品来自于T族,这这35个里其实只有15个真正属于T族。因为阴阳性的检测是公正的,所以阳性血样来自T族的可能性实际就是15/35,也就是42.9%。这意味着其实阳性样品来源于O族的可能性更大,但是单凭直觉,就会有很多人认为有75%的可能来源于T族。

 

不过有个地方需要注意,我们说筛查是完全公平的,意思是不管该血样来源于哪个族,只要实验结果显示为阳性,其患病概率是相等的。但有的读者也许会不同意,认为该过程并不公平,因为在情境B中,O、T两族人口数是相等的,但还是有80个血样来源于O族,20个来源于T族。这是怎么回事呢?举个例子,比如患高血压可能会引发该疾病,那么我们的筛选测试就是通过测量血压选出所有血压在某一阈值之上的个体。现在,如果在情境B中,O族人很大比例有遗传性高血压,那么我们通过阈值筛选就会从O族中选出更多个体。因此,如上所述,O族人也更有可能患这种病。但是,我们在进行种族测试的时候,对所有血样都是一视同仁的,所以在情境B中阳性血样来源于T族的可能性也是42.9%,而在该情境中,我们的直觉似乎更准确一些。


为什么会这样呢?诺贝尔奖得主Daniel Kahneman在他的书《Thinking, Fast and Slow 》中进行了精彩的描述与分析。正如Kahneman所言,心理学家Icek Ajzen认为我们错误的感觉过程叫做“假贝叶斯推理”。Kahneman将这种现象定义为“描述胜于数据”,我们大脑对文字的理解力强于数字。在情境B中,O族更容易患病是一种描述,它更深刻地驻留在我们的脑海中,并影响我们对概率的计算。而在情境A中,我们却没有这样的描述,有的仅仅是数字,而且可能还不那么显著。所以我们在种族测试的计算上付诸了更多无谓的精力,但其实在数学上,两者都一样。

 

点击阅读原文,查看原文链接。

扩展阅读

 

霍金人生课:脚踏实地,仰望星空【知社视频】第10期

国际竞争加剧,美国政府大幅度增加2018年度研发支出

爱因斯坦的“黑洞方程”的证明

本文系网易新闻·网易号“各有态度”特色内容

媒体转载联系授权请看下方


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存