查看原文
其他

《思考,快与慢》共读第13天:大数法则与小数定律

绿骏马 和你一起终身学习
2024-12-02

你好,我是家安,今天是和你一起共读的第13天,一起读书,一起探索,一起成长......



这周我们共读的书是美国心理学家丹尼尔·卡尼曼的《思考,快与慢》。
上一章我们知道,系统1对目标问题,相对较难的问题采取替代、启发的方式做出回答。在系统1发散思维和强度匹配作用下,系统2遵循最省力原则没有对系统1回答给予干预。于是出现错误答案,或答非所问现象。第10章卡尼曼又会告诉我们什么新鲜知识?
让我们继续共读,一探究竟。
1 相互矛盾的假设
一项对美国肾癌发病率调查数据显示,3141个县发病最低县差不多都位于中西部人口稀少的乡村。对这一结果你怎么看?
你的系统2能迅速通过联想记忆给出建议,得出结论:由于人口稀少的乡村空气好,水污染少,食品没有添加剂,居民生活方式健康,所以肾癌发病率低。
与此同时,另一组数据显示,肾癌发病率最高的县也在中西部人口稀少的乡村。对此你又怎么看?
系统1和2给出的解释是:这里的居民医疗条件差,人们爱喝酒、吸烟,生活方式不健康,所以......
听上去,两次假设都有道理,但问题是,人们的生存环境和生活方式既是发病率高的原因,又是发病率低的原因,这就说不通了。

2 假设与数据
问题出在什么地方?答案出在乡村人数较少。
卡尼曼说,这个数据与肾癌发病率分布无关,它只是大脑对统计数据给出的反应和解释。
系统1惯用的因果模式和系统2记忆搜寻联手给出上面的解释,而这个解释在数据面前却是相互矛盾的。
实际上,系统1对“纯统计学”数据没有发言权,这些数据显示了发病概率,我们却不能以数据对结果做出解释。
也就是说,数据只是反馈事情当前的状态,但不能以数据多少对事情进行预测。系统1和2习惯对事情做出解释,但在数据面前,它们的解释却相互矛盾。生活方式是系统1、2找到的原因,在两组数据面前,他们的解释站不住脚。

3 红白球实验
卡尼曼认为,一个随机事件不需要解释,但一连串随机事件就有规律可循。
他举了一个例子:
一个装有红白两色球的箱子,红白球数量一样多。你随机从箱里拿出4个球,记下红球数,再把球放回去。重复这种做法多次后发现,“2红2白”出现次数几乎是“4红”或“4白”出现次数的6倍。这个结果是数学事实,你自信的预测,这个6倍的结果不会改变。
现在增加拿球数量,你继续从箱中拿4球,你的同事拿7球。这次记录全是红球、全是白球次数。你们拿球次数一样多,结果发现,你拿到同色球数量是你同事的8倍,你们预期概率分别是12.5%和1.56%。
这一结果与系统1因果关系无关,就是数学事实:一次拿4个同色球的概率比一次拿7个同色球概率更大。原因是,4个球少于7个球。
样本大小与极端结果
现在我把这些球看成美国人口数,一些球上写上肾癌字样。
你随机拿出小球,并依次按所在县摆放,乡村地区小球自然比其他地区小球少。结果发现,肾癌发病高和发病低的小球都出现在人数较少的县。因为这些县人数少,小球分配数量也少,所以有一个肾癌小球就显得占比较大,没有肾癌的小球又显得发病率较低。
这样看来,相比于大样本和小样本,极端结果更容易出现在小样本案例里。
这与因果关系无关,只与样本大小有关。人口稀少的县既不会引发癌症,也不能避免癌症,它的癌症发病率只会比人口稠密地区发病看上去更高或更低。
这就是数据提供的真相。
相信大样本
上面的案例表明,我们更应该相信大样本得出的结果,而不是小样本。
科学家以事实说话。如果事实建立在小样本基础之上,结果就可能出错,哪怕事实已经得出了结论,我们也不能相信这样的结果。
这就是大数法则:大样本比小样本更精确,小样本比大样本产生极端结果的概率更大。
偏僻乡村肾癌发病率忽高忽低就是最好的例子,小样本比大样本出现极端结果的概率大的多。
也就是说,虽然你做过某项测试,但因为提供的样本少,你的测试结果也不足为凭。小样本的出错风险可能高达50%。
6 小数定律与错误偏见
小数定律是说,如果统计样本太少,各种极端情况都可能出现,你根本不应该当真。数据少,就别轻易下结论。
但是,如果你并不了解事情真相,也不了解是大数据还是小样本得出的结论。你只是看到新闻或专家给出了相关信息。你会相信这条信息?还是不相信?
一般系统1会选择相信,不但相信,还会引发联想,并以此信息为基础,开始憧憬更多可能性。
系统2对信息能够提出质疑,但是这种质疑的力量远远小于相信的力量。
所以,相信多于质疑的偏见就这样不经意发生了。
7 随机事件与因果解释无关
卡尼曼说,随机事件不可预测,也无法解释。
比如,买彩票,彩票开奖是随机过程,所有号码中奖概率都是一样的,这次的中奖号码跟历史号码完全没关系,彩票走势分析毫无意义。
再比如,1940年的伦敦大轰炸,当时伦敦在德军导弹的攻击下损失惨重。伦敦的报纸公布了所有受到轰炸的地点之后,人们发现,轰炸分布得很不均匀。有些地区反复受到轰炸,而有些地区毫发无损。这对英国人来说是件很恐怖的事情,因为这意味着德国导弹的精度非常高,指哪儿打哪儿,可以对准一个地方反复轰炸。很多老百姓觉得,那些没被轰炸的地区可能是德国间谍居住的地方,于是很多人开始搬家。
战争结束后,英国人知道了真相,德国当时的导弹精度差得很,他们只能大概把导弹打向伦敦,根本无法控制落点,也就是说,各个地区受到的轰炸完全随机,那些地区被反复轰炸,只是因为碰巧,没什么道理可言。
***
人们犯错,一个重要原因是认为如果是随机的,那就必然是均匀的。其实,这只有在样本总数非常大的时候才成立,数据少的情况下结果是不均匀的。
这就是说,从案例中发现规律,是人类的重要生存本能,但也要区分是随机事件还是非随机事件,如果是随机事件,是不可能有规律可循的。
许多事情其实只是巧合,对随机事件作出因果关系解释必然是错误的。
这一章我们就说到这里。
明天见。


今年的读书计划
行动·2023



共读书合集
第1本:《牧羊少年奇幻之旅》




《思考,快与慢》共读回看

第1天:共读构想

第2天:共读路线图

第3天:系统1和系统2

第4天:主角和配角

第5天:惰性思维与延迟满足

第6天:启动效应

第7天:你的直觉可能是错觉

第8天:意料之外与情理之中

第9天:字母B与数字13

第10天:第1周讲书复盘

第11天:我们如何做判断

第12天:目标问题与启发性问题形影不离




家安:自我探索者、长期主义者、知识创作者。以文字方式重启自己,认识自己,走进自己。和你一起,读书、发现、思考、记录、陪伴。


继续滑动看下一个
和你一起终身学习
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存