查看原文
其他

很多事情难解释,回归平均是原因






数学算法俱乐部

日期2020年04月20日

正文共:2041字1图

预计阅读时间:7分钟

来源:数学之美












你也许见过很多百思不得其解的事情。朋友圈里最聪明的姑娘,嫁了个没文化的笨老公。大帅哥娶了个平庸妻子还捧在手心上。小时候长得极漂亮的校花,却过着落寞贫困的生活。成绩最差的那个,成了上市公司的总裁。书香门第生出了流氓。流氓世家却出了个英雄。一生勤奋的人总出不了头,吃喝混日子的人却平步青云。注重保养生活健康的人,早早得了癌症去世了;吃喝嫖赌抽一样不差的人,活到99还精神矍铄。
面对这些违背常理的事情,有人将其归结于命运,有人怨天不公愤世嫉俗,还有人常常总结归纳各种各样的“人生经验教训”。其实呢,这三种人都错了。这三种人是一种人。我们所有人都是这种人。我们所有人都会犯这些错。
这三种错误,简单可以总结为,信命,怨命,和“算”命。这里的算命,是指广义上的“试图给不合常理的事情做出解释”。比如,聪明姑娘嫁的那个笨老公,一定有其他过人之处。比如,校花过得惨,肯定是性格不好特别“作”。比如,书香门第的逆子,肯定是因为母亲忙于事业没有给他关注和爱。
我们每天都在给自己讲这种故事。脑补那些“奇葩”事件的理由。论坛上也充斥着各种分析贴,八卦贴,教育他人贴。我自己年轻时候也写过不少这种东西。想想真是惭愧。
那么为什么我们会脑补这些理由呢?很简单,我们的大脑的天性就是“因果脑补机”。因果脑补,是除了食欲和性欲之外,大脑最大的最难以压抑的冲动。
我们的冲动,都是为了生存所设计的。旺盛食欲让我们能迅速积攒营养能量。勃发性欲能让我们广泛传播基因。因果脑补能让我们躲避危险。想象一下远古人类,你的老祖宗看见一片草在动,而后出来一只大老虎。下一次,只要他看见草在动,是马上推断一定有老虎,赶快开始跑安全点呢?还是根据概率理性思维,告诉自己“草和老虎没有必然联系”,更安全点呢?
所以读者要问了,你凭什么说上面这些事情没有必然因果关系呢?凭什么说我们琢磨出来的这些原因是错的呢?那就要讲到今天的第二个概念了,回归平均(regression towards the mean)。虽然这是挺深的统计学原理,但是解释起来其实非常简单——当两个变量A和B的相关度不是100%的时候,其中A的值远超于人群平均水平,那么B几乎完全不可能也达到A的水平。
而这个宇宙中,100%相关的两个变量几乎不存在。事实上,在人口基数足够大的社会中,跟人有关的两个变量,能有30%-40%的相关,就是极其强极其显著的相关了。诺贝尔经济学奖得主Daniel Kahneman在书中说,一个极其优秀的所有决策都正确的CEO,和他带领的创业企业是否最后能成功,之间的相关度只有30%。他在书中叹息说,这个世界,远比我们想象的混乱和随机。
总结来说,企业的成功,爱情的建立,孩子人格的形成,健康和长寿,都是非线性随机动态系统。被相当多的因素所操控,单一因素能有30%-40%相关性就相当厉害了。
因此,即便妻子智商和丈夫智商的相关度能达到30%,那么一个聪明姑娘会有60%的概率找到一个聪明的丈夫,也有40%的概率找到比较笨的丈夫。他也许没有过人之处,就是恰巧两人在某时某地某刻相遇相爱,完全随机。
假如人的外貌和财富的相关度是30%,那么美女也有40%的概率没上财富平均线。也许她没有任何顽劣的性格,只是在人生增加财富的几次机会下,没看清楚,随机地做了些当时她认为对的决定。当然,在我们这些马后炮眼里看来,事后来指点她的错,简直没法更容易了。
还有,假如优秀的母亲和优秀的儿子的相关度是30%,一个尽心尽力殚精竭虑的母亲,也有40%的可能性养出个惹事的熊孩子。也许说出这句话,会让很多家长气得想扔我石块,一大群粉丝想把我拉黑。但是别着急,我并不是让您放弃教育自己的孩子。我是想让您放下心理的包袱。不要在孩子成绩不好的时候,往地上一坐就开始大哭,捶胸顿足责怪自己,老娘到底造了什么孽?您也许一点错也没有,一时熊,也不一定一世熊,及时调整策略,尽人事,听天命便好。
同样,人生的成功和学历的相关度,也可能只有30%。所以不要在事业不顺的时候迎风流泪,问为啥当年学习最差的同学却成了亿万富翁。
最后,在爱情中,一个人为他人付出真心,和得到他人的爱,相关度可能还不到30%。也就是说,你爱一个人,和他也爱你,几乎可以认为是两个完全随机事件。所以啊,想想我们这些愚蠢的人类,为了个随机事件,失眠,暴食,发疯,纠缠,想不开,一遍遍问为什么,也是有点醉。
话说这么多,道理很简单。调整心态和欲望,如大禹治水,不在于堵,在于疏导。要减肥,就得正确认识自己的食欲,顺势而为。要成为不耍流氓的文明人,就得正确疏导性欲。同样,要保持一个好的心态,认识到世界的随机,就要先承认我们的大脑中过度的“因果脑补”。
当你用德智体美劳,才貌文武,家庭事业,智商情商,儿女双全,福寿安康,眼睛眉毛五官,腿有多长胸有多大肚脐眼是不是长得圆……等等一万条并不100%相关的指标,来衡量自己或者他人的时候,就是制造烦恼和麻烦的时候。特别像我前面提到的,当一个人某个指标(例如外貌)远远超于平均,那么几乎可以保证,她总有其他指标低于平均。这就叫“回归平均”。因此,你说你拿着放大镜,找自己的缺陷,找别人的缺陷,再嘲笑,再鄙视,再感慨一番,有意思吗?
人有悲欢离合,月有阴晴圆缺,并非是凄凉之事。在这个混乱随机的宇宙中,本来就没啥可信命,没啥可怨命,没啥可算命。只有一条自然规律,此事古难全。(编辑:游识猷)
如果两个特别矮的爹妈生了个比他们都高的女儿,或者一对特别高的父母生了个比他们都矮的儿子,很可能矮父母并没有特别做对什么,高父母也没有做错什么,一切只是因为回归平均而已。


— THE END —


清华教授教你:如何做出好的文献综述
编程语言大牛王根:编程的智慧(上)我,斯坦福AI读博,李飞飞是师娘,5年5篇顶会论文,依然一度抑郁怀疑人生82岁江泽民在2008年发表论文指出:发展智能化,机器学习将有所作为……李德毅院士:通用人工智能十问每个程序员都必须知道的8种通用数据结构

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存