用数学思维 做正确决策
▍传染病的数学规律
事实上,隔离这种手段并不是这次新冠肺炎大流行才发明出来的,也不是针对病毒传染病设计的。在人类文明早期,当人类的祖先们意识到传染病存在的时候,就已经下意识地采取某些隔离措施保证自己的安全了。
隔离这个古老的手段发挥功效,根本不需要考虑传染病本身到底是什么病原体引起的,也不需要知道这种病原体有什么特性。只要是传染病,隔离就能起效。因为它的工作原理,其实就是传染病的数学规律。
▍巴尔的摩股票经纪人
买就上当了。因为若每轮赛马有 10 匹马相争, 此人要做的就是找 100 个赌马者的电话, 逐个打去, 对前 10 人预测第 1 匹赢, 对接下来的 10 人预测第 2 匹赢…… 第一轮结果出来后再逐次向蒙对的 10 人预测下一轮, 对第 1 人预测第 1 匹赢, 对第 2 人预测第 2 匹赢……
▍粗暴线性回归法
2005年10月底,恐怖袭击让1074个以色列人死亡,7520人受伤。对以色列这样一个小国而言,这两个数字已经大得惊人了,按照比例换算,相当于有5万个美国人死亡,30万个美国人受伤。
176年前,下密西西比河在凯罗与新奥尔良之间的河段长1215英里,经过截弯取直之后,缩短为1180英里,之后在美洲湾取直,缩短为1040英里,再后来,这个河段又缩短了67英里。也就是说,在176年的时间里,下密西西比河缩短了242英里,平均每年缩短一又三分之一英里,因此,只要不是瞎子和白痴,我们就不难推测出,再过742年,下密西西比河将只剩下不到两英里长。
这里,马克·吐温就用到了线性回归法,得出结论是下密西西比河会不断缩小,看起来还蛮有道理的,但真的会是这样吗?
▍消失的弹孔
二战的时候,军方给一个牛人无数的数学小组(包括控制论创始人维纳、诺贝尔奖得主弗里德曼),出了一道数学题:为了不让飞机击落,需要给飞机装上装甲,但装甲会使飞机性能减弱,怎样找到一个平衡点?军方说,在返航的飞机上,机身上的弹孔比引擎上的弹孔更多。
在这个牛人无数的小组里,天赋最高的不是诺贝尔奖得主们,而是一位叫瓦尔德的。瓦尔德给出的答案跟军方最初的想法不一样,他认为,需要加装装甲的恰恰是弹孔少的地方。
瓦尔德说,需要加装装甲的地方不应该是留有弹孔的部位,而应该是没有弹孔的地方,也就是飞机的引擎。瓦尔德的独到见解可以概括为一个问题:飞机各部位受到损坏的概率应该是均等的,但是引擎罩上的弹孔却比其余部位少,那些失踪的弹孔在哪儿呢?
瓦尔德深信,这些弹孔应该都在那些未能返航的飞机上。胜利返航的飞机引擎上的弹孔比较少,其原因是引擎被击中的飞机未能返航。大量飞机在机身被打得千疮百孔的情况下仍能返回基地,这个事实充分说明机身可以经受住打击(因此无须加装装甲)。
如果去医院的病房看看,就会发现腿部受创的病人比胸部中弹的病人多,其原因不在于胸部中弹的人少,而是胸部中弹后难以存活。
数学上经常假设某些变量的值为0,这个方法可以清楚地解释我们讨论的这个问题。在这个问题中,相关的变量就是飞机在引擎被击中后不会坠落的概率。假设这个概率为零,表明只要引擎被击中一次,飞机就会坠落。
那么,我们会得到什么样的数据呢?我们会发现,在胜利返航的飞机中,机翼、机身与机头都留有弹孔,但是引擎上却一个弹孔也找不到。对于这个现象,军方有可能得出两种分析结果:要么德军的子弹打中了飞机的各个部位,却没有打到引擎;要么引擎就是飞机的死穴。这两种分析都可以解释这些数据,而第二种更有道理。因此,需要加装装甲的是没有弹孔的那些部位。
美军将瓦尔德的建议迅速付诸实施,我无法准确地说出这条建议到底挽救了多少架美军战机,但是数据统计小组在军方的继任者们精于数据统计,一定很清楚这方面的情况。
美国国防部一直认为,打赢战争不能仅靠更勇敢、更自由和受到上帝更多的青睐。如果被击落的飞机比对方少5%,消耗的油料低5%,步兵的给养多5%,而所付出的成本仅为对方的95%,往往就会成为胜利方。这个理念不是战争题材的电影要表现的主题,而是战争的真实写照,其中的每一个环节都要用到数学知识。
瓦尔德拥有的空战知识、对空战的理解都远不及美军军官,但他却能看到军官们无法看到的问题,这是为什么呢?根本原因是瓦尔德在数学研究过程中养成的思维习惯。从事数学研究的人经常会询问:“你的假设是什么?这些假设合理吗?”
▍幸存者偏差
对于数学家而言,导致弹孔问题的是一种叫作“幸存者偏差”的现象。这种现象几乎在所有的环境条件下都存在,一旦我们像瓦尔德那样熟悉它,在我们的眼中它就无所遁形。
以共同基金为例。在判断基金的收益率时,我们都会小心谨慎,唯恐有一丝一毫的错误。年均增长率发生1% 的变化,甚至就可以决定该基金到底是有价值的金融资产还是疲软产品。
晨星公司大盘混合型基金的投资对象是可以大致决定标准普尔500 指数走势的大公司,似乎都是有价值的金融资产。这类基金1995~2004 年增长了178.4% ,年均增长率为10.8% ,这是一个令人满意的增长速度。如果手头有钱,投资这类基金的前景似乎不错,不是吗?
标普500指数
事实并非如此。博学资本管理公司于2006 年完成的一项研究,对上述数字进行了更加冷静、客观的分析。我们回过头来,看看晨星公司是如何得到这些数字的。2004 年,他们把所有的基金都归为大盘混合型,然后分析过去10 年间这些基金的增长情况。
但是,当时还不存在的基金并没有被统计进去。共同基金不会一直存在,有的会蓬勃发展,有的则走向消亡。总体来说,消亡的都是不赚钱的基金。因此,根据10年后仍然存在的共同基金判断10 年间共同基金的价值,这样的做法就如同通过计算成功返航飞机上的弹孔数来判断飞行员躲避攻击操作的有效性,都是不合理的。
如果我们在每架飞机上找到的弹孔数都不超过一个,这意味着什么呢?这并不表明美军飞行员都是躲避敌军攻击的高手,而说明飞机中弹两次就会着火坠落。博学资本的研究表明,如果在计算收益率时把那些已经消亡的基金包含在内,总收益率就会降到134.5% ,年均收益率就是非常一般的8.9% 。
《金融评论》于2011 年针对近5000 只基金进行的一项综合性研究表明,与将已经消亡的基金包括在内的所有基金相比,仍然存在的2 641 只基金的收益率要高出20% 。幸存者效应的影响力可能令投资者大为吃惊,但是亚伯拉罕·瓦尔德对此已经习以为常了。
▍回归平均值
你有没有发现一个现象,一对极度聪明的父母所生的子女表现稀松平常,完全没有他父母一半的成就。这里面是有什么原因吗?
大家可以从各个方面入手,也许是教育,也许是机会,也许只是时代变了。但是如果我们从数学角度来看,这种现象是完美的数学呈现,这是数学的“回归平均值”概念。什么是回归平均值?它指的是,只要研究对象受到随机性的影响,就会发生回归平均值的现象。
最先发现这个理论的是19世纪的英国科学家高尔顿。他有个愿望,要把遗传问题量化。首先,他从父亲与孩子的身高入手,因为这是组比较容易采集的数据。他拿出一张白纸,用尺子画出坐标轴,横轴表示孩子的身高,纵轴表示父亲的,每一对父子在坐标图上就是一个黑点。他在收集了大量的数据之后,发现了“散点图”。
如果孩子的身高完全取决于父亲的身高的话,这张图就会变成一条直线。如果孩子的身高与父亲毫无关系,那么我们会得到一章杂乱无章的图,充满了随机的小黑点。
实际上,高尔顿得到的既不是直线图,也不是杂乱无章的图,而是一张散点图,也就是说,它呈现出一个近似椭圆的形状,其中心对应的就是父母与孩子正好都是平均身高的那个点。也就是说,不管父母的身高是高是矮,大数据表示,孩子们的身高都是逼近普通人的身高,也就是回归平均值的。
他在1889年《自然的遗传》一书中是这么总结的:我认为,从整体情况看,成年子女的身高与他们的父母相比更趋于平均水平。所以如果你个子很矮也不必担心,因为你的后代是有很大可能会达到正常人身高的。
那我们到底还受不受遗传学的影响呢?高尔顿发现,遗传还是影响我们,但是通过相关函数发挥作用的。高尔顿的椭圆形有胖有瘦,如果离心率大,则意味着遗传因素的作用大,椭圆形就胖,回归平均值的作用小,相反的话,回归平均值就起到了决定性作用。
高尔顿把这个量称为“相关函数”。高尔顿就此推论,不仅身高,人们的智力水平肯定也会如此。不管父母的智商如何高,后代不可能永远聪明下去,他们必然受到回归平均值的影响,成为普通人中的一员。
这一理论后来被大数据的分析证明了,事实上,生活中随着时间产生变化的任何东西,几乎都会受到回归效应的影响。
那么现在你明白了吗,一位作家在他的第一部小说成功之后,第二部作品受欢迎的程度往往会下降,这不是、至少不全是因为大多数艺术家的能力只是昙花一现,而是因为艺术家跟所有人一样,他们的成功是天赋与运气共同作用的结果,也会受到回归效应的影响。至于影响到什么程度,那要看他的才华和运气之间的相关函数了。
▍彩票能不能买
前九百九十九万九千九百九十九次的价值为零,而只有千万分之一的价值为600万美元,千万分之一,乘以六百万,为60美分,这就是这个彩票的期望值。也就是它的获奖价值。
数学作为一门基础学科,在当今时代乃至未来世界,已经是颠覆想象般的重要。数学工具,能让我们更好地了解这个世界的结构和本质。
数学知识分为四类,一类是浅显而且简单的,比如我们小学学的算术;一类是浅显但是复杂的,比如多位数的乘法;第三类是职业数学家的领域,是复杂而且深奥的,比如数论;最后一类是深奥但是简单的,这才是我们普通人需要关注的数学思维,比如不确定性、线性回归谬误、37%法则、回归平均值等等。
艾伦伯格《魔鬼数学》:如果你没有爱上数学,大概是因为没有早点遇到这本书。本书带领我们踏上了一段精彩绝伦的数学思维之旅:它可以磨练我们的直觉,让我们的判断更敏锐,它还可以驯服不确定性,让我们更深入地了解世界的结构和逻辑。
克莱因《数学简史:确定性的消失》:本书再现真实数学的发展过程,它不但是一本数学史,更是一部思想史。揭示了数学的起源,现在与未来。这本书更是一部真正的史诗,全书基本没有一个公式,却把数学史讲得明明白白作者是20世纪最后一位数学史大师。豆瓣评分9.2。
用数学思维,避免掉入错误的陷阱。识别下图二维码,即可一键收藏。