查看原文
其他

萝卜共读|《噪声》:人类判断的缺陷

哪里有判断,哪里就有噪声


 点击收听 主播 流年  温情朗读 | 制作  子

你是否听过这样的故事?有人身体不舒服去医院检查,第一家医院大夫说得了某某病,去另一家医院,医生却说得了另一种病,同样的症状却得出了两个不同的结论。

又或者,在鉴宝节目中对同一件古董,有的专家说价值连城,有的专家却说是一文不值。为什么他们的判断会有这么大的不同呢?这其实你就在见证噪声的出现,也就是这本书要讲的主题。

本书的作者一共有三位,其中最主要的一位就是大名鼎鼎的丹尼尔·卡尼曼,以色列裔,美国心理学家。卡尼曼是诺贝尔经济学奖得主,他的上一本著作还是2011年出版的《思考快与慢》,这本书堪称行为科学领域的里程碑式著作。

卡尼曼十年磨一剑,在2021年推出了新书《噪声》,有卡尼曼这样一位高人在,另外两位作者自然也不简单,其中一位叫奥利维耶·西伯尼,他是巴黎高等商学院教授,曾在全球最大的战略咨询公司麦肯锡公司担任资深合伙人长达25年。另一位作者是卡斯·桑斯坦,他是哈佛大学教授,专门从事政策制定的相关研究,以前是美国白宫信息与监管事务办公室主任。

这三位凑在一起,他们既有理论功底又有实战经验,可以说代表了当今世界对行为决策领域研究的最高水平,有如此的作者阵容,这本《噪声》自然不可小觑。

在本书中文版的推荐序中,清华大学社会科学学院彭凯平院长就评价道,卡尼曼的这本新作读起来令人兴趣盎然,心潮澎湃。

纽约时报更是评价本书是一部杰作。这本书共分为六个部分,前三个部分解释了不同类型的噪声,第四部分剖析噪声是如何产生的,最后两部分则给出消除噪声的方法。

作者将理论与实践相结合,用丰富的实力来进行论证,帮助读者在工作与生活中做出更好的判断和决策。

▷1◁

什么是噪声?


人在做判断时往往会出现错误,按卡尼曼所说,这些错误来自两方面,一种叫偏差,另一种就是噪声。在测量或判断中相对于正确值来说,偏差是朝同一方向的偏离,而噪声则是无规律的误差变异。

当然,这么说就太学术了,咱们该怎么理解这两个概念?这里有一个小例子,假如你很关心自己的体重,每天早上都会在体重秤上量一下,但是这个秤有点不准,它显示的数字其实比实际重量轻了一斤,所以你心里有数,平均来说要加上这一斤误差才是真实的体重。而这一斤就是偏差,也就是你这个体重秤的平均误差。

有时候当你快速连续踩上两三次的体重秤时,你会发现读数并不完全一样,显示的数值往往会上下波动,此时出现的误差就是噪声了,它的大小是随机变化的,时而高出准确值时而又低于准确值。

如果你还是没太理清偏差和噪声的区别,咱们来举一个书中的例子,说是有ABCD四个人在射击打靶,结果发现,A全都命中靶心,而B的子弹全都打偏了,但是偏的方向是一样的,全都集中设在靶子左下方。

此时我们可以说B的偏差比较大,而C射出的子弹在靶子上到处都是,但整体上是以靶心为中心的一种均匀分布。对于C来说,它就是偏差很小,但是噪声很大。而最后一个D它射击是又偏又分散,也就是偏差和噪声都大。

我们再来仔细对比一下B和C,B的射击都集中偏到了一处,可能是吧B的瞄准器歪了,造成每发子弹都偏向了同一位置。也就是说偏差的出错方向是一致的。而C的子弹是散落在很大范围中,可能的原因是C的手抖,所以每次开枪时弹道方向都不同,于是在结果上出现了很大的噪声。

无论是量体重还是打靶子,在多次行动的结果中偏差带来的错误是一致的,稳定的。而噪声却是随机的分散的,这是二者本质区别。

在《思考快与慢》中,卡尼曼着重介绍的就是偏差对人们决策的影响,而这本新书中他则瞄准了噪声这个部分。

在书中,卡尼曼给出的一个结论是:对错误来说偏差和噪声的贡献是相同的。换句话说,要想减少我们的判断错误,既要克服偏差也要降低噪声。

当然,噪声的概念还有更为深刻的内涵,虽然它是随机的分散的,但如果仔细研究的话,其实噪声还可以分出不同的类别,分别是水平噪声、模式噪声和情景噪声。

为了更好的理解这几种噪声的不同,书中介绍了一个来自美国司法体系的故事。在美国的司法判决中,法官在案件判罚中有着很大的自由度。人们普遍认为,如果法官太对规定束缚,可能会做出一些对罪犯不人道的惩罚,然而这种高度的自由真的能带来公平吗?

在书中提到了这样几个例子,有两起类似的挪用公款案件,在不同的法官手中一人被判监禁117天,而另一个被告则被判了20年。

更夸张的一个案例是有两名男子都是使用假支票被抓,他们涉案金额分别是35美元和58美元,第一个人被判了30天监禁,而第二个则被判了15年。

有人会说这些都是个例,可能是一些极端情况。为此,有学者做了一次系统的研究,他们找来了50名来自美国不同地区的法官,让这些法官分别审理20起虚构的案件,每位法官拿到手里的资料是完全相同的,但是审判的结果却出现了巨大的差异。对于20起案件中的16起,法官们都无法给出一致的意见。

同样是贩卖海洛因,毒贩的量刑有的是1年,也有的是10年。对于敲诈勒索,有的法官给出的量刑是20年有期徒刑外加65,000美元罚款,而有人只给出了3年有期徒刑,还不用罚钱。总之同一案件同一个被告可能会因为审理法官的不同而导致判决结果天差地别,这就是典型的噪声。

而如果我们对这种同罪不同罚的结果进行分析,会发现在法官们的判决中其实出现了三种噪声:

第一种叫水平噪声,它主要指的是单个法官判罚的严厉程度跟所有法官平均水平之间的差异。有些法官不管判什么案子,都比其他人严苛,甚至有的人喜欢所有的罪行都顶格判罚。比如法律规定3~5年的刑期,他就一律判5年。而有的法官则是比较仁慈,不管判什么案子都会从轻发落。于是让不同的法官来审理同样的案子,所得到的量刑结果自然参差不齐。

第二种叫模式噪声,这种噪声可以理解成一种个人的特别偏好。有的法官虽然整体很严格,但对年轻的罪犯更宽容。有的法官虽然大多时候很宽容,但是却可能非常讨厌那些诈骗老年人的罪犯,或者愿意给家暴者更严厉的判罚。

对比一下这两种噪声,水平噪声说的是法官的平均表现与整个行业的差别。模式噪声则可以理解成他对某类罪犯的判罚跟他个人原有风格之间的区别。

而第三种噪声叫做情境噪声,这种噪声来自于无法预料的环境因素。比如如果天气晴朗,法官会比较放松,相应就会减轻一些量刑。又或者如果法官喜欢的球队昨天输了比赛,今天他的判罚可能会更严格。

我们在这里虽然说的是美国法官们的例子,但类似的情况会出现在各行各业中。无论是通过X光片诊断病情的医生,还是给应聘者打分的人事主管,亦或是商讨是否要收购公司的高管,人们只要是作出判断,就不可避免的会出现噪声。

除了带来同罪不同罚的这种不公平现象,噪声还会直接产生经济损失。像是在保险行业中,不同保险经理测算的保费相差巨大,这之间的差异甚至可能会高达55%。有人估算这种噪声的存在会让保险公司每年损失几亿甚至几十亿元。

好,我们先来简单总结一下这部分内容。人类的判断错误源自偏差和噪声,偏差是系统性的,噪声则是分散的,二者同样重要。而噪声可以进一步分成水平、噪声、模式噪声和情境噪声,而且噪声的危害巨大,人类社会必须正视这一问题,自然而然的我们就要问,那么,这些噪声是怎么产生的呢?

▷2◁

噪声是怎么产生的?


噪声的来源很广泛,比如,做判断者本身的无知,判断流程设计的不合理,甚至连情绪变化都会引起噪声。

对于我们日常生活中有三类噪声来源最为常见,分别是:信息的局限,个人认知的局限以及群体效应。

先来说说信息的局限,这主要体现在两点:

第一个是信息数量是有限的。简单来讲,就是我们不可能掌握事情的所有细节。

第二点是信息的复杂性。这是说在我们掌握的信息中会有很多模糊甚至自相矛盾的线索,使得我们无法做出准确判断。

为了弄懂信息的这些局限,咱不妨来玩一个小测试,想象有这样一个人,他叫张三,在4岁时张三就能背诵唐诗了。那么,请问你觉得张三的高考成绩是多少呢?听到这个问题,也许你脑子里会快速蹦出一个数字,这个数字大概率是600~650左右,那么大脑是如何做出这个判断的?

首先你可能会评估一下张三的聪明程度,4岁就能背唐诗,确实是挺聪明的孩子。但在你心中的某个聪明程度的量表上,这种表现似乎还不够判断成最顶尖的天才。毕竟你可能还听过三岁跪下围棋,5岁能说多门外语这种更传奇的神童故事。所以对于张三你只能给出一个挺聪明,但不是特别天才的评价。

有了这个判断,你再思考起高考成绩满分750分,如果顶尖的学生是700分左右,那么张三这种第二梯队的聪明程度可能就是600~650分左右的成绩。就这样你在大脑里迅速完成了这种匹配过程,并对张三的高考分数作出了判断。

其实从统计学的角度,人在小时候的聪明程度跟他的高考成绩相关性很小。我们心里也都清楚,单凭张三在4岁的表现,这种简单信息不可能给出精准判断。当我们决定要回答这个问题时,就已经注定了结果会充满噪声,这就是信息的有限性,它是无法避免的。

那么,你可能会说再多给点信息判断是不是就能改善一些了。好,咱们再来补充几条张三的情况。比如他10岁时父母经历了不愉快的离婚,12岁时沉迷游戏,开始荒废学业,幸运的是张三在高二时碰到了一个特别负责的老师,让他再次认真对待起了学业。

如果又加上这么多信息,再让你来评估一下张三的高考成绩,你该怎么判断?此时你可能就有些懵了,因为对于张三你最开始在心中构建的形象出现了不协调,虽然他十分早慧,但是家庭因素却是个负面影响。虽然错过了最黄金的学习时光,但后来碰到的优秀老师似乎又让他重新回到正轨。

这就体现了信息的复杂性,对于同一个人的评价,信息并不兼容,甚至相互矛盾,从而会带来截然相反的分析结果。在真实世界中张三这样的故事到处都是,多数问题远比判断学生的高考成绩还要复杂。而面对这种问题,我们能获得的信息十分有限,关键是这些信息往往还是相互矛盾的。

第三个是个人的认知局限。于这种局限作者给出了一句精辟的描述,那就是:

人们会选择不同的证据碎片来构建自己的故事,从而得出不同的结论。

再次回到张三的例子,有的人从中看到了张三父母离异,可能会想到自己的某个亲戚,也是因为家庭不和,使得学习成绩一落千丈。于是,他在预测中就会强化原生家庭的负面影响,从而评估出张三的高考并不理想。

另一个人在看到张三的故事后,可能想起来自己的高中老师在老师的鼓励下自己才考出了好成绩,那么他就会不自觉的提高老师对成绩的影响权重,从而上调自己的预测分数。

就这样同样的信息给到不同人就得出了不同的判断结论,这其中就出现了噪声。

除了上面说的那些噪声来源,人们在做判断时会受到其他人的影响,出现所谓的群体效应。而在分析群体决策的噪声时,作者着重提到了一种叫做信息级联的现象,级是级别的级,联是联合的联。

在信息级联中噪声会被放大。那么什么叫信息级联呢?咱们就举一个开会的例子,这个例子初听起来可能会有点绕,但是一旦你带入自身的经验,说不定就能立刻搞懂这里面的门道。

咱们可以想象由一群公司高管坐在一起讨论新的总经理人选。候选人有两个,分别叫张三和李四。会议正式开始,这群高管开始按顺序发言了,A先开了口,他认为张三是最佳人选。第二位发言人是B,他知道了A的判断,如果他也认为张三合适,那么他就会支持A。如果他还不确定两位候选人谁更合适,那么他出于信任A的原因,同样也会支持张三。

好了,现在轮到C了,此时的C除非有特别强力的证据说李四更合适,否则他只会去附和前面人的观点。如果发生了这种情况,并不是说C是一个懦弱的人。咱们可以带入到C的身份去想一想,C也许会觉得可能A和B有一些关于张三和李四的特别信息,他自己不知道,于是他的理性决策就是跟随A和B的意见。此时C其实就处于了一个信息级联之中,出于类似的考量,后面其他人的发言也会越来越倾向于选张三。

这个例子的诡异之处在于A的最初判断,很可能也只是根据一些有限的信息做出的,但是他的发言开启了这么个信息集连的过程,其他人被引导进入了其中,后面发言的人对张三可能根本没有任何看法,甚至有人认为张三不是最佳人选,但最终结果仍然是所有人都选择了张三。就是说最开始的噪声经过信息级联,而在群体中被进一步放大,从而产生了错误决策。

这里要注意一下,信息级联跟咱们平常说的从众行为还不太一样,从众描述的是为了获得在集体中的安全感而去做大多数人都在做的事。这种行为可能并不理性,而在一个信息级联中,其实每个人都是比较理性的,他们各自根据所了解的信息给出了最适合自己的判断,只不过全体所作出的最终决策却把噪声放大了。

好,让我们再回顾一下关于噪声来源的这部分内容。在面对复杂问题时往往出现相互矛盾的线索,而人的认知能力也有局限,他们会选择不同的证据碎片来构建自己的故事,从而得出充满噪声的判断。在此基础上,随着更多人参与到决策中,会进一步将噪声放大,从而出现群体效应,使得判断出现更大的错误。

既然噪声问题有这么大的危害,我们又对噪声的来源有了一定的认识,那么就能对症下药来减少噪声。

▷3◁

如何减少噪声?


针对不同的场景和需求,作者在书中介绍了很多种降低噪声的方法。不过作者着重说明,虽然从统计学上讲,减少噪声可以避免许多错误,但你可能永远也不知道到底避免了哪些错误。

这就好比当你洗手时,你不知道自己到底在预防哪种细菌感染,你只知道洗手是预防疾病的好方法。作者还将减少噪声的策略称为决策卫生,就是想提醒我们,如同要保持个人生理卫生一样,我们在做判断时也要尽量保持决策卫生,在各种错误发生之前对其进行预防。

在此我们将重点介绍其中三种对个人生活可能最有帮助的方法,分别是改进认知风格,使用规则算法以及多人独立判断。

第一条改进认知风格,具体来说就是要保持开放心态和不要匆忙下结论。首先是开放心态,这种心态最典型的特征就是能坦然接受与原有看法不一致的新证据。

2011年一项研究招募了数万名志愿者,让他们对几百个问题进行预测。这些问题主要是一些国际大事,包括“未来一年会有国家脱欧吗”之类的问题。

在随后的日子里,因为会议不断有新的情况发生,所以也允许志愿者对原来的预测进行修改。即便如此,经过后来的验证,绝大多数志愿者的预测水平都很糟糕。但是,仍然有大约2%的人,他们的表现要远超常人。

这些超级预测者们虽然都是各行各业的普通人,但他们的预测能力甚至超过了专业机构分析师们的平均水平。对这些超级预测者进行观察,研究者发现他们的思维方式中确实有着独到之处,而其中最主要的就是他们能够运用积极的开放性思维,也就是保持开放心态。

这些超级预测者们不会认为改变原来的想法是一种懦弱的表现,他们会不断吸取新的观点和意见,来对自己的预测进行升级和改进,从而实现了远超常人的预测准确度。

此外作者还指出,能做出优秀判断的人也不会过于匆忙的给出结论,他们在做出一个判断后会迅速反思一下,看看自己有没有出错,从而抑制自己下结论的冲动。

有一种叫做认知反射测试,可以用来评测人们的这一品质。咱们也可以来试试看。下面请回答这个问题:在赛跑中你超过了第二名,你现在是第几名?很多人会脱口而出第一名,但其实暂缓一下说出答案,稍微回过神来就会发现超过第二名,你现在还是第二名。

这种认知反射能力简单来说就是咱们常说的三思而后行。总之,保持开放心态,不匆忙下结论,是我们个人能够减少噪声的良方。

当然,人的能力终归是有限的,为了对抗噪声,作者认为最高效的一种手段,也就是第二条,是把判断过程交给算法或者规则。这里所说的算法既可以是简单的公式,也可以是复杂的人工智能。

作者指出,哪怕是最简单的算法模型,在克服噪声方面都比大部分人表现优秀。在一项来自2020年的研究中,学者们关注了法官是否应该批准被告的保释申请这个问题。如果错误的拒绝保释申请,那么被告可能会遭受不必要的羁押,反之如果错误的批准了保释,那可能给嫌疑人逃跑甚至二次犯罪的机会。

而对于这个问题,研究者只用了两个参数来构建模型,他们分别是被告的年龄和未按时出庭受审的次数,因为年龄越大,逃脱风险越低,而不按时出庭的人可能法律意识更薄弱。

总之,用这两个参数构建了一个简单的算法,来对被告的保释风险进行评分,计算十分方便,甚至不需要使用计算器,所得出的判断准确性却几乎比所有法官都要好。

不只是在司法界,在医学领域,比如判断肿瘤严重程度,心脏病风险,新生儿健康状况等方面,使用几个参数的简单模型所得出结果都要优于大部分专家的判断。

另外,制定规则对减少噪声帮助同样很大,为了限制法官量刑时过大的自由权利,1985年美国量刑委员会通过分析1万起真实案件中罪行的平均刑期,制定了一部量刑指南。

根据罪行的严重程度,指南将罪行分成了43个等级,并对每个等级的判罚都给出了具体的量刑范围。当然,法官的实际判罚也可以偏离该范围来加重或减轻处罚,但要向法院说明理由。

这一指南生效之后逐渐开始发挥作用。在指南刚生效时,法官之间在量刑期限长短上的差异为4.9个月,但在指南生效的三年后,这一数字下降到了3.9个月,同罪不同罚的现象有了明显缓解。不过,这个量刑指南还是遭受了猛烈的抨击,一些法官认为指南妨碍了他们充分考虑案件的具体情况。

在2005年美国最高法院取消了指南的强制性,而只把它作为一种建议来使用。随后有研究发现,在对40万起刑事被告的测量中,法官之间的量刑差异在2005年后又再次有了明显的增加。

不论是交给算法还是制定规则,说白了就在决策中尽量降低人的参与程度,从而最大可能的降低噪声。

而咱们提到的第三种降低噪声的方法却反其道而行之,就是要多人参与。

第三种方法就叫做多人独立判断,重点在于独立二字。先来听一个真实的故事,体会一下独立判断的重要性。2004年,在西班牙首都马德里发生了炸弹恐怖袭击,造成了2000多人的伤亡。警方在犯罪现场发现一枚指纹,并立刻将它发送给了世界各地的执法机构。

几天后,美国联邦调查局也就是FBI,确认了这枚指纹属于一个叫做梅菲尔德的男子,他目前居住在美国俄勒冈州,随后FBI在没有实质证据的情况下逮捕了他。

结果,几天后西班牙警方就通知美国方面说是根据指纹已经找到了真正的罪犯,梅菲尔德跟这个案件毫无关系。两个星期后梅菲尔德获释,美国政府向他道歉并赔偿了200万美元的和解费。

这个例子相当不可思议,美国有着世界最先进的司法检测技术,为什么还会在这样的大案中犯下如此的错误呢,这就要从指纹的鉴定流程中寻找答案。

警察利用指纹对比来锁定嫌疑人,这项技术已经出现了100多年。再想想我们平常用指纹解锁手机出国登机也要验证指纹等,几乎没有人质疑过指纹的可信度。但是,日常中用到指纹时会使用专业设备来采集指纹是清晰且完整的,而从犯罪现场提取的指纹往往是残缺的,甚至还会被污染,此时就要靠经验丰富的专家来进行判断。

正所谓只要有判断就会有噪声,2012年 FBI让72名鉴定人员再次审查他们在7个月前评估过的25对指纹,结果发现有1/10的判断需要被修改,可见司法鉴定中对指纹的评估也是充满了噪声。

在梅菲尔德案件中有三名人员对这个指纹进行了鉴定,不幸的是第一位鉴定人员作出了错误的决定,而恰巧他又是一位德高望重的鉴定官,后面的两位鉴定人员预先知道了第一位的结果,于是也就都认定了指纹属于梅费尔德,从而铸成了大错。

经过这样的教训,美国政府对指纹鉴定的司法流程进行了重新设计。现在的司法实验室中,鉴定人员鉴别指纹时,他们不会提前得知任何关于嫌疑人的信息,而在第二名鉴定者进行核实时,也不会知道第一位的判断结果,从而在角色中增强了判断的独立性。

越多人参与到独立判断过程,就越容易得出水平更高的结果。作者在书中就给出过一个数学证明,从统计学的角度来说,如果取100个独立判断的平均值,那么将减少90%的噪声。如果对400个判断取平均值则可以减少95%的噪声,基本上就消除了噪声。所以,这种基于独立性的多人判断就能形成群体智慧。

好,让我们总结一下减少噪声的这几种方法。首先是改善我们自己的认知方式,一个开放心态来做出决策判断。而在个人能力有限的问题上,最好能借助算法规则和群体智慧。

▷4◁

总   结


当然,只要有判断就会有噪声。作者也承认噪声问题是不可避免的,特别在有些领域对抗噪声所要付出的成本也太过高昂。

即便如此,我们还是要正视噪声的存在,并且尽量学会运用科学方法来降低噪声的影响,从而让个人、企业和政府做出更优质的决策判断。
- The End -
主播简介:流年,河北省朗诵协会会员,有声平台主播。一个用声音温暖心灵,用真诚拥抱生活的朗读人。
图片声明:文章配图来自网络,版权归原作者所有。

科普系列讲座 | 往期音频精选    

  1  《双相情感障碍的诊疗》

  2  《自我认识与自我接纳》

  3  《让孩子成年又成人:避免过度养育》

  4  《焦虑与焦虑障碍 (症)》

  5  《爱的五种语言教你越爱越甜蜜》

  6  《正念疗法:穿越抑郁的迷雾

  7  《儿童抽动症的诊断与治疗 》

  8  《如何从逆境中反弹,创伤中成长》

  9  《如何与青春期孩子沟通交流》

 10 《和失眠说再见:做自己的失眠治疗师》

 11  《克服社交焦虑,实现轻松社交》

 12 《放下对自我的成见,重建自信》

 13 《分心不是错,如何提升孩子专注力》

 14 《超越原生家庭,活出全新自我》

 15 《学习树 :解决孩子学习问题新思维》

 16《四步拯救情绪崩溃,摆脱情绪控制》

 17《婚姻中的挑战,如何更好应对》

 18《告别拖延症,掌控自己的人生》

 19《用父母的大格局,筑最好学区房》

 20《自我训练:摆脱焦虑抑郁恶性循环》

 21《赞美与责备:评价如何影响我们》

 22《正面管教:抚养孩子的黄金法则》

 23学会真倾听 :轻松与所有人沟通》

 24《父母老后难相处 子女如何和谐相处》

 25《如何减少内心冲突  实现理想人生》

 26《如何正确求助 告别求助困难症》

 27《别对我撒谎:如何识别谎言》

 28《这不是矫情,不可忽视的产后抑郁》

 29《控制愤怒:拒绝做情绪的奴隶》

 30《反焦虑思维:破解快乐生活的密码》

 31 ………


关注我们,公众号对话框发送

讲座序号(每次一个阿拉伯数字 )

即可获得讲座音频

如果您想进行更加 专业系统 的心理学习、甚至成为心咨询师,欢迎大家加入我们的心理志愿者大家庭。 9 个月,0 费用,0 基础,种子咨询师(心理科普志愿者)成长课程 ,第 8 期又开课啦……

▼ 了解更多  点击下图 ▼ 每天一小步,人生一大步
继续滑动看下一个
萝卜心理Psyrobot
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存