为什么我们看人总会有偏见?
告诉你一个好消息:万维钢老师今天携最新的《精英日课·第四季》回归了!万维钢是谁?如果你是经常在「得到」学习的同学,或者是喜欢看前沿知识新书的人,想必已经比较熟悉他了——他是一位科学作家,曾是物理学家,现居美国。在过去三年间,他在「得到」《精英日课》专栏中,第一时间和大家分享英文世界的最新好书,自然科学、经济学、心理学、商业等各个领域都有涉及,他把好书吃透后,再把其中的精华用简练易懂的语言解释给你听。
今天开始,他将继续在新一季专栏里与你一同阅读好书,吸收前沿知识。我们为你抢先选出一讲,来说说为什么我们看人时总免不了偏差。
什么是“伯克森悖论”
今天咱们说一个不怎么著名,但是应用场景很广的统计学现象,叫“伯克森悖论”(Berkson’s Paradox)。你可能没听说过这个名词,但是你肯定听说过下面的说法:关蓉蓉是一位青年女性,有过几次恋爱经历但是都没成。这一天,朋友给她介绍了一位各方面条件都很好的男子。可是关蓉蓉一看照片就拒绝了。关蓉蓉说:“我想清楚了,我要找一位性格好的暖男,可是这个人太帅了。以我自己的经验和对周围人的观察而论,长得帅的男人性格都很差。”
秦奋是研究所的业务骨干,能力一流但是有点木讷。这一次所里评职称,秦奋给全所作了个报告,但是发挥的不是很好。所长徐治功说:“我们用人要用长板,不能因为报告没讲好就让秦奋落选。以我这么多年的经验而论,不善言辞恰恰是智商高的特征。”
大学生邓豫突然对文学产生了兴趣,他决心发奋读书,通过经历虚构的故事迅速领悟人生的智慧。他向一位老师请教应该读哪些人的作品。老师说:“你应该多读一些小众的作家。以我读过这么多书的经验而论,像村上春树这种特别流行的都没啥深度。”
伯克森悖论是说,哪怕上面这些人的经验都是真的,他们从经验中总结出来的结论,也很可能是错的。理解这个悖论能消除你的一些偏见。咱们先说几个常见的,再说一个高级的应用。“ 相 关 性 ”
我们要借助“相关性”这个统计概念。经济学家曾经做过很多次的统计,长得漂亮的人的收入会更高一些。那么我们可以说,“漂亮”和“收入高”这两个特性之间存在一个“正相关”。相关性只是一种大致的关系,有些长得不漂亮的人收入也很高,但是在统计意义上,以社会总体而论,有这么一个趋势。你考察的范围,会影响你的结论
伯克森悖论的常见形式,就是如果你对两个特性有一个总体的阈值要求——这两个特性哪怕没关系,甚至哪怕原本可能还是正相关——在你考察的那个范围内,也能让你感觉它们有负的相关性。为什么很多人觉得学术水平高的人都不善言辞?跟关蓉蓉选男朋友是同样的道理。一个人要想能进入学术界,业务能力和说话能力都得有才行,而且这两个能力能互相弥补。既然已经进入了研究所,那就必然有的人水平高而不善言辞,有的人能说但是水平不算太高。但你不能说既然这个人讲话能力一般,他水平就肯定极高——也可能他两项加起来也只是勉强过线而已。一个作家要被人所知,要么他的作品特别有深度,让评论家喜欢,要么他的作品特别通俗,让大众喜欢——但这并不意味着流行的就肯定没深度,更不意味着作家只要降低深度就能流行。事实上有很多号称的严肃文学作品,虽然不流行,但是也没深度。像这样的例子有很多:漂亮的女生都不聪明,颜值高的演员都没演技,有特长的人必定有明显短板,家里条件好的大学生必定不用功……这些都是伯克森悖论导致的偏见。伯克森悖论和人们熟悉的“幸存者偏差”都属于“选择偏差”,出错的根本原因都是你统计的数据不够全面。在统计研究中,你稍不小心,就会犯伯克森悖论的错误。有一个真实的例子是这样的(2)。有人统计了因为出车祸而被送进医院急诊室的摩托车手,发现戴头盔的人所受的伤,反而比不戴头盔的人更重。难道说因为戴头盔的人开车更大胆,所以更容易受重伤吗?不一定。事实是很多戴头盔的人因为头盔的保护,而只受了轻伤,根本就无需进急诊室。你考察的其实是“身体受到的保护”和“身体受到的伤害”这两个因素——保护必须足够小,伤害必须足够大,才能让这个人进急诊室——这跟关蓉蓉关注的“长相 + 性格”是一个道理,所以你看到了不戴头盔和受重伤的假的负相关。我听到一个有意思的例子来自中国的金融业(3)。如果你在银行贷款信息中比较国有企业和民营企业,你会发现民企的效率比国企高。有的学者就把这个结论当真了。但事实上“能拿到银行贷款”是个很强的阈值,企业的“效率”和“风险担保”这两个因素必须都很好才行。国企有国家的隐性担保而民企没有,所以民企的效率必须得高才能拿到贷款——那个学者没有统计那些拿不到贷款的民企。“高分低能”可能只是错觉
最后咱们再说一个有点不容易看出来的例子:高分低能。Google是个非常善于使用统计方法的公司,经常弄个“机器学习”之类。大概是2015 年,Google把机器学习用在了自己身上,它想看看从哪些因素能判断一个员工是不是个能干的好员工。Google经常会招一些各大编程竞赛的获奖者。而机器学习发现,在编程竞赛中得过奖,恰恰是一个说明这个员工工作能力不行的因素。这不就是咱们中国人常说的“高分低能”吗?Google自己也没想明白这是为什么(4),它猜测可能是因为竞赛优胜者更善于快速解决问题,未必适合长期的项目。但是伯克森悖论可以完美解释这个现象,高分低能很可能只是错觉。一个科技博客的博主,埃里克·伯恩哈德森(Erik Bernhardsson),是这么分析的 (5):如果你考察世界上所有的人,显然编程比赛成绩和实际编程能力是绝对的正相关,能在比赛中拿奖说明你必定是个编程高手。在理想情况下,Google招人应该只看实际能力,而不管这个人是不是获奖者,那么它招到的人应该是下面这张图中红色的那些点——了解了伯克森悖论,下一次再听说涉及到能力、人品、长相、运气的各种“负相关”论断,你都应该保持戒心。
生活中有很多这样的民间智慧,比如什么“寒门出贵子”,什么“为富不仁”,什么“仗义每从屠狗辈,负心多是读书人”,什么“杀人放火金腰带,修桥铺路无尸骸”,都十分可疑。平庸的寒门子弟、遵纪守法的富人、没有英雄壮举的屠狗辈、忠诚的读书人和安享晚年的好心人,他们的新闻阈值太低,他们的事迹没有四海传扬。你必须把这些人都统计上,才能得出正确的结论。欢迎你把这篇文章转发到朋友圈,或者分享给你的亲朋好友。
最后欢迎你在留言区说一说:你的生活中,还有哪些体现了“伯克森悖论”的事?
注释1. 图片来自 Chris Wallace, Berkson's paradox Or, the danger of conditioning on a collider. https://observablehq.com/@cjwallace/berksons-paradox Dec 5, 2019. 第二张图中的红色线段是万老师画的。
2. J. D. Woodfine and D. A. Redelmeier, Berkson's paradox in medical care, Journal of Internal Medicine 16 March 2015.
3. 可能出自“数据seminar”,《什么是"伯克森悖论",这种现象在生活中有什么影响?》,https://www.zhihu.com/question/317966300/answer/968386116 但原始出处已经不可考。
4. Peter, Being good at programming competitions correlates negatively with being good on the job, https://catonmat.net/programming-competitions-work-performance
5. Erik Bernhardsson, Norvig's claim that programming competitions correlate negatively with being good on the job, erikbern.com, 2015-04-07.
更多这样的真知灼见,你可以在《精英日课·第四季》中找到更多。每天与万维钢老师一起你追踪西方精英在各大领域的思想突破,用最少的时间,紧跟全球精英的眼光和思维。
▽ 戳此加入点个“在看”,守望互助,共克时艰!