查看原文
其他

“最难高考作文”的背后,蕴藏着怎样深刻的科学道理?

前两天的全国大事件

毋庸置疑是我们物理所的90周年所庆

但除了它以外,大家肯定有关注

一年一度的——


高考!


以及

出题人被骂(??


但是你们骂就骂

火力这么集中是什么情况!

全国 II 的作文到底做错了什么?

它是这样的——


全国 II 高考作文


阅读下面的材料,根据要求写作。


(60分)

“二战”期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了。事实证明,沃德是正确的。

要求:综合材料内容及含意,选好角度,确定立意,明确文体,自拟标题,不要套作,不得抄袭,不得泄露个人信息;不少于800字。


概括一下诸位考生的疑问,就是——



但是,作文故事的背后

蕴藏着十分深刻的科学道理

想知道这篇文章怎么写吗?

赶快来补补课吧~



诡异的判断


二战期间,为了降低伤亡率,盟军试图对战斗机进行加固。在研究了大量返航的战斗机之后,研究人员发现飞机的弹痕是这样分布的。


弹孔分布假想图:如果你是决策者,你会选择将哪里加固呢?图片来源:wikipedia.org


海军分析中心的工作人员认为,飞机的弹孔大多集中在机翼和尾部,于是他们建议将这些受损最严重的地方加固。


统计学家亚伯拉罕·沃尔德(Abraham Wald)却得出一个跟直觉相反的结论。通过计算,他发现参与调查的都是在战斗中幸存下来的飞机,它们并未遭受致命的袭击。 相反,机舱和发动机等看似毫发无伤的地方反而比较危险,因为这些区域一旦被击中,就会导致飞机失事坠毁。


机舱和发动机没有弹痕,是因为这里中弹的飞机都坠毁了。图片来源:wikipedia.org


事实证明他的建议才是正确的,战斗机的伤亡率最终得到了控制。死掉的数据不会开口讲话,这被人们称作“幸存者偏差”。


幸存者偏差


“幸存者偏差”是统计学的一种逻辑谬误,它是指我们忽略了数据筛选过程的逻辑陷阱,从而得出了一个错误的结论。

“好多科技大佬都退过学,所以我也要退学”就是典型的幸存者偏差。事实上,更多同样退学但事业失败的人根本没有被公众知晓的机会。图片来源:dazeinfo.com


假设一名高中学校的一个班级在4年中(编注:美国高中有4年)考试成绩稳步上升。无论用什么评价标准,这批学生每一年都比前一年做得更好:平均数、中位数、学生在年级水平的百分比等等。我们能不能以此肯定校长的工作,甚至提名这所学校的领导为“年度最佳校长”呢?


恰恰相反,这些数据值得质疑。如果你有一屋子高矮不齐的人,强迫最矮的那个离开房间也会使整个房间的平均身高上升,但这样做并不会使任何人的身高变高。这就是幸存者偏差的猫腻,在这种情况下,样本中去掉了一些观测数据,那么对于剩余数据的分析也势必会产生变化。


假设我们的校长真不是个好人:他学校里的学生啥也没学到,每年都有半数人辍学,没有任何一名学生实际上考得更好,但这所学校的考试分数反而看上去很漂亮。因为学得最差的学生(也是考试分数最低的学生)最有可能辍学,那么考试分数的平均分会随着更多学生辍学而稳步上升。


选择偏倚


”幸存者偏差”背后更值得深究的问题是:我们如何选择评估样本?在进行统计调查特别是抽样调查时,我们必须确认,接受评估的群体中,每一个成员都有均等的机会入选样本,否则最终得出的结论就会有偏颇。


样本的选择,大有讲究。图片来源:globalinvestigationsreview.com


1936年的美国总统选举就是个很好的例子。《文学文摘(The Literary Digest)》于事前进行了大规模的民调。他们向读者邮寄了1,000万份问卷,回收230万份。根据读者的反馈,《文学文摘》预测阿尔夫·兰登将会以绝对优势战胜罗斯福,顺利当选总统。结果事实恰好相反,罗斯福成功连任,实力打脸。


这么大的统计样本,为什么还会产生这种误差呢?其原因就是样本选择的失误,又叫做“选择偏倚回收的230万份问卷是受访者的自愿选择,他们对此议题有着强烈的兴趣,根本算不上随机样本。《文学文摘》杂志社还通过电话调查的方式对自己的读者进行了抽样调查,但在当时,能订购杂志、安装电话的家庭大多很富裕,他们的观点并不能代表全美民众。


类似的事情还发生在2016年美国总统大选。当时大多数预测机构都表示希拉里会获胜,结果却出乎所有人的意料。图片来源:chinadialogue.net


选择偏倚还有其他很多种形式。在机场做消费者问卷调查很可能造成偏倚,因为坐飞机的人大体上会比一般人更富裕;而在一些贫穷街区做同样的调查,问卷结果又会偏向另一端。这类调查所共同面对的问题是,收到的反馈都来自那些愿意在公共场合接受问卷调查的人,而他们同那些不愿意被打扰的人又大不相同。如果你在公共场合问100个人做一份简短的调查,其中只有60人愿意,剩下40个看都不看你一眼就走开。那么这60个人的数据显然就有失偏颇。


每项重要的研究背后都离不开好的数据,是它们使分析成为可能。错误选用的数据,往往会使我们得出完全相反的结论。如果说统计学家是侦探,那么数据就是线索。用正确的方法找到好的数据,永远是侦探心中的第一要务。


作者:Charles Wheelan

来源:Medium,Garbage In, Garbage Out

翻译:ccyou

编辑:大琳砸

原文发表于果壳网主站,有删改。

来源:果壳少年

编辑:Lixy


近期热门文章Top10

↓ 点击标题即可查看 ↓

1. 文科生看了会沉默,理科生看了会流泪!物理所『网红井盖』官方大揭秘!

2. 为什么学渣常觉得自己考得不错,学霸老觉得自己考砸了?

3. 碰到这三种物质,你大概连哭都来不及

4. 自然常数e为什么这么重要?

5. 灭霸力气有多大?钢铁侠战衣有多重?科学家是这样看漫威的

6. 《细胞》子刊:啊这善良可爱的小肥肉!科学家发现脂肪细胞竟会帮助伤口愈合

7. 绝对零度达不到,那么温度上限在哪里?| No.104

8. 霍金最后一篇论文终于正式发表:解除曾一手造就的科学“危机”,为人类寻找多元宇宙留下线索

9. 光就认识薛定谔的猫了,科学大佬们养的宠物妖怪们你还知道几个?

10. 那个名为“又大又好”的方程组,真的是又大又好!

点此查看以往全部热门文章


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存