查看原文
其他

为什么我们说不要轻易和数学家吵架之辛普森悖论 | 科技袁人

科技袁人 风云之声 2018-07-19


这周袁老师来替大家消耗一点脑细胞了。袁老师讲辛普森悖论指出了常识性判断有时往往会有误导性,那么怎么能不被误导而错判呢,那就需要懂辛普森悖论这种数学逻辑,当然光懂道理还不行,你还要懂得怎么把数学知识应用到现实问题上……

当然,全懂了之后,如果想说服别人,你还得多读读论语古书,这样还能时不时念两句诗来辅助表达。粗略估计了一下,大概重新回去花九年制义务教育的时间就能赶上这种数学语文基础了。


所以还在上学的同学们,千万要珍惜当下学习机会,视频末尾小问题欢迎在评论区讨论。


https://v.qq.com/txp/iframe/player.html?vid=d06334xj7rq&width=500&height=375&auto=0


视频链接

哔哩哔哩:https://www.bilibili.com/video/av22293480


腾讯视频:https://v.qq.com/x/page/d06334xj7rq.html


今日头条:http://www.365yg.com/item/6546111995089781252/


部分评论

tddud:

记得以前有人用宋朝对外战争70%胜率来对比唐朝那30%-40%的胜率来证明宋朝军事实力比唐朝要强的,现在看来也是辛普森悖论了

仙人掌盆栽者:

其实老师很隐晦的表达了让我们看媒体文章的策略。好多媒体颠倒黑白的技巧就在于此,你要细扣它发现人家并没有使用假数据,但是,媒体可以通过这种方法,结合去除某些判断条件的手法来暗示你,让你接受他的观点已达到某种目的。

BisAnubis:

在视频里袁老师说了几句媒体过分夸大,就又勾出来几个假道义联盟的,什么叫中国媒体是最没公德的?你统计过?挨个调查过?全球摸底过?几个uc能代表全部?你能不过脑子顺口说出这种不负责的话就已经代表缺乏家教和素质,根本不懂客观是什么,只有你美国爹媒体公德?水平低于正常人脑子容量太小就少说话多看书,少在这动不动就装智者总结什么中国外国如何,说小了你这是顺嘴胡说,说大了就是煽动谣言破坏社会稳定,uc震惊党谁搞的?写那些的不是所谓的老百姓?还是说震惊党个个都是公职人员?你见过几个国内正常媒体标题党了?想赖到中国头上?标题党我们独有?看到这种随口胡扯的玩意真是恶心。


原文:辛普森悖论


经常有人问一个问题:数学有什么用?


当然,这个问题一般是学渣问的……


学霸们对于这么low的问题,往往发挥各种冷嘲热讽,暴击造成一万点的伤害。不过今天我们不打算冷嘲热讽,而是来讲一个非常硬的、超越常识的数学知识,听了你就明白它在日常生活也经常出现。放心好了,这个数学知识一点都不复杂,即使是学渣也肯定能听懂的。(慈祥的微笑)


这个数学知识,叫做“辛普森悖论”,英文叫Simpson's paradox。这个悖论,是英国数学家Edward H.Simpson在1951年提出的。其实在这之前也有其他的数学家提出类似的现象,不过真正引起公众注意的还是Simpson,所以我们就把它叫做辛普森悖论好了。


这位Simpson老先生的生卒年,是1922年生……但是没有卒年!因为他还活着呢,今年已经96岁了!2017年,也就是95岁的时候,他还为一本专业书写了两章的内容!


真是应了那首歌,“革命人永远是年轻”……


言归正传。辛普森悖论说的是什么呢?它说的是这样一个统计学的现象:有时候,两组数据各自都满足某种性质,可是当你把这两组数据合并起来考虑时,却会得到相反的结论。


这话是什么意思?听起来很难以理解,对吧?正是因为难以理解,所以才叫做“悖论”嘛。看下面这个具体的例子,你就能获得一些感觉了。


有甲乙两个运动员,各打了100场比赛。他们的对手分为两类:高手和低手。


甲跟高手打了80场,胜了8场。乙跟高手打了20场,只胜了1场。那么跟高手打的胜率,甲是10%,乙是5%,甲的胜率比乙高。


再来看跟低手的比赛。甲跟低手打了20场,全胜。乙跟低手打了80场,胜了40场。那么跟低手打的胜率,甲是100%,乙是50%,甲的胜率还是比乙高。


好,无论跟高手还是低手打,甲的胜率都比乙高。那么如果统计总的胜率,甲肯定也比乙高,对不对?


在直觉上,你会认为,那绝对是当然的!(国产动漫《魁拔》里蛮吉的口头禅)


但是,不要忙着下结论哦,算了以后才能确定。


同样都是打了100场,甲对高手胜了8场,对低手胜了20场,总共胜了28场,总胜率是28%。而乙对高手胜了1场,对低手胜了40场,总共胜了41场,总胜率是41%。


你看,论总胜率,情况就反过来了,乙就比甲高了!


你的直觉是不是碎了一地?


实际上,这种情况在篮球运动员的技术统计中就不时地出现,例如某人投二分球和三分球的命中率都高于另一个人,总的投篮命中率却低于他。为什么会这样呢?显然是因为前边那个人太喜欢投三分球了嘛。库里同学发来贺电!

                           

姚明


我们再来看一个医学中的真实例子。对于肾结石,有两种疗法。肾结石的症状,有大结石和小结石两种程度。两种疗法和两种症状总有四种组合,医学家们对于这四种组合做了四组实验,得到下面这个表里的结果。



疗法1

疗法2

小结石

93% (81 / 87)

87% (234 / 270)

大结石

73% (192 / 263)

69% (55 / 80)

总和

78% (273 / 350)

83% (289 / 350)


每一个格子里的比例,是治疗的成功率。后面的两个数字,是成功的病例数和这一组总的病例数。


现在的诡异之处是:无论对于小结石还是对于大结石,第一种疗法的成功率都高于第二种疗法。但是,当你统计总的成功率时,第一种疗法却低于第二种疗法!


我们再来看一个假想的例子。有A和B两个编辑,他们的工作是改进稿子。第一个星期,A只收到1篇稿子,但没有改进成功。B收到4篇稿子,改进了1篇。第二个星期,A收到4篇稿子,改进了其中3篇。B只收到1篇稿子,改进成功了。我们同样可以画一个表如下:



编辑A

编辑B

第一周

0% (0 / 1)

25% (1 / 4)

第二周

75% (3 / 4)

100% (1 / 1)

总和

60% (3 / 5)

40% (2 / 5)


现在的诡异之处是:第一周和第二周,A的成功率都低于B,但是总的成功率,A却高于B。


以上都是数字的例子。如果你还是云里雾里的话,我们还可以举一个形象一点的例子。看下面这个关于矢量的图:


辛普森悖论


这里有两组矢量,褐色的L1、L2和蓝色的B1、B2。在同样下标的矢量相比时,L1在B1的右边,L2也在B2的右边。可是当你把同颜色的矢量加起来的时候,L1 + L2却在B1+ B2的左边。


为什么会这样呢?这是因为L1比B1短得多,而L2比B2长得多。在L1 + L2中,主要的贡献来自第二组的矢量L2。而在B1 + B2中,主要的贡献却来自第一组的矢量B1


总而言之,辛普森悖论告诉你的是,你的直觉有可能是错的。如果有两组数据,A在这两组数据中的成功率都高于B,那么总的成功率却可能会反过来,成了B高于A。


现在我们可以明白,辛普森悖论并不是个悖论,它只是个现象而已。这个现象是违反直觉的,但这只是因为你最初的那个直觉本来就不严格,没有任何数学的证明。这个直觉只是经常成立,而不是必然成立,如果数据特别一点,就不成立了。所以一个有趣的问题反而是:你最初怎么会产生那个错误的直觉的?!


我知道,这样的解释还不足以令你心安。因为你还是会感到迷惑:这让我怎么决策啊!我究竟该看分组的数据呢,还是该看总和的数据?


比如说,在我们的第一个例子,两个运动员跟高手和低手比赛的例子中,如果你是教练,你会挑选谁进入你的运动队呢?


在第二个例子,肾结石的两种疗法的例子中,如果有人得了肾结石,你会向他推荐哪种疗法呢?


在第三个例子,两个编辑的例子中,如果你是主编,你觉得哪个编辑的能力更强呢?


决策时究竟该看分组的数据,还是总和的数据,这是一个更高层次的问题了,比辛普森悖论本身更加难以理解一些。在这里只能说结论:有时该看分组的数据,有时该看总和的数据,视问题本身的因果关系而定。


我们可以把这三个例子作为思考题,请同学们课下去想想,究竟该用分组的数据,还是总和的数据。欢迎踊跃留言哦~


最后,我们可以得到一个广泛的哲学性的教益:日常语言是很模糊的,而数学语言就很精确。如果你跟别人辩论一个问题,谁都说服不了谁,请想想看是不是因为你们指的不是同一个东西,再想想看能不能用数学语言把你们想说的清楚地表达出来。


这就回到了我们最初的问题:数学有什么用?


无论是学渣还是学霸,现在同学们是不是都对这个问题理解得大有深化了呢?


科技袁人系列

“科技袁人”元旦首发,走近中国科技工作者

科技袁人第二弹:有人觉得中国科技太弱,因为全世界除了中国只有一个国家:“外国” | 风云之声

科技袁人第三弹:量子通信、液态金属、可燃冰……中国领先世界的黑科技,你知道几个? | 风云之声

去美国NASA访问,才听说中国人2020年都要登上火星了 | 科技袁人

搞科研中文有时不如英文,有些人就想出来要废除汉字?| 科技袁人

理解引力波很简单,只需要你先搞明白爱因斯坦的相对论…… | 科技袁人

中国的量子卫星究竟什么水平?也就比日本少用了99999999个光子 | 科技袁人

为什么不该拿科学家去和明星比收入?听听这三位诺奖得主的故事 | 科技袁人

喵星人可能早就发展出了引力波探测技术,否则为什么每次我刚想倒猫粮…… | 科技袁人

中国有些教授竟然觉得造银河计算机没用,我都惊呆了 | 科技袁人

我,科大,用大数据给学生打钱 | 科技袁人

被有些人吹上天的日本人“工匠精神”,到底是个什么东西? | 科技袁人

相信那些治绝症的微信神文,这本身是一种“反智”病! | 科技袁人

真有人认为中国没有哲学家?我一个化学博士都坐不住了 | 科技袁人

霍金离开了,比起去争论他有多伟大,更该了解他为我们做了什么 | 科技袁人

中国网速不如阿富汗?这些都是黑中国的套路 | 科技袁人

我们都知道钱学森的伟大精神,那么他的贡献有多强?| 科技袁人

今天,让我们纪念,一位为中国保留未来种子的师长 | 科技袁人

石墨烯超导和21岁博士生:对科学的宣传要高调,对个人的宣传要低调 | 袁岚峰





欢迎关注风云之声


知乎专栏:

http://zhuanlan.zhihu.com/fengyun

一点资讯:

http://www.yidianzixun.com/home?page=channel&id=m107089

今日头条:

http://toutiao.com/m6256575842




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存