查看原文
其他

三门问题:直觉究竟去了哪里?

张和持 返朴 2021-09-20

点击上方蓝字“返朴”进入主页,可关注查阅往期文章



导语:三门问题,也被称为蒙提霍尔问题,是一道著名的概率问题:一个游戏节目中共三扇门,一扇门后有汽车,另两门后只有山羊,你选择了一扇门但不打开,这时主持人会在另两门中打开一个后面是山羊的门,现在你换不换自己刚才选择的门?30年前这一问题被美国一知名杂志刊登后引发了热议,因为直觉告诉我们换不换都是一样的,但答题人选择换。数学爱好者、专业人士纷纷加入讨论,进行了一场旷日持久的论战,还发展出了诸多变种。现在让我们来回顾一下这道经典问题,来看看直觉到底哪出错了,信息又是如何影响结果的。

撰文 | 张和持



问题背景


在美国的一档节目Let's Make a Deal 中,主持人蒙提·霍尔设置了一项小游戏:

在你的面前有三扇门,其中一扇背后藏有一辆价值不菲的汽车;剩下的两扇背后则分别是两头山羊。你现在有机会选择一扇门,选好之后先不要打开,这时主持人会在另外两扇门中,开启一扇山羊门。现在你有两个选择,是应该维持原来的选择,还是转而选择另一扇没有开启的门?


三门问题示意图/图片来源:维基百科

看起来似乎是一个没有深度的问题。可供选择的两扇门之间没有什么不同。不管选哪个,概率都应当是相同的才对。果真如此吗?

实际上这个问题有很古老的历史,可以追溯到法国数学家伯特兰(Joseph Bertand)的盒子悖论,后来著名的数学科普大师马丁·加德纳(Martin Gardner)也提出过与三门问题相似的囚徒问题。1975年美国统计学家塞尔文(Steve Selvin)根据电视节目改编提出了这一问题,投给了《美国统计学家》,这也是蒙提霍尔问题名称的由来。而真正引发讨论是到了1990年,一位读者向当时美国知名杂志《游行》Parade)的专栏“交给玛丽莲”提出了关于这一问题的询问。

玛丽莲·莎凡特(Marilyn vos Savant)曾被吉尼斯世界纪录认定为世界上智商最高的人,后来成为这家杂志社的专栏作者专门回答各类问题。她给出的回答是:应该换门,而且换门后,开出汽车的概率将变为原来的两倍。

玛丽莲的吉尼斯记录颇受争议,她给出的这个答案也同样。人们纷纷向她写信,质疑她的结论。一时间,社会各界都在谈论这诡异的概率。来信表示反对的占了92%,其中有将近 人拿过博士学位;65%来自大学,特别是数学等院系的信,都反对她的答案。蒙提·霍尔问题,或称三门问题,一下子成为了关注的焦点。90年代的十年间,40多种学术刊物发表了关于这一问题超过75篇论文。

反对并不是毫无根据。关于问题和答案的表述不甚严谨,表面上看,我们也看不出换不换门究竟有什么决定性的区别。玛丽莲为了说服反对者,专程组织了几次实验,其结果都证实了她的结论。

笔者听说这个问题,是在多年以前看的另一档美国电视节目 MythBusters ,中文译为 流言终结者 。两位主持人演示过的诸多实验令人印象深刻。这一次他们也同样忠实地再现了三扇门和山羊。最终他们的实验结果证实了玛丽莲的答案:不换门,概率 ;换门,概率


流言终结者节目

其实我们不一定非得大张旗鼓地搞些花里胡哨的东西,用电脑也能模拟,得出的答案没有不同。


计算机模拟29次的结果/图片来源:维基百科

那么这样看来,玛丽莲的答案是对的了。现在的问题是,我们应该如何解释这样的结果?是我们的直觉究竟出了问题吗?接下来我们并不打算解释谁的观点为什么对,谁的观点又为什么错;我们细细来看问题的前因后果,把所有条件和结论整理清楚。



简单直观的图示解答


最不动脑的方法是把所有可能列出来,如下图所示,当玩家选择1号门的情况下所有的可能性。

玩家最初选择1号门时的所有可能/图片来源:维基百科

但这并不代表我们真正理解了问题所在。为了解答疑惑,我们先一步一步理清思路。首先,三门问题与两扇门二选一究竟有何不同?或者说,我们刚刚开始选定的这扇门究竟产生了什么样的影响?

第一次的选择,的确是随机的。如果这时候把门打开,那么有车的概率就是 。而剩下的两扇门中,必然有一扇山羊门。所以打开的山羊门不会影响这个 。那么这样说来,用总的 去减 ,就应该是剩下那扇门开出汽车的概率, 。这样的确说得过去:一开始概率分布是均匀的:


图片来源:维基百科

打开山羊门之后, 的概率被“挤”到另一个门上了:


图片来源:维基百科

回到一开始的疑问:我们一开始的选择对结果产生了什么影响?



用条件概率来直接计算


三门问题中所提到的“我们刚开始选的门对剩下那个门的影响”,数学上我们称之为条件概率,用

来表示事件 发生的情况下,事件 发生的概率。那么自然(其实这是条件概率定义),条件概率就等于 发生的概率除以 发生的概率:

其中分子表示 两个事件都发生的概率。在这个问题中,关键在于我们要求的是剩下的门开出汽车的概率。那 事件就是剩下那门开出汽车。 是什么呢?我们最初做的选择,有两个结果:一开始就选到车,我们记为 ;一开始选到山羊,记为 。这样,剩下的门开出汽车的概率,就应该考虑到两种情况的条件概率,分别乘上两个先发事件的概率(相当于权重),再加起来

这个式子称为全概率公式,有了它我们可以具体计算。如果一开始就选到了车,那剩下的两个门里肯定没有车。所以 ,那么贡献概率的就只有第二项了。如果一开始选到山羊,那剩下的门就一定是车,所以 ,这样算出来

也是非常自然的结果。第一次选出山羊的 概率全部贡献到剩下的门开出汽车的概率中了,所以换门概率更高也不足为奇。主持人开山羊门并不能改变一开始选到车的概率,但却改变了剩下的门开出车的概率:如果不开门,条件概率 本应该是 (毕竟剩下的两个门概率均等),而开门后,山羊门不可能有车,所以条件概率变成了 。或者用贝叶斯理论的话说:主持人开的那扇山羊门,为我们提供了关于剩下那个门的信息。



用贝叶斯公式来追本溯源


虽然问题就解决了,但还是不知道我们最开始错误的直觉来自哪里。我们来思考一下主持人“提供信息”的问题。一切的改变,都是因为主持人提供给我们的信息:主持人很明显是知道门背后都是些什么,才打开山羊门的。那要是主持人根本就不知道汽车在哪里,只是随手选择了一扇门,而这扇门恰好是山羊门的话,主持人岂不是就不能提供任何信息了?

为了验证这个想法,我们就假定主持人的开门行为完全是随机的。记他开出山羊门这个事件为 ,那么还是使用全概率公式

我们想要知道的,就是当事件 发生时,事件 ,也就是最初的门开出汽车的概率。因为主持人自己都不知道汽车在哪,所以如果要做实验的话,样本里肯定存在主持人开出汽车的情况。而我们现在要算的条件概率 ,描述的就应该是在排出了这些样本后的实验结果。接下来我们就来计算

看!果不其然,概率是 。第二个等号其实也算是全概率公式。这个结果符合我们的直觉:如果主持人跟我们一样什么也不知道,那不管换不换门概率都是一样的。至此,我们已经完全搞清楚了这个问题。我们看到,一个看似毫无意义的行为,竟然能为决策者提供如此多的信息。那么在更为复杂的博弈中,找到对手留下的蛛丝马迹便尤为重要。

下面详细说一下这个算式。

这整个式子被称作贝叶斯公式,其中最神奇的地方,莫过于为了计算 ,竟然用到了 。贝叶斯的思想最初不被人接受。贝叶斯公式相当于是在知道了结果的情况下求原因。同时代的数学家们批判它为“玄学”,可在三门问题中,确实派上了用场。

为了理解这种思维,让我们假想一个工厂,有三台机器生产同一种零件,事件 分别表示一个零件是由某一台机器生产的,事件 表示生产出次品。在生产中,每台机器产生次品的概率 通常是已知的,总的次品率 也是已知的。那么对于任意一个次品,它更有可能是哪台机器生产出来的呢?这种情况下,我们就需要计算 ,而这用到的也是贝叶斯公式,读者朋友们感兴趣的话自己试试推导,跟我们上面的计算步骤差别不大。

这种由果溯因的思路一般称为贝叶斯推断。这种方法最早的特例是托马斯·贝叶斯证明的,后来拉普拉斯将其推广,并应用于天体力学、医疗统计学等方面面。在面对未知的自然界时,我们无法知晓其背后的法则,但能观察到现象,比如天体力学中,就是可观测天体的大小、数量与过去的轨迹;医疗统计学中,则是患者的症状、化验结果、CT数据等,有了这些数据,我们就可以猜测,是否存在一个我们尚未观测到的天体,或是患者是否得了某种病。猜测自然有可能是错的,现在我们有了贝叶斯推断,就能反过来计算我们所作假设成立的概率。

这一方法近几十年来更多应用于机器学习领域,或者更窄的概念:统计学习。任何包含了模式识别的算法,基本上都能用上贝叶斯推断,包括人脸识别,自动驾驶,他们会用到更加复杂的概念:当事先不存在假设时,就需要人为设定一项先验分布。不过总的来说,思想与最经典的贝叶斯公式一脉相承。如今,以此为基础的统计学仍在飞速发展。



相关阅读

1  中心极限定理:从高尔顿板到麦克斯韦分布

2  伽罗瓦理论究竟想干什么?

3  世界是受控的幻觉:大脑根据贝叶斯概率预测来认识世界吗?

4  2019邵逸夫奖揭晓,概率论学者Talagrand获数学科学奖


近期推荐

1  颜宁对话科研伉俪:幸福的科研人员有着相似的幸福,事业和家庭并肩作战 | 女科学家去哪儿了

2  科研中的奶爸奶妈:怀孕从来没有什么最佳时机,我们最想要的是托儿所丨女科学家去哪儿了

3  曹则贤2021跨年科学演讲:什么是相对论丨贤说八道

4  一朝感染终身复发,史上最难缠病毒攻陷全球九成人口,性生活时发现它一定要及时喊停丨病毒超话

5  自然界为何处处是六边形?这里有深刻的数学和物理


特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。


收不到推送了?快加星标!!




长按下方图片关注「返朴」,查看更多历史文章

微信实行乱序推送,常点“在看”,可防失联
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存