查看原文
其他

用乐高积木给你的宝宝讲懂贝叶斯定理

will kurt 集智俱乐部 2022-04-30


导语

贝叶斯理论是数学中一个简单而重要的理论,它的核心目的是帮助我们用一个事件的信息去理解另一个事件。接下来我们试着用一个乐高的实验去理解这些公式,看看它到底在讲一个什么故事?



编译:集智俱乐部翻译组

来源:countbayesie

原题:Bayes' Theorem with Lego



关于贝叶斯定理


贝叶斯理论简单来说就是下面这个等式:


这个公式本身并没有那么可怕,它甚至都没有求和号。不过公式的背后描述的到底是个什么故事?让我们用一堆乐高积木和一些具体的问题来探索贝叶斯理论。


积木的概率空间


我们有一个面积为6*10的乐高积木拼图,我们把它假设成乐高积木的概率空间,在这个空间下有蓝色、红色、黄色的乐高积木,其中黄色的积木在红色和蓝色积木的上方,接着我们尝试着用更数学化的语言来描述这堆积木,比如从概率的角度:


在积木的底层,有60块小积木,其中蓝色40块,红色20块,用概率描述也就是积木为蓝色的概率以及积木为红色的概率,可以表示成以下公式:


重要的是,这两个概率的加和为1,也就是:



也就是说红色积木和蓝色积木可以组成整个概率空间,那么黄色积木去哪里了呢?




看上面的图片,如果我们要从这个6*10的积木拼图中随机取出一个积木,这个积木是黄色的概率为:



但是我们无法直接将P(黄色)与P(红色)、P(蓝色)的概率相加,否则你会得到一个超过1的值。实际上黄色积木的下面要么是蓝色积木要么是红色积木,而取出一个黄色积木的概率,与它处在红色概率空间还是蓝色概率空间有关,我们把这种概率叫做条件概率,用P(黄色|蓝色)表示在蓝色概率空间下取出黄色积木的概率。



通过看图算出条件概率


     可视化贝叶斯定理

解决红色概率空间下取出黄色乐高的概率


我们怎样才能算出这个条件概率呢?实际上如果我们要算出P(黄色|红色),我们或许会经历几步:


  1. 将红色积木和蓝色积木分开

  2. 我们得到面积为2*10的红色概率空间

  3. 在这个空间上,黄色积木有4块

  4. 将黄色积木和红色积木分开

  5. 计算出P(黄色 | 红色) = 4/20


很棒,到目前为止我们计算出了给定红色概率空间下,取出黄色积木的概率。但是,如果我们将事件和条件反过来,如何计算在取出的积木是黄色的条件下,下方积木是红色的概率,也就是如何计算P(红色|黄色)呢?


尝试着观察黄色积木下的红色积木


通过看这个图,你很容易能发现,一共有6块黄色积木,其中2块下面是蓝色,4块下面是红色,所以取出一个黄色积木下面是红色积木的概率就是4/6。如果你是这样思考的,那么也就恭喜你,成功地独自的探索了一遍贝叶斯定理。



通过数学计算条件概率


如何用数学的表达来重复我们上面的过程呢?


相比数学的语言是简单而严谨,人类的直觉在推理过程中总是跳跃的。从直觉到贝叶斯定理,我们还需要费些功夫。


  1. 首先我们试着用数学的语言,推出“一共有6块黄色积木”这个结论。推出这个结论,我们只需要用通过以下计算:

    黄色积木的个数  =  P(黄色) * 总积木的数量 = 1/10*60 = 6

  2. 接着,如何得到“其中4块底下是红色”这个结论呢?

  3. 第一我们先算出红色积木的数量,跟上面的计算方式相同:

        红色积木的个数 = P(红色) * 总积木的数量 = 1/3*60 = 20

    第二,在我们已经知道P(黄色|红色),也就是底层是红色积木的条件下取出黄色积木的概率时,我们可以得到:

    在黄色下面的红色积木的个数 =

     P(黄色|红色) * 红色积木的个数 = 1/5*20 = 4

  4. 最后计算出红色积木上是黄色积木的概率:

        P(红色|黄色) = 在黄色下面的红色积木的个数 /  黄色积木的个数 = 4/6


不过这还不太像贝叶斯公式,我们再重写梳理一遍这个过程:


P(红色|黄色)  = P(黄色|红色) * 红色积木的个数  /  P(黄色) * 总积木的数量


P(红色|黄色)  = P(黄色|红色)* P(红色) * 总积木的数量  / P(黄色) * 总积木的数量


最终我们得到:

P(红色|黄色)  = P(黄色|红色)* P(红色)  / P(黄色)


这就是贝叶斯定理!



回顾一下


上面的实验提到了两点:


  • 概念上,贝叶斯定理是服从直觉的。(我们只是用数学语言重写了一遍我们的直觉的推理。)

  • 同时,贝叶斯定理的形式化表示,不一定是显而易见的。(推出最终的公式,我们还需要多几步数学的表达)


数学的好处在于,它把我们的直觉变成了推理,这样了既保持了跟直觉的一致性,又能提供一个新的有效的工具,去解决那些比乐高积木更复杂的问题。


如果想了解更多关于,贝叶斯定理和贝叶斯推理的故事,你可以参看这些帖子:


  • Learn about Bayesian Priors with Han Solo

    https://www.countbayesie.com/blog/2015/2/18/hans-solo-and-bayesian-priors


  • Understand Bayes' Factor and Bayesian Reasoning by exploring a classic episode of the Twilight Zone

    https://www.countbayesie.com/blog/2016/3/16/bayesian-reasoning-in-the-twilight-zone


  • Use Bayes' Theorem to reason about the probability that your friends are really allergic to gluten

    https://www.countbayesie.com/blog/2016/1/22/why-you-should-believe-your-friends-claims-about-food-allergies


翻译:文雷

编辑:王怡蔺

原文:

https://www.countbayesie.com/blog/2015/2/18/bayes-theorem-with-lego



推荐阅读


贝叶斯网络之父:如何真正教会机器理解

人工智能如何掷骰子——三种概率理论

复杂度阈值与概率论中“漏洞”

复杂性科学家对信息经济学做出开创性研究

加入集智,一起复杂!


推荐会议


正值著名城市学者、圣塔菲研究所前任所长 Geoffrey West 教授来华之际,集智俱乐部联合清华大学凯风公益基金会与凯风发展研究院,邀请多位学界大咖,于10月26日举办一场高端闭门学术研讨会,探讨城市复杂系统的Scaling Law。会议语言为英文。现开放10位现场席位的报名,报名方式为邮件申请。


有意向的请看详情:圣塔菲前所长、《规模》作者Geoffrey West高端闭门学术研讨,10个参会名额开放申请!




集智AI学园:

https://campus.swarma.org





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存