查看原文
其他

近60%本平台网友答错的【数据分析师】问题,你要来看看!

Kenneth 阿Ken看零售 2022-12-07

早几天,我给平台朋友出了一个数据统计的题目,复述如下:


题目:

一个城市的初中生的IQ平均值是100,随机抽取了50名,随机抽查了50名中的一个IQ是150,问这50个初中生的IQ平均值最有可能是多少?请说明理由.


当时候,我给了大家三个选项,有184朋友投票了,分布如下 :

A答案)IQ = 100 (51%选取)

B答案)IQ < 100 (8% 选取)

C答案)IQ > 100 (40% 选取)


首先,我是不太理解选IQ < 100 同学的心理阴影,或者是他们误解以为问剩下的49个初中生的平均IQ值。有一个朋友截屏了在朋友圈晒答案,还说这肯定是套路,所以坚决选取B答案。


好吧。做地球人不容易呀。


这条题目其实我是直接把度娘看到的版本一模一样的复制下来,题目是蛮严谨的,可惜回答是错误的。



这条题目其实也没啥套路,但真的要说,其实这条题目的答案就是让大家认识大名鼎鼎的 【赌徒谬论】。好,这次我再复制一下百度百科的解释:


赌徒谬论亦称为蒙地卡罗谬论,是一种错误的信念,以为随机序列中一个事件发生的机会率与之前发生的事件有关,即其发生的机会率会随着之前没有发生该事件的次数而上升。如重复抛一个公平硬币,而连续多次抛出反面朝上,赌徒可能错误地认为,下一次抛出正面的机会会较大。这是一种非正式谬误。


这条问题是一个比较特殊的【赌徒谬论】应用,首先我要说明几个关键词:


(1)随机就是随机

一个买了很多次彩票的朋友,和一个第一次买彩票的朋友;面对这一次开奖的时候,其实大家中奖的几率是一样的。上天不会眷顾你多次努力,而给你提高中奖的概率。


(2)小样本量以及离群值

50个样本其实不算太多,已知其中一个样本是一个离群值(outlier),150可是比100高出了50%,我们总不能相信会有一个50的IQ,或者两个75的IQ来作为抵消。所以,正确的想法是剩下的49位同学,平均IQ还是100,加上这位150的outlier,平均值是 (4900+150)/50 = 101


(3) 独立事件以及大数定律

其实抽样中出现一个150的高材生是一个独立事件,这并不会影响之后49位同学的平均。注意独立事件也是说明了 【随机】 =/= 【均匀】。谬误是来自很多人会以为如果过去一段时间内发生的事情不均匀,人们就错误的以为未来的事情会尽量往“抹平”的方向走。如果连输几把,那么下一把就应该会赢。


【赌徒谬论】其实在生活中有很多应用,甚至连足球的点球也可以用来“分析”。这里我先随便举两个例子,下次再深入分享!


  • 有个笑话说一个人乘坐飞机时总带着一颗炸弹,他认为这样就不会被恐怖分子炸飞机了,因为一架飞机上有两颗炸弹的可能性非常小。(按:两颗炸弹是否同时出现是独立事件,并没有关联)


  •  iPod最早推出“随机播放”功能的时候,用户发现有些歌曲会被重复播放,他们据此认为播放根本不随机。苹果公司只好放弃真正的随机算法,用乔布斯本人的话说,就是改进以后的算法使播放“更不随机以至于让人感觉更随机”。
    (英文原话:The random playlist: When you press shuffle on iTunes, what you get is not actually a random playlist. Steve Jobs modified Apple's shuffle feature so that certain songs would not appear after others, making the shuffle feature appear more random when in fact it was less. This was because users complained that it did not seem random enough, with, for example, their favourite artists sometimes appearing twice in a row. Of course, in a random playlist, the chances of this happening are as likely as any other song appearing )

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存