为什么大多数关于美国总统选举的预测都错了?
互联网时代的民意调查倒退回了1936年之前:
“没有科学采样,依靠选择性回复,
这和我们今天所看到的
网络民意调查如出一辙。”
▲点击上方绿标可收听音频
语音丨伯凡时间
—
2016年美国总统选举昨天落下帷幕,特朗普战胜希拉里成为了美国第45任总统,对于这个结果,每一个人基于自己的不同立场都会有不同的解读,而不管是支持者还是反对者,很多人都提出了同一个问题:为什么这次总统大选中的种种民调与预测,与最终结果差得离谱?
要知道,就在这场选举开始之前,纽约时报网站公布的希拉里胜率超过85%,曾经准确预测过多次大选和赛事的著名数据网站 FiftyThreeEight 在大选前 15 个小时公布的希拉里胜率为 71.4%,在大部分主流媒体的预测中,特朗普当选总统的概率都就没有超过30%。
更有不少国内评论者言之凿凿地说,如果现在还有人认为特朗普居然真的有希望当选美国总统的话,那只能说明他被国内扭曲的信息渠道给蒙蔽了,在他们眼中,希拉里当选几乎是板上钉钉的事情。
有些不给自己留后路的评论者甚至立下了如果特朗普当选,他们就要裸奔、吃土、吃硬盘等等誓言——请注意,他们并非都是希拉里的拥趸,而是从理性上认为特朗普当选实在是不可思议,于是放心的撂下狠话。
可事情就这么发生了,特朗普拿下了几乎所有摇摆州,随着一个个州选举结果揭晓,特朗普的获胜概率从15%,一路飙升到48%,70%……一直到最后尘埃落定的100%,而希拉里的当选概率,则从85%一路下降到52%,30%……最后是残酷的0,两条走向截然相反的概率曲线交叉形成了一条极富戏剧性的X型曲线。
这个结果让很多人想起了关于美国总统选举历史上那次关于民意调查的著名典故。在1936年的美国总统选举中,美国的《文学摘要》杂志社为了预测两名总统候选人谁能当选,通过电话薄和车辆注册系统上的地址发出了1000万封调查信件,并且根据200万封回信得出了兰登将以57%对43%的比例胜出的结论,但最终结果却是另一名候选人富兰克林.罗斯福以62%对38%的压倒性优势胜出。
《文学摘要》杂志当年所犯的错误,后来人往往都能看得很明白,首先它的采样方法就带来了样本偏差,当时能用得上电话和汽车的,往往都是比较富裕的阶层,同时愿意回信的也大都是表达意愿比较强的人们,所以这个调查实际上针对的是比较富裕的和比较愿意表达的人群,而那些贫困的或者没那么愿意表达自己观点的人,并没有放弃自己投票的权利。
1936年同时也是统计学家乔治.盖洛普采用科学抽样的总统民意调查的第一年,盖洛普的民意调查只有大约5万个样本,但在精心规划的样本中,黑人与白人、穷人与富人的比例都接近美国人的总体比例,最终,盖洛普准确预测了罗斯福的当选,并且奠定了自己民意调查权威的地位。
美利坚大学著名历史教授艾伦.里奇曼评价说,“这是现代民意调查的诞生,也是老式民意调查的终结——直到互联网出现之前”,他提到这句尾巴是因为,里奇曼认为互联网时代的民意调查又回到了1936年之前的状况:“没有科学采样,依靠选择性回复,这和我们今天所看到的网络民意调查如出一辙。”
直到今天,盖洛普等这些现代调查公司还是CNN这些著名媒体的合作伙伴,他们仍然会通过电话访谈来进行调查,每次大约访谈上千名拥有投票资格的公民——电话如今也不再是什么稀罕的东西了,调查公司还会通过电脑程序来随机选择受访对象,以确保每个人都会有同等机会被选到,他们还会在访谈之后根据美国人口调查数据来进行对比,调整权重以消除样本偏差。
但是,为什么这些“科学”的调查方法跟最终结果仍然错得离谱?
至少在这次总统选举中,一个重要的原因是,很多人在面对调查时没有说真话,特朗普拥有一个糟糕的公众形象,这些人虽然不敢在外人面前表达自己对特朗普的支持,但在匿名的投票中,他们把票仍然投给了特朗普。这也是为什么特朗普在此前多轮选举民调都不被看好的情况下,仍然能一路过关斩将成为总统候选人。
当支持希拉里的声音被刻意放大,而支持特朗普的声音被悄悄隐藏,民意调查的偏差也就可想而知了。在这次选举中,就连一直拒绝融入美国现代生活、从不参与总统选举投票的阿米什人,也成批来到投票站为特朗普投票,他们正是无论哪种民意调查也无法覆盖到的那群人的一个缩影。
在选举结果揭晓之后,一个略带戏谑的帖子迅速风靡中文网络,它告诉人们,其实中国浙江义乌的出口工厂早就指明了美国总统选举的结果:特朗普的旗帜和面具的出货量是希拉里的四倍,虽然这个帖子所说的数据还有待考证,但客观指标确实比主观意见更能够反映人们的真实想法。
另一个例子则来自人工智能。与大部分看好希拉里的主流媒体不同,印度新创公司Genic.ai 开发的名为 MogIA 的人工智能系统一直就预测特朗普将最终胜出。跟其他调查公司主要依靠访谈和问卷不同,MogIA的判断依据是收集自 Google、Facebook、Twitter 和YouTube等网站的超过 2000 万个数据点,尽管希拉里的竞选经费是特朗普的5倍,在付费媒体上的投入是特朗普的6倍,但在社交媒体上希拉里却始终处于全面劣势。
虽然有人认为MogIA不能有效识别人们在这些网站留言评论中的“讽刺”、“反话”、“脑残粉”、“高级黑”、“似黑实粉”等细微之处,但这反而可能成为了MogIA的优势,很多时候,点赞、转发甚至只是阅读,关注,就足以代表了那些“沉默的大多数”的真实想法。
正如昨天伯凡时间里《互联网使人变得更开放,还是更封闭?》这篇文章里所说的,互联网所带来的个性化信息服务都具有一种排除异己的功能,它让拥有一种观点的人不断更多结交拥有相似观点的人,不断接触更多支持自己观点的信息,久而久之,人们就会越来越对自己的观点深信不疑,对反面观点视而不见。只有当面对总统选举,或者脱离欧盟这样的集体公开表态时,他们才会惊异的发现,原来自己所接触到的人群只是拼图里的一小块碎片。
一位特朗普支持者在选举后接受NBC采访时说,“过去的一年,我们都不愿意听对方说什么。我希望在大选结束之后,我能和那些我最反对的人好好聊一聊。我不会再去尝试说服他,而是去倾听他会讲什么”——诚然,胜利者比较容易摆出高姿态,但这种愿意接触而不是排斥异己的态度,显然比让对手兑现承诺裸奔吃土,更能弥合人们之间的观念鸿沟。
或点击左下方“阅读原文”,订阅相关内容
—————————————————————
随时评论,随时提问
我们终于获得了微信原创保护,
从此可以开通评论区,
欢迎大家在下方评论区踊跃留言。
——