查看原文
其他

大选 | 美国民调怎么这回又错了?

李燡 尽量有趣一些 2021-05-20
这是一篇速就的文章,没有特别严谨详实的材料,体现的则是我个人一段时期的想法。

也欢迎点击上方尽量有趣一些”关注我:)

——————————


美国的大选,已经成为全世界的新闻,关注的朋友大概不少。

从美国到欧洲,乃至在中国,绝大多数正规的新闻媒体在选前传达的信息多是“Biden稳了”。根据美国各类平均民调结果,biden整体领先6-8%——这是巨大的优势,历史上凡有如此民调的美国总统候选人,没有不能获得胜利的。

昨夜的大选却令人意外,就像一场精彩的足球赛,双方你来我往胜负相当胶着,创普还一度取得巨大优势,赔率还要超过biden好几倍。
尽管胜负尚未分明(最新情况看biden可能小胜),但媒体以及背后的民调机构们却已然大败亏输。
比起2016年尚可以“我们猜对了总票数”来勉强遮羞;这一次民调输得就更惨,biden传说中的“巨大优势”完全没有体现,几个摇摆州的结果大多与民调预测相去甚远。
创普就有点像05年欧冠决赛的利物浦,各类媒体进场先打了人家个零比三落后,biden简直就要中场直接开香槟了——结果创普生生扳成了三比三平,马上要进入点球决胜

我不知道创普是否能有利物浦的好运气,但抛开最终结果,这篇文章要探讨的是:民调这回怎么还是不准呢?


 被同一块石头绊倒好几次


 


首先要申明:民调-polls本质上就是伪科学。即使它相当接近科学,也作为整个“社会科学”的重要奠基,但仍然是个伪科学。

前面我写过一篇议论逻辑的文章,已经有充分的讨论。总之“民调”是要建立在统计和数据分析的学科基础上;而统计学作为一门以“归纳”为根本的学问,天然就蕴含不可靠——如果能够完全可靠,民调就干脆可以代替选举了。

但是,统计学毕竟还是社会科学最重要的方法论基础,人类的认知离不开统计的技术。美国是全世界统计科学技术最先进的国家,大选的民调一般也被认为是“最准确的民调”——从1936年至今,大多数的时间,民调结果都是对的。

问题恰恰集中在最近几届,比如2012年的罗姆尼vs奥巴马:美国乃至全世界最权威的民调机构之一-Gallup一路预测Romney获胜,同最终Obama以4%大优势胜选的结局完全相反,就导致Gallup心灰意冷,宣布从此退出美国大选预测。

2016年的民调误差令很多人记忆犹新,希拉里在民调的巨大优势面前最终输掉了选举。加之17年的英国脱欧民调再次失准,已经令一些统计数据专家“怀疑自己做的是什么”,乃至有“data science的幻灭”一类危言。

为了要维持统计科学的尊严,2016民调之后,各家机构统统深刻反思检讨,对照大选结果,检查出一系列问题,有一些诸如“忽略了低学历人群比重”、“低估了电话调查的城乡差异”等听上去确实很重要的;还有一些像“很多选民会选择第一个候选人,为避免”全选A“,民调人员会有意调换候选人顺序,但各州的选举通常却还是按字母顺序“的归因——因此创普或许应该庆幸他叫Donald比Hilary字母更靠前。这个归因叫作“投票顺序效应(Ballot order effect),听上去就比较玄学。

总之,经过一系列思考与调整,2018年的美国中期选举,民调的确和实际结果差不多,看起来是进步了。
2018年的国会选举民调,确实进步了一些

2020年,所有民调机构都高调宣称:我们痛定思痛!今年我们修正了方法,再也不会犯四年前的错误了,这次的民调是准确的,是非常科学的!

——现实则是残酷的,这一次民调机构输得更惨:

左侧民调、右侧实际;红创普、蓝biden


明显的,TX, OH这类民调显示”持平“的州,创普均获胜甚至大胜;WI这类民调显示”biden大胜“的州,即使蓝党能拿下,优势也在毫厘之间而已——就以威斯康辛为例,民调预计biden将暴胜17个点,下午的结果却只赢了0.7个点(预计此地还会有争议)。

这一次的民调偏差,实际较2016年还要更大。有一些统计的专家,居然还教我们“正确的解读民调”,认为“民调只是给出概率,创普胜选概率只有10%也不是否定创普可能当选”——这显然是胡扯,如果一项民调的读法是“两种情况其实都有可能”,这样我奶奶都知道的结论,需要polling来宣布吗?

无论大选的情况如何,民调的失准都已经是确定的事情,原因则可能有客观和主观两种:


 “Shy Trump”


 

综合各类研究报道,比较可信的一个解释,还是所谓的“shy Trump hypothesis”(hidden trump)—“害羞创普假说”。

我就想到我在哥伦比亚时的一件故事:2017年的时候,有个学生团体要搞个关于LGBT的大party,作预算要确定多少师生具参加参加,兼为证实汇报“本校LGBT如火如荼”的运动成果,他们在校内搞了个问卷调查——就是各位在食堂门口不时碰到“同学能帮忙填份问卷吗”内种东西。

调查分现场和网上投票,结果都令人振奋,问卷收回不少,相当高比例都“比较关注/很关注LGBT运动”、“比较支持/支持LGBT”、“愿意参加LGBT的宣传活动”,组织者意料之外颇受鼓舞,预定了个五百人的场地便准备搞个大新闻了。

现实却很冰冷,当天只来了三十几人,分散在偌大的场内,稀稀落落和没有也没什么区别。我一位老师叫做Ruben恰好也是组织者之一,Ruben告诉我“他的心都要碎了”。

我很同情Ruben,但这是个有趣的例子:作为一个传统的天主教国家,哥伦比亚的Catolico人口超过九成,”反同“是社会的普遍情绪。但是,作为现代的潮流,他们当然也知道“应当开放一点包容一点”的道理。

当面的问卷调查,便构成参与者与调查者的“隐性互动”,参与者很难不受“be watching me”的心理波动影响;而网上的投票,一方面可能有“支持LGBT会比较时髦”的自我心理标榜,另一面,愿意点开投票的可能本就是偏LGBT群体人士——几项因素相加,结果便也在意料之内了。

美国的大选,也是类似的情形。我自己也有不少美国的朋友,日常看他们的推/fb,就没有不骂创普的,我便常常会有一个疑惑:创普到底是怎么被选出来的?支持创普的人都在哪儿呢?

民调等等一切“调查”的抽样,电话的访谈仍然是主要和最优的方式:一方面为着确定受访者的真实存在;另一方面这类民调通常不是几个问题, 而是诸多问题的综合验证,电话可以确保受访者的持续参与——总之,电话优先是一种可以理解的方式。

但是,电话的访谈必然造成无可避免的“心灵互动”,创普的白人至上妄自尊大出言不逊包括“打消毒水”等特质,在美国的社会也同样是“错的”,要当着陌生人讲“我支持创普”,对于很多人都不是容易的事情。今天美国的很多人喜欢将创普的支持者称作“种族主义者”——这是个不轻的指责。

电话的受访者很可能不愿意当着调查人“勇敢地”讲出“我支持创普”来,却被迫说一些违心的谎言这样的数据失准被称为“害羞创普假设”——学术称谓则是“社会期望偏差-social desirability bias”。

统计学是一门数目字分析解释的学问,它总要默认自己的“数字”是正确的(尽管也有一系列修正原始数据偏差的办法)。但如果原始的数据就是假的是不准确的,再高明的统计家也不可能得出正确的结果来,就譬如用腐肉是不可能做出什么佳肴的。

尽管“害羞创普”的假设仍有不少质疑,但就我们日常的观察,这个假设很可能是有效的——尽管不能确定量化的效应。

我曾经发过这么一篇微博,也引起了一些共鸣:
——我当然不是说“只有神经病才会支持创普”,更可能的情况是只有神经病才会说自己支持创普”,这其中的区别,当然就很大了。

与很多朋友的想象不同,美国的民调实际上应当被看作一个“公众场合”:由公众的机构媒体,以公开的调查方式,做公布的结果。在这个过程中,“隐私”并没有我们想象的那么多。


 美好的期望


 

客观的数据偏差之外,还可能有主观的影响。

美国的媒体人都反对创普,这不是什么新闻。而民调、尤其是比较权威的民调,对选举本身亦有影响,这也不是什么秘密。

譬如上述的调查方式,我非常喜欢的皮尤中心(Pew)也是一家数据效力相当强的非盈利民调数据中心,就曾经抱怨过,电话调查的接听率已经从1997年的36%下降到了现在的9%——Pew的电话调查至少要联系受调者7次,7次都不能接通才视作未响应;而商业的民调机构通常仅仅拨3次电话而已,“响应率”当然还要更低。

没有哪家商业民调机构公布他们的大选电调接听率,有估计认为这个数据在3%-5%,如果polling分析师基于3%的这部分响应样本去推算整个选民,这个模型的效度便可想而知——这被称为“无响应偏差-Nonresponse Bias”。

难道媒体们不了解“无响应偏差”吗?当然不会。但是他们的立场可能令他们“更愿意报道对创普不利的结果”(Robert Cahaly),创普也同样看到了这一点,所以简明扼要的表示:“Don’t trust the polls-不要相信民调”。

创普鼓励自己的支持者尽量不要参与民调,因此大量数据也证实:通常而言创普的支持者更不倾向于接听电话——意即受调的群体天然就比较倾向蓝党。

有趣的是,民调一边倒的结局不一定就有利于biden。预测的大比分领先,一方面可能导致一些biden支持者“失去了投票的动力”(反正我不投也会赢),另一面可能激发创普支持者努力投票的“斗志”——同样的情况在1980年的卡特vs里根的大选也出现过,那一次里根同样在民调不利的局面下胜出,而“民调本身”被认为是卡特失利的罪魁之一。

事实上,即使有上文所说的“shy trump”问题,民调也不是不能有所作为,比如复旦的这份民调

来源:复旦复杂决策分析中心

六个州的结果,复旦已经对了五个。去除四个形势本就比较分明的,密歇根和宾州两个摇摆州,mi已经确定猜对,pa还在投票中,仍有成功的可能。这个成绩好于绝大多数美国权威民调机构。

——大家面对的数据毕竟相同,连一间中国的大学都可以做到的事情,这么多美国民调机构都做不好做不到吗?这其中有多少主观的因素,恐怕就很难讲。


 结语——危险的世界


 

我的前一篇文章,是讨论世界保守化的。文中的观点,在本次选举中恐怕仍然有效。

所以会出现“害羞创普”的现象,恰恰验证了美国社会的保守化”,就像Trafalgar的民意测验官Robert Cahaly描述的那样:
“2016年,特朗普的支持者被称为“可悲的”,但2020年,情况完全不同,更糟,明显更糟……在美国的现代历史上,几乎没有任何一年会比今年因在主流之外发表意见而受到惩罚的事情更多。我发现人们非常犹豫(分享他们对特朗普的偏好),因为现在它不仅被称为“可悲的”了,人们因为戴错帽子被殴打,因为在车上贴有贴纸受到骚扰——人们只是不想说什么。”
(有些翻译腔,为了体现真是美国人说的缘故)


当“政治正确”本身也成为一种政治正确,保守的一方将放弃自己说话的权力——但他们并不会放弃自己的观点,现实的体现便是民调失灵。媒体与民调机构正是在这场“保守运动”中推波助澜的一方,他们自己将创普的支持者标榜为“种族主义者”,这恰恰造成了他们目前的困境。

FOX的主持人Tucker Carlson昨天直播中的提问我觉得很有趣:
'The most basic question the polls raise: Is this a free country? If you're afraid to express a political view in public — you could be fired for it, banished for it — is that a free society? The answer is, of course not.'
(用英文倒不是为了体现真是美国人说的,而是作者不能确定公号的审查AI是不是知道他这是在说美国)


前文所描述的“两种原因”,其实可以看作同一问题:“一种声音”的媒体助长了保守化的趋势,保守化又使得“反对派”不敢说话,只是默默地用手中选票解决问题。

很多人预测,2020大选后美国可能陷入混乱。由着民调与现实的距离,我们已经看到:美国有大量的”沉默者“,他们不能发声,如果他们的选票再也落空,他们又将如何选择呢?
——而这样的情况,又仅仅发生在美国吗?

本账号系私人维护,内容均系原创,主要兴趣领域为非理性主义哲学、美学及艺术史,更新频率不固定,更新内容不固定,欢迎转发谢绝转载——更欢迎大家点击上面蓝色的“尽量有趣一些”关注我:)


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存