民调为什么又错了? | E闻美政(附音频)
编辑:SUN
音频专栏 | E闻美政
文章仅代表作者本人观点,不代表《纽约时间》立场。
第 41 篇
民调为什么又错了?
By | Eric
在 2016 年大选前的民调,普遍认为希拉里将获得大选的胜利。值得注意的是,民调结果和普选结果 popular vote 的差距其实不大,全国民调显示希拉里得票总数将超过川普 3%-4%,而实际结果是希拉里总得票数超过川普 2.1%。但那一次民调,在之后的总结中,发现对各州的预测有较大出入。普遍认为,这是因为那一次民调中,忽略了未接受过大学教育的白人这个川普的主要票仓,导致民调采样的成分,和实际投票者的组成成分不匹配造成了预测的误差。这就好像如果你调查某种疾病的发病率,结果采样人群的各年龄段人数比例和实际人群的年龄构成比例不同,比如说人口比例中老年人占 20%,而你采样人群中老年人只有 5%,而这个病主要集中发病就在老年人。那么采样本身就存在了误差,最后得出的疾病发病率就会比真实的发病率低很多。这就是统计学中的所谓抽样误差(sampling error)。
在 2020 年大选之前,各民调机构认为自己修改了自己的抽样标准,加大了对无大学教育背景的白人群体的抽样。但他们今年的预测,其错误率几乎和 2016 年一模一样,甚至某些州还比 2016 年的预测更糟糕。要知道,在美国,民调的准确性是很高的。比如 2018 年中期选举,民调预测的结果基本上都符合最后投票结果。
很多华裔会问,民调会不会作假呢?这种想象显然是把神州的某些特色运用到了西方社会。事实上,西方绝大多数民调公司是专业搞市场调研的公司,民意调研的准确度,就是他们的产品质量。一些阴谋论所谓民意调查造假,是因为他们根本不知道西方的民调公司是靠什么吃饭的。像经常受 CNN,美联社委托做民调的 IPSOS 公司,就是一家法国的上市公司,年收入超过 20 亿美元,全世界市场调研公司排位第五。说这样一家公司数据造假,不如说可口可乐公司在可乐里兑自来水了。
但让我们回到现实。一旦涉及到川普,民调就立刻不准了。为什么?这是一个让人饶有兴趣的话题。
在蓝州,其投票结果川普得票比例的中位数,比民调的要高出 2.6 个百分点;而在红州就更离谱,川普实际得票超过预测 6.4 个百分点。
有一种流行的说法是,川普的支持者很害羞(shy Trump voters)。他们在接受民调的时候羞于承认自己支持川普。但在实际投票中还是把票投给了川普,这造成民调出现误差。但越来越多的证据显示,这种说法正确的可能性不大。因为很多民调不是人打电话,而是机器人提问和接受答案,这种情况下,人不会觉得自己正在接受道德审判,不会隐藏自己的观点。另外,更有力的证据是,和大选无关的一些民调,比如对共和党的支持率,对移民政策的看法等,都高度和大选民调吻合。这说明接受民调的人并没有掩饰自己。
有一种解释是这样。由于疫情的影响,对民主党和共和党的选民是不对等的。比如在传统的红州,民主党支持者投票的意愿本来也不高(这归功于美国古怪的选举人团制度,在深红州民主党支持者投票等于白费。),疫情影响下,他们更加懒得去投票,这可以解释今年大选中红州的投票结果,川普大大超出了民调预测的胜出比例。但反过来,疫情对共和党支持者的影响没有那么大,所以他们的投票比例并没有下降太大。
但这种解释是基于投票率在疫情影响下会下降的假设。实际的情况是,今年的投票率非常高,达到历史性的 65.4%。所以这种解释的力度也不大。
让我们回到抽样误差的理论。看上去这一次还是发生了抽样误差。民调公司想要预测投票结果,就必须预测哪些人将会出来投票。他们选择的抽样的样本,其年龄,性别,学历,种族等组成成分,需要和实际出来投票的人群比例接近,这样抽样结果才能反映真实的投票结果。但是,2020 年发生了一件事,那就是剧烈的社会撕裂导致破纪录的投票人数。无论是拜登还是川普,他们获得的票数,都是美国迄今为止最高的得票数,超过 1.5 亿的美国人出来投票,而 2016 年投票人数已经是当时历史最高了,也只有 1.2 亿人投票。今年这种情况可能是民调公司没有想到的,这可能导致他们抽样上的误差。
另外可能还有一个更为深刻的原因。那就是社会信任度的问题。
谷歌公司下属的一家数据分析公司 Civis Analytics 认为,川普的支持者,有很大一部分是对美国社会充满了不信任感的社会底层老百姓。他们不相信建制,不相信科学家,不相信大公司。在抽样中选定的这部分人,往往不愿意接电话,不愿意配合调查。分析指出,接电话接受调查的人群,其社会信任度 social trust 的程度,高于普通民众。接受调查的人,其民主党或倾向于民主党的可能性,高于共和党或倾向于共和党的可能性。另外还有一个很有趣的现象,就是,凡是相信 QAnon (阴谋论组织)的地区,民调都显得更为不准确。这是因为相信阴谋论的人,他们的社会信任度,非常低。虽然民调公司试图弥补这一偏差,但显然不太成功。请注意这样一个数据,在 1997 年,超过 1/3 的美国人在接到民调电话时愿意接受调查,而这一比例在 2019 年,下降到了 6%。
另外还有一个有趣问题,是这次大选特有的现象。在以往的大选中,候选人都是标准的美国政客,选民对候选人的关注点基本上是对称的。他们会对比双方的政策,双方的风度,双方的丑闻等。所以,传统上的民调,都是将同一个问题对称地去套在两个候选人身上,比如“你更同意川普的经济政策,还是拜登的经济政策?“ 但这一次,情况完全不同。选民其实不是在选择两个对等的对象。这次大选的选民投票抉择,实际上是在两个不同类别的对比中形成的。这两个不同类别是:”我是否还能忍受川普的恶劣人品?“ 和 ” 我是否能容忍拜登的加税政策?“ 这是两个完全不同的类别问题,但真实地存在于选民的抉择因素之中。这种不对称也可能造成民调问题设计的困难。
最后,还需要考虑到人的因素。尤其在人工调查中,调查者的语气和态度会影响被调查者,而被调查者给出的答案又会受到调查者的主观判定影响。这就是说,一个左派的调查者,更容易获得倾向于左派的答案,反之亦然。这就出现了左派媒体调查的结果,往往倾向于民主党,而右派媒体民调的结果,会倾向于共和党。
民调除了能够帮助商业人士更加了解顾客的需求外,在西方也是政治人物的问路石。民主政治中,了解选民意愿的重要性无论这么说都不过分。那么民调机构在这两次非典型大选中获得的经验和教训,对于民主政治来说,也是非常重要的。