编者按:临近大选,几乎各家媒体每天的新闻里都少不了总统支持率、民调结果等数据。那么,这些数据究竟是怎么来的?这些数字真的能反映选民们的倾向吗?今天我们就来聊聊民调。
民意调查的结果经常占据日常的新闻版面,例如有多少45-65岁的人喜欢玩Nitendo Switch游戏,多少美国人信上帝等等。今年正逢选举年,随着美国大选的日期日益临近,每天打开电视,或者各大新闻网站,就充斥着各种民调的数字,例如有多少共和党支持者比民主党支持者更倾向于到投票点投票等等。
昨晚最后一场总统辩论刚刚结束几个小时,有媒体和机构就放出了对此次辩论中谁胜谁负的民调结果。比如CNN,直接在节目中显示拜登以53%对39%的比例赢得了这场辩论。
与CNN发布的时间相差不多,另一家机构US Politics Polls也发布了一份民调结果。有52%的参与者认为拜登获胜,39%的人认为川普胜出,9%的人认为是平手。
上面的US Politics Polls民调,是对772名观看了当晚辩论的可能投票者进行的闪电调查。这样的调查是否有参考价值?是否能反映真实的民意?这么多民调是怎么来的,谁在做民调,如何确定民调的对象以及最常见的问题,民调到底准不准,被川普支持者嗤之以鼻的各种民调结果是否信得过?今天我们就来聊聊民调是什么。当然,也有人会用民调来恶搞,比如第一场辩论会前恶搞网站Babylon Bee就PS了上面这张图,还煞有介事的写了一篇文章(原文链接:https://bit.ly/31BxV8R)。
这图被一个喜欢造谣的油管大V日常引用,还说是大选后CNN做的民调,以此来证明民调的结果不可信,可见其信息来源的不可靠,以及这些人不懂英文,因为标题明明写的辩论前的民调。这是题外话,那么真正的民调是怎么做的呢?政治性的民意调查也是公共意见调查的一种,如果调查得当,公共意见的民调是一项精确的社会科学实践,它对样本空间,参与者的随机选择,以及误差范围都有严格的规定。然后,即使是最高水平的民调也只是民意在特定时刻的快照,而不是永恒真理。比如核电站灾难之后调查民众对核能的意见,支持的比率就会比灾难发生之前低很多。政治民调亦如此,跟随着候选人在选战中展开激励的争夺,选民的意见可能每周,甚至每天都会经历戏剧性的变化。政治民调也不总是科学的,在19世纪末20世纪初的时候,新闻工作者对普通公民进行田野调查,以评估公众对政客和即将举行的选举的看法。例如一个乘坐火车的报社记者,可能会向每个坐在车上的人提问同样的问题,然后将结果进行汇总,并把这个作为事实发在第二天的报纸上。这样的调查,由于其局限性太大,自然难言准确。如今,高水平的政治民意调查组织采用数学方法和计算机分析,来收集美国投票公众中最具代表性的样本的回应。但是,政治民意调查科学中仍然有很多“艺术”,甚至必须对随机响应进行调整和筛选,以识别选民意见中的细微趋势,从而有助于预测选举日的最终获胜者。而有关民调结果准确性最重要的指标就是,抽查样本的代表性。抽查样本是如何选取的?
民意调查的目的是通过询问一小部分可能的选民来评估整个国家民众的政治观点。为此,民意调查人员必须确保样本组准确代表更大的总体。如果选民的50%是女性,则样本组中的50%需要是女性。这同样适用于年龄,种族和地理位置等特征。为了获得准确的,有代表性的样本,民意调查者会使用概率论来建立模型。使用概率理论的目的是使得看似随机的数据具有统计学上的意义。通过为数据建立数学模型,研究者可以准确预测将来发生事件的概率。民意调查者试图提出能够准确预测选举的模型,为此他们需要从一个完全随机的样本开始,然后调整样本以使其与整个人群的特征相匹配。左侧为总人群,右侧为筛选出的样本人群。最理想的状态是右侧的人群特征与左侧完全一致。获得随机样本的最通用方法是通过随机数字拨号(random digit dialing)。民意调查者先从一个不断更新的数据库开始,这个数据库收录了全国的列在电话号码簿(黄页)上的电话号码,但是黄页上是没有手机号码的,只有座机号码。而且有很多人的电话号码,并没有被列在黄页上。如果只给列在黄页上的电话号码打电话调查,则这样的电话号码并不是真正随机的,因为没有包括未在电话号码簿上列出号码的人。由于美国10位数的电话号码是有规律的,每个号码分成三段,前三位是区号,中间三位是交换局号,后四位是随机号码。研究人员就利用电脑,对黄页上的号码进行分析,分析区号+局号活跃的电话号码数字块。然后随机拨打每个活跃块中可能的数字组合。而且手机号码和座机号码的区号+局号组合是不同的。这样就成功的解决了未列在黄页上的电话号码以及手机号码的限制。对于真正的随机样本,民意调查人员不仅需要拨打随机号码,还需要在家庭中选择随机的受访者。统计数据显示,与其他美国人相比,女性和老年人接听电话的可能性要大得多。为了使样本随机化,政治民意调查人员通常要求与房屋成员中,生日最近者对话。当然,这是仅在拨打固定电话时使用的方法。一直以来,很多的新闻机构都采用随机打电话的方式进行民意调查。手机的普及和座机的消失给民意调查带来了新的挑战。例如美国广播公司ABC在2008年才开始通过手机号码进行民意调查。现在,为了确保民意调查中手机与座机号码的比例和全国实际的比例相一致,该新闻机构将其民调来源的比例更新为75%的手机和25%的座机。然而,美国联邦法律的规定,不允许用自动拨号系统拨打手机,所以从事民调的人员必须手动拨打受访者的手机,这就使得包括手机号码的民调成本更高。学概论统计的时候我们都学过,样本空间越大,则调查的结果越接近真实情况,但是实际情况并非如此。根据皮尤中心2018年的一项研究表明,对于抽样调查8000人的结果,并没有比调查2000人的结果精确多少。(原文地址:https://pewrsr.ch/31BBZG9)根据皮尤中心的研究,在一项对比调查中,8000个样本的组仅比2000个样本的组准确率高0.2%民调的误差
民调都有误差,在一般的新闻报道中,民调的误差,也就是所谓的误差容限(margins of sampling error,简称MOSE)是一个不一定会被提及,容易被人忽视的概念。MOSE有一个仅基于样本组大小的,直观的计算公式(假设总人口为10,000或更大)。通常,样本组越大误差范围越小。例如,样本量为100的受访者群体,其MOSE为+/- 10个百分点,这是非常大的。但是,有1,000名受访者的样本组,其MOSE就减为+/- 3个百分点。而为了达到MOSE +/- 1个百分点,您需要至少5,000名受访者的样本。因此,大多数政治民意调查都针对1,000名左右受访者,因为它能以最少的电话提供最准确的结果,达到调查成本与调查结果的平衡。538网站列出的一组不同机构发布的针对弗罗里达州的民调结果,红框内为受访者人数,均在600到1000之间。比如女主播说,最新的民调显示,旺财跟小强的支持率是51%对49%,误差3%。那意思就是说旺财的支持率是从48%到54%,而小强的支持率是从46%到52%。小强也可能以52%对49%在选举中获胜。所以说2%的民调差距并不能确保旺财就一定在选举中获得胜利。现在拜登跟川普比在全国民调中领先9%-10%,如果按照现在的情况投票的话,误差容限(MOSE)是小于两者的民调差距。也就是说如果按照目前民调结果的话,即便考虑了误差的情况,拜登也能获得全国普选投票(popular vote)中的多数。当然,由于美国采取的是选举人团制度(electoral college vote),即便赢得了普选投票的多数,但是未能获得选举人团投票多数的话,也并不意味着拜登可以赢得选举。加权民意调查结果
如前面所述,具有代表性的抽查样本要随机选取。民意调查组织试图通过电话随机采访获得一个完全随机的抽查样本。但是随机拨号调查也有局限性,因为研究发现,女性和年长者更倾向于接听电话,年轻人则不爱接电话。这就打乱了样本的性别和年龄比例。于是要对采样结果进行一定的加权调整,以达到跟潜在选民人口性别年龄比例较为一致的结果。要知道达到选举年龄的人并不一定会去投票,这又给民意调查增加了难度。如果要获得最准确的政治投票结果,则需要进一步过滤样本,以淘汰所有不太可能投票的受访者。这就是政治民调的“艺术”发挥作用的地方。最好的民意调查机构是可以开发民意调查问题和分析模型的组织,这些问题和分析模型可以将小麦与谷壳分开,并仅将最有可能的选民的回答分离出来。毕竟,在政治意义上,只有真正投票才能发表意见。民调的问题设计以及推票民调(Push Polling)
确定了如何找到受访者、找多少受访者,民调的下一步就是如何进行调查了。因为大多数政治民调都是通过电话进行的,无论民意调查员是真人调查员还是机器问答,回答的结果通常都是固定的,一般都是选择题。民意调查者发现,民调答案的措辞可以提供对政治观点更深入的理解。比如,民意调查公司Rasmussen Reports每天都会跟踪总统的支持率。与简单地问受访者支持还是不支持总统的表现不同,Rasmussen要求受访者从下面几个选项中选择:强烈支持,某种程度的支持,某种程度不支持和强烈反对。该民调公司发现,“某种程度”选项对于捕捉到细微的意见倾向很重要,也避免更多人直接选择“我不确定”这样的纯中立选项。
Rasmussen Reports 每天都在发布各类不同的民调
但是有时候民调的问题也有误导性和带有催票性质,比如我自己就接到过这样的电话调查,问的问题是:“某某党把纳税人的钱都用于修这些无关紧要的项目上,你是否赞同?”这明显是把个人观点掺杂在民调之中,背离了民调的中立性。
这就是推票式民意调查(push polling),它是伪装成合法政治民意调查的负面政治广告。这些问题并没有向受访者提出有关几个候选人政治见解的一系列问题,而是专门用来推销目标候选人的负面印象。在某些州,推票式投票是非法的,被视为违反选举法。美国公众舆论研究协会谴责推销民意调查削弱了公众对政治民意调查的信心。还有一种民调会在大选当天出现,就是出口民调。我们才看大选开票的时候,投票还没有结束,或者票数还没有完全统计出来。各大电视台就开始纷纷出投票结果了。这是因为各大新闻媒体在选举投票日当天会派出大量的采访人群,在投票站门口询问选民他们投票给谁以及投票理由。这些出口民意调查提供了选举当天的第一手资料,其结果将实时收集,并与主要电视机构组成的国家选举池共享。例如在2016年大选时,ABC News就在各州进行出口民调,并实时在节目中发布2016年特朗普赢了就意味民调不准吗?
因为美国的选举制度,是由选举人团制度形成的间接选举,也就是对于各州普选票领先的一方,赢者通吃该州全部的选举人票。其本意是为了平衡大州和小州之间的不平衡。然而,这一制度导致的结果就是大部分的蓝州和红州对选情的影响不重要。选举胜负的关键就集中在一些所谓的摇摆州。以往的投票,全国民调的结果还是比较准,但是地方的民调结果就没有那么准。2016年大选,希拉里赢了普选票300多万,却输了选举人票。然后很多人就说民调不准,不在相信民调。其实2016年,最后时刻的全国民调显示希拉里领先3%,而希拉里最终赢了普选票2.1%,可以说全国民调还是相当准的。2016年民调的问题主要出现在摇摆州上,中西部的几个摇摆州表现出来的问题比较严重。这主要由于摇摆州民调中的取样比例,低估了白人蓝领所占的比例,导致偏差增大。而且民调时,因为川普的口碑和形象都较差,很多人可能不好意思说自己投给川普,所以大部分受民调时声称“未决定”的选民最终把票投给了川普。2016年大选,受教育程度和投票结果之间的关联,学历越高的选民对民主党的支持率也越高2016年之后的民调机构做了一些修正,开始根据选民的教育程度来进行采样。而且今年大选的两极分化,比2016年更严重,很多人早早就决定了选谁,不管再出什么新闻都铁打不动,提前投票的人数也已经创历史新高,也有更多的人敢于直言不讳对川普的支持。所以预计今年的民调结果应该比4年前更为准确一些。今年拜登的全国民调数字,一直是在50%附近徘徊,比川普的数字领先得比较多。而2016年,希拉里和川普的民调数字比较纠结,也较为接近,领先的幅度也没有拜登这么大。而且民调和预测网站,比如538和RCP,都增加了它们作为信息来源的民调机构的数量,期望能增加其准确性。但是由于有选举团制度的存在和共和党的结构性优势,民调结果跟选举结果之间到底会有多大的误差,还存在一定的变数,只有选举结果揭晓的时候才能知道。