川普能否连任?
距离11月3日美国大选日只有一天时间,算上时差,也就一天半时间。最近我特别留心观察中文媒体关于美国大选结果的预测,总体就一个感觉,拍脑袋的居多。包括不少专业机构做的分析,也很不专业。
举个例子,中金公司是国内首屈一指的投行,最近做了几篇美国大选的公开研报,最新一期是今天发表的《中金 | 美国大选前瞻:拜登胜率较大,参议院焦灼》,其中主要两个观点:一是认为美国今年的民调预测比2016年更“靠谱”,二是认为民主党“横扫”总统和两院“依然是概率最高的情形”。
而这些观点的依据是什么呢?是美国数据聚合分析网站538(fivethirtyeight.com),和另一家分析网站realclearpolitics的分析数据。
目前国内关于拜登将会大胜的研究性观点,依据主要包括:
1、538等聚合分析网站的预测结果;
2、美国主流民调机构的预测结果;
3、佛罗里达大学Michael McDonald教授的United States Elections Project的统计结果。
以上三方面,是相对“靠谱”的数据来源,引用这些数据作为分析依据,可以理解。但这些数据是否真的“靠谱”,引用是否适当,这是许多国内分析者有欠考虑的。
真正从头做过基础数据统计,再进行分析,最后得出分析结论的其实是极少数。大多数分析,都是基于他人的数据。而统计数据是一个神奇的东西,统计的标准,才是真正的“魔法”。2016年美国大选的主流民调数据基本全错,主要原因就在于统计的标准是按照美国主流民调机构的传统标准设定的,而这个标准并未将那些“非主流”群体纳入在内。事后人们发现,原来这些“非主流”竟然“不知不觉”的成为了“主流”。一次民调的样本量大概多少呢,少则千余,多也不会超过上万。所以这门科学,要以数千统计量去预测数千万人的行为,这本身就非常难,如果再有点“私心”,很可能离现实相差甚远。
最近一段时间,国内分析非常喜欢采用538的分析结论,538是Nate Silver创办的数据聚合分析网站,因为成功预测2008年和2012年两次美国大选(也就是奥巴马的两次胜选),名声大振。之所以讲538是数据聚合分析,是因为它本身没有任何基础数据,只是依赖民调机构的基础数据,在此基础上进行二次分析。这也意味着,只要民调机构的数据发生变化,538的分析结果就会随之而变,这种变化会非常快,可能一天一变,甚至一天多变。538的优势在于,它聚合了全美大小上千个民调数据,然后通过算法让这些数据进行相互碰撞,得出没有预设立场的结论。
这种聚合分析模式,是在不停的实时变动中去接近最终的结果,但必须记住,它的基础数据是来自其他民调机构的。尽管在奥巴马两次竞选时538都成功预测,但在2016年希拉里与川普的对决中,到2016年10月7日,538的分析结果仍然是希拉里有80.7%的胜率。
比起有预设政治立场的主流民调机构,538相对独立,但这种独立并非一定会带来绝对正确。主要原因包括:
1、538的基础数据全部来自民调,而许多民调机构其实都已预设立场,并非那么中立。今天美国的主流媒体差不多都在支持民主党,这些主流媒体的民调一定会显示拜登胜,且在摇摆州也会取胜,只是胜多胜少的问题。反过来,支持共和党的主流媒体是少数,在民主党媒体“山河一片蓝”的情况下,很难显示“一片红”。538关于不同民调数据的权重如何处理,这是非常关键的。
2、民调本身不能包罗万象,民调数据与现实远离的重要原因,包括一些难以言说的问题。例如,在美国公开歧视黑人几乎不可能,但这不代表许多白人内心就不反感黑人。民调只能存在一些冠冕堂皇的调查事项,难以显示那些“政治不正确”的调查项。在《贺锦丽对拜登来说是一个好的选择吗?》,我们已经提到一本书,Everybody Lies,在奥巴马竞选时,google上就有大量检索nigger president这样的信息。在之前的文章中,读者们也已经了解了在BLM运动兴起之后,川普时刻提起的law and order其实是1960年代George Wallace主政下的Alabama州,白人老百姓拥护的反对黑人群体的口号之一。以上这些在民调中难以被涉及的方面,目前却是影响许多人投票的关键因素。
3、民调数据采样的不足。聚合数据分析在一定程度上弥补了单个民调数据的不足,但真正基础的数据仍然会有很多不足。与政治随大流时代拿下主流地区就拿下选举不同,民粹主义时代,曾经的“非主流”变成了“主流”,政治结构的切换让数据收集的地域问题突显。美国大选的投票率通常在50%多一点,这也意味着大量选民并不参与投票。2016年之后投票率的大幅提升,两党都要拜民粹主义所赐。右翼的川普和左翼的桑德斯,把曾经不投票的群体都鼓动起来了。今年的投票率很可能要创几十年新高,但传统的民调区域可能不足以覆盖那些过往不怎么投票的地区。
从民调数据看,虽然拜登仍然大幅领先,但这也让川普的支持者有了哀兵姿态。临近大选日,川普以惊人的毅力和体力连续在摇摆州举行竞选集会,现场支持者人数之多,令众多支持民主党的媒体也不敢轻言最后胜负。可以说在民主党占优的邮寄选票阶段结束后,川普能让摇摆州多少尚未投票的选民去投票站,成为了决定胜负的关键。
11月1日川普在宾夕法尼亚州Butler的竞选集会现场
除此之外,国内部分误读源于对United States Elections Project(USEP)统计结果的理解。根据USEP的统计,最新的已投票数据是9,329.7万,其中现场投票是3,404.5万,邮寄投票已返回5,925.2万,待返回3,195.8万。其中已经能够区分出注册党派的数据如下(截至11月1日):
这里的Democrats、Republicans分别是投票时注册为民主党、共和党的已投票选民人数,而非最终投向这两党的人数。No Party Affiliation则是没有注册为两党的已投票人数。在这个统计里,截至发布时间(11月1日),尽管注册为民主党的已投票数量超过了注册为共和党投票数量大概15%,但仍然有高达23.4%的投票是来自非两党选民。除此之外,已投票数量接近1亿,但如果以今年超常的投票热度来看(预计最终投票人数可能达到1.5亿),那意味着近三日的现场投票人数可能超过5,000万,而最近三日的现场投票意味着一边倒的支持川普。
所以,站在此时此刻,真的敢说拜登会大胜吗?
中文媒体关于摇摆州的数据分析是比较少的,有兴趣的读者可以尝试找一找,关于摇摆州的分析数据(是票数统计而不是民调)才最有针对性。到今天再看民调(包括聚合数据分析),已经没什么意义了,直接数票才是更有效的。
川普是否能够连任?站在今时今日,我的回答是,川普连任概率仍然很大。
但这并非最需要关心的。我们真正需要思考的是,为什么在新冠大流行如此严峻的美国,在BLM运动如此如火如荼的美国,川普仍然没有被美国民众一举放弃?支持他的数千万美国民众,是蠢、是笨、是无知、是低智,还是另有别的原因?
对上面这个问题,在《民粹主义改造美国(增补完整版)》中,我们已经给出了解释。历史的认识,永远是比简单的数据认知更有意义的。可以不谦虚的讲,时至今日,国内关于美国民粹主义研究最有深度的文章,是在这个公众号上,而不在任何其他纸面媒体上。而这正是深刻理解今日美国的一把关键钥匙。如果不能从美国的长期历史中找到变革的脉络,也就难以深入理解和判断美国未来的走向。
最简单的办法仿佛是把美国未来的所有结局都想象成与中国高度对立,在每个方面都维持最底线的思维,那这跟美国某些政客要追求的、自我实现的“修昔底德陷阱”,又有什么差别呢?
更加深入的理解美国人民,而不是更加深入的理解华尔街和硅谷,才是一个人民的共和国应有的选择。
以上。