开学特辑⑩:算命先生还是科学?政治学预测的价值 | 学科发展
编者按
在这个不确定性加剧的时代,如果你能够对某一时间进行准确的预测,无论是天气预报、股市走势,还是地区局势,我们相信你一定会成为公众追捧的对象。在政治学研究领域,参与者最为众多的预测研究变式对选举结果的预测。这些预测不仅提供了为政治学正名的机会,也给公众带来了对未来的期待。然而,随着预测工具和模型的日益变化,预测并非如我们想象中的那样100%准确,甚至于因为预测模型的普遍失准(比如2016年美国总统大选),政治学的科学性受到了公众的普遍质疑。
那么,政治学的预测究竟有何价值?这种预测又和村口摇着铃铛,嘴里喊着“阴阳五行,十卦九灵”的算命先生的铁口直断有何区别?基于此,我们编译了《为什么预测?预测对政治学的价值》一文。文章深入探讨了预测在政治科学中的作用。文章指出,预测不仅是对即将发生事件的猜测,更是对所建立政治理论的一次检验。预测模型的成功不仅在于它们能否准确预见结果,更重要的是它们能否提供有价值的解释。科学预测是一种逻辑推论,它基于现有的理论来推测未来的可能性,并且这种推测是有条件的——“如果条件C成立,那么我们预计Y”。因此,政治科学家必须清晰地界定自己的预测内容,同时也要向公众传达预测的本质和局限性。预测的价值不仅仅在于它是否能够准确预测结果,而在于它如何帮助我们理解驱动选举结果背后的结构因素。
开学特辑⑩:算命先生还是科学?政治学预测的价值
(原标题为:《为什么预测?预测对政治学的价值(Why Forecast? The Value of Forecasting to Political Science)》,现标题为译者所拟)
作者:
Keith Dowding, Australian National University
编译:
焦磊,山东大学
引文格式(MLA):
Ishiyama, John. “Whither Political Science in a Post-Pandemic World? Challenges, Trends, and Opportunities.” Perspectives on Politics, vol. 21, no. 2, 2023, pp. 419–24.
快速阅读(本部分基于AI生成)
文章《为什么预测?预测对政治学的价值》探讨了预测在政治学中的作用及其价值。主要观点如下:
预测对政治学的重要性在于,准确的预测可以帮助我们更好地理解选举过程。然而,如果预测被误解或相互矛盾,则可能导致行业声誉受损。
文章区分了普通预测与科学预测,强调科学预测是从理论中得出的逻辑推论,它不需要指向未来,而是条件性的陈述。例如,“如果条件C成立,那么我们预计Y”。
公众对于概率估计的理解不足,往往会高估预测的确定性。实际上,预测存在不确定性,特别是在不寻常的选举中,如2016年的美国总统选举。
判断预测模型的标准包括预测的成功率、概率范围的宽度以及预测的时间跨度。科学模型的价值在于其解释能力,而不单是预测准确性。
政治科学应当专注于预测那些具有相对稳定模式的事件,并且需要高质量的数据支持。预测选举结果的能力取决于数据的质量及选举本身的稳定性。
结构模型相较于简单的民意调查聚合模型能够提供更多的解释信息,因为它们使用了客观的经济和政治指标。结合两种模型可以提高预测准确性,但未必能增强科学解释力。
预测模型越可靠,其科学基础越坚实。预测未知数据比仅容纳已知数据更有助于科学进步,因为它表明模型不过度拟合。
社会生活中的稳定模式使得预测成为可能,但也存在风险,即批评者可能会利用预测的不准确来质疑政治科学研究的有效性。这是对科学预测本质的一种误解。
因此,政治科学的问题在于,公众可能会通过对单个象征性事件的预测的准确性来判断其科学价值,同时误解这些预测的实际内容。
40年来,政治学界一直在对总统选举(和其他)进行严肃预测,现在已扩展到学术界以外,出现了许多相互竞争的在线和媒体预测。它们对公众和候选人来说当然很有趣,但它们对政治学的价值是什么?一方面,如果我们准确预测结果,那么在理解选举方面应该会有认识上的收获。另一方面,如果评论员和公众误解了预测,或者不同的方法提供了相互矛盾的预测,那么预测业务可能会使我们的职业声名狼藉。
在这篇评论中,我将首先以一种相当简单的方式阐明预测被误解的危险。其次,我将区分预测和科学预测。本次研讨会中的预测模型对下一次总统选举的结果进行了预测。至少,这是一种描述。一些人预测候选人的普选票数,一些人通过预测州选举结果来预测选举人团的构成,一些人将普选估计值转化为选举人团估计值,还有一些人预测国会选举的结果。这些具体的预测将由11月的实际结果来判断。
判断2016年研讨会的一种方法是,在九个预测中只有两个预测了特朗普的胜利,其中一个是不自信的警告:“希拉里·克林顿可能被认为是一个强有力的获胜候选人”。然而,六个克林顿胜利预测模型是基于50.4-52.5%的普选票数得出的,这几乎完全符合她实际获得的51.12%的投票率。这六种模型可能被认为在它们实际建模方面是正确的。当然,总统不是通过普选产生,而是由选举团选出。因此,目前研讨会上的八篇文章也模仿了选举团制度,或者至少考虑到了这一点。这一点显而易见:我们所认为的预测会影响我们对模型成功与否的判断。但是,我们能够根据不同的标准做出不同的判断这一事实可能会引起公众和媒体对整个行业的怀疑,使该学科声名狼藉。
预测者可以明确他们实际预测的内容,即使评论员没有。然而,还有其他更深层次的解释问题。公众不了解概率估计,也不理解这些估计存在误差;因此,人们高估了预测的确定性。根据民意调查数据得出的仔细估计可能是错误的,因为报告的民意调查误差幅度仅包括抽样而不是总调查误差。换句话说,预测并不像它们通常声称的那样确定,而且经常被误解。我们不能指望每一次预测都是正确的,尤其是在像2016年这样不寻常的选举中。许多“错误”的预测实际上完全在预测不确定性的范围内。但试图向公众解释这一点很可能会引发公众对“所谓的专家”更大的怀疑。
我们主要根据(1)预测成功,(2)概率范围狭窄和(3)交付周期长短来判断预测模型。科学模型的判断依据是它们的解释价值。可以肯定的是,与世界的预测性契合是这种解释的必要特征,但科学预测不是未来预测。科学预测是从某种理论中得出的逻辑推论。它不需要任何未来的参考。科学预测是存在的,也是解释的必要部分。它们是存在的,因为它们是有条件的。他们说“如果条件C成立,那么我们预计Y”;或者“如果条件C成立,那么我们预期Y以某种概率p成立。”它们是解释性的,因为如果假设C可以解释Y,那么它应该在所有类似的情况下都能做到。
当然,有了足够的数据,科学模型就可以预测象征性事件。天文学家有足够的数据来预测日食或月食,但无法预测陨石何时会落在白宫草坪上。他们无法预测后者并不会玷污天文学。政治科学应该只能可靠地预测具有相对稳定模式的事件,而且只有具备良好数据才能做到这一点。我们预测选举结果的能力取决于良好的数据,也取决于选举具有相对稳定的模式。2016年,预测者知道两位候选人的特点和特朗普竞选活动的异常特征将使选举变得不同寻常——正如Erikson 和Wlezien很好地指出的那样,“预示着更大的不确定性”。
科学预测涉及类型的结构特征,在预测象征性例子的细节时需要关于意外事件的具体数据。此外,从科学的角度来说,每次正确预测获胜者并不像模型的证据方面那么重要。毕竟,选举结果的所有细节的直接原因在于每个选民如何投票以及计票规则。在科学中,我们想要的是最终原因、结构特征,这些可以解释选民投票的原因。当然,不是针对每个选民的,因为任何给定的事件都包含不同层次的细节——有时被称为描述的“粒度”。拜登赢得总统职位可能是由许多不同的事件在较低层次上造成的。预测可能是不正确的,但可以准确地跟踪它们所使用的证据,或者在没有跟踪解释因素的情况下是正确的。
一些预测模型只是简单的聚合——它们从民意调查中推断。人们说他们打算如何投票是他们将如何投票的一个指标,但民意调查并没有提供太多的解释。投票意向可能会跟踪世界上的突发事件,但需要将理论和其它证据联系起来。对偶发事件最好进行回顾性跟踪。例如,Lewis-Beck和Quinlan很好地检验了希拉里·克林顿对导致她失败的体制因素和偶然因素的看法,而Sances则模拟了据称不寻常的县翻转情况,以观察随着时间的推移是否真的不同寻常。
结构模型使用客观的经济和政治指标。它们通过解释提供更多信息,并且比综合预测更准确。将两者结合起来可以提供更准确的预测,尽管提前时间较短,但它们本身并不能提供进一步的解释,因为它们仍然只映射偶然性。因此,改进预测并不一定会提高科学预测。2016年大选前一周的民意调查变化可能无法告诉我们2020年选举中类似的民意调查变化,除非两者都满足相同的条件C。从科学上讲,我们所学到的只是民意调查在最后一周可能会发生变化。
然而,我们可能会认为预测模型越可靠,其科学依据就越强。相信预测是政治科学正确途径的一个很好的理由是,预测未知数据的模型在认识上优于仅容纳已知数据的模型。已知的数据限制了潜在的解释理论,并不能增加我们对任何理论都是正确的信念。预测未知数据增加了某些东西。通过过拟合可以实现包含已知数据的高度预测模型。预测未知数据表明我们的模型没有过度拟合。然而,即使数据已知,也有办法防止过拟合。只有当新数据追踪到模型之间其他具有显著意义的差异时,才会产生认知优势。此外,模型可以在类型级别上跟踪证据重要性,但无法在特定的标记示例中跟踪证据重要性。
科学的预测和解释是针对类型的。为了证明给定标记事件的准确性,科学预测需要挑选出该事件中具有明显重要性的东西。如果选举结果接近,预测的信心较低,那么一些特定的情况可能是因果关系重要的。在总统选举中,这些可能是某个摇摆州特有的情况,也可能是不寻常的情况——比如大流行!事件后的适应可能会导致过度拟合,并不能提高长期模型的准确性。当然,预测的概率分配旨在考虑偶然因素。总体上表现最好的预测模型是那些对整个类型最明显重要因素进行建模的模型。
社会生活中有很多稳定的模式,它们往往能持续很长时间。对特定事件进行预测;有时,这些并不符合整体模式。预测模型对政治学来说显然很重要,因为它们对我们的调和主义建模进行了认识上的检验。然而,危险依然存在。批评者可能会嘲笑标题预测的准确性,然后利用这一点来贬低政治研究中的科学。这是对科学预测本质的误解,并且容易灌输我们对未来事件进行预测的能力期望,这些事件具有复杂的因果决定因素,其粒度水平是自然科学家从未预料到的。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰