模型,模型,还是模型!现代政治科学的核心方法 |【研究方法】专题
编者按
现代政治科学研究是由模型所驱动的。每一项研究和每一篇文献都在利用理论及其构建的模型解释现实世界。但是,我们对模型的作用及其功能的理解真的正确吗?我们利用模型的方式是否真能够如我们在理论中所说的解释因果关系,或是对未来将发生的事件进行预测?Kevin A. Clarke 和 David M. Primo 在这篇论文中进行了相关的回答。这篇文章挑战了传统的模型测试方法,并倡导一种新的模型评估框架。他们不仅详细阐述了模型的不同目的,即基础性(Foundational)、结构性(Structural)、生成性(Generative) 、解释性(Explicative)和预测性(Predictive),而且还提供了一系列实用的社会科学研究规则,指导我们如何有效地运用模型和数据分析。
模型,模型,还是模型!现代政治科学的核心方法
(原标题为:《现代化的政治科学:基于模型的方法(Modernizing Political Science: A Model-Based Approach)》,现标题为译者所拟)
左为Kevin A. Clarke,右为David M. Primo
作者:
Kevin A. Clarke, University of Rochester
David M. Primo, University of Rochester
编译:
焦磊,山东大学
引文格式(MLA):
Clarke, Kevin A., and David M. Primo. “Modernizing Political Science: A Model-Based Approach.” Perspectives on Politics, vol. 5, no. 04, Nov. 2007.
内容提要
尽管模型的使用已经成为了政治学科学研究的许多方面的主导方式,但是这门学科对模型在科学工作中所起的作用或功能的理解却没有跟上。我们认为应该根据模型对特定目的的实用性来评估它们,而不仅仅是看它们的预测准确性。我们提供了模型的用途分类,并表明了这一领域过分强调模型测试是如何导致这些用途被模糊的。我们的方法强调了模型在科学推理中的重要性,避免了当前实践中的逻辑矛盾,为政治科学家提供了关于自然世界与我们所熟悉的模型之间关系的新思考方式。
快速阅读
本部分基于AI生成
主要观点
模型的角色:在政治科学中,模型被广泛使用,但对其作用和功能的理解却未能跟上步伐。文章提倡将模型视为对象而非语言实体,因此模型既不是真的也不是假的。
模型的用途:模型可以用于不同的目的,如预测、解释因果关系、生成新的研究假设等。每种用途都有其适用的标准和评估方法。
模型测试的局限性:传统的模型测试侧重于预测准确性,而忽略了模型在理解和探索政治现象中的其他价值。文章建议放弃简单的“模型测试”观念,转而关注模型的实际效用。
模型的应用
明确目的:研究者应当清晰地定义模型的目的,并据此选择合适的模型。模型的选择不应仅仅基于预测能力,还应考虑其在揭示未知机制或激发新研究方向等方面的价值。
数据分析的角色:数据分析应当服务于模型的目的,而不是仅仅作为一种验证工具。只有当数据分析有助于理解模型的意义时,才应被纳入研究。
实例分析
Achen的案例:Achen的论文展示了如何使用模型来解释已知的事实,而不是简单地进行预测。他的模型关注于解释党派认同如何从一代传递到下一代,这展示了模型在解释现象方面的强大能力。
社会科学研究规则
明确模型的目的:研究者需要明确模型的目标,并据此选择最适合的模型。
放弃模型测试的传统做法:应关注模型的实际效用而非其真假。
按需使用数据分析:数据分析应当支持模型的目的,而非仅作为验证工具。
整合模型与数据:将模型与数据真正结合起来,而不是简单地在文章末尾添加分析。
结论
呼吁政治科学家重新思考模型在科学推理中的角色,并提倡一种更加全面的方法来评价模型的有效性。
在政治学的科学研究中,模型的使用已经占据了主导地位。我们使用模型,无论是数学的还是其他类型的,来探究和揭示因果机制、生成比较静态情况以及理解我们期望特定结果发生的条件。虽然我们使用模型的方式在不断扩大,但对于模型在科学工作中所起的作用或功能的理解却没有跟上。
在20世纪70和80年代,模型被视为概念探索的工具,测试其假设或预测并不会带来太多收益。例如, Moe曾指出理性选择模型缺乏实证内容,而Achen则告诫说数学模型“应该被使用而非盲目相信”。理论建模有时会指导数据分析,反之亦然,但除了少数例外,该领域被理论家和实证主义者所分割。
随着政治科学中模型的普及,我们使用这些模型的方式发生了显著变化,如今,重点在于使用模型来生成可检验的预测作为后续数据分析的假设,而数据分析的解读则被视为对模型的检验。该领域已经形成了一个模型层次结构,其中“经过检验”的模型比那些未与回归分析相关的模型更有价值。虽然很多人主张以测试模型的方法来研究政治科学,但对这种方法的合理性和合理化却鲜有关注。很少有人试图去合理解释它。为什么从演绎以及因此是真理保留系统中检验预测?从这样的检验中我们能学到什么?如果预测未得到证实,那么是否要归咎于已知的错误假设?这些问题从未得到满意的解答。
缺乏对模型检验的合理化解释并不是重新审视模型在政治科学中作用的唯一原因。对模型检验的过度关注导致了对建模过程和数据分析艺术的扭曲。更偏好能做出良好预测的模型使该领域轻视了模型对理解政治世界作出的其他重要贡献。将数据分析作为检验模型的手段的过度强调使得回归成为假设检验机器,而忽视了数据分析在产生可作为进一步建模推动力的经验概括方面所能发挥的作用。
重新思考我们在政治学中使用模型的方式至关重要,因为一代学者正在被训练用过时且不充分的方式思考科学。理论模型的经验性影响(Empirical Implications of Theoretical Models,EITM)项目的成功突显出一个事实,即尽管政治学者比以往任何时候都更多地使用模型,我们仍然在旧的方式中思考。因此,这篇论文的目标是使政治学现代化。遵循Suppes、van Fraassen、Suppe等人的工作,我们将模型定义为一个对象,而非语言实体,因此既不是真也不是假。我们详细说明了模型可以应用的五种用途,并认为模型评估应类似于物理科学中的机械模型评估——好的模型对于特定目的有用。这种观点使政治学摆脱了对预测的过度强调所带来的不利影响。我们提出的不是仅仅改变语言;我们倡导的是改变政治学者构建、认知和利用模型的方式。这种基于模型的方法提供了新的思考方式,涉及模型在政治学中的用途、模型与经验世界之间的关系以及科学探究的语言。
什么是模型?
在讨论模型如何应用之前,我们有必要明确什么是模型。首先,我们通过类比来解释。地图是模型。地图不是现实,也不是现实的同构体。确切地说,它们是现实的表征。此外,地图是实物,而非语言实体。因此,询问地图是真是假的问题,就像询问茶壶、玩具飞机或燃气烤架等其他物理对象是真是假一样,毫无意义。地图具有片面性;它们代表世界的某些特征,但不代表其他特征,且准确度有限。地图是代表另一个对象即现实的物体。
对于地图,我们要问的问题不是它是真是假,而是它是否与真实世界相似。对这种推理的常规反对意见是,两个对象可能在无数种方式上相似或不同。对于此类反对意见,我们可以通过明确地图与世界在何种方式、何种程度以及出于何种目的上相似来解答。模型是否与世界足够相似,以至于对特定目的有用?地铁线路图可能与城市地理的相似性不大,但却与快速交通系统足够相似,使其成为所有通勤者的必需品。因此,正如Giere所言,“地图必然反映了地图制作者和使用者的兴趣。”也就是说,它们是相对有趣的。
如果理论是语言实体,那么询问它们是真还是假就有意义,就像任何陈述都可以是真或假一样。我们认为,政治科学家应该把模型更多地看作是表征对象,而不是语言实体。也就是说,我们认为政治科学中的模型应该被视为地图而非陈述,我们应该问我们的模型是否与真实世界足够相似,以至于可以用于特定目的。为了实现这一目标,我们考虑了与Patrick Suppes、Frederick Suppe、Bas van Fraassen和Ronald Giere等人的工作最紧密相关的理论语义(指语言与现实之间的关系,与指语言符号之间关系的语法相对)观点。语义方法的好处包括证明模型的核心地位,以及阐明模型与经验世界之间的关系。(模型是语义概念,因为我们关心模型与其指称之间的关系。)语义观点对政治科学家来说并不陌生,因为Henry Brady最近(尽管很简短)将其引入政治科学,他指出,在语义观点下,模型“类似于探索现实的工具”。
语义方法最重要的特点是,模型而非理论是科学事业的核心。语义观点的一位主要支持者甚至认为,对“什么是理论”这一问题给出精确答案并不重要。因此,在语义观点上,理论通常被视为模型的集合。
模型是一种系统,其特性由明确(有时详尽)的定义指定。由于模型是通过定义来表征的,因此从构造上来说,它不可能被证伪。例如,“牛顿粒子系统是一个满足运动三定律和万有引力定律的系统。”也就是说,该模型断言,如果一个系统满足运动三定律和万有引力定律,那么它就是一个牛顿粒子系统。
我们应该问模型的问题不是它是真是假,而是在某些方面和某些用途上,它是否与真实世界的系统相似。重要的是,实质性研究人员需要精确地说明在哪些方面以及出于何种目的,他们的模型与特定的现实世界系统相似。“测试”不再是“确认预测”的问题,而是评估两个系统之间的相似度是否足以满足特定目的。
因此,“一个模型可能适合,也可能不适合......但它既不是真的,也不是假的,也不是可证实的,也不直接受通常所说的归纳的影响”。在这种观点下,“证实”一个模型意味着证实关于一个模型的实证主张。也就是说,模型确认包括评估模型与自然系统的相似程度,以及它是否达到了其预期的目的。这样的评估不仅仅是最新的高性能数据分析技术,还允许在模型评估过程中使用范围更广的实证证据和方法。这种方法使实质性研究人员能够自由地精确说明他们的模型在哪些方面与他们试图解释的现实世界系统相似,在哪些方面不同。
模型的目的
由于模型应根据其对特定目的的有用性进行评估,因此有必要详细说明模型可以适用的目的,以及我们如何判断模型是否有用。在最基本的层面上,模型可以在五种不同的角色中任何一种(或多种)发挥作用:基础性的,结构性的,生成性的,解释性的,以及预测性的。请参阅表1以获取概述和示例。
表1 模型的目的
我们最熟悉的是模型的最后一个功能,即预测,尽管其主要目的是预测的模型的实际示例非常罕见。这些模型大多可以在国家选举预测领域找到。Campbell在PS:Political Science杂志上发表的一篇关于选举预测的研讨会上明确指出,这些模型的有用性应通过其预测的成功率来判断:“每个模型都预测了主要政党候选人在全国两党普选中的得票率……[并且]他们的评估应基于他们在预测选票方面的成功。”
然而,在大多数研究中,预测是从模型中推断出的假设。这种预测通常被视为科学中的“关键活动”,而模型的好坏取决于它们的预测能力。但是,正如Michael Laver所指出的那样,预测并不是模型评估的“全部和最终目的”。语义方法的一个巨大优势在于,它让我们能够超越预测,并判断模型是否适用于各种其他目的。如果我们考虑政治学早期的模型,就会发现有用性和预测之间的脱节,当时预测不准确并不会毁掉一个模型。
Downs首次在选举环境中使用的空间模型就是一个很好的例子。该模型预测,在两党竞争中,最佳政策立场是两个政党都位于中位数选民的理想点上。这个结果显然没有得到实证支持;候选人采取不同的政策立场,通常远离中位数。尽管缺乏预测准确性,但该模型在为候选人竞争提供直觉方面取得了非凡的成果。事实上,空间模型的许多扩展也做出了不准确的预测。政府部门间和立法谈判的完全信息空间模型预测,像阻挠议事和否决权这样的阻碍手段不应该发生,然而事实上它们确实发生了。
这个例子表明,预测能力和有用性之间的相关性远非完美。因此,模型可以以其他方式证明是有用的。例如,高度抽象的模型可能存在,为应用建模者提供基础性结果。这些模型可能不反映任何现实世界的情况,但仍然可以提供对一般问题类别的见解。考虑Arrow定理,它表明,除非让一个人成为独裁者,否则没有任何集体选择规则能够将所有可能的个人偏好配置连贯地转化为群体选择。模型也可以作为进一步模型构建的基础。Baron和Ferejohn的立法谈判模型已被用作数十种应用和扩展的基础。最后,一个模型可能将几个其他模型连接在一个理论框架下。Banks和Duggan为一类谈判模型建立了唯一性结果,其中包括分钱游戏、空间模型以及公共产品和交换经济模型。他们的模型还包括Black的“中位数选民定理”和Downs的政党竞争结果。
发挥组织或结构作用的模型不必像发挥基础作用的模型那样抽象。这类模型提供了一个“框架,其中可以定义、收集和整理信息”。此类模型的一个目的可能是在单一框架下收集一组不同的经验概括或已知事实。Chris Achen在一篇论文中提出的关于投票和政党认同的简单预期模型恰恰发挥了这一作用。在这篇论文中,Chris Achen证明了他的模型符合已知的十一个概括,因此“在一个统一的框架内包含了文献中的广泛发现”。
模型还可能具有生成功能。这些模型的目的在于它们的“丰富性”,即能够生成关于感兴趣的现象的有趣而非显而易见的陈述。Laver 显然认为理性选择模型正在发挥这一功能,并强烈主张理性选择理论的目的是“寻找有趣而非琐碎的同义反复论点”。“有趣”和“非显而易见”的陈述,在这个语境中,指的是违反直觉的结果,这是在模型解决之前未曾预料到的。例如,Romer 和 Rosenthal 为向选民提出预算的收入最大化议程制定者建模。如果选民批准预算,它就会生效。如果选民未能批准预算,则会自动实施一项替代预算。与直觉相反的结果是,替代预算越严格,议程制定者的权力就越大。推理很简单。对于严格的替代预算(那些低于中位数选民或议程制定者所期望的预算),替代预算的大小与最终颁布的预算之间存在反比关系。也就是说,替代预算越严格,政府支出就越大,议程制定者的境况就越好。那种认为机构负责人应该更害怕严格的替代预算而不是慷慨的预算的直觉是错误的。
最后,模型还可能起到解释说明的作用,这是指我们可以使用模型来探索感兴趣现象背后的假定因果机制。其中一种方法就是提出反事实或“假设”问题。一个很好的例子是 Knight,他使用两个博弈论模型来分析杰斐逊和马歇尔之间关于司法审查的冲突,然后使用这些模型来提出“假设”问题:“通过改变博弈中的相关条件,我们可以评估构成这一时期不同解释基础的历史反事实的相对优势。”在另一个例子中,我们可以使用一个模型来探索制度变革对行为和结果的影响。为不同的q规则(其中q表示立法通过所需的立法者人数)解决立法议价模型,可以检查超级多数要求对议程制定者权力的影响。请注意,对于旨在回答“假设”问题的模型,预测几乎不能成为衡量其成功与否的标准,因为这些问题涉及尚未实际发生的情况。
由于模型可用于多种目的,因此预测成功不能像我们经常做的那样,成为我们评估模型的唯一指标。事实上,预测可能与模型的目标正交。鉴于模型是目的相对的,适当的评估必须从确定模型的意图开始。一旦确定了这一点,我们就可以问模型是否达到了其既定目的。因此,模型的目的产生了其自己的成功标准。产生大量有趣陈述或反事实的模型是成功的,经常被用作进一步调查的基础构件的模型也是如此。同时,很有可能构建出产生无趣、空洞或狭隘结果的模型。有用的模型无论其预测能力如何都应继续存在,而没有用的模型则应因被忽视而消亡,同样,这也与其预测能力无关。
政治科学方法
为了清晰区分前一节概述的模型理解与政治学学科现状,我们需要对政治学中的大多数科学方法进行描述和批判。这种方法的专业术语是假设演绎法(hypothetico-deductivism,H-D),乍一看,我们似乎在描述政治学的讽刺画。然而,我们将从纪录片记录中提供的证据来继续讨论,政治科学家确实是以这种方式写作和思考的。
H-D方法包括以下内容:
为测试或检查而设立的假设H;
由H以及理论背景陈述、混合陈述、边界条件等暗示的观察句O;
以及对世界的实验或检查,我们观察到的是O或~O。
如果我们观察到~O,那么我们就反驳了H。如果我们观察到O,那么我们就证实了H,或者至少没有反驳H。简单来说,“理论意味着预测(基本句子或观察句子);如果预测是错误的,则理论是错误的;如果足够多的预测是正确的,则理论是正确的。”
从表面上看,这种方法似乎很难反驳。从模型中推导出预测并进行测试,还有什么比这更直截了当的吗?然而,正如我们和许多人所争论的那样,一旦人们开始摆脱其直观的吸引力,H-D方法的直截了当就会崩溃。H-D模型的一个特别缺点是,它没有具体说明测试演绎含义能告诉我们关于该模型的什么信息。
从测试模型的含义中,我们能了解到关于演绎模型的什么信息?表2描绘了世界的两种状态。模型的假设要么为真,要么为假。如果模型的假设为真,那么模型的预测一定为真,因为演绎系统是保真的,因此测试是不必要和多余的。正如多伦和塞内德所写,“演绎推理与归纳推理相比有一个明显的优势,即它不需要在经验世界中得到验证。事实上,它甚至不需要反映现实世界的现象。它的证伪是由于内部不一致导致的。”
图2 世界可能的状态
如果模型的假设是错误的,那么模型的预测可能是真或假。并不是说如果假设是错误的,那么预测也一定是错误的。(演绎系统不保留谬误。)因此,即使假设模型可以为真或假,预测是否在数据分析中得到验证并不能告诉我们模型的真相。预测的准确性并不以任何必要的方式与模型相关联,因此其准确性不能反映模型。
当然,政治科学家永远不知道世界的真实状态,因此可以认为错误的预测确实表明假设是错误的。这个论点相当有效,但政治科学家清楚地意识到几乎所有的假设都是错误的。因此,数据分析不能告诉研究人员模型是否“确认”。我们应该注意,辩解说我们的假设“大致正确”或“足够正确”并不是一种辩解。当假设是近似的时候,演绎模型的保真属性就不成立了。在演绎模型的背景下,“近似正确”等于错误。
通过演绎法从模型中得出的预测或推论进行测试,并不能帮助我们了解模型本身。正确的预测不能说明模型是正确的,而错误的预测也不能告诉我们已经知道的事情。然而,测试预测并不是检验模型的唯一方法。莫顿认为,也可以通过测试模型的假设来评估模型。鉴于正式模型的演绎性质,这一程序似乎比测试推论更合理。不幸的是,测试假设的问题与“发现”错误前提的问题非常相似。一般来说,我们已经知道我们的假设是错误的。测试假设只能证实我们的信念。
政治科学家真的在做假说演绎法吗,还是我们树立了一个稻草人?在转到证据之前,我们重申,我们所说的模型不需要是正式的数学模型。政治科学家常常从非正式或口头模型或理论中推导出预测进行测试。例子包括Zaller的公众意见研究、Huth和Allee关于领土冲突的研究,或Norris关于选举规则的比较研究。因此,虽然我们使用“模型”一词似乎将我们的论点限制在使用正式模型的一小群政治科学家中,但实际上我们针对的是该学科的大部分内容。
假说演绎法在大多数政治科学家的思维中根深蒂固,但往往不被承认。我们通过两种方式展示了我们领域对假说演绎法的依赖。首先,我们引用了政治学中最受尊敬的学者的一些著作,他们的工作经常成为其他人的榜样。其次,我们报告了政治学顶级三本期刊近期发表的文章的调查结果。有证据表明,假说演绎法是政治学中主要的模型测试方法。
例如,Walt和Bawn认为,一个理论的成功或失败取决于通过测试从模型中得出的预测来确定的“经验有效性”。Fiorina将可证伪性视为模型科学地位的必要条件,而Bueno de Mesquita和Lalman写道:“建模的科学取决于以逻辑一致的方式提取变量之间可测试和可证伪关系的能力,以便模型的结构与其经验含义之间的联系清晰且一致。”假说演绎法的观点在政治科学家的思维中变得如此根深蒂固,以至于它曾一度被美国政治学杂志制度化。从1995年到1998年,该杂志的所有摘要都有相同的四个部分:理论、假设、方法和结果。
在整个学科中很容易找到假说演绎法影响的进一步例子。Keith Krehbiel在研究立法委员会组织时写道:“为了获得联合理论经验方法的好处,本研究的其余部分寻求符合实证社会科学正统教义的要求。假设是实证驱动的。理论假设是明确而精确的。理论结果从假设中逻辑地得出。从理论结果中提取实证预测。并且实证预测是可以反驳的。”
John Zaller采用类似的公理化方法来提出关于公众意见的可测试命题:“那么,这本书的方法是针对给定的高度特定条件集,开发四个基本公理的演绎含义;回顾表明这些含义在经验上是否正确的证据;并在必要和可能的情况下提供新证据,以解决悬而未决的经验问题。”
Cameron, Segal和Songer从他们的模型中推导出比较静态学,并“用1972年至1986年间向伯格法院上诉的搜查和扣押案件的随机样本来测试”。他们的实证研究结果“支持该理论”。Clark和Hallerberg研究资本流动性如何影响财政和货币政策;他们构建了一个模型,“根据不同组(理想典型)的结构条件,对中央银行和政府行为做出预测”,“测试”该模型,并发现“结果在很大程度上证实了理论模型”。
Pippa Norris写道,理性选择制度主义“对理性行为者自私自利的目标做出了一些简单的假设,然后试图概述并测试从这些前提中逻辑地得出的预测”。Barbara Geddes在指出模型可能或多或少有用时写道:“如果这些测试也符合由论证产生的[演绎]预期,我们就会更加确信该论证是正确的。”
甚至经常撰写方法论文章的学者,如克Chris Achen,也大量使用假设演绎主义的语言。在最近一篇关于政治社会化的文章中,Achen写道,演绎命题正在被“验证”或评估。假设演绎主义的语言已经不够用,这一点从Achen写的“程式化模型”中可以看出。这种语言似乎更符合我们前面介绍的基于模型的科学方法。(我们稍后会再讨论Achen的文章,并更深入地探讨它与H-D的偏离。)
有些人可能会反对,虽然政治科学家经常用假设演绎主义的术语写作,但他们往往以更复杂的术语思考模型。这一反对意见提出了两个问题。首先,我们所能得到的关于政治科学家想法的唯一证据就是他们的著作。其次,这一反对意见假定写作方式不会影响思维方式。虽然这一假设几乎肯定是错误的,但以HD模型的方式写作可能会对研究产生恶劣影响,即使学者们以更复杂的方式思考。例如,以H-D格式撰写文章可能会扭曲我们构建的模型类型和执行的数据分析类型。原因在于,H-D视角将预测视为科学中的关键活动。因此,许多政治科学家经常忽视那些没有直接可测试的比较静态学的模型,无论该模型有多有用,或者可能与之相符的其他类型证据的范围有多广。同时,H-D视角使数据分析从构建数据的统计准确描述转变为服务于模型评估的假设检验。
其他人可能会声称,引用该领域的顶尖学者是轶事证据。为了解决这一说法,我们对政治学三大综合性顶尖期刊进行了调查:《美国政治科学评论》、《美国政治科学杂志》和《政治学杂志》。在2001年至2005年间,这些期刊共发表了738篇文章,我们随机抽样了10%,即74篇文章。我们使用非常保守的编码规则,发现近一半的文章(46%)使用或推广了H-D。H-D并非罕见,它在除政治哲学外的所有子领域都有实践,而且如上所述,它通常被视为政治学研究的黄金标准。
在政治科学中,对H-D科学推理方法的现代诠释是EITM项目。如果我们仔细观察EITM项目主要支持者的作品,就会出现一个与假设演绎法非常相似的模式。Morton使用了“步骤类比”,在适当简化的基础上,论证了如何确定预测(第2步)以及如何用实证模型评估这些预测(第4步)。Aldric和Alt在为《政治分析》特刊撰写的一篇引言中指出,EITM面临的挑战是“改进我们的理论研究,使其产生更多可检验的假设,并改进我们的方法论工作,使检验更加有效,并为理论提供更多信息。” Granato和Scioli简要介绍了一个统一的EITM世界,包括:1)理论,2)确定因果关系的模型,3)推论和假设,4)测量和研究设计,以及5)数据收集和分析。从本质上讲,Granato和Scioli的论点包括一个理论、一个具有伴随含义的演绎模型,以及一个测试。测试结果用于修改模型的假设。也就是说,测试能让我们了解模型的结构。
如果还有人怀疑上面引用的作者是从H-D的角度出发写作的,请注意,假设演绎法的支持者也同样劝诫我们“要清晰地阐述自己的假设,通过有效的演绎推理从中得出可检验的含义,并毫不畏惧或偏袒地把这些含义付诸实验检验。” Kyburg接着声称,这些劝诫在“与社会和行为科学相关的方法论课程中”尤其普遍。
一个例子
一个详细的例子能够最清楚地说明语义方法与政治科学当前状态的学科之间的差异。尽管Brady最近提到,并且尽管语义观已经在生物学、心理学、经济学以及健康科学和物理学方面取得了进展,但由于语义观尚未在政治科学的任何讨论中发挥作用,因此提出这样一个例子要复杂得多。因此,指出政治科学的成功案例有些困难。虽然我们相信一些顶尖的政治科学家经常以更符合语义观的方式思考问题,但他们仍然经常以假设演绎法的方式来阐述问题。我们解决这一困境的方法是研究现有的高质量政治科学研究,这些研究显然已经摆脱了假设演绎主义的束缚,但尚未放弃假设演绎主义的语言。
Achen最近提出了一个政治社会化的理性选择模型,试图理解为什么孩子们可能会尝试认同他们父母的政党,同时却又欣然拒绝父母在音乐和风格上的建议。该模型本身相当简单。据说,当选民预期从某一政党获得的未来利益超过从其他政党获得的未来利益时,他们就会与该政党保持一致。选民对这些未来利益的不确定性会根据最近发生的事件和贝叶斯法则不断更新。非工具性考虑因素,如对某一政党的情感依恋,被排除在模型之外,从而强化了模型的程式化特征。
令人困惑的是,一个没有自己经验可以借鉴的新选民如何能够理性地选择一个政党。(在此初始选择之后,贝叶斯更新将以正常方式进行。)根据模型,选民从政党获得的利益取决于选民在社会中的地位,而父母和子女的社会地位是相互关联的。因此,一个新选民可以借鉴父母的经验来估计自己未来的利益。因此,她可以根据这一估计理性地选择一个政党,并随着经验的积累而不断更新。
就本文而言,Achen的论文中有趣的是,除了一些语言之外,没有假装严格遵循假设演绎主义的教条。Achen的论文是基于模型的推理的语义方法的典型例子,尽管他几乎没有打算这样做。正如我们所展示的,Achen在本文中所做的选择从语义的角度来看是完全合理的,而从H-D的角度来看则令人困惑。
语义方法的关键见解是,模型是对象,因此既不是真也不是假。因此,前面讨论的那些学者,他们问自己的模型是否通过了他们所运行的测试“确认”,是在问错误的问题。他们应该问的问题是,他们的模型是否在特定方面与特定目的的世界相似。正是这个问题推动了Achen的作品。
在整篇文章中,Achen从未声称他的贝叶斯模型在常规意义上得到了“证实”。事实上,他特别指出,“详细的经验真实性”并非该模型的目标,他坦承自己的假设“有些不准确”。相反,该模型的目标是解释我们已知关于“父母将党派认同传递给子女”的现象,以专门理解为何儿童在政治领域与社会领域的行为有所不同。
第一步是写下一个以某种特定方式与现实世界相似的模型。对Achen来说,这意味着要写下一个“程式化模型”,以产生与“主要经验概括相匹配”的定性预测。因此,Achen的模型有一个明确的结构性目的。他关注的是解释政治社会化的众所周知的特点,包括父母与子女党派之间的相关性、年轻选民中相对较多的无党派人士,以及党派联盟随时间衰减的现象。这里并没有假装模型只是恰好预测了这些发现;模型的设计初衷就是预测这些发现。由此产生的模型确实预测了这些发现,但这绝非对模型的检验。相反,这表明该模型在特定方面与现实世界相似,具有特定的目的(理解新选民的行为)。Achen声称,他的模型在理解党派认同(PID)的代际传递方面比社会心理学模型更有用,这一观点正是基于此。
Achen非常满足于陈述他的模型在哪些方面与现实世界不相似。例如,该模型忽略了经验性主张,即重组是连续的(世俗重组)而非间歇性的。事实上,Achen指出,“更大的真实性”对于数据分析将是必要的。然而,模型的经验验证并非问题所在。问题在于模型如何捕捉现实世界的特定特征。
如果模型能够以连贯的方式捕捉关于世界的已知事实,那么它将做出贡献。然而,基于模型的推理的优势之一是能够利用该模型进一步探索现实。Achen的模型引出了命题5:“在其他条件相同的情况下,跨世代的政党政策变化越大,年轻选民的初始党派认同就越中立。”Achen指出,这一命题从未被研究过。与“认识论差异”的支持者不同,Achen并未声称对这一新颖命题的经验性调查将“证实”他的模型。相反,重点在于该模型基于经验性发现,开辟了新的经验性调查途径,因此既具有生成性,又具有结构性。这种理论模型与经验性发现之间的相互作用与语义方法是一致的,但在假设演绎法(H-D)的规则中没有立足之地,因为在假设演绎法中,演绎性假设会“毫无偏袒或畏惧”地接受经验性检验。
为了更有力地说明这一点,Achen的论文根本不符合“演绎理论、预测、测试”的科学研究方法。然而,不太可能有人会对这篇论文的科学地位或其对文献的贡献提出异议。语义方法要求研究者阐明模型的目的以及它与现实世界的相似性和差异性。对于Achen来说,该模型旨在阐明政党认同的代际传递。该模型与世界的相似之处在于,它解释了三个已知的实证概括:父母与子女党派之间的相关性、年轻人更大的党派独立性,以及党派联盟随时间的衰变。该模型与世界的不同之处在于,它不关心世俗的重新结盟,并忽略了选民可能拥有的非工具性偏好。该模型是成功的,因为它达到了其特定的解释目的,并指导我们探索跨代政党政策变化对年轻选民最初政党认同中心性的影响。
集成模型和数据
Achen的例子为政治科学家在放弃假设演绎主义的实践后应如何进行他们的研究提供了一些见解。接下来,我们将这些见解提炼成一套四条“社会科学研究规则”。这些规则既不详尽无遗,也不过于严格,而是旨在作为整合模型和数据的指导方针。
明确你的模型想要达到的目的。任何政治情况都可以以几乎无限的方式和出于各种目的进行建模。因此,研究者应该努力解决“为什么选择这个模型而不是另一个模型?”的问题。答案可能会引用表1中列出的模型的任何目的。可以选择一个模型而不是另一个模型,因为它具有特别好的预测能力。在另一种情况下,尽管某个模型的预测性能不高,但如果它揭示了一个迄今尚未被认识到的因果机制,那么它也可能被选中。第三个模型可能因为其在产生新的研究方向方面具有巨大潜力而被使用。这样,建模工作的成功可以根据其自身的优点而不是假设演绎法的人为优点来判断。
放弃目前所实行的“模型测试”的目标。“模型测试”意味着使用统计分析来确定模型的真假(或政治科学家使用的任何同义词,如“支持”、“确认”、“验证”或“有效”),但如前所述,模型的真假并不是问题所在。相反,关键在于证明模型在特定方面是有用的。对于地铁地图制作者来说,这项工作将证明平均通勤者可以成功地使用地图从A点到B点。对于结构模型的制作者来说,这项工作将展示模型确实将数据组织成一个特定的理解框架。
这种论证是否需要数据分析,这取决于具体情况。对于上一节中讨论的阿肯模型,不需要数据分析就能充分证明其模型的有用性。阿肯在结构模型中不需要数据分析的一个原因是,政治社会化领域充斥着许多强有力的实证概括。在研究区域较少的领域,需要进行数据分析才能提供有力的论证。
只有在模型的目的被数据分析所服务时,才应包含数据分析。并非所有模型都需要附带数据分析。这一点被广泛误解,最近,《美国政治科学杂志》的编辑做出了一项由评论者启发的决定(随后撤回),即只在伴随数据分析的情况下才发表形式理论,这一决定突显了这一点。在表1中列出的五种不同类型的模型中,只有预测模型才需要某种形式的数据分析相伴。当然,原因是预测是衡量这类模型的标准。
以上并不意味着数据分析在预测模型领域之外就毫无用处;它只意味着数据分析不是必需的。Krugman写道,一个模型是“好的”,如果“它以一种你可能没有预料到的方式成功地解释或合理化了你在世界上看到的一些东西”。然而,你经常需要数据分析来理解你在“世界上看到的”是什么。研究人员应该清楚地了解数据分析是如何支持模型的目的的,如果它不支持模型的目的,就不要加进去。
把数据分析视为不仅仅是一个终点。在那些模型和数据被整合的场合中,模型通常在论文的前九分之十中被精心构建,而一个无关紧要的数据分析被附加在论文的最后十分之一,这无疑是为了取悦审稿人。将数据分析简单地视为一个终点是专注于模型测试的一个不幸结果。寻找模型可能包含和解释的新的实证发现被替换为寻找“三星”,这表示模型的核心预测是“确认”或“支持”的。这种研究方式很难说是模型和数据的整合。
模型和数据的真正整合并不容易。表明模型以特定方式类似于世界,通常是以描述为目标,而不是以推断为目标,而对一些政治科学家来说,描述是一个肮脏的词,因为它唤起了没有概念性吸引力的纯理论解释。然而,当以理论为指导时,描述成为评估模型有用性和为理论探索开辟新途径的有力工具。
在政治科学中采用模型理论方法不仅仅意味着简单地改变研究语言。它意味着我们要改变思考和从事政治科学的方式。随着这一变化,带来了几个优势。采用我们的方法将有助于澄清关于假设是否应该“现实”的问题。研究人员可以自由地准确说明他们的模型中的假设在哪些方面和出于什么目的与自然世界中的系统相似。假设可能“真实”与否取决于具体情况。同样,我们的方法允许更广泛的证据,研究人员的责任是通过任何适当的手段证明所讨论的模型在特定方面和特定目的上与世界相似。最后,与目前我们谈论从事政治科学的通常语无伦次的方式相比,我们的方法将为研究生培训奠定更坚实的基础。只有摒弃假设演绎法的语言和实践,采用科学推理的模型理论方法,我们才能希望认真解决这些问题。
结论
政治学是一门以模型为基础的研究,但学界对于模型的作用和功能的理解仍然停留在过去。根据目前的观点,研究人员或多或少地将模型视为现实的真实表现,然后通过得出预测并使用这些预测的准确性来判断模型是否正确。好的模型预测准确,而不好的模型预测则不准确。
然而,这一过程基于对模型性质的两个误解。第一个是模型要么为真要么为假,第二个是我们可以了解我们的模型是否真实。相反,我们认为模型是对象,因此既不是真也不是假。我们认为,应该根据模型对于特定目的的实用性来评估模型,而不仅仅是根据它们演绎预测的准确性。模型可能是基础的、结构的、生成的、解释的和/或预测的,并且必须使用适当的指标进行判断。我们认为,以这种方式查看模型可以考虑更广泛的证据,并使实证研究摆脱对统计意义的盲目追求。
以这种方式看待模型的影响是深远的。纯粹的形式理论可以被认为与任何产生可测试预测的应用形式理论一样具有深刻的实质性。构建与已知事实相匹配的模型可以被认为是一种有用的科学活动,而一个为实证主义者提供新方向的模型是值得称赞的。我们基于模型的方法突出了模型在科学推理中的核心地位,避免了假设演绎主义的陷阱,并为政治科学家提供了一种新的思考自然界与我们如此熟悉的模型之间关系的方式。此外,我们的方法将模型和数据的真正整合带入了EITM项目,该项目目前正在培养下一代学者。在强调假设演绎模型测试会缩小可接受研究范围的地方,我们的方法扩展了模型和数据可能整合的方式,并使政治学摆脱了当前实践所施加的方法论束缚。
顶尖的政治科学家一直认识到理解我们工作的基础,以及在必要时重新构想这些基础的重要性。我们认为本文完全符合这一传统,并希望其他愿意重新审视我们学科基础的人能够进行建设性的参与。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰