开学特辑⑪:定量方法的三次革命与比较政治学的未来 |【研究方法】专题
编者按
随着大数据与信息科技的发展,社会科学研究的科学化成为了一个至关重要的议题。虽然目前国内学界仍然在批判政治学科学化可能带来的所谓“研究平庸化”,但是,在我们的学术研究中,无论是制定公共政策,还是对因果机制进行推断,都无法忽视科学方法论的巨大影响力。那么,对于比较政治学和定量研究而言,我们应当如何应对这种趋势,以及所带来的可能挑战?
基于此,我们翻译了北京大学庞珣教授所发表的《共同挑战与解决方案:比较政治学与定量方法论的共同未来》这篇论文。这篇文章先是回顾了定量方法于近期所发生的三次革命,即“贝叶斯革命”、“可信度革命”和“大数据革命”。这三次革命为方法论上带来了全新的变化,也使得社会科学研究者需要建模复杂的相互依存关系、处理模糊的概念以及在混沌中寻找秩序。除此之外,面对定性方法与定量方法之间持续的争论,文章指出应当打破这两种方法之间的界限,形成一种全新的研究方法,使得研究者们能够理解并研究当前的复杂社会现象。
开学特辑⑪:定量方法的三次革命与比较政治学的未来
(原标题为:《共同挑战与解决方案:比较政治学与定量方法论的共同未来(Shared Challenges and Solutions: The Common Future of Comparative Politics and Quantitative Methodology)》,现标题为译者所拟)
作者:
庞珣,北京大学
编译:
焦磊,山东大学
引文格式(MLA):
Pang, Xun. “Shared Challenges and Solutions: The Common Future of Comparative Politics and Quantitative Methodology.” Chinese Political Science Review, vol. 1, no. 3, July 2016.
内容提要
本文从方法论的角度加入了关于“比较政治学的未来”的讨论,并认为Schmitter论文中涉及的挑战并非比较政治学所特有的,而是包括定量方法在内的其他研究领域共有的。定量方法的最新趋势和发展表明,定量和定性方法越来越被整合起来,共同应对对整个社会科学产生广泛而深远影响的挑战。本文简要介绍了定量方法的最近三次革命。“贝叶斯革命”、“可信度革命”和“大数据革命”从根本上改变了定量方法。本文进一步表明,三次革命带来的挑战与比较政治学中的挑战基本相同,如对复杂的相互依存关系进行建模、处理模糊概念和混乱的现实世界等。最后,文章用定量方法学家开发的一些新分析工具的几个例子来说明定性知识和定量技术应该无缝地混合在一起,成为创新而强大的方法。所有这些都指向比较政治学和定量方法的共同未来。
关键词
比较政治学;定量方法;复杂相互依存;全球化;互动
快速阅读(本部分基于AI生成)
引言
作者从方法论角度探讨了比较政治学的未来,并指出Philippe Schmitter在其论文中提到的挑战不仅限于比较政治学,而是整个社会科学领域,包括定量方法论,所共有的挑战。定量方法的发展使得定量和定性方法的整合成为可能,从而应对整个社会科学所面临的挑战。
定量方法的三次革命
贝叶斯革命:通过马尔可夫链蒙特卡洛方法,贝叶斯革命使研究人员能够处理更为复杂的模型设定,突破了传统技术限制。
可信度革命:强调了在因果推断中使用主题知识的重要性,因为仅凭统计技术不足以识别因果效应。
大数据革命:面对海量、高维且关系复杂的数据,定量方法学家正在开发新的工具和技术来处理和分析这些数据,揭示其中的模式。
共同的挑战:比较政治学和定量方法论
全球化、相互依存和复杂性:全球化的相互依存关系要求超越传统统计模型的基本假设,需要新的方法来处理复杂性。
变量、模糊概念和模式:社会科学中的许多概念都是模糊的,包含了多层次属性,需要新的方法来准确描述和测量。
合并定性和定量方法:为了应对共同挑战,需要将定性知识与定量技术结合起来,创建出更加强大的研究方法。
共同解决方案,共同未来
因果推断中的更仔细比较:定量方法论的进步为因果关系提供了坚实的检验基础,但需要结合定性知识来识别和解释因果关系。
复杂相互依存的建模:定量方法学家正在开发新工具,如贝叶斯多级模型和网络分析,来应对复杂的相互依存关系。
发现、描述和测量:定量方法开始更加重视描述和模式发现,这要求使用定性知识来定义和测量模糊的社会科学概念。
结论
共同的未来:比较政治学和定量方法论面临着类似的挑战,需要共同寻找解决方案,并且拥有一个共同的未来。定量方法将与实质性研究更加紧密结合,并融入计算社会科学中,其中统计工具、计算技能及定性知识都将用于解决复杂世界中的社会问题。
1. 引言
在这篇题为《比较政治学的未来:过去、现在和未来》的论文中,Philippe Schmitter调查了当今比较政治学家面临的深刻挑战,并就如何应对这些挑战以实现比较政治学的美好未来提出了富有洞察力的想法。Philippe的文章在我心中产生了共鸣,虽然我“正式”是一名定量方法学家,主要研究领域是国际关系,但读到这篇文章时,我觉得自己更像一名比较主义者。从认识论的角度来看,每个人都是比较主义者,因为正如Philippe所说,“比较是一种分析方法——可能是推进有效的、累积的政治知识的最佳方法”。科学是建立在比较的基础上的。没有比较,就学不到东西。作为科学探究的方法之一,定量方法通过比较相对大量的观察结果来进行描述性或因果推断。关于比较政治学未来的讨论也吸引了方法论者,因为定量方法作为一个研究领域,在分析经验数据时受到方法问题的驱动,而方法创新的来源正是学者们在实质性研究领域面临的挑战。
如今,定量方法领域与几十年前相比已经大不相同,可以预见的是未来将更加不同。在过去30年里,该领域至少经历了三次革命,被深刻而压倒性的挑战所重塑。与比较政治学类似,定量方法领域也处于十字路口,方法学家们正在争论这些革命性趋势是否相互冲突以及我们应该采取哪种可能的路径。这两个领域就他们共同面临的挑战的影响和可能的解决方案进行对话和交流是非常重要的。我的理解是,Philippe和其他许多比较学家所关心的大多数问题基本上都是方法论上的,它们绝不是比较政治学的特有现象,而是包括定量方法在内的其他研究领域的共有现象。定量方法学家在最近的革命的刺激下,为修改现有方法和发明新方法做出了巨大努力。然而,挑战是如此深刻,孤立的努力是不理想的和低效的。应创新性地整合跨学科和多样化的方法,以产生更好的解决方案。
在这篇文章中,我首先想总结一下定量方法领域的三次最新革命是如何对比较政治学家提出类似挑战的。然后,我介绍了一些方法论解决方案的例子,这些方案可能有助于比较政治学家应对他们的挑战。这些例子说明了为什么创新定量解决方案的开发和实施应该而且必须严重依赖定性知识和专家判断。我想指出,为了应对共同的挑战,坚持定量和定性方法的传统界限是适得其反的。最好的解决方案将来自合并,而不是简单地结合这两种方法。因此,这两个领域实际上拥有一个共同的未来。
2. 定量方法的三次革命
对许多人来说,定量方法或多或少等同于计量经济学回归模型和统计检验。线性最小二乘回归是建模的主力,统计推断依赖于渐近理论,通过想象未来无穷多的输入观测值。统计界对依赖渐近的推断提出了许多强烈的批评。对于真实数据和特定的研究目标,线性假设往往是不成立的,于是人们发明了各种链接函数和数据转换技巧来使世界线性化。实施定量方法的传统做法是选择“最佳”标准模型,并且估计量的渐近性质会自动应用于接受或拒绝一个暂定的理论,即使理论和数据结构不是“标准的”,而且样本量对于“N趋于无穷大”的讨论来说小得可笑。毫不奇怪,在实质性领域经验丰富的研究人员经常抱怨定量方法过于简单化,忽视了现实世界。幸运的是,这种做法已经过时了,不能反映该领域的最新技术和动态。自20世纪90年代以来,定量方法经历了三次革命,极大地改变了这一领域。
2.1 贝叶斯革命:从估计问题中解放建模复杂性
最近的三场革命中的第一场是贝叶斯革命,由马尔可夫链蒙特卡洛方法的重新发现所驱动。贝叶斯统计推断范式绝不是革命性的新事物。贝叶斯认识论和贝叶斯模型设置可以说甚至比统计学的频率主义范式更古老。贝叶斯方法起源于贝叶斯定理,其模型设置非常机械,如下:
这也被称为贝叶斯更新——利用新的观察到的实证信息y,将我们对θ的先验理解从π(θ)更新为后验π(θ|y)。
“贝叶斯革命”大约发生在20世纪90年代初,这要归功于马尔可夫链蒙特卡洛方法(MCMC)的重新发现。在发明了半个世纪之后,统计学家们终于意识到两种基本的MCMC采样方案——吉布斯采样器和更通用的Metropolis-Hastings算法是多么强大。统计学家们很快找到了MCMC的理论和数学基础。这对统计学及其从业者来说是革命性的,因为MCMC可以根据研究需要而不是传统估计技术允许的参数来指定统计模型。更确切地说,贝叶斯模型设置和MCMC技术结束了研究人员必须调整她的理论以适应标准或已知统计模型的局面。相反,研究人员现在可以指定参数丰富的模型,其结构与她的理论要求一样复杂。传统标准模型借助强假设和简化使模型线性化或广义线性化,因为它们需要估计量的闭式解并分析其渐近性质。参考几乎所有应用统计学或计量经济学的教科书,了解这样一个呈现模型的模板:标准模型规范、统计假设列表、估计量的数学表达式、无偏性和估计量渐近特性的发展和呈现。参考最流行的计量经济学教科书。如果研究人员选择应用“定量方法”,她必须接受不切实际的假设或某种模型的简化程度(例如线性模型、中毒模型、各种面板数据估计器等)。这似乎是实施定量方法和进行复杂理论实证检验之间不可避免的权衡。在MCMC的支持下,贝叶斯模型使科学社会理论摆脱了严格的技术限制,并彻底改变了实证研究的方法。
2.2 可信度革命:用主题知识找出因果关系
第二次革命是可信度革命,大约在新世纪之交在政治学领域爆发。这是一种“强调获得可靠因果推断目标的活动”。传统上,其他条件不变是因果关系本质,也是回归结果解释的方式:在线性回归中,因果关系通过“控制其他所有因素”表达;在非线性回归中,稍微改变后则用“所有其他变量处于均值(中位数、最小值、最大值或其他)水平(the set values)”来表示。当研究者经常使用这种思考和表达方式时,她可能甚至没有想过是否在逻辑上可能保持一些变量恒定,同时让主要感兴趣的变量发生变化。在可信度革命中,因果关系被重新定义为“潜在结果”语言和反事实思维。正如前人直言,“数据只揭示了关联性,这些关联性是由因果和非因果(即虚假)成分组合而成的”。因果关系与可以合理认为反映了因果关系的可观察关联的假设或条件有关。用数学术语来说,我们需要假设来得到下面的等式:
在等式中,左侧的条件概率(或条件期望)是Y和X之间关联的统计表达式,而右侧的术语是给定X(干预)值时Y的潜在结果概率(或期望),这被定义为因果关系。
至少对于观察性研究而言,接受因果关系只能通过假设而不是建模技术来识别的事实对定量方法具有深远的影响。人们认识到,无论计算技术多么先进,样本量多大,数据分析都不足以估计因果效应。相反,在观察性研究中识别因果效应必须诉诸于不可量化的主题知识和专家判断。例如,因果关系的图形理论被发明并被统计学家广泛使用,但该理论不是定量的而是定性的。因果图只能在对所研究主题有深入了解的情况下绘制,混杂因素的选择取决于专家对现实世界中事物相互关系的判断。可信度革命中的识别概念不同于统计学中的识别。后者是为了确保基础数据生成过程的唯一性,可以在不诉诸定性知识的情况下实现和检查。在可信度革命中,识别是指我们可以将一组观察结果视为另一组反事实的条件。由于反事实是不可观察的,因果关系只能通过假设来确定,并由专家判断。
2.3 大数据革命:从混乱中发现模式
近年来,大数据已成为所有行业以及学术界最热门的流行语之一。“大数据”革命对科学界意味着什么尚不清楚,不同学科的科学家对大数据以及科学界应如何应对持有不同的、往往是相反的观点。激进的观点通常来自商界、计算机和数据科学领域,他们认为大数据从根本上改变了科学的定义和实践。他们声称“相关性就足够了”,预测理论的终结,并主张“科学家不再需要做出有根据的猜测、构建假设和模型,并用基于数据的实验和例子来检验它们。”但是,大多数自然科学和社会科学的研究人员充分认识到大数据的深远影响,但并不认为我们应该让“巨型计算机做科学”。
社会数据的数量、结构和速度要求研究人员修改传统工具并发明新方法。大数据不仅“大”,而且高维、关系和混乱。大数据可以更好地反映复杂而动态的现实世界。在数据的生成、收集、存储、分析和利用方式上,它们与传统的“小数据”不同。在过去,定量方法是处理“清理”数据的工具,“优雅的”简单模型足以理解高度聚合数据所反映的简化世界。但大部分大数据都是社交数据,这意味着它们是“胖”的(高维)和“关系性”的(相互依存)。它们是“关于人们或其集体互动的数据:他们如何交流,他们如何建立关系,他们如何发生冲突,以及他们如何通过政治和经济机构塑造未来的互动。”在《比较政治学的未来》中,Phi指出,对比较政治学的一个关键挑战是违反独立案例的假设。这一假设对于科学比较至关重要,但在全球化和复杂的相互依存的时代过于严格。随着关系数据的可用性不断增加,定量方法面临着同样的挑战——回归分析中最基本的假设之一是独立同分布(independent and identically distributed, i.i.d)假设,(观测值是从同一分布中独立随机抽取的,以可观察到的条件为前提),但它不再成立。
大数据革命也改变了科学探究的优先顺序。因果推理长期以来被视为科学研究中最“崇高”和最终的目标。现在可能还是这样。但是对于复杂的数据,描述是一项更加困难和重要的研究任务。传统观点认为,描述是必要的,但也是简单的,作为因果推理的准备。这在研究论文中相对不重要的描述性统计表和变量相关矩阵中得到了明确的证明。现在,我们从嘈杂混乱的现实世界中获得了大数据,相互依存使得不可能通过将高维空间投影到一维变量上来使用简单的降维。随着大数据在理论和技术上的挑战,定量方法比以前更加重视描述和模式发现。自动化信息提取、观点挖掘和网络分析等快速增长的研究领域主要用于发现模式,而不是分析简单变量之间的因果关系。
3. 共同的挑战:比较政治学和定量方法论
这三次革命相继发生,共同创造了新的研究任务,深刻地改变了定量方法领域。贝叶斯革命使模型设置摆脱了严格的技术限制,并使研究人员能够开发和测试具有复杂和丰富结构的理论。可信度革命要求对因果效应进行定量(统计)推断,更明确地依赖于潜在结果或反事实的比较,而因果关系只能通过主题知识来识别和证明。大数据革命意味着定量方法应该成为更多样化研究任务的工具,并帮助研究人员观察、发现、探索和描述复杂而混乱的世界。Philippe Schmitter在文章中阐述的比较政治学面临的挑战,定量方法也有同样的挑战。
3.1 全球化、相互依存和复杂性
做科学必须简化。所有的理论和方法都在一定程度上进行了简化,以便更好地理解现实世界。简化没有错,真正的问题在于什么是适当的简化程度。简化是一项严肃的研究任务,但这不是以忽视现实世界的复杂性为代价寻求理论或模型优雅性的借口。
复杂的相互依存关系直接违反了传统统计模型所依据的关键假设。只要违反了独立同分布的假设,通常的做法是纠正标准误差以证明估计量的期望性质。人们可以很容易地找到关于大量误差修正技巧的计量经济学教科书和研究文章。政治学中广泛应用的PSCE方法是一种简单易行、功能全面的相互依存修正。
换句话说,传统的定量方法将相互依存视为需要纠正的麻烦,而不是一种值得研究的现象,尽管许多理论和假设都集中在全球化时代复杂相互依存的起因或后果上。
相互依存对定量方法的另一个挑战是,相互依存意味着高维建模。如果不满足独立同分布假设,我们就必须处理n维多元随机变量。任何维度的变化都必须同时考虑所有其他维度中的变化进行分析“维数诅咒”是定量分析师所熟知的,而降维是一项具有复杂相互依存关系的艰巨研究任务。降维的一种传统(也可能是最简单)方法是依靠独立同分布假设将n维联合分布简化为n个独立的一维分布。然而,随着相互依存性在实质性研究中的重要性日益增加,定量方法必须直面“维度诅咒”,并开发技术来系统地建模,而不是简单地纠正由相互依存性引起的“统计问题”。
Philippe Schmitter进一步指出,复杂性相互依存的另一个严重挑战是复杂性违反了比较政治研究中效果稳定性的假设。这也是对定量方法的挑战。回归模型假设单位和时间上的系数是恒定的,并否认变量之间存在依赖于上下文的关系的可能性。参数定量模型,如E(Y)=f(X, θ),需要对f(.)做出假设,这对确保估计量的闭合形式解起着至关重要的作用;关于参数数量θ,它必须足够小以确保足够的自由度;关于潜在的解释变量Xs,其中许多往往基于隐含的假设而被忽略。但是,复杂性需要一个比OLS或MLE具有闭合形式解所需的线性或凹函数复杂得多的f(.)。具有异质成分的群体会导致另一种类型的并发症——多峰函数和混合分布应该被用来总结总体,并且需要特定群体的参数来捕捉不同子群体中的不同因果机制。此外,复杂性也意味着系统由更多的参与者和因素组成,许多X不能轻易被归零以获得一个简单的系统。
从方法论的角度来看,复杂的相互依存意味着不同层次(相对定义为微观和宏观层面)的异质行为者(个人和集体)在做出决策和采取行动的同时,期待、观察并回应他人的行为。准确性和简约性之间的权衡不再能以统计规则为指导,例如King等人所建议的:
相反,应该决定如何权衡折中办法的,是研究人员在研究一个相互依存的复杂世界时可以获得哪些可解释且有意义的结果。减少和孤立是理解世界所必需的。没有减少和孤立,我们就无法总结和解释我们所观察到的内容。但是,高维现实世界可以减少到多少个低维理论世界?这个世界的哪个部分可以被孤立于世界之外?如果孤立的低维世界不再代表真实世界,那么无论估计过程多么完善,都无法了解真实世界。
3.2 变量、模糊概念和模式
定量方法基于概率论,与随机变量一起工作。定量方法的广泛接受和实施已经普及了统计术语,例如“变量”这一统计术语在许多领域中每天都在使用。Philippe Schmitter认为,“比较政治学往往倾向于关注变量”。但在我看来,定性方法实际上关注的是“概念”而不是变量,在这里,“变量”被用作与“概念”可互换的术语。在研究被量化之前,“变量”只是一个概念。变量用于研究事件发生的概率。我们不关心变量本身,但我们对其特征以及与其他变量的关系感兴趣,如领域、范围、定义参数、密度函数、概率和相关系数等。同时,一个变量可以是一元或多元的,而一个变量的分布函数可以有几个、很多,甚至无穷多个参数。变量不一定是统计教科书中的“简单”或标准变量。相反,它们可以与研究人员所能想象的同样复杂。蒙特卡罗模拟方法的发展是为了实证研究复杂变量的特征。变量是表达对任何研究兴趣相关的不确定性的量,如概念、关系、模式和真相(在贝叶斯范式中)。研究人员可以定义自己的变量并应用模拟技术来了解非标准和复杂变量的特征。
对于定量方法而言,新的挑战是如何使用变量来表达概念和模式。变量、概念和模式是三个存在于三个不同世界中的不同事物——变量是统计量,概念是理论实体,而模式是经验实体。科学研究需要将这三个世界联系起来。如果不将概念转化为变量,则无法应用统计工具。如果不表示概念,则变量及其实现(数据)在实质性研究中将毫无意义甚至具有误导性,而定量方法可能会产生无意义的结论。此外,模式可以通过归纳推理激发新概念,并可以就应做出哪些分布假设以及多元分布的方差协方差矩阵应如何指定等给出想法。
定量方法和比较政治学面临的真正挑战不在于选择概念、模式和变量中的哪一个,而在于如何将它们连接起来并相互转化。传统上,在概念化和操作化概念之后才应用定量方法,而比较研究者则仿佛必须将模糊的多维概念强制转化为简单的变量以应用定量方法。定量分析人员更了解如何指定一个变量来捕捉概念的模糊性、不确定性和维度,但他们需要与实质性领域的人员合作以理解概念及其理论应用。
3.3 合并定性和定量方法
在论文中,通常会在结尾部分倡导通过“桥梁方法”弥合定量与定性方法的差距。但是两派的学者却经常被看到依然把两种方法视作竞争对手。Philippe Schmitter注意到,越来越多的研究者同时使用定量方法和精心挑选案例的小样本分析,我也是如此。我很高兴看到越来越多的学者根据他们的研究任务选择方法,而不再受“意识形态界限”的束缚。但我认为,将定量和定性方法“融合”起来可能会更有成效和更有力量。这一任务充满挑战但极其有前景。
以上提到的三场革命都共同指向了“融合”定性知识和定量分析的必要性。正如上面提到的,可信度革命提升了定性知识在观察研究因果识别中的重要性。识别因果效应需要定性方法,然后通过定量方法估计因果效应。这两项任务在因果推断中是密不可分的,而定性方法和定量方法在单一的因果推断方法中实现了融合。
贝叶斯革命需要指定先验值。对于一些人来说,先验值是贝叶斯方法中不科学的部分,因为先验值中的信息不是来自“客观”数据,而是来自研究者主观的知识。同时他们认为先验值是使用强大的MCMC技术的必要之恶,并试图将先验值对后验值的影响降到最低,让客观似然(数据)完全主导贝叶斯学习。许多其他人认识到不可量化信息和知识的价值,并提倡利用贝叶斯框架提供的机遇,利用先验值来融入我们在看到新数据之前就已拥有的相关信息。先验值应由现有的理论判断、专家知识和研究者甚至直觉来决定。充分代表我们现有理解和知识的先验值对于推进学习的累积过程是有价值和有帮助的。此外,贝叶斯方法在指定了先验值后,明确要求研究人员在分析数据之前成为某一领域的专家。如果研究人员对某一主题完全不了解,那么无论收集了多少数据或作为数据分析师多么熟练,都不具备进行研究的能力。就像可信度革命一样,贝叶斯革命在贝叶斯更新的过程中融合了定性和定量方法。
而大数据革命则以更基础的方式模糊了定量和定性方法的界限。大多数大数据并非数值数据,而是文本、音频、视频、图像等。它们往往是非结构化的,需要定性判断来理解数据并从信号中提取噪声。模式发现是大数据分析中的主要任务之一,并激发了定量方法的最新发展。反过来,定性研究人员收集的数据在数量和速度上越来越“大”,而信息提取和数据分析需要定量技术。因此,如果传统上区分定量和定性方法的方法在于数据是否被量化,那么大数据革命则完全消除了这种区分。如果定量和定性方法的定义区别在于信息处理的方式,那么在大数据时代任何数据分析都需要机器和人类的方法相结合,而两种方法被大数据所融合。
4. 共同解决方案,共同未来
在过去的三十年里,定量方法领域已经发生了变化并取得了进步,通过应对三场革命带来的挑战。有大量的新工具被发明出来以完成不同的研究任务。在本节中,我想用一些定量方法中的最新重要发展作为例子,来证明新工具越来越多地被用来应对挑战,并认为比较学者和定量方法论者共同努力是解决共同问题的更好解决方案。
4.1 因果推断中的更仔细比较
比较政治学因其主要的比较方法而得名,可信度革命重新定义了因果关系的因果效应比较,即潜在的因果结局或假设相反情况。身份研究和身份识别工具的研完任务(如各种匹配或重抽样方法),让我们清楚看到,在进行研究的过程中,定量方法与比较案例研究具有相同的方法论基础。唯一的区别在于,定量方法主要关注多个匹配案例的平均因果效应,而比较案例研究则更关注少数匹配案例的个别因果效应。比较研究者善于仔细选择案例、进行案例选择的合理性说明以及谨慎地比较案例以进行因果推断。在追求具有大量观察值的平均因果效应的因果推断中,他们的培训、专业知识、技能和经验都是非常宝贵的。
许多政治学家,包括比较研究者,都进行实地实验,尤其是调查实验。这是定性还是定量的研究方式? 实验的设计需要统计培训和地方知识,要求定量方法论专家和比较研究者共同合作确定调查问题、抽样方案(随机化或分层)、潜在混杂因素、缺失数据的解决方案等。什么是“处理”?什么是人口?对照组和处理组可以互换吗?这些类型的问题不仅仅是统计问题或实质性问题。
正如前面提到的,另一个识别因果关系的强大工具是图形理论。图形理论是一种统计发明,但并不是“定量”工具。图形理论用于找出混杂因素,即为了识别X对Y的因果效应而必须控制的因素。在因果推断中,变量选择比传统应用的计量经济学规则(如规则{Z: cor(Z, X) ≠ 0, 且 cor(Z, X) ≠ 0},这些规则的变量应得到控制以得到无偏估计)更加“定性”。 通过绘制图形来帮助研究应阻断哪些其他关联关系,以得出结论说观察到的X与Y之间的关联等于因果效应。什么变量应包含在反向阻断路径(混淆性关联)中是主要的依据专业知识进行的判断。
此外,我怀疑即使有完美的随机化,因果效应的识别也无法满足工作科学家对因果机制或“为什么”问题的好奇心无论我们是否依靠传统的回归模型来实现其他条件不变,还是采用反事实(潜在结果)比较,定量方法和因果推理设计仍然对因果机制保持沉默。因果推理文献中的中介分析声称,它调查了因果机制。但中介分析仍然是在测试因果机制,而不是解释“为什么”。因果故事只能以定性的方式构建,对因果解释的好奇心也只能通过定性方法得到满足,比如深入的叙述和过程追踪。
因果推理定量方法的最新进展为检验假设的因果关系提供了坚实的方法论规则,但如果没有定性知识和分析,我们就无法获得因果推断或解释。
4.2 复杂相互依存的建模
随着比较学家试图解决复杂的相互依存关系产生的问题,定量方法论者正在开发新的工具来适应现实世界的复杂性和相互依存性。贝叶斯革命使研究人员能够指定复杂的模型。MCMC使高维集成变得容易,现在我们可以对大量单元之间的相互依赖性进行建模。贝叶斯多水平模型可以很好地整合跨层次交互作用。此外,贝叶斯模型设置的灵活性和强大的MCMC工具意味着学者可以在单个模型中分析横向和纵向的相互依赖关系。大数据革命激发了许多新的分析方法的发明,以模拟复杂性和相互依赖性,如网络分析和复杂的社会建模。定量方法的快速发展凸显了定性知识的重要作用。我可以用几个例子来说明这一点。
空间建模可能是政治学家最熟悉的相互依存关系建模方法之一。空间计量经济学因预先指定的空间度量W而受到批评,即包含有关所有单元之间相互连接的模式或结构的重要信息的大型空间矩阵。不同规格的空间度量可以产生模型中所有参数的非常不同的推论,而不仅仅是与W相关的空间自回归系数。批评者担心空间建模缺乏稳健性,并且对用定性知识指定W矩阵的事实表示不满。事实上,W矩阵的规范将重要信息注入模型中,只有该领域的专家才能根据他们对相互依存的定性判断来指定和证明W矩阵。定量方法可以估计相互依存的影响,但定性知识对于了解相互依存的结构是必要的。解决方案必须同时依靠这两者。
第二个例子是网络分析,它在政治学中越来越多地被应用于研究相互依存关系。空间建模可以看作是网络分析的一个特例。网络分析是一种描述性工具,用于总结系统和单元的特征以及连接单元的关系(联系)的特征。定量方法可用于数据简化、团簇分类、计算系统或个体特征的数值表达式,估计网络演化和网络间依赖的趋势。但是,定性方法和知识对于通过回答什么是网络的理论问题来构建网络至关重要?为什么这样的网络如此有趣?一个网络应该解释或被解释的特征是什么?
第三个例子是用于分析跨层次交互的贝叶斯多水平模型。贝叶斯模型设置的优势之一是它的灵活性。可以指定一个统计模型来密切反映复杂的理论和现实。更大的灵活性并不意味着更少的模型规范。相反,灵活性意味着统计模型规范需要更多的专家判断。例如,一个具有两个水平的贝叶斯多水平模型可以表示如下:
虽然这是一个非常简单的多水平模型表达式,但它表明模型设定的灵活性需要严格的定性判断。例如,观察i应该属于哪个组j?在θs中,哪些系数应该是恒定的,哪些系数应该因组而异?哪些情境因素Zj可以解释不同群体之间因果效应θjs的差异?两个级别是否足以捕获数据的层次结构,并且足够好地服务于研究目的?对模型规范的限制越少,就越需要谨慎的选择和更有根据的猜测。
4.3 发现、描述和测量
在社会科学中,许多重要的概念都是模糊的,包含多层属性。在抽象和一般意义上,可能无法精确地描述和衡量一个概念,但我相信,在任何特定的研究中,仍然有必要尽可能准确地定义、描述和衡量一个概念。
定量方法领域已经充分认识到描述和测量的重要作用,并一直在努力开发工具和方法来更好地描述和衡量社会概念的模糊性和复杂性。定量方法被视为假设检验的工具,只有在理论和假说形成并格式化后才能进入实质性研究。理论和假设来自哪里,这不是定量工具关心的问题。定量方法用于理论检验,而不是理论发现。但今天,在定量方法的前沿是发现、描述和测量的新方法的发明。从方法论的角度来看,所有三个任务都是关于数据缩减的——通过数据反映的高维空间和关系,我们可以适当地实现什么程度的缩减来理解数据和现实世界。
政治学中衡量任务定量成就最常引用的例子之一可能是VoteView项目和NOMINATE分数。个人或政治集体的政治意识形态绝不是一个简单的变量。政治立场是一个高维度的模糊概念,无法直接观察。定量方法使用信息聚合和唱名表决数据以及降维来将多维政治立场投影到左右(自由保守)光谱。测量模型,如项目反应理论模型,已成功地在低维潜在政策空间中定位了政治立场。
另一个例子是权力的衡量。权力是政治学中最重要的概念之一。它本质上是一个理性且依赖于语境的概念。学者们长期以来一直试图衡量权力,但大多数措施都远不能令人满意,甚至无效。学者们充分认识到大多数权力衡量标准的无效性,有些人甚至声称权力的概念是如此模糊和依赖于语境,以至于无法衡量。也就是说,权力不能被视为一个变量,因为它无法系统地描述和经验性地测量。但最近网络分析的发展为定义和衡量权力概念提供了一种新方法。通过考虑交互的结构,而不是关注单元的一元特征,可以使用不同类型的中心性得分来衡量权力。不同类型的中心性反映了不同类型的权力,例如,权力来源于枢纽、桥梁、可信的退出威胁等。通过透明定义权力和数据缩减规则,研究人员可以根据自己的特定研究任务选择最相关的。
一个研究中概念的运作和测量可能与另一个研究无关。社会科学中一个概念的定义、描述和衡量不是与背景无关的,而是取决于特定的研究问题和任务。描述和发现的挑战可以通过定性知识、数据分析工具和科学研究设计成功解决。
5. 结论:共同的未来
在论文《比较政治学的未来》中,Philippe Schmitter表示,比较政治学的未来应该朝向“拥抱复杂性”的方向发展。这也正是我所看到的定量方法领域的未来发展方向。如今,定量方法比过去更加多样和通用。未来,定量方法将不再是像独立的领域,而是更多地与实质性研究相结合,融入一个新兴学科——计算社会科学中。在该学科中,统计工具、计算技能以及定性知识和判断被应用于探索、描述、解释和解决由复杂依存世界产生的社会问题。比较政治学和定量方法面临着相似的挑战,需要共同寻求解决方案,并拥有共同的未来。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰