查看原文
其他

怎样的政治学研究是高质量的?

2017-08-14 政治学人

点击上方关注“政治学人


作者简介:

阿斯比约恩·森内·内尔高,南丹麦大学政治学系。

译者:管玥,香港中文大学政治与行政学系。


   有时,那些假装对知识积累做出贡献的文字游戏是如此拙劣,以至于很难相信其作者确实以为自己发现了新的真理(他们应该确实是这样认为的),而不是在暗中窃笑读者的轻信。①

  政治学和其他社会科学领域中充斥着大量平庸的研究。但幸运的是,我们也能找到不少高质量的成果。也许后者在数量上几乎和前者旗鼓相当了?本文无意为此类经验命题提供证据,它们仍然只是假设而已。本文的真正目的乃是阐明怎样的政治学研究才是高质量的。

  我们是否有可能就高质量的政治学研究的评判标准达成某些共识?这类标准的建立,能否不局限于确立某种科学哲学的地位,无论是本体论或认识论?②这两个问题也与学术研究中一些基本的方法论之争息息相关:采用归纳式,还是演绎式的研究策略?运用定量的,还是定性的分析技术?注重研究的深度,还是广度?致力于诠释,还是解释?探求个体法则,还是寻找普遍规律?是否采用个案研究的方法?这些争论不休且注定无解的方法论之争不过是缺少评判政治学研究质量标准的表现之一。通过讨论这些相互对立的观点,本文试图就评判高质量的政治学研究建立一套涵盖广泛、但又不失明确的标准。这实际上也提供了一套“概念语法”(conceptual grammar),方便研究者开展卓有成效的理论讨论以及解决经验层面的争端,从而促进学术进步。毕竟,“方法论上的两分法”,尤其是其与实际研究的脱节,已经让我们付出了极为沉重的代价。③

  本文认为,讨论高质量研究的评判标准并不一定要围绕科学哲学和方法论层面的一些白热化的议题展开。高质量的研究应该首先探讨如下两个问题:我们已经获得了哪些知识?我们还要认识什么?这也意味着,推动研究向前发展的是研究问题和理论基础,而某些元理论上的分歧并不妨碍我们就具体的研究问题在理论和经验层面展开唇枪舌剑。这样一来,学术研究的过程就变成了尽可能严格地检验我们的成见、观念和假设,以便在最大程度上确定我们确实掌握了新的知识。进一步来说,这意味着成果斐然的政治学学术共同体的基础在于精巧的研究技术和多元的研究方法。

  本文的第一节即提出了评判高质量的政治学研究的实证标准,这也是社会科学的必然要求。当然,这一标准平淡无奇,有的读者可能会觉得是陈腔滥调。本文的第二节则认为,研究者应聚焦于发现和考察(广义和最狭义层面的)因果关系,而诠释和理论化的努力构成了推动政治学研究不断进步的基石。针对前面提到的那些在政治学和社会科学方法论之争中占据主导地位的两分法,本文的第三部分考察了其影响,并指出所有高质量的研究都必须首先提出两个问题,即:我们已经获得了哪些知识?我们还要认识什么?对这两个问题的回答也决定了在某个具体议题上怎样的研究设计是最为合适的。本文的结论部分则主张,前面提倡的这些对高质量的政治学研究的理解在规范层面同样颇具吸引力。


  一、高质量的政治学研究是……


  本文认为,高质量的政治学研究应根据研究方法而非研究对象来界定。政治学的研究对象很难定义。除那些醉心于把国家、权力或政治等界定为政治学独有分析对象的尝试外,本学科的研究者很少就这些核心概念达成共识,更何况其他一些学科也会涉及此类议题。实际上,政治学的研究者也不可能同时讨论所有这些研究主题和问题。也许我们可以通过回顾学科发展史来重新理解政治学的实质。④但本文无意于此,而且,对研究对象的严格界定也无助于厘清高质量的政治学研究的评判标准。当然,正是因为我们没有清晰界定研究领域,所以本文的论点其实不仅仅局限于高质量的政治学研究,也同样适用于一般意义上的社会科学研究。

  150多年前,马克思就断言,人类书写着自己的历史,但这种书写不是任意的,“人创造环境,同样环境也创造人”。⑤即使对马克思关于行为与环境的辩证关系的一整套理论有所保留,我们也很容易认同前述论断(或者说,它已经不仅仅是论断,而是可以上升为公理了)。这一论断固然平淡无奇,但绝非乏善可陈。它极具洞察力,并触及了作为社会科学核心问题之一的社会行为(唯意志论)与社会结构(决定论)的关系,也就是结构与能动的问题。多年来,许多学者都尝试突破结构—能动的二元对立。⑥但他们的理论(更准确地说,只是他们的研究路径)不仅在理论层面难以理解,而且在试图解决结构—能动关系问题的同时也带来了一系列新的困惑。目前学界最没有争议的结论是:行动者和结构都很重要,二者的权重取决于所研究的问题。

  人类行为可以理解为部分是个人意志和创造力的产物,部分则是由社会结构决定的限制条件和激励作用的结果。这些结构性激励究竟是社会经济、制度、文化、话语,还是其他什么,并不重要。真正重要的是,我们从来不能先验地确定在既定的情境和时间条件下,某类特定行为在多大程度上是由个人的创造性行为决定的,在多大程度上又是结构性激励作用的结果。如果否认这一作为本体论起点的常识性判断,转而强调与其相反的观点,那就只能诉诸哲学、神学或其他那些专就此类形而上的议题展开充分论辩的学科了。

  社会科学在面对那些真正具有创造性的行为时是难以发挥作用的。所有高质量的研究都应致力于从社会或结构的层面建立对人类行为系统性的理解和解释。我们完全可以就研究结论能够推广到何种时空情境之下,乃至研究结论的推广性本身是否值得追求等问题各抒己见(关于这一点,下文还会更详细地进行讨论)。但要注意的是,社会科学无法讨论独特性,或者说,那些真正具有创造性的行为。在这个意义上,社会科学多少显得有些无趣和乏味。它总是尝试论证个体的行为都能在或远或近的社会情境之中加以理解和解释;同时,社会、政治、制度、文化或经济条件也都以某种方式影响着个体行为。

  在某些情境下,形成对人类行为的一般性的理解困难重重。例如,一个有严重精神问题并且不关心选票、未来政府的权力或政治目标的总理,其行为是很难解释的。尽管作为社会科学的研究者,我们总是倾向于事后合理化,并声称有能力根据对各种社会情境和条件的分析来理解即便是最为古怪的行为,但毫无疑问,社会科学并不能解释一切。奇怪的是,政治学并不为由此产生的自卑情结所困扰。相反,很多研究者在媒体上频频现身,传播一些只有极其有限的(如果有的话)学术依据的知识。⑦

  当然,不管政治学是否野心勃勃地想要对人类行为形成一般性的理解,现实中的人们确实并不像我们自认为的那样具有创造性和选择自主性。用罗纳德·金(Ronald King)的话来说:“每个人独立作出选择,但选择的结果在很大程度上是一致的。”⑧人类活动到底有多一致,是一个经验研究的问题,但并不仅仅是经验问题。

  政治学总是寻求对具体社会现象作出(某种程度上)一般性的理解和解释。没有哪个理论是为真正独一无二的现象而存在的,因而我们也对此类现象缺乏认知。就具体的社会现象而言,任何两个独立存在的现象都是独一无二的,因为它们至少在时间和空间上是不同的。⑨但正如路德维希·维特根斯坦(Ludwig Wittgenstein)指出的那样,⑩我们无法理解、描述或断定这种纯粹意义上的独特性。只有在与可预期的社会行动规则(也就是模式)进行比较的过程中,我们才有可能发现这种独特性,并把它表述出来。这一事实导致了两个结果。

  第一,必须使用词汇、类别和概念来描述我们研究的是某一社会行为的哪个或哪几个方面。“真实的”研究对象本身不会说话,也不可能告诉我们应该如何对其进行分类和理解。因此,不是研究对象,而是理论、理论化的概念和在规范层面的兴趣指引着研究向前发展。所有的现象都可以从很多方面加以研究。但是,即使是最具归纳性的分析也必须回答诸如观察何种现象、根据何种目的对其进行何种分类这样的问题。否则,一切都是徒劳。纲纳·缪达尔(Gunnar Myrdal)认为那种极端的归纳方法是“幼稚的经验主义”,戴维·伊斯顿(David Easton)称之为“粗糙的经验主义”,丹麦的埃里克·拉斯姆森(Erik Rasmussen)则只是指出“不可能让数据为自己说话”。(11)研究者应总是聚焦于特定经验领域的某个或某几个方面。在学术研究中,“描述并不是简单地对所观察到的现象从语言或符号意义上予以辨识”(12),而是需要清晰的概念和分类标准作为支撑。分类是一种“测量。我们在描述某个现象的时候,总是把它大致等同于其他一些现象”(13)。

  只有在某一特定视角下,我们才有可能分辨出两个独立的现象是相同的还是不同的。如果研究者没有就其使用的概念进行明确的定义和清晰的界定,他对于某物具有独特性的断言根本不必当真。同样,如果研究者的分类不够准确和严谨,也就无法辨别出某物是一般的、典型的,还是特殊的、反常的。很多政治学研究在导论和结论部分大谈其研究问题的复杂性,却连聚焦研究兴趣、定义所用概念都没有做好。如果某项研究使用的是不甚清晰的概念、关注的是关于某个研究议题的未经适当分类的“全局”情况,那往往只能得到质量低下的分析和模糊难懂的结论,因为研究问题一开始就没有得到厘清。

  第二,我们必须认识到,每一行为模式都有一系列的限制条件。哪怕仅仅是描述性研究而不涉及背后的因果关系,这样的限制条件也是存在的。所有的关系、结构和模式都是暂时的、有条件的。否定这一点就意味着宣称社会科学中存在着与自然科学类似的法则。卡尔·波普(Karl Popper)就曾指出,认为社会科学也存在普适法则的观点在方法论层面就是不成立的。(14)我们不可能完全确信某一关系或模式是真实存在的,更不可能保证这样的关系或模式永远存在。

  实际上,对这种认为社会科学中存在定律式概括(law-like generalization)的观点最有力的辩驳来源于我们的基本预设,即:人是有意志的,理论上可以作出不同的选择,实践中有时也确实作出了不同的选择。因此,我们在社会科学中建立的种种模式和关系都是暂时的、概率性的,并受到一系列已知的或尚未被辨识出来的因素的制约。社会科学的目的在于尽可能扩展人类的认知范围,尽管我们很清楚这一目标永远不可能完全实现。对于那些声称能够解释一切(如判定系数R[2]接近乃至等于100%)的研究,我们不能太过当真。正如斯坦尼斯拉夫·安德列斯基(Stanislav Andreski)所言:

  幸运的是,在推进研究的过程中,我们没有必要接受普遍决定论。只要预设多数现象可以用因果关系来解释,不是所有可能的因果解释都是已知的,且我们有可能发现新的因果解释,那么研究就可以继续进行下去了。……(我个人秉持的)非决定论可以重新表述为这样一种信念:人类永远无法达到知识完全被习得、没有什么新的知识有待发掘的阶段。(15)

  对安德烈斯基这一观点的讨论远没有结束。其中最富争议的就是它暗含的论断,即:社会科学的目的乃是形成因果命题,并检验其有效性和可能性。当然,研究应以因果关系为旨归这个观点其实没有初看起来那么有争议。目前在政治学及社会科学界最难取得共识的地方在于:第一,建立因果解释的难度有多大;第二,是否已经有了足够的理论和方法论准备来证明某一因果假设在理论上是合理的、在经验上是可靠的。


  二、探寻因果关系还是描绘经验事实:解释还是理解?


  在高度规制的现代社会中,人与人之间的社会、政治和经济交往活动很大程度上是可预测的,并受到已知因素的影响。否则的话,人类的共同生活将难以为继。想象一下,如果大多数驾驶员不遵守同样的交通规则和规范,可能会发生什么吧。同理,一旦学生的行为难以通过合理的、可预见的方式加以控制,教育教学活动将无法展开;一旦家庭和企业不根据利率水平来决定财务开支,通货膨胀将彻底失控。现代社会中的多数行为都是可预测的,而这种预测正是建立在理解和解释的基础之上。

  自亚里士多德的时代起,学界对“解释”应由哪些因素构成、可以有哪些分类的深入讨论就从未停止。(16)有时,学者们区分了功能性、目的性、因果性三类解释;有时,也讨论描述性解释、类别性解释等其他维度。(17)还有很多研究就因果解释本身进行了类型学划分,如直接诱发性原因与间接背景性原因、必要原因与充分原因、决定性原因与非决定性原因,等等。本文无意就这些分类及其各自的优势展开长篇大论,只是简要介绍约翰·耶林(John Gerring)对因果关系作出的最低限度的定义,即:“原因可能指的是(在其他条件相同的情况下)那些提高某种结果发生概率的事件或条件。”(18)这一定义一方面涵盖了目的性解释,换句话说,涵盖了韦伯所说的“解释性理解”(19);另一方面,它也包含了(若干定义下的)功能性解释,尽管我们可能因为其他种种原因否认功能性解释本身的存在。(20)

  根据这一最低限度的定义,如果我们想要相对有说服力地论述某个原因“引起、创造或产生了既定的结果”(21),那就需要满足以下四个要件:(1)能清晰区分两种现象:因和果;(2)能确定何者为因、何者为果;(3)能描述反事实情境,即如果既定原因没有出现,可能发生什么;(4)能进行比较,具体来说就是,当既定原因出现变化的时候,能就变化前后的结果进行比较;当既定原因没有出现变化的时候,能就实际发生的结果与假想的反事实情境下的结果进行比较。这四个要件都与在理论层面阐明、在经验层面检验某一因果假设的能力紧密相关。对研究者而言,尤为关键的是要能够应对所宣称的因果关系并不存在、所观察到的共变现象是虚假的等情况。尽管研究设计不可能穷尽所有能想到的替代性解释,我们仍应尽最大可能来控制那些看上去合理的原因。大样本定量分析和小样本定性研究都遵循这样的逻辑,尽管这两类研究控制替代性解释的方式并不相同。(22)

  多数研究者都会认可现代社会中的许多现象受到部分已知的因果关系的控制,也很容易同意推进因果解释和理论知识的巩固、完善是政治学的雄心所在,但同时又承认,只有极少数的、很可能无关痛痒的因果解释才可能长期成立,且这还需要严格的约束条件。很多研究者还可能秉持这样的观点:对于政治学领域中既存的因果关系,我们目前所掌握的还极为有限。只有在我们自身的研究能够与某一研究问题及相关理论文献形成对话的基础上,政治学的知识积累才有可能切实增长。(23)在诸如投票、政党行为等研究领域中,因果理论已经得到了很好的证明,“概念语法”已经发展得相当完备,现有的理解也较为深入。在这些领域中,再进行以描述和理解为目的的、深度的单一个案研究很可能价值有限。但在另一些研究领域,现有知识积累则远远不够。哪种类型的社会干预可以为弱势儿童的发展提供最为有利的条件,就是这样一个例子。在理论和经验知识的储备都颇为贫乏的研究问题上,开展一些以描述和理解社会行为为目的的探索性个案研究比那些力图阐明和检验缺乏扎实基础的因果命题的研究更有价值。

  高度强调情境的描述性研究和旨在检验概括性的因果理论的分析各有优劣,不能、也不应依据二者在本体论和认识论上的不同来判断它们的高下。在设计研究的时候,应先于世界观层面的定位而务实、具体地根据该议题上现有的知识积累作出决定。高质量的诠释、可信的描述和扎实的概念都必不可少。只有在这样的基础上,我们才可能进入下一阶段,即作出条理清晰的因果论断,提出因果命题,并最终在经验层面检验其是否成立。当然,在多数政治学议题上,我们还没有能力进入这样的研究阶段。

  描述和诠释是因果解释的必然要求,在那些关涉目的性和策略性行动的因果解释中更是如此。不客气地说,在对政治和社会行为进行扎实的话语分析和深描之前,根本不应该贸然尝试作出因果解释。正如韦伯提倡的那样,我们必须首先理解人类行为以及行动者赋予这些行为的主观意义,只有在这样的基础上,才能继续推进研究,进而解释某一类行为的原因、过程和影响。(24)

  理性选择理论预设了若干动机,赋予了行动者特定的偏好,并认为情境性诱因(一般被概念化为诸种制度激励或博弈场景)对人类行为起着决定性的作用。在这样的演绎分析中,结论最终与预设一致。也正因为如此,理性选择的预设应该是可以辩护的、有充分理由的,且最终需要和其他描述性命题一样接受检验。(25)换句话说,诸如政治家追求选票最大化(26)、高级官僚追求预算最大化(27)之类的预设都需要切实的事实根据来证明其正确性。

  诠释是整个研究的重要组成部分。社会科学的研究对象有着自己的想法和逻辑,但研究者仍可以自行选择视角、建构分类并组织研究。正如理性选择范式中所有单调乏味的预设都得接受检验一样,对于那些自称出于好意的官僚或自称出于理想主义的政客对自己行为动机的解释,我们也不必照单全收。制度角色、结构诱因以及隐蔽的个人动机都可能是决定行为的重要因素,哪怕人们没有完全意识到或从不承认这些因素的作用。


  三、我们已经获得了哪些知识?我们还要认识什么?


  高质量的社会科学研究没有单一定式。与我们经常读到的说法不同,所谓最好的研究设计、最优的研究方法在现实中并不存在。(28)一些研究方法(比如实验法)较之另一些研究方法(比如单一个案法)更有利于检验因果关系,作出因果推论。但很多时候,我们的知识积累并没有达到足以合理地提出和检验因果理论的程度,更不要说用实验法进行检验了。分析路径、研究设计和研究方法的选择既是由研究问题决定的,又受到研究者本人的概念框架以及现有理论和经验知识积累的启发与限制。(29)从根本上说,所有的研究在最开始的时候都应提出两个问题:我们已经获得了哪些知识?我们还要认识什么?只有在这样的基础上,我们才可能最大程度地确定在该问题上最为合适的研究方法是什么。

  现有知识多数都是暂时性的,或多或少带有不确定性,对因果关系的认识更是如此。尽管如此,我们的研究仍应建立在(我们认为)已知的知识的基础之上。一方面,这是由于研究总是在一定的理论视角下进行的。如果相关的概念和定义足够清晰,那么必然会有很多学者从事类似的研究。另一方面,只有在对现有知识充分了解的基础上、并在与本领域相关文献交锋的过程中,我们才能判断是不是真的有些新的发现。研究某一事物的方方面面并不现实。唯有努力认识它,并在学术版图中对其进行定位,才能真正做出贡献。

  社会科学不可避免地带有理论色彩,因为我们追求的是系统性的知识,而理论正是其中的关键。1990年代初我住在纽约市B大道和D大道之间的10街,也很喜欢那里。据我所知,没有人研究居住在那里的拉美裔2000年以来的政治和社会认同,但早有研究者涉足政治认同的建构这一议题。在美国政治中,有关种族和少数族裔的研究更是汗牛充栋。有关贫民窟问题(inner-city problem)、草根动员、社会流动和城市富人化(gentrification)的后果等议题的研究也并不鲜见。但如果真要讨论居住在那里的拉美裔的政治认同的话,任何一个社会科学的研究者都必然会问:研究这一问题可以给本领域带来哪些新的知识?

  对一个特定现象而言,研究议题和相关理论决定了我们有意向研究它的哪个方面或哪几个方面,也决定了该现象是否真的值得研究。理论确定了某项研究在知识谱系中的位置,也保证了研究的开展。尽管部分政治学家、多数历史学家以及绝大多数人类学家可能不同意这一点,但实际上,无论探究有多么深入、立场有多么公正,我们也不可能真正研究某个经验现象的“本来面目”。

  (一)归纳还是演绎:经验与理论之争

  多数研究者以及绝大多数学生都声称他们的兴趣在经验层面,而非理论层面。这通常来说是荒谬的,也没有明确的意涵。如果他们说的“理论”指的是那种抽象的、形式化的模型,上面的陈述可能还稍微说得通一点。事实上,一旦脱离了特定的理论视角,我们根本不可能研究某一社会现象。正是理论帮助我们聚焦于研究对象的某些特定方面,而搁置另一些方面。

  归纳分析与演绎分析之间的区别稍微复杂一点,但它们之间的这种区分也没有太大意义。纯粹的归纳(即“只根据经验事实作出推论”)是不现实的,因为真实的研究对象本身并没有告诉我们它希望如何被诠释。完全脱离经验现实的演绎分析也不可取。这种纯粹的演绎不过是“阐明了某一陈述的内容”(30),无法为形成系统性的陈述和经验性的论点提供依据。

  克利福德·格尔茨(Clifford Geertz)认为,人类学的目的在于对文化进行深描,并找出在社会中长期存在的、且贯穿社会行动和互动的意义结构。(31)他提倡的其实是一种归纳式的理念。但根据本文的论点,这是不可能实现的,或者说,即使实现了也没有太大的学术价值。格尔茨承认,理论、概念和过去的研究影响着他的分析以及对他人意义结构的建构。但他又认为,只有当研究者真正深入其所分析的文化的时候,才能更加准确和完善地认识当地文化。“在这里,理论建构的根本任务不是对抽象规律进行整理,而是使深描成为可能;不是超越个案进行概括,而是在个案之中进行概括。(……)对民族志来说,理论的职能在于提供一套专业词汇,使得符号行为对自身的陈述可以被表达出来。”(32)根据格尔茨的观点,最高质量的学术性诠释既能在当地文化中发挥作用,又能在知识界获得生命力。然而,在社会科学(人类学)研究中,这样的视角至少存在两大问题。

  首先,符号行为无法表述出自身的方方面面。无论耗费多长时间研究某一社会现象,我们都只能揭示其特定的若干方面,而搁置另一些方面。我们必须在理论和概念上不断作出这样的选择,并对此保持尽可能坦诚和开放的态度。设若这种选择是无意识的、被刻意隐瞒的甚或暗含的,那必然会对学术讨论,尤其是其清晰性,产生不利影响。对于尽可能深入当地文化的含义和目的,格尔茨并没有说清楚。他的观点似乎是,我们分析得越深入,对当地文化的真实情况的认识就会变得越清晰。这样的观点带有实证主义色彩,强调如果研究者探究得足够努力,那么研究对象就会真实地呈现在其面前。问题在于,如果不能根据某些选定的尺度和标准加以衡量,那么我们对研究对象的理解变得更加精确到底是什么意思呢?这样的批评也适用于形形色色的扎根理论。主张扎根理论的学者认为,鉴于既有理论知识会影响经验研究的开展,因而在开始经验分析之前,必须避免理论讨论。他们进而提倡在对经验材料编码的过程中发现概念和情境。(33)对一些学者来说,扎根理论的理念听上去不错,但实际上,这根本是不可能完成的任务。它掩盖了理论先于经验事实而存在、且伴随分析过程始终这一事实。理论无时不在发挥作用。

  其次,把理论作为深描工具的观点意味着无法建构一般化的分类,形成概括性的命题,更不要说因果命题了。然而,如果缺乏对不同文化的考察和比较,我们怎么可能知道当地文化和话语到底意味着什么呢?格尔茨认为,当地的意义结构对社会互动起着关键性的作用。他确实可以这么说,但如果缺少了比较分析和一般概念,我们根本不可能判断这个命题是否有效。格尔茨承认,存在很多塑造并贯穿人类行为的现象,文化仅是其中之一。但他并没有说清楚他是如何作出文化更加重要、且“能在人类行为的诸多决定因素之中凸显出来”(34)这一判断的。为了分析这些彼此冲突的人类行为的决定因素,概念化必不可少。

  认为一旦收集了足够多的事实,终极真理就会自动出现在我们面前的观点显然是错误的。在收集了大量事实之后,我们只能制造一大堆彼此之间毫无关联的句子。这最多可以训练记忆技巧,但显然无助于从根本上加深对事物运转方式的理解。没有理论支撑的事实是无声的,正如没有事实基础的理论是空洞的一样。(35)

  对很多研究问题而言,深入的、定性的、个案式的研究设计特别合适。那些针对过度归纳或缺乏理论指导的诠释的批评并不足以构成对个案研究的有力反驳。在理论积累比较薄弱的领域,探索性的个案研究有助于新命题的产生;离开了个案研究,我们将寸步难行。(36)多数情况下,新的描述和分类无疑会推动研究的前进,但这仍然在很大程度上取决于这些新的描述在现有研究的基础上提供了什么新的内容、可以让我们获得哪些新的知识。在这里,我想举一个例子。

  对丹麦公共部门的比较研究或多或少都会强调其高度的分权性。(37)地方政府对多数社会福利负责。它们组织这些福利的供给,并征收绝大部分提供这些福利所需要的税收。一般认为,丹麦是世界上公共部门分权程度最高的单一制国家之一。开展又一项旨在说明这一点的研究并不值得资助。但是,一项以说明丹麦的公共部门实际上长期高度集权为旨归的深度描述性研究就特别有意思。而且,一旦得到可靠论据的支持,此项研究就可以增加我们对丹麦公共部门的特征的理解,甚至有可能发现一种新的中央规制形式。这样的描述性研究不仅要求展开相当多的理论工作,以梳理分权、地方自治、中央规制等概念,也需要仔细的数据筛选和系统的比较分析。如果没有做好此类理论研究和经验分析的工作,这样的推测很可能仍然缺乏说服力。

  政治学的雄心确实在于形成和研究因果命题。但与那些旨在检验本身就缺乏坚实基础的因果解释的平庸分析相比,构思精巧的描述性研究更加有趣,也更具学术价值。研究是一项集体性的探险。每个研究者都在为共同的学术大厦添砖加瓦。设计合理得当的描述性研究和对因果关系的检验都是理论大厦的重要组成部分,或者说,都有助于我们更好地理解社会和政治生活中系统性的那一面。

  (二)理论与设计:研究的阴阳两面

  行文至此,想必没有人会惊讶于不存在一个在绝对意义上更胜一筹的最佳研究设计了吧。任何情况下它都是不存在的。良好的方法论意识和严密的分析是完成高质量的政治学研究的前提条件。研究设计的选择应建立在研究问题和现有知识的基础之上。但既然政治学(社会科学)的根本兴趣在于理解和解释社会行为中系统性的那一面,那么就如何设计研究而言,我们也可以给出许多概括性的经验法则(general rules of thumb)。不同类型的研究问题要求不同形式的研究设计。下面仅围绕理论与研究设计的关系,讨论三个核心要点。

  1.变异性:以经验为导向的理论化要求对现象背后的模式进行辨识。在这一过程中,变异性必不可少。

  2.大样本研究:一般来说,如果想要尽可能确定某一原因是否会引起某一结果,并估计该因果效应的形式,那么大样本研究比较合适。

  3.比较个案研究:一般来说,如果想要考察因果机制而非估计因果效应,那么比较个案研究更加可取。个案研究还有其他一些优势。

  变异性:在判断一系列现象背后是否存在某种模式的过程中,变异性必不可少。无论研究的目的是形成理论还是检验理论,分析都必须建立在模式辨识的基础之上。在其他条件相同的情况下,更多的个案或分析单位有助于更好地观察某一模式、分辨某种可能存在的因果关系。也就是说,在同等条件下,个案数量越多越好。基于单一个案的研究在逻辑上是不成立的,除非该个案包含了若干子个案,进而提供了更多的观察值。(38)我们不能根据常量得出描述性或因果性的结论(尽管我们可以通过创造反事实情境,或者说虚拟个案,来实现变异)。

  为了便于讨论,我这里举一个例子。假设有一位研究者分析了过去20年间的三个地方政府,并得出地方民主的程度有所下降(表现为政治参与越来越少,大众意见与精英决策越来越不一致,等等)这一结论。下面马上应该考虑的问题就是如何根据这三个个案作出推论和概括。城市有大小之别、贫富之分,在官僚科层化程度、地方议会组织的民主程度和政治家的类型等方面也有差异。以上所列举的因素和其他一些因素在理论上都可能对当地的民主运转产生影响。那我们应该如何设计研究,把这些因素都考虑在内呢?此时,采用“最大差异性研究设计”是最合适的。(39)当然,不管研究设计得如何精巧,对仅依据三个个案就得出的过于肯定的结论,我们完全有理由保持怀疑。

  我们所能想到的最简单的因果关系就是在两个二分变量之间展开的。一个看似可信的命题是:高收入者的政治取向偏右,低收入者则不然。对该因果命题最粗浅的检验要求研究者至少考察一名高收入者和一名低收入者的政治态度。无论结果如何,我们对这样的检验显然不会太有信心,因为很可能其他未被考察的对象不符合这一模式,而且,很多其他的(或许更为重要的)因素都影响着政治态度的形成。我们也可以推测这一因果关系是概率性的,而非决定性的,也就是说,高收入者政治取向偏右的可能性高于低收入者。

  如果研究的是有关个人收入与政治态度之间关系的因果命题,大多数人都同意仅仅分析两个个案是很不充分的。但要是这里的个人换成了地方政府、政党、改革或福利国家这些明显更为复杂的研究对象,那么人们(出于某种原因)似乎更容易接受基于两个个案而作出的对因果关系的概括。然而,既然仅根据对两个个人的考察就得出的过于肯定的结论值得怀疑,那么对两个特定的地方政府、政党、改革的研究得出的结论又怎么能够轻易推广到一般意义上的地方政府、政党、改革上去呢?

  因果效应、控制和大样本研究:收入高的人政治取向偏右这样的命题太过简单了,只有极少数的因果命题采用这样的形式。而且它是决定论式的,一个异常值就足以否定整个命题。根据我们现有的知识判断,该因果命题成立的可能性不是很大。很多同领域的研究者也可能指出,这一因果模型不够完善,设定得并不准确,而且未能很好地利用现有的研究积累。一个更加可信的替代性的因果模型可能是这样的:一个人的收入越高,政治取向就越右。这就要求收入和“右”的程度这两个变量在测量层次上至少是定序的,但我们一般把它们当作定距变量来处理。这样,下面要考虑的就是我们对这两个变量间因果关系的预期了:是线性的(如图1中的曲线A),还是超过了特定收入后,收入的增加会明显加剧“右”的程度(曲线B)?是否有可能穷人与富人一样政治态度偏右,因而其趋势是先随收入的增加而下降,继而随收入的增加而上升(曲线C)?理论上说,这三个命题都有可能成立。

  图l:两个定距变量间的不同因果关系

  我们不可能只根据两个个案就判断以上三个命题当中的哪一个最为准确。比如说,我们的研究对象是一名中等收入者和一名高收入者,对他们的政治态度的分析无法否定以上任何一个命题。为了估计因果效应到底是哪种形式的,更多的观察值必不可少。(40)此外,由于绝大多数因果关系都是概率性的,因此我们只能估计因果效应的平均情况。概而言之,只有在大量观察值的基础上,我们才能对哪个命题更为可信作出相对准确的估计。

  与刚才类似,大多数人都会认同,以上就如何研究收入对政治态度的影响而展开的讨论是合理的。这种分析因果效应的形式、强度和特征的方法同样适用于研究其他领域和其他对象。对诸如社会民主党的力量(例如,以执政时间长短来衡量)与福利支出的增加、城市的繁荣与服务外包的程度、经济增长与民主化进程、法团主义的程度与社会平等之间的因果效应的研究都应该以类似的方式展开。

  还要注意的是,原因与结果之间的关系可以颇为复杂。它们有可能受到某些交互变量的制约,也有可能共同受到某一变量的影响,因而是虚假的。再拿收入与偏右的政治取向之间的关系来举例子。二者的因果关系可能取决于研究对象在公共部门还是私营部门工作。这时候因果命题就变成了:公共部门雇员的收入对“右”的程度的影响小于私营部门雇员。同时,二者的因果关系也可能因为引入教育这一变量而消失。也就是说,受教育程度较高的人一般会同时具有较高的收入和较右的政治取向。

  因果效应还是因果机制:如果要研究复杂的多变量因果模型或因果效应的形式和强度,大样本研究更加可取。多元的分析单位也为更好地控制其他变量提供了可能。然而,归根结底,弄清因果命题背后的理论根据显然比单纯讨论因果命题本身更有价值。对于变量间因果关系的诸多环节,大样本研究可以实现一定程度上的理论化,但难以在经验层面予以证明。(41)设计得当的大样本研究固然有助于我们观察因果机制,但巧妙的比较个案研究在此方面更为擅长。(42)

  讨论小样本研究的文献都会以不同的辞藻和概念强调,当研究兴趣在于挖掘某个原因是如何引起特定结果的时候,精细的个案研究比大样本研究更加合适。(43)一个因果命题通常包含了诸多环节(或中介变量),但在大样本研究中,很难找到合适的可比较的指标来衡量这些环节。如果有待考察的因果关系在理论上足够有力(这可能是因为这一因果关系的诸多环节之前就已经得到设计合理的个案研究的证明了),那我们确实没必要通过个案研究再来证明一遍。此时,由于前面提到的诸多原因,大样本研究就变得十分有意义。但是,强有力的、且已经被较好证明过的因果理论在政治学领域并不多见,对因果机制的讨论因而特别具有学术价值。事实上,如果理论背后的因果机制没有得到阐述和证明,我们完全有理由拒绝这样的理论。来看下面这个例子。

  在丹麦政治学领域,欧勒·克里斯滕森(Ole P.Kristensen)关于非对称的决策过程和公共支出增长的研究广受推崇。(44)该研究的一个推论是,购买性支出的增长比转移性支出的增长更快,因为购买性支出背后那些服务提供者的利益更为集中,更倾向于大型预算,而转移性支出所代表的利益则不然。现有研究已经表明,以上推论并不总能得到经验数据的支持,(45)但这还不是关键。对该推论的检验一般是这样进行的:在控制可能引起支出变化的其他因素的前提下,考察一段时间内购买性支出和转移性支出的增长。这样的检验看上去不错,但却不无问题。该推论实际上依赖于一系列环节,其背后的因果机制并没有得到明确的阐明和细致的研究。代表服务提供者利益的组织究竟是如何施压的呢?

  这种压力可能以不同的方式施加。有一种可能是,较之于代表转移支付收益客户的利益的组织(如高龄老人协会、学龄儿童家长协会、各种病人协会等组织),代表幼儿护理者、教师、医生等服务提供者利益的组织更为积极地在政策制定过程中进行游说。进一步来说,他们拥有更充足的资源和专业技能,进而能够更好地扮演游说者的角色。我们也可以猜测,代表服务提供者的利益的组织拥有与政治家、公务员更为紧密和良好的关系网络,因而其观点在议会辩论和媒体报道中被更多地提及。换句话说,我们可以通过两条不同的路径来研究购买性支出的增长快于转移性支出的增长这一命题:其一是通过控制其他变量之后展开的大样本研究,其二是通过小样本研究来厘清背后的因果机制。

  使用相对较少的分析单位的个案研究提供了考察过程和因果机制的机会,而这仅是其较之于大样本研究的优势之一。(46)甚至可以认为,就推论逻辑而言,设计巧妙的、跨时段的和跨截面的个案研究与实验法并没有太大区别。(47)此外,个案研究在因果分析中还有两个特别值得注意的优势。

  分辨某种模式和证明某种因果关系都要求我们研究那些完全具有可比性的现象,也就是统计学所说的“单位同质性”(48)。没有两个个案是完全相同的。只有在特定的理论视角下它们才是可比的和一致的。许多大样本研究都暗含了这样的预设:被称为同一现象的现象确实是相同的。这样一来,语义对等就被当作了功能对等。比如说,丹麦1945年的社会民主党同1975年、2005年的社会民主党,以及其他国家的社会民主党在语义上都是一致的。一项围绕社会民主党政府(与其他中右翼政府相比)对社会福利的影响而展开的常规研究可能会有如下设计:在控制一系列变量之后,比较1945年以来不同政党执政时期福利支出的增长。(49)但是,这种把1945年的社会民主党与今天的社会民主党完全等同起来的预设合理吗?这两个时期的社会民主党是否有着同样的选民(当年的选民今天还健在吗)?这两个时期的社会民主党与工会运动的关系是否相同(今天还开展当年那样的工会运动吗)?这两个时期的社会民主党所信奉的意识形态是否相同(今天还秉持当年的意识形态吗)?在社会民主党执政对福利支出的影响这一理论背后,包含了一系列关于社会民主党的性质和所面临的激励的预设。对其发展情况的比较个案研究可以帮助我们澄清“不同时空条件下的社会民主党是相同的”这一预设是否合理。也就是说,如果我们可以进行更多高质量的描述性个案研究的话,很多概念上的过度延伸都是可以避免的。反之,我们将无法理解、进而无法有效检验因果命题。

  按照这样的思路推进,比较个案研究的作用越发明显,这就意味着对所讨论的现象而言,相关的概念辨识和因果理论的积累越为薄弱。如果对某现象存在的可能原因只有一个非常模糊的认识,那么对其进行更加细致的研究就是一个不错的选择,以期形成更为清晰的因果命题来研究类似的现象。(50)这与格尔茨对深描的论述在一定程度上是相容的,但仅仅是在一定程度上而已。我们这里讨论的深度个案研究受到理论兴趣和视角的影响,并以建构理论、形成假设为旨归。我们寻求的是理解和解释社会行动中的一致性、普遍性,而不是独特性的那一面。

  对任何单一事件的分析都无法脱离界定其范畴的研究领域,赋予其意义的理论背景和确定其坐标的研究方法而存在。(51)


  四、社会科学与民主政治:辩论出真知


  我们总是下意识地认为民主政治与社会科学之间存在张力。在民主社会中,有见地的讨论总是围绕如何实现集体行动、进而改变社会发展进程而展开的。在学术共同体中,高质量的讨论则强调发掘社会行动中的一致性,从而证明社会发展的可预测性(至少是可解释性)。但是,二者之间并不存在张力。

  奥古斯特·孔德(August Comte)当年认为可以找到社会科学中的普适法则和一般规律。然而,今天的研究者越来越放弃这一奢望。所有的理论和一般化的因果关系一方面取决于一系列已知因素,另一方面,通常来说也依赖于诸多未知因素。这种不确定性之所以在所难免,首先就是因为人类拥有创造力和个人意志,并且可以在社会交往中形成集体行动(或者说政治行动)。人类是有能力学习和改变社会的,不可预测性因而难以避免。社会科学研究面临的这一根本限制也适用于政治生活。它在给社会科学提出严峻挑战的同时,也是政治家施展才能的前提条件。如果政治家对一切都无能为力,那么民主问责之类的提法就变得荒谬可笑、毫无道理了。

  扎实而重要的社会科学研究所能获得的最高礼遇就是政治家不仅认同研究结果,而且运用其来改变现状。但这也意味着昨天还被认为是完全正确的分析也许明天就不成立了。政治家可能调整了不合常理的激励机制,重新考虑了之前被隐瞒的动机,并着手纠正政策上的失误。这样,现有的因果关系方面的知识就过时了,现有的理论也需要修正。

  本文的论点在于,高质量的政治学研究一开始就应探讨两个问题:我们已经获得了哪些知识?我们还要认识什么?只有当这两个问题都得到解答的时候,才能提出第三个问题,即:我们如何能够认识?这也是科学哲学和社会科学方法论的核心问题。它涉及我们对人类自身和社会生活的基本理解,以及如何才能获得尽可能确定的知识。它也涉及在强调自我反思和研究技术的大背景下,我们应该如何解释根据经验现象作出推论的过程。也就是说,我们如何确信已经真正了解了那些我们声称了解了的东西?但是,在对前两个更为基本的问题作出回答之前,对第三个问题的讨论没有太大意义。如果就像本文指出的那样,研究问题、理论和方法之间存在着一定的联系,那么研究者就应该成为优秀的知识工匠,妥适地雕琢打磨三者之间的联系。否则,我们能够提出和尝试解答的学术问题必然是十分有限的。

  无论是在民主社会还是学术共同体中,对知识的有效性的证实都需要一定的规则。既然社会科学的知识本来就是暂时性的,其讨论规则也与民主政治的规则没有太本质的区别。观点的自由交流、思想自由和言论自由、给予辩论和证明以充分空间的多元主义是民主政治和学术研究共同遵循的基本准则。那些听上去稀奇古怪的言论也有表达的自由。既然我们预设自己有足够的辨别能力,那么无论是天才还是蠢材的观点都不应该被忽视。作为自由主义和多元主义最坚定的倡导者之一的密尔(John Stuart Mill)针对一般意义上的社会生活提出的观点也同样是社会科学的有效标准。为了获得正确的知识,我们就应该接受自己的观点有可能被证明是错误的这一事实。


本期编辑:吉先生

本文原载丹麦期刊《政治》(Politica)2007年第39卷第3期,英译版刊于《世界政治科学评论》(World Political Science Review)2008年第4卷第1期。本译文根据英译版译出,限于篇幅,内容有删节。转载于《国外理论动态》。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存