速看!如何撰写学位论文中的文献综述?| 【研究方法】专题
编者按
攻读一个博士学位对任何一名学生来说都是极具挑战的任务,而撰写一篇令人满意、拓展学术边界的博士论文就是这项任务中的终极关卡。撰写学位论文,尤其是博士论文的艰难,非经历者不可体会。
那么,学位论文如何选题?如何确定我们的研究是对现有学术知识有所拓展呢?实际上,回答这一问题的关键就是我们在做学位论文时的文献工作,也就是学位论文中的文献综述部分。
在“确定研究兴趣—广泛阅读文献—厘清理论脉络—寻找学术空白”的过程中,我们往往会陷入学术文献的汪洋大海中。有很多中工具可以帮助我们寻找学术空白,但毫无疑问的是,元分析(也译为荟萃分析)是其中效率最高的一种研究方法。基于此,我们翻译了本篇文献,简要介绍了元分析的优势和应用中可能面临的挑战,为正在撰写学位论文的研究生和寻找理论Gap的研究者提供趁手的研究工具。
如何撰写学位论文中的文献综述?
(原标题为:《综合论述:运用元分析作为学位论文研究方法(Synthesize This: Meta-Analysis as a Dissertation Tool)》,现标题为译者所拟)
作者:
Christopher Jackson, University of Colorado Boulder
Andrew Q. Philips, University of Colorado Boulder
译者:
焦磊,山东大学
引文格式(MLA):
Jackson, Christopher, and Andrew Q. Philips. “Synthesize This: Meta-Analysis as a Dissertation Tool.” PS: Political Science & Politics, vol. 57, no. 1, 2023, pp. 70–75.
内容提要
元分析被用来综合大量文献,以生成一个统一的总结性估计,并解释各研究之间的差异。近年来,政治科学领域逐渐认识到其使用价值;然而,在学位论文中运用元分析仍较为罕见。考虑到元分析工具能够勾勒主题、揭示未来研究有待解决的潜在空白,以及对未来项目具有持久实用性的特点,这一现状令人费解。我们主张,基于上述理由以及其他若干原因,研究生应当考虑在学位论文中纳入元分析部分。本文详细讨论了这些优势,并根据数次访谈和应用实例,提供了如何进行元分析的建议。同时,我们也探讨了在学位论文中采用这种研究设计可能面临的挑战。
“尽管元分析适用于‘书籍式’博士论文,但对于撰写‘文章式’博士论文的学生来说,它们应该更具吸引力。这是因为元分析章节可以很容易地作为独立文章发表,这对学生而言甚至在进入就业市场之前就可能带来益处。”
“元分析非常适合用来获得文献研究现状的基础认识,并能够强化作者对于原创性贡献声明的可信度。”
“元分析使得研究生能够收集所有可获得的研究资料,建立更广泛的专业人脉网络,可以作为其学位论文的一个独立章节,往往被频繁引用,在未来持续产生收益,并有助于分析发表偏倚问题。”
引言
元分析综合了针对特定研究问题的全部研究成果,并且政治科学家对它的使用正在增加(Ahmadov 2014; Araújo 2021; Blair, Christensen, and Rudkin 2021; Blair, Coppock, and Moor 2020; Costa 2017; Doucouliagos and Ulubaşoğlu 2008; Incerti 2020; Kertzer 2022; Li, Owen, and Mitchell 2018; Owen and Li 2021; Philips 2016; Schwarz and Coppock 2022)。其优势体现在两个方面。首先,元分析汇总了整个文献中的效应量,提供了前人研究的系统性综合。其次,学术研究可以被理解为一系列主观决策过程:应使用哪些数据?如何操作化因变量?是否应该优先选择估计量A而非估计量B?元分析使我们能够探究为何不同文章间会出现差异。基于这两个理由,元分析是一种强大的工具。然而,本文明确指出了一项额外的实用性,即元分析对于撰写学位论文的学生尤其有用。
为了了解当前政治科学中元分析的使用情况,表1列出了2015年至2021年间三大顶级期刊中标题、摘要或正文提及“元分析”一词的文章数量。尽管实际进行元分析的研究并不多,但提及次数却几乎增加了五倍。例如,元分析已被用于研究石油财富对民主和现代化的影响(Ahmadov 2014),以及恐怖主义如何影响个体的政治态度(Godefroidt 2022)。
表1 在APSR、AJPS和JOP中提及“元分析”的文献数量
注:《美国政治科学评论》(American Political Science Review, APSR)、《美国政治科学杂志》(American Journal of Political Science, AJPS)和《政治学杂志》(Journal of Politics, JOP)每年在线发表的包含“元分析”一词的文章数量。
鉴于顶级政治科学期刊中对元分析引用的不断增长,我们预期研究生会采用这些工具。但实际上并非如此。我们下载了根据美国政治科学协会(APSA)数据,在2020年期间发表的所有可用的学位论文。在249篇已发表的论文中,我们获得了178篇(其余部分处于保密期或无法获取),其中仅有一篇包含了定量元分析。此外,只有32篇论文甚至引用了元分析。显然,目前在文献中使用的元分析与在学位论文中应用的之间存在明显的差距。
本篇文章借鉴了对一些在其已发表作品中运用过这一工具的早期职业学者的访谈,讨论了将定量元分析纳入学位论文的优点及挑战。本文简要概述了不熟悉元分析的读者进行元分析的一般步骤;在线附录第2至5部分提供了四个元分析实例的详细分步说明,以及相关的实用阅读材料和统计软件推荐。在线附录还包括了一份注释版阅读清单,涉及最佳实践文本和用于进行元分析的不同统计软件包(第6和7部分)【注:本文在线目录为:http://doi.org/10.1017/S1049096523000446】。
元分析的步骤
元分析包括一系列步骤来构建“对研究问题或领域的一个概览”(Hansen, Steinmetz and Block 2022)。在确定了研究问题后,学生首先必须制定策略,明确指出将包含或排除哪些类型的文章。例如,在一项关于政治精英与大众公众的元分析中,Kertzer(2022,543)明确描述了纳入标准,即来自“由实验者随机分配处理条件的实验”,并且“同一实验同时在政治精英样本……和大众公众或方便样本上进行”。为了避免任何不必要的偏见,学生还可能考虑纳入工作论文以及非英文发表的研究(Stanley and Doucouliagos 2012)。一般来说,建议尽可能地包容各类研究,同时确保这些研究“指向一个共同的实质性(理论性)量,并专注于捕捉相同的事物”(Slough and Tyson 2023)。换句话说,尽管某项研究可能出现在关键词搜索结果中,但这并不意味着它在主题上符合要求;该研究也可能“使用不合适的变量测量方法”,或者“未报告可用的效应大小”(Hansen, Steinmetz and Block 2022)。
表2 研究—模型观察数据集示例
注:OLS(普通最小二乘法)= ordinary least squares; SE(标准误)= standard error; Lag DV(滞后因变量)= lagged dependent variable
其次,在获取所有相关文章后,学生必须记录实证发现,通过创建一个新的数据集来实现,其中每个观测值代表一项研究—模型(参见表2中的示例)。这个数据集中至少应包含系数、标准误差以及自由度等变量。数据集通常还会列出其他感兴趣的数量,如作者信息、方法特性、数据类型及覆盖范围(如横截面、时间序列、分析的时间段或单位),以及所使用的估计器。这些变量可以用于后期评估调节变量的影响,或探索各研究间的异质性。例如,在他们对民主与经济增长关系的元分析中,Doucouliagos和Ulubaşoğlu(2008)编码了特定研究是否包含某些大陆,以及是否使用了非普通最小二乘法。而Kertzer(2022)则编码了所纳入研究关注的是代表性、国内政治、国际政治经济还是国际安全。研究生甚至可以为每种模型使用的控制变量进行编码。这一阶段是元分析中最耗费精力的部分。
第三,学生可以利用编码后的数据集进行分析。虽然分析类型各异,但我们会重点介绍几种最常见的;在线附录中有深入的实例讨论。学生可能首先计算一个总结所纳入元分析研究的总体效应大小,常用的方法是将研究估计值转换为部分相关系数(参见在线附录,第7至8页)。接下来,他们可以探查效应大小的异质性。理解异质性的一种流行方法是采用元回归分析(Meta-Regression Analysis, MRA),其中因变量是效应大小,自变量则是从每篇文章中编码出的研究-模型因素(参见表2中的示例)。这使他们能够“识别方法选择、设计及数据的具体选择如何影响报告的结果”(Stanley 2001,132)。例如,Araújo(2021)利用MRA测试了随机对照试验与断点回归设计、同行评审与非同行评审、政治科学与经济学之间的差异,以及研究区域的不同(详细讨论请参阅在线附录)。
最后,学生可以检测是否存在发表选择偏误,并检查在考虑到任何偏误之后文献中的效应大小是否依然稳健。在线附录概述了几种用于识别发表偏误的统计检验方法:漏斗图不对称性检验(第2.3.4节);精度效应检验、精度效应估计及其标准误差,以及修剪填充法(第4.3.2节);以及p曲线(第5.3.1节)。
为何元分析应引起研究生的兴趣?
现在我们已经了解了什么是元分析,它对研究生有何用处呢?我们认为主要有六大优势。首先,通过开展广泛的文献检索,学生可以系统地收集与他们论文主题相关的所有现有研究。每一位论文委员会成员都希望在论文结束时,作者能成为某一特定领域的专家。通过元分析,研究生可以获得该领域已发表的以及有时是未发表(例如Costa 2017;Godefroidt 2022;Roscoe and Jenkins 2005)的所有研究成果。从这个意义上讲,元分析类似于一个特别全面的文献综述。然而,后者仍是一种定性总结,往往包含一些保留意见和限定条件,使得得出明确结论较为困难。相反,元分析利用这样一个事实:通过对多篇研究中的效应量进行合并,可以在文献库中创建出一个单一的效应量总结。总之,元分析的第一个吸引力在于其对某一主题进行了全面且详尽的文献搜集。
其次,由于元分析必须考虑该主题的所有相关工作,因此通常需要与其他学者建立联系,这有助于扩大研究生的专业网络。例如,Costa(2017)通过电子邮件列表服务联系同行,而Roscoe和Jenkins(2005)则联系美国政治科学协会获取过去会议上发表的论文。一位受访者通过Twitter发布论文请求、发送电子邮件至邮件列表,并联系了约100名正在该主题上工作的人员。通过这样的广泛交流,受访者几乎了解到了自己领域内的每一项研究、作者及其所做的工作以及所使用的方法。
第三大优势是对于撰写毕业论文的学生来说,元分析可以作为独立的一章纳入论文中,为该主题提供基准:我们已经知道什么?文献中还存在哪些尚未解决的问题?在撰写其他章节之前先进行元分析可以帮助识别未来研究的有成效方向,并预测新研究可能发现的结果(Stanley 2001)。此外,这也能够说服读者后续章节确实填补了文献中的空白。尽管一名受访者将元分析作为其论文的最后一章,但他们建议以元分析开始,因为它可以突出显示领域内缺失的内容。另一名受访者怀疑墨西哥在其关注的主题上是个异常值,而元分析证实了这一猜想。即使某个主题已有大量研究,学生也可能难以提出新颖的贡献,但对那些方法论导向较强的论文而言,元分析可以通过揭示不同方法论途径之间结果的异质性而发挥作用,DeCrescenzo(2020)在其在线附录中对此做了详细描述。尽管并非所有的博士论文都适合采用元分析,但它可以帮助研究生确定关于某一系列文献已知(及未知)的内容。例如,一名受访者怀疑某个案例是一个异常值,先前的研究错误地将该案例的发现泛化了;元分析确认了这一异常值。
第四大优势是元分析被引用较多,能够展示专业知识。它们是对整个文献权威性的总结,在其他学者定位自己的研究于既有文献框架时非常有用。虽然元分析适用于“书籍式”的博士论文,但对于撰写“文章式”博士论文的学生来说,它们尤其具有吸引力。这是因为元分析章节可以轻松地作为独立文章发表,这对学生甚至在进入就业市场之前就可能带来好处。尤其是,元分析可以证明学生在该领域的专业水平。例如,Philips(2016)在答辩前发表了其元分析。一名早期职业学者接受采访时表示,他们的元分析发表在顶级期刊上,并在出版第一年内被引用了25次。Slough和Tyson(2022)讨论的2018年至2022年间发表的12篇元分析文章已经累计获得了1012次引用,平均每篇文章84次引用。
第五个优点是元分析是一项长期受益的投资。由于元分析涉及对收集到的每一篇文章进行编码并创建一个可搜索的数据集,其中包括它们的特征信息,这对于撰写其他论文章节提供了极大的帮助。比如,想要找到某种因变量的具体操作化定义?哪篇文章引用最多?谁使用了工具变量回归?这些问题都可以通过元分析过程中创建的数据集轻松解答,并且具有长期价值,这一点得到了受访者的强调。
第六个优势是鉴于近年来社会科学领域出现的复制危机,元分析可以探查发表偏倚,并更好地理解为什么某些研究可能会得出特定的关系结论。有些学者认为元分析可能只是暂时性的解决方案(Kline 2013),并不能替代诸如预注册(Nelson, Simmons, and Simonsohn 2018)等其他技术手段。尽管如此,研究生通过进行元分析,可以帮助整个学科更好地认识这些偏倚的程度,从而推动科学研究的进步(Chan and Arvey 2012)。
进行元分析时可能遇到的挑战
元分析还提出了一些挑战,我们将在本节中介绍这些挑战,并讨论学者们如何克服这些挑战。
(一)可比性问题
首先,由于研究间可能存在异质性,以至于无法将它们全部纳入单一的元分析中。研究异质性包括但不限于数据或样本大小、研究问题或方法、控制变量的选择、研究质量和所测量的概念等方面的差异。在设定研究范围时存在一种“过于宽泛”与“过于具体”之间的权衡。起初,明智的做法是有意地放宽范围,广泛筛选文献,这有助于避免在构建样本时产生偏见(例如排除非英文或未发表的研究)。然而,在最终样本中包含过多的研究也会带来问题。因此,最终样本应聚焦于感兴趣的研究问题上,并且要尽可能精准。在数据收集之前明确设定纳入和排除标准可能会有所帮助。Godefroidt(2022)预先界定了并定义了“关键概念”,以确保纳入的手稿之间具有概念上的可比性。她最初从12133项研究开始筛选,最终仅确定了241项符合研究参数的研究。即使经过这些努力,她也注意到审稿人担忧她的样本范围过大。
其次,虽然设定广泛的纳入搜索标准有明显的好处(Borenstein et al. 2021),但重要的是要将最终样本限制为高质量的研究,这些研究在概念上衡量的是相同的实证关系,即它们是“目标等价”的(Borensteinet al. 2021;Slough and Tyson,2022;Stanley and Doucouliagos, 2012)。为了满足这两项标准,Araújo(2021)仅纳入了随机对照试验和断点回归设计(有关更详细的讨论请参阅在线附录);Incerti(2020)仅纳入了调查和实地实验。尽管这种方法导致Araújo(2021)在最终样本中仅包含10项研究,保守的方法确保了样本具有“低偏误风险”。
Ahmadov(2014,以及Godefroidt 2022)也提供了一个满足上述两项标准的良好示例。Ahmadov(2014)在收集过程中对哪些指标应该包含、哪些不应该包含有着清晰的概念界定。例如,在从石油对民主的影响得出明确结论时,Ahmadov(2014)在一定程度上保持了广泛性,因为“关键变量的不同度量方式可以影响研究结果”。因此,虽然包含了不同政治制度的度量方式,但由于其“产生的结果在概念上与大多数基于民主—独裁连续体测量制度的研究不同”,所以选举竞争和威权主义单独存续与民主存续的度量并未被纳入研究中。
第三个批评是,试图用一个“最佳”估计值来概括整个研究领域过于简化。例如,Bailar(1997)认为,如果将整个研究领域的结果浓缩为一个“带有置信区间的单个数值”,那么从元分析得出的结论可能是错误的——“可能严重错误”。然而,正如定性文献综述一样,元分析应当通过多种途径综合评估该领域效应量的多样性,而不仅仅是报告一个总结效应量。Borenstein等人(2021)指出,元分析结果有三个含义:(1)一致的效应提示领域内达成共识;(2)中等程度的分散(在各研究间)应当用于解释平均效应;(3)大幅度的分散应导致更多权重放在分散而非平均效应上。因此,学者们不仅要报告单个总结效应量,还应注意描述围绕它的异质性(即研究异质性)。此外,他们还应报告特定类型的研究或研究者决策是否可能导致这种异质性,这可以通过使用元回归分析(MRA)轻松解决(Stanley and Doucouliagos 2012)。一位接受访谈的博士后研究员强调了元分析的实用性,认为它提供了文献效应量的方向和规模。因此,特别案例或离群值不应轻易被忽略,因为元分析允许学生针对多个结果和估算值进一步评估某个特定案例的意义。例如,Ahmadov(2014)通过纳入不同类型解释变量和结果变量的研究实现了这一点,而Philips(2016)则根据分析的因变量类型对效应量进行了分离。
第四个关于可比性的批评是,论文主题可能太过新颖,即目前对该主题的研究很少甚至没有。尽管这种情况有可能发生,但通常存在大量相关的现有文献可供借鉴;每篇博士论文至少都会引用一些已有的工作。在这种情况下,元分析非常适合获得文献现状的基础认识,并能强化作者对于原创贡献的主张。由于博士生在撰写论文时必须解决这一贡献空白,因此使用元分析更容易为其“增值贡献”进行辩护。比如,一位受访者需要证明针对非洲的研究在其研究领域中是缺失的,元分析成功地证实了这一点。
(二)兼容性问题
我们已经讨论了如果研究不可比性对解释结果构成的威胁,那么如何选择研究以纳入元分析呢?如果将质量较差的研究也包含在内,这个问题同样会影响元分析结果,可能导致效应量出现偏差。因此,在进行元分析时,运用策略性和系统性的纳入标准应能限制低质量研究的数量。例如,研究生可以通过子群分析(subgroup analysis)来比较那些做出较强识别假设的研究与其他假设较弱的研究的结果有何不同。此外,由于效应量可以融入对研究“质量”的衡量(如引用次数或观察数量),学生可以轻松判断其计算出的效应量是否相对于其他研究质量替代指标具有稳健性,或者这些效应量能否作为元回归分析中的自变量。
关于纳入/排除标准的另一个考虑因素是审查过程中可能遇到的困难。鉴于前面的讨论,在进行元分析时满足审稿人的要求可能会显得颇具挑战性。特别是在整个过程初期以及文稿中明确并合理定义纳入/排除标准尤为重要(在线附录中有示例)。这些标准必须预先确定、给出理由,并且保持不变。在收集过程中,宁可过于包容也不宜过度排除。例如,一位接受采访的学者最初搜寻并找到了所有关于“条件现金转移或选举”及“反贫困计划或选举”的已发表作品(共54项研究);然而,只有10项研究符合更为严格的“低偏误风险”搜索标准。从受访者的角度看,这种严格的纳入标准使得论文更难以被发表。由于搜索和纳入/排除标准在过程开始之初就已确立,所以在开始收集数据之前,它们应根据元分析的研究问题和目标仔细考虑并加以合理化。
实际上,我们仅看到一个例外情况,即在收集过程的第一阶段不考虑研究的质量(即最终分析中是否包含某项研究取决于前面讨论过的因素)。也就是说,有些研究根本就没有足够的信息来进行元分析编码。例如,一名受访者提到一些研究因为没有提供足够的信息来验证论文结果而被排除在外。另一名受访者同样会排除那些未在文稿中包含定量测试或系数与标准误差的研究。对于研究设计存疑、缺乏详细解释估计值如何得出的研究,以及未报告关键信息(如观测数量)的研究,在将其纳入之前应仔细审查。
(三)作者本身的问题
未来的元分析研究者也应该注意作者可能面临的潜在陷阱。有一种批评认为,开展元分析是一项艰巨的任务,如果与撰写博士论文相结合,可能会令研究生望而却步。我们同意,进行元分析确实涉及大量的工作;然而,在撰写博士论文时,学生已经需要收集并仔细研读大量文献资料。在同时进行元分析的过程中,与单纯撰写论文的唯一区别在于,必须特别注意收集所有现存的文章,并按照编码标准对它们进行编码。的确,元分析需要付出大量的努力;同样地,阅读众多文章以完成博士论文也同样耗时。此外,在整个过程中对文章特性进行编码可能从长远来看节省时间,因为研究生在随后撰写其他论文章节时可以根据已编码的内容快速找到特定的文章。
结论
元分析在政治科学领域中的应用日益广泛。我们认为,它们对正在撰写博士论文的研究者具有特别的吸引力。元分析使研究生能够收集所有可用的研究资源,建立更广阔的专业人脉网络,可以作为其博士论文的一个独立章节,通常会被频繁引用,在未来持续带来回报,并有助于分析出版偏倚问题。然而,对于有意进行元分析的人来说,存在一些挑战。但是,通过首先广撒网式地搜集资料,然后将样本限制为检验实证关系的高质量研究,并熟悉元分析工具,研究生可以克服许多这些难题。定量综合整个文献体系是一项艰巨的任务;然而,元分析带来的益处远大于成本。
(因篇幅限制,参考文献从略)
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰