系统综述与meta分析(5/5): 撰写论文及最新进展
本文是“系统综述与meta分析”全部5集系列的第4集,之前各集的链接见下:
第六节 撰写报告和更新
第七节 系统综述的特征和优缺点
其次,系统综述使用了定量的方法,提供了精确定量的信息。传统的综述因无法对不同研究的结果进行定量的整合,至多只能对效应的方向做类似有效或无效这样定性的结论。系统综述通过meta分析不但可以得到定性的结果(显著性检验),还可以得到定量的信息(效应的点估计值及其95%可信区间),为量化决策奠定了基础。当入选的研究具有足够的同质性,各原始研究的结果均未没有统计学显著性意义,但合并之后却达到了统计学显著性时,系统综述的优势就尤其明显。同时,定量的方法大大增加了识别交互作用和确定剂量效应关系的能力。因此,系统综述一系列定量的结果可以更好地指导实践和决策。
再次,在所有需要的地方,都尽可能地引入科学的可靠的方法,以保证研究的质量,大大减低了系统综述的偏倚,增加了结果和结论的真实性。例如,利用经过严格评估的可靠的文献检索策略以减少选择偏倚,使用双人独立执行相互验证的操作方法以减少信息偏倚,利用漏斗图相关的方法评估和矫正发表偏倚,利用meta分析提高效应估计的精确性。
另外,系统综述对有关研究的数量、质量及其结果的异同的分析可以更明确地指出有关研究领域的问题和未来研究方向。例如,对于某个非常重要的问题,如果系统综述没有发现相关的研究,或者现有研究的质量均较差时,就指出了现有知识的空白区,为未来的研究指出方向。此外,还可以用累积meta分析(见后文)分析研究证据随时间推移或数量增加的变化趋势,以及时引导医学实践和决策,并避免类似的后续研究造成不必要的浪费。
系统综述综合了关于某一实践问题综合、精确、可靠的信息,拉近了研究证据和医学实践的距离,因为有了系统综述,医学实践者就可以越过检索和收集原始文献的障碍,避免分析和整理原始研究结果的困难,直接利用现有最好的证据。因此,系统综述已被公认为总结关于某一特定问题的研究证据的最佳手段。
一、系统综述和meta分析两者不是等价的。Meta分析只是系统综述的一个部分,是一种经常但不是必须使用的定量整合结果的统计学方法。没有meta分析,依然可以是一个很好的系统综述,但是不恰当地进行meta分析反而可能得出错误的结论。Meta分析不能脱离系统综述而独立存在,如果没有全面的文献检索和可靠的数据提取,meta分析整合结果将会存在偏倚。
二、虽然系统综述目前常用于总结评价治疗效果的临床试验,但它作为一种研究方法,也可以用于各种医学研究问题,如病因、诊断、疾病频率、疾病转归、治疗副作用、经济学评价等,以及各种不同的研究设计,如病例对照研究、前瞻性研究、现况研究等,还可以用于实验室研究如疾病基因关联研究。此外,国际上已有尝试将系统综述用于非医学领域的研究。
作为基于文献的二次研究,系统综述和其它流行病学研究一样,如果在设计、实施、分析等环节出了问题,也会引入偏倚,影响最后结果和结论的真实性。
与其它流行病学研究一样,系统综述中的偏倚可分为选择偏倚、信息偏倚和混杂偏倚。不同的是,系统综述中这三种偏倚都存在两个层面,即原始研究在三个方面的固有问题,以及系统综述制作过程中引入的新的偏倚。
在系统综述里,信息来自原始研究的集合数据,如果变量的定义不合理或不明确,或者数据提取方式不正确,或者原始信息不准确,或者原始研究中有关信息缺如,都会导致提取的数据不准确,从而引起在最终研究结果上的信息偏倚。这些都是由于系统综述而可能引入的新的问题。如前所述,控制信息偏倚,需要在定义变量和提取数据上下功夫,必要时应和原作者取得联系,核实可疑的信息或索取缺如的信息。
在系统综述里,混杂偏倚首先可能来自于原始研究。然而,即使原始研究是高质量随机对照试验,在亚组分析时,不同组的原始研究在其它可能影响效应估计因素方面的不可比性,仍可能对两组合并效应的比较产生混杂作用。如果有足够的高质量研究,控制混杂的首要方法是尽可能依赖混杂作用较小的原始研究,如随机对照试验,或是充分有效地控制了主要混杂因子的观察性研究。在分析交互作用时,如果有足够的研究数目,可采用meta回归的方法,尽可能控制主要的可疑的混杂因素。
选择偏倚是系统综述中最重要的偏倚来源,原因是实际收集到的研究与“研究总体”之间存在差异。“研究总体”指与研究题目相关的所有已经完成的研究,实际收集到的研究指最后纳入系统综述的研究。实际纳入的研究与“研究总体”之间的差异的原因有多种,主要包括纳入和排除标准不当或不明确、文献检索策略和方法不当、发表偏倚、语言偏倚(language bias)、地区偏倚(geographical bias),以及根据结果人为地纳入或排除个别研究等。
另外,meta分析还存在一种特殊的偏倚,叫作权重偏倚(weighting bias),是由于使用不恰当的权重而引起的偏倚。唐金陵的一项研究发现,使用不同的权重方法有可能做出完全相反的结论。例如,一个有6个原始研究的meta分析显示,使用率差时合并的结果为-6.5%,p<0.01,使用率比时合并的结果为2%,p>0.05。权重偏倚的原因是由于不同的效应指标赋权的原则不同,使用率差时,事件发生率越低,赋予的权重越大,使用率比时刚好相反,事件发生率越低,赋予的权重越小。因此,当不同效应指标的合并结果相差很大时,应参考以样本量为权重的合并结果。
如前所述,选择偏倚是系统综述中最常见的偏倚形式。选择偏倚产生的主要原因包括纳入和排除标准不当或不明确、文献检索策略和方法不当、发表偏倚、语言偏倚、地区偏倚,以及根据结果人为地纳入或排除个别研究等。
纳入和排除标准是收集文献的前提。纳入和排除标准不明确会导致漏掉相关的研究以及纳入不相关的研究,偏倚可以发生在文献检索阶段,也可以发生在检查研究合格性的阶段,也可以发生在资料分析阶段。纳入和排除发生越晚,就越可能与研究的结果相关,偏倚就可能越大。例如,在资料分析阶段,发现个别研究的结果与大部分研究存在明显差异,如果研究者试图寻找理由将其排除,会造成严重的偏倚。因此,研究者必须在研究伊始,根据研究目的,制定明确的纳入和排除标准,如没有明显缺陷,不应中途更改,并在筛选研究中严格执行,尽可能杜绝依据研究结果排除或纳入研究的做法。
从理论上讲,一项系统综述必须纳入世界上所有已经完成的有关研究,否则就可能产生选择偏倚。在某种意义上讲,系统综述的“研究总体”很不明确,研究者预先不知道是否存在有关研究,有多少,也不知道在哪里做的,发表了没有,发表在哪里。即使有了电子文献库,寻找有关研究还是十分困难,即使找到了一些,也不知道它们是否代表了全部,还是其中一个部分,如果是一个部分的话又是多大一个部分。因此,为了减少选择偏倚,研究者必须按照国际上认可的策略,制定全面的严密的文献收集计划。一般来讲,文献检索是系统综述最费时费力的部分,往往需要两个人合作进行,是系统综述成败的关键,必须十分重视。
除非研究问题明确需要,如中国某疾病发病率的研究,否则,对于一般性的科学问题的研究(如病因和疗效),所有文献检索都不应在发表语言、研究地点和人群等方面进行限制。在实际系统综述中,语言和地区限制是常见的选择偏倚。例如,研究发现中国针灸临床试验几乎百分之百的结果都是阳性的,支持针灸的疗效,但是这个比例在西方国家完成的试验里只有50%左右。如果一项系统综述只包含了在中国完成的研究,偏倚是显然的。但是,对于大部分研究问题,英文发表的研究一般阳性结果偏多,因此只包含英文发表的研究,会高估实际的结果。
发表偏倚是系统综述里特有的一种常见偏倚,是由于选择性发表具有某些特征的研究而引起的系统综述结果的偏倚。由于过去杂志空间的限制,以及读者对阳性研究的趋向性,研究者、审稿者及杂志编辑在选择论文发表时会有意无意地更偏向那些大型的重要的或者具有统计学显著意义的阳性研究,致使很多小型研究和没有无统计学显著意义的阴性研究没有机会发表。系统综述收集相关研究主要依赖于电子文献库的检索,但是电子文献检索不能发现没有发表的研究,这种被动的文献选择,会导致夸大真实结果的偏倚。
系统综述的质量高低有别。因此,利用系统综述进行实践和决策的读者,需要对系统综述的真实性进行评价。由荷兰和加拿大的专家在2007年制定的AMSTAR(A Measurement Tool to Assess Systematic Reviews 2)是较为公认的系统综述质量评价工具。该工具从系统综述是否事先制定了研究方案、文献检索是否系统全面、文献筛选和数据提取是否可重复等11个方面出发,对系统综述的实施过程和所采取的偏倚控制措施进行评价。2017年,该工具已经更新为AMSTAR 2;有关细节,读者可从AMSTAR的官方网站(www.amstar.ca)免费获得。AMSTAR可以作为评价结果真实性的工具,也是研究者认识和控制系统综述偏倚的重要参考文献。
第九节 系统综述和meta分析进展
四、个体资料meta分析
五、累积meta分析
网络meta分析在英文里叫network meta-analysis。常规meta分析合并的是同一个研究中两组直接比较的结果。例如,有10个随机对照试验比较了A药和安慰剂的差别,那么常规的meta分析合并的是这10个研究提供的A药组和安慰剂组的差别,展示的是A药的绝对效果,回答的是“治还是不治”的问题。与安慰剂比较,是既往大量临床试验的设计方式。
然而,目前很多疾病都已经有多种有效治疗可供选择,因此实践中更常见的问题不是治不治,而是选择哪个治疗更好。最近兴起的比较疗效研究(comparative effectiveness research)正是为了解决“哪个治疗更好”这个更常见的实践问题。然而,在同一个研究里直接比较不同干预措施的随机对照试验较少。欲回答比较疗效的问题,往往需要借助不同的试验,进行间接比较。例如,当没有直接比较A药和C药的试验时,可以利用比较A和B、比较C和D、比较C和E等包含A或C的试验中接受A治疗和接受C治疗的病人,间接比较A和C的区别。在间接比较里,所比较的病人不是来自同一个研究。因此,其结果可能存在混杂偏倚,真实性一般低于直接比较。
图 9. 网络Meta分析中不同干预措施的比较示意图
11. Lefebvre C, Manheimer E, Glanville J. Chapter 6: Searching for Studies. In: Higgins JPT, Green S, editors. Cochrane Handbook for Systematic Reviews of Interventions. Version 5.0.2 [updated September 2009]. The Cochrane Collaboration, 2009.
12. Lip GY, Felmeden DC, Dwivedi G. Antiplatelet agents andanticoagulants for hypertension. Cochrane Database Syst Rev 2011;18:CD003186.
13. Yang ZY, Shen WX, Hu XF, et al. EGFR gene copy number as apredictive biomarker for the treatment of metastatic colorectal cancer with anti-EGFR monoclonal antibodies: a meta-analysis. J Hematol Oncol 2012;5:52.
14. Mao C, Yang ZY, He BF, et al. Toremifene versus tamoxifen foradvanced breast cancer. Cochrane Database Syst Rev 2012;7:CD008926.
15. Higgins JP, Altman DG, Gøtzsche PC, et al. The Cochrane Collaboration's tool for assessing risk of bias in randomised trials. BMJ 2011;343:d5928.
16. Little J, Higgins JPT, Ioannidis JPA, et al. STrengthening the REporting ofGenetic Association studies (STREGA) - an extension of the STROBE statement.Ann Intern Med 2009;3:206-215.
17. Whiting PF, Rutjes AWS, Westwood ME, et al. QUADAS-2: a revised tool for thequality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155:529-536.
18. Moher D, Liberati A, Tetzlaff J, Altman DG for the PRISMA Group (著). 李迅,曹卉娟译,刘建平校. 中西医结合学报 2009;7:889-896.
19. Khangura S, Konnyu K, Cushman R, et al. Evidence summaries: the evolution of a rapid review approach. Syst Rev 2012;1:10.
20. McMurran M. Individual-level interventions for alcohol-related violence: a rapidevidence assessment. Crim Behav Ment Health 2012;22:14-28.
21. 杨克虎,刘雅莉,袁金秋等. 发展和完善中的系统评价再评价. 中国循证儿科杂志 2011;6:54-57.
22. Mikton C, Butchart A. Child maltreatment prevention: asystematic review of reviews. Bull World Health Organ 2009;87:353-361.
23. Harden A, Thomas J. Methodological issues in combining diverse study types in systematic reviews. Int J Soc Res Methodol 2005;8:257-271.
24. Harden A, Garcia J, Oliver S, et al. Applying systematic review methodsto studies of people's views: an example from public health research. J Epidemiol Community Health 2004;58:794-800.
25. Riley RD, Lambert PC, Abo-Zaid G. Meta-analysis of individual participantdata: conduct, rationale and reporting. BMJ 2010;340:c221.
26. Rothwell PM, Fowkes FG, Belch JF, et al. Effect of daily aspirin on long-term risk of death due to cancer: analysisof individual patient data from randomised trials. Lancet 2011;377:31-41.
27. Lau J, Schmid CH, Chalmers TC. Cumulative meta-analysis of clinicaltrials builds evidence for exemplary medical care. J Clin Epidemiol 1995;48:45-57.
28. Antman EM, Lau J, Kupeinick B, et al. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts: treatments for myocardial infarction. JAMA 1992;268:240-248.
29. Salanti G, Schmid CH. Research Synthesis Methods special issue on network meta-analysis: introduction from the editors. Res Syn Meth 2012;3:69-70.
长按上方二维码关注我们