系统综述与meta分析（2/5）：检索文献

Original 唐金陵杨祖耀临床研究与循证医学 2022-03-25

目录第一节引言第二节研究问题和文献收集一、提出研究问题二、检索文献（一）文献检索的原则（二）文献的来源（三）MEDLINE检索策略的制定三、筛选文献四、文献检索的记录和管理第三节提取数据第四节评价原始研究质量第五节分析数据第六节报告的撰写和更新第七节系统综述的特征和优缺点第八节系统综述的偏倚和质量评价第九节系统综述和meta分析进展

第二节研究问题和文献收集

二、检索文献

（一）文献检索的原则

制定了原始研究的合格标准（即明确了需要什么样的研究）之后，就可以有针对性地制定文献检索策略（search strategy），继而寻找相关的文献。需要注意的是，在检索原始研究之前，应首先确定近期是否已经有针对同一研究问题的系统综述发表。如果没有，方可继续进行原始研究的检索；否则，就无需进行当前的系统综述了。框3介绍了用MEDLINE检索系统综述的策略。

框 3. 通过PubMed平台在 MEDLINE中检索系统综述的检索策略

#1. meta analysis [Publication Type]

#2. meta analysis [Title/Abstract]

#3. meta analysis [MeSH Terms]

#4. review [Publication Type]

#5. review* [Title/Abstract]

#6. #1 OR #2 OR #3 OR #4 OR #5

根据研究入选的合格标准，可把所有研究报告分为有关和无关两类。无关的研究是大量的，有关的研究是少数的。一项文献检索策略检出相关研究的百分数为灵敏度，无关研究不被检出的百分数为特异度。1减去灵敏度为漏检的百分数，即漏检率；1减去特异度为无关研究被检出的百分数，即假阳性率（表2）。灵敏度越高，检出有关研究的机会就越大；特异度越高，检出无关研究的比例就越小，即假阳性率越小。假阳性率是初步检出的研究中无关研究的比例，其大小是进一步筛选文献工作量的主要决定因素。

表 2. 文献检索的灵敏度、特异度、漏检率和假阳性率

用自定的检索策略检索	所有合格和不合格的文献
合格	不合格
检索到的	A	B
未检索到的	C	D
合计	A+C	B+D

注：灵敏度=A/(A+C)；漏检率＝C/(A+C)；特异度=D/(B+D)；假阳性率＝B/(B+D)

值得注意的是，改变检索策略总是同时改变检索的灵敏度和特异度，且灵敏度和特异度成反比，提高灵敏度的同时必然降低特异度，反之亦然。与其他一般性的文献检索不同的是，为制作系统综述进行的文献检索应尽可能采用高灵敏度的策略，这势必会降低特异度。降低特异度的后果是，检出无关研究太多，增加进一步筛检有关研究的工作量，而且增加的工作量可能很大。例如，在MEDILNE中有100篇文献是相关的，其他约1900万篇都是无关的。假设一项检索策略的灵敏度为95%，特异度为99.999%。检出的可能合格的文献包括95篇真正合格的文章和1.9万篇不相关的文章，研究者必须从这19095篇文章中筛出95篇合格的文章，假阳性造成的工作量是显而易见的。

系统综述文献检索的总体原则是，要多途径、多渠道、最大限度地收集所有发表和未发表的相关研究，力求做到不漏检。但也需注意，一味地增加灵敏度可能是不现实的，因为如果因此而导致工作量太大的话，系统综述将无法实施。为了在灵敏度和特异度之间达到平衡，在检索文献的时候，要尽可能利用研究设计类型、PICOS特征和人类研究，对检索策略进行限制，限制的关键词越特异越好。

（二）文献的来源

文献的主要来源包括以下六种，一项好的系统综述必须尽可能通过所有6种途径收集有关文献：电子文献库（如MEDLINE 和EMBASE）；近期相关会议的文摘；手工检索主要的、相关的专业期刊；临床试验注册库；相关临床指南、系统综述及合格的原始研究的参考文献；咨询相关领域的专家及医药公司的有关人员。

1．检索电子文献库

检索电子文献库是系统综述文献检索快速而全面的途径，也是多数系统综述发现原始文献的主要途径。可用于检索的电子文献资源包括文摘库、全文文献库及其它网络资源。常用的文摘库有：

（1）美国医学文献分析与检索系统（MEDLINE）

（2）荷兰医学文摘（EMBASE）

（3）考科蓝临床试验注册库（CENTRAL）

（4）其它国家和地区的文献库（例如中国生物医学文献库）

（5）特定专题文献库（例如 International Pharmaceutical Abstracts）

（6）引文索引文献库（例如 Science Citation Index）

（7）学位论文文献库（例如 Index to Theses in Great Britain and Ireland）

（8）灰色文献库（例如 System for Information on Grey Literature）

MEDLINE由美国国立医学图书馆于1966年创立，是当前国际上最权威的生物医学文献库。MEDLINE收录了世界上70多个国家和地区出版的5600多种生命科学，尤其是生物医学期刊的文献，以题录和文摘形式进行报道，涉及39种语言，涵盖的时间范围可追溯至1946年甚至更早，共有超过1900万条记录。从2005年起，每年增加约70万条记录，其中91%是英文文献，83%文献有英文文摘。在MEDLINE中，可通过MeSH主题词、关键词、篇名、作者、刊名、ISSN、文献出版年、出版国等进行检索。PubMed是免费的网上MEDLINE文献库，还包含一些最新的尚未被索引的文献。

EMBASE是另一个世界上最有影响的文摘库，由荷兰的Elsevier公司于1974年推出，通常叫作《荷兰医学文摘》。EMBASE涵盖的时间范围可追溯至1947年，收录了来自90多个国家7600多种生物医学期刊，其中约2000多种是MEDLINE未收录的期刊，总记录数超过2500万条，现在以每年超过100万条记录的数量增长。EMBASE的使用方法与 MEDLINE基本相似，但需要注意的是该文献库具有不同于MEDLINE 的独立主题词表系统，即EMTREE主题词。

CENTRAL是收录临床试验的专业文献库，由世界考科蓝协作组织创建，收录了各种途径来源的文献，包括手工检索世界各地的医学杂志发现的临床试验。截至2012年8月，CENTRAL共收录有关题录近67.5万条；其中60%来自MEDLINE，EMBASE补充了10%，其它30%的条目则来自其他文献库和手工检索。CENTRAL、MEDLINE、EMBASE 是三个收录临床试验研究最丰富的电子文献库。另外，很多领域都有自己的专业文献库（表3），应该纳入必须检索的文献库之一。

表 3. 不同专业领域的数据库举例

专业领域	英文数据库（中文译名）
1. 艾滋病	AIDSLINE（艾滋病文献库）
2. 传染病、公共卫生、热带医学、食品安全	Global Health（全球卫生文献库）
3. 传染病、寄生虫病、热带病、营养学	CAB HEALTH（CAB卫生文献库）
4. 护理学、助产学	CINAHL Plus（卫生保健及护理学文献库）；British Nursing Index（英国护理学索引）
5. 替代医学	AMED（Allied and Complementary Medicine）（辅助医学与替代医学文献库）
6. 心理、行为与健康	PsycINFO（美国心理学会文摘索引文献库）
7. 心血管疾病	Global Cardiovascular Infobase（全球心血管疾病文献库）
8. 药物疗效及副作用	Iowa Drug Information Service（爱荷华药物信息文献库）
9. 人类基因流行病学	HuGE Navigator（人类基因人群研究检索系统）
10. 运动与健康	SPORTDiscus（运动与健康文献库）
11. 肿瘤	CANCER（肿瘤综合信息文献库）
12. 卒中	DORIS（Database of Research in Stroke）（卒中研究文献库）

对于系统综述的文献检索而言，未正式发表的“灰色文献”（grey literature）也是非常重要的部分，因为这些文献更可能包含阴性研究结果。灰色文献包括未发表的学位论文、制药工业的报告、有关机构技术评估报告、工作报告、会议摘要等等。有时，这些灰色文献可能占所有有关文献的30%以上。对国内研究者来说，尤其是进行中医药研究的系统综述时，中国期刊全文文献库（CNKI）、万方文献库和维普《中文科技期刊文献库》（VIP）也是重要的文献资源。我们的一项研究发现，90%以上的中医药临床试验发表在中文期刊，而这些中文期刊发表的研究在MDELINE和EMBASE均无记载。

2. 查阅会议文摘

很多重要疾病都存在独立的国家、地区和国际性协会，协会举办的学术会议是很多研究早期报告的重要文献来源。因此，近期的会议摘要是系统综述文献检索非常重要的一部分，是电子文献库检索的重要补充。例如，美国高血压协会（American Society of Hypertension）、美国临床肿瘤学协会（American Society of Clinical Oncology）和欧洲医学肿瘤学协会（European Society ofMedical Oncology）的会议文摘都十分有用。

查阅会议摘要需登录有关协会的官方网站，在线检索和浏览，因为这些网站不像MEDLINE和EMBASE那样的专业电子文献库，因此检索和导出不方便。应注意的是，会议文摘和最终正式发表的文献之间数据和结果可能存在差异，因此如果已经有正式发表的全文文献的话，一般应选择后者。

3. 手工检索专业期刊

手工检索旨在补充电子文献库检索系统的不足或发现电子文献库没有收录的研究。很多杂志（尤其是非英文语种的杂志）可能没有被MEDLINE等大型文献库收录，有些被收录杂志的部分内容（如增刊和研究通信）也在MEDLINE检索不到。另外，1990以前，由于不特异的文献库索引和标注系统，即使研究收录在文献库库中，也很难检出。因此，手工检索就成了电子检索的重要补充。手工检索费时费力，检索的杂志须精挑细选，一般只须检索那些专业性极强且发表有关研究最多的杂志。

例如，世界上只由为数不多的几种临床针灸专业杂志，而且多不被国际大型文献库收录，收录的文献也因翻译而降低了索引和标注的特异性和检出率，手工检索就显得十分必要。为了弥补电子文献库的不足，世界考科蓝协作组织在全世界组织了大规模的手工检索临床试验的工作，目前已经完成约3000种杂志的检索，发现的临床试验全部收录在上述考科蓝图书馆的CENTRAL文献库中，并回馈到MEDLINE文献库，大大提高了MEDLINE临床试验收录的全面性和检出率，减少了研究者手工检索文献的工作量。

4. 检索临床试验注册库

检索临床试验注册库的主要目的在于确定目前是否进行某项系统综述的适当时机。如果发现一个或多个重要的临床试验即将完成或刚刚完成，研究者最好等到这些研究结果发表之后再进行综述研究，这样才不至于因漏掉最新最重要的证据而得出错误的或片面的结论。

检索临床试验注册库还可以补充和验证其它检索途径。例如，如果在注册库中发现有的试验早已完成而其它检索途径并未发现，就有两种可能，一是该研究还没有发表，或是只由会议文摘形式发表，二是该研究已经发表但其他检索没有发现，那么其他检索途径就可能存在问题，需要修订和改善。

下面介绍了国际上几个重要的临床试验注册库的网址，供研究者参考：

（1）美国国立卫生研究院临床试验注册平台：

www.clinicaltrials.gov

（2）世界卫生组织国际临床试验注册平台：

www.who.int/ictrp

（3）美国国立癌症研究所临床试验信息网：

www.cancer.gov/clinicaltrials

（4）澳大利亚临床试验注册中心：

www.actr.org.au

（5）英国国家卫生系统联网临床试验注册平台：

www.controlled trials.com /mrct/

（6）中国临床试验注册中心：www.chictr.org

5. 查阅相关文章的参考文献

这里的“相关文章”特指那些最可能在其参考文献里包含目前系统综述所需的原始研究的文章，主要包括那些已经收集到的合格的原始研究，以及有关的系统综述、临床指南、传统综述、评论文章和编者按等，其中以合格的原始研究、系统综述和临床指南最有价值。“查阅”就是检查和发现这些文章的参考文献里包括的可能与目前系统综述有关的原始研究。很多时候，必须参照文中的描述和相应文献的题目，才能确定一个参考文献是否研究者需要的有关研究。从合格的原始研究以及有关的系统综述和临床指南的参考文献中，最容易核对和发现有关研究。

6. 咨询专家及医药公司

研究显示，专家和药厂提供的有关研究可占高达总合格研究的四分之一，而且这些研究又多属于阴性研究，说明联系专家和制药公司对收集文献的重要性，应得到充分重视。与专家和药厂联系应在文献收集的后期，联系前要做好充分准备。笼统地要求专家提供某方面的研究，几乎没有人会回应。询问时应尽可能提供已经检索到的所有有关研究的清单，请专家和药厂指出是否有遗漏的研究，这样更有可能得到有用的回复。即使如此，与专家的联系也多是徒劳的。的确，很多药物临床试验都是医药公司资助的，他们的确拥有没有发表的研究。但是，一般来讲医药公司阳性结果的临床试验会及时地公开发表，即使有阴性结果的研究，医药公司多不会愿意分享。因此，与制药公司的联系大多也没有收获。

以上讲述的是系统综述文献检索的一般策略和途径。研究者应根据研究问题的特点，有重点地选择不同的文献库和检索策略。例如，对于中国的研究者来讲，中文文献库是重要的可及文献来源之一，但由于中文文献库只收集国内的文献，带有很大的局限性。比如，关于抗高血压药物的高质量的大型随机对照试验主要来自英文文献，即使中国有些研究，它们往往比较小，很多是国际多中心试验的一个部分，已经在国际上发表，很多研究随访时间很短，使用的多是中间替代指标，对抗高血压药物效果的整体结论影响不大，因此中文文献库不是系统综述文献检索的重点。但是，关于诸如发病率、患病率，以及药物在中国人群的特殊反应，只有中国人群的研究才是相关的，中文文献库应是检索的重点。

（三）MEDLINE检索策略的制定

目前，MEDLINE和EMBASE仍是系统综述原始文献的主要来源和检索重点。下面我们将以评价干预措施效果的临床试验的系统综述为例，讲解如何制定和调整MEDLINE的文献检索策略。EMBASE的检索与MEDLINE 大同小异，不再赘述。

如前文所述，一个关于干预措施效果的实践问题，主要构成可以概括为PICOS，回答此类问题最好的研究设计是随机对照试验。PICOS决定了一项研究的目的，也决定了该项研究的实践意义，改变PICOS的任何一个方面，就改变了研究所回答的问题。因此，文献检索就是发现那些回答了特定PICOS的实践问题的研究，检索的诀窍就在于如何对PICOS和研究设计进行限制。

检索电子文献库时，必须采取必要的限制，减少无关研究的检出，从而减少进一步筛检的工作量。可以用来限制文献检索的因素包括以下四个方面：①研究问题；②研究设计；③人类研究；④发表年限。

所谓限制，就是只检索限制词特别指定的方面的文献。PICOS的部分或全部内容都可以用来进行限制。但是，一般来讲，P和I是最基本的，必须进行限制。由于文献库对C、O和S的记录和索引往往不是必须和统一的，很难对针它们进行限制，限制的结果会大大降低检索的灵敏度。为了保持检索的灵敏度，往往无需对C、O和S进行限制。但是，当C、O、S十分特异和明确并很可能会出现在题目、文摘或主题词里时，也应尽可能对它们进行限制。例如，氢氯噻嗪和氨苯蝶啶都属于利尿降压药，在检索比较这两种药物效果的研究时候，氢氯噻嗪（I）与氨苯蝶啶（C）的相关词汇可均用来进行限制；在评价某干预措施是否可减少病人死亡（O）时，“死亡”及“生存”的相关词汇可纳入检索；在评价抗高血压药物在初级保健环境下预防心血管事件的效果时，与初级保健有关的词汇可纳入检索。

由于PICOS的每个方面都有很多同义词或不同的表达方式，所以在检索时必须同时包括同一概念的多种同义词或表达方式（包括缩写形式），并用“or”将所有的同义词和表达方式连接起来进行检索，以增加检出相关研究的机会。例如，在英文里高血压一般称作hypertension，但也可叫做high blood pressure和elevated blood pressure，hypertensive也是常用的有关的词汇。一般来讲，同义词和不同表达方式用的越全越多，检出有关研究的机会就越高，即灵敏度越高，但混杂的无关研究也越多。一个好的检索策略须尽可能包括了所有有关的同义词、近义词、相关词，以及其它不同的表方式。关于一个疾病或一种治疗的同义词、近义词和相关词，研究者应该充分与有关专业人员沟通，征求他们的意见。另外，参考既往有关系统综述（尤其是考科蓝综述）的检索策略，也是一个十分有效的方法。

其次是对研究设计类型进行限制。与PICOS一样，一类研究设计会有很多不同的叫法或描述方法，检索时应尽可能囊括所有有关的同义词和表达方式。例如，在MEDLINE中检索随机对照临床试验时，研究者应尽可能使用框4提供的检索策略。这是一个专门为系统综述设计的、经过严格测试和评估的、灵敏度和特异度可以接受的检索策略，并得到了国际上广泛认可和应用。当然，还有其他类似的策略可以借鉴，但一般不建议用研究者自己设计的临床试验检索策略。

框 4. 通过PubMed平台在 MEDLINE中

检索随机对照试验的策略

#1 randomized controlled trial [pt]

#2 controlled clinical trial [pt]

#3 randomized [tiab]

#4 placebo [tiab]

#5 clinical trials as topic [mesh: noexp]

#6 randomly [tiab]

#7 trial [ti]

#8 #1 OR #2 OR #3 OR #4 OR #5 OR #6 OR #7

#9 animals [mh] NOT humans [mh]

#10 #8 NOT #9

注：

[pt]= Publication Type（发表类型）；

[tiab] = a word in the title or abstract（在题目或摘要中检索）；

[sh] = a subheading（副主题词）；

[mh] = a Medical Subject Heading (MeSH) term (‘exploded’)（扩展检索某主题词）；

[mesh: noexp] = a Medical Subject Heading (MeSH) term (not ‘exploded’)（检索某主题词，但不扩展）；

[ti] = a word in the title（在题目中检索）

因为所有临床试验都是在人群中进行的，因此应使用“人类研究”进一步对检索进行限制，排除那些无关的纯实验室研究和动物研究。一般来讲无需对发表年限进行限制。但如果知道某干预措施明确地是在某某年以后发明的，则可以只检索此时间以后的文献。

最后用“and”将PICOS各个方面或组分的检索结果合并，得出最终的检索结果。一般来讲，一个检索策略中“and”用得越少且“or”用得越多，检出有关研究的机会就越高，即灵敏度越高，但混杂的无关研究也越多。相反，“and”用得越多且“or”用得越少，即特异度越高，混杂的无关研究就越少，但检出有关研究的机会也越低。

举例说明。框5展示了一篇考科蓝系统综述的实际检索策略。该系统综述的研究问题是：与安慰剂或现有其它治疗比较，在高血压患者中，抗血小板药和抗凝药减少死亡和血栓栓塞事件的效果及不良反应如何？原始研究的合格条件：病人＝无房颤、心衰或先兆子痫（因为已有系统综述对他们进行评价）的高血压病人；干预组治疗＝抗血小板药或抗凝药；对照组治疗＝安慰剂或现有有效治疗；研究设计＝随机对照试验。

MEDLINE检索结果如下：

（1）第1-4步是对高血压有关词汇的检索，第5步用“or”合并了所有高血压相关词汇的检索结果；

（2）第6-23步是对治疗措施有关词汇的检索，第24步用“or”合并了所有治疗措施及其相关词汇的检索结果。可见抗血小板药和抗凝药有很多种，而且每种还有不同的叫法；

（3）第25-32步是对随机对照试验有关词汇的检索，第33步用“or”合并了所有随机对照试验相关词汇的检索结果；

（4）第34步排除了动物研究，限制在人类研究，第35步排除了那些关注房颤、心衰或先兆子痫的研究，第36步合并了34和35步的结果；

（5）最后，第37步用 “and” 把以上疾病、治疗、临床试验和排除条件四个方面检索的结果合并起来，符合这四个条件的研究共3308项；第38步将发表时间限制在2005年以后。最后检出结果是1047项。

框 5. MEDLINE检索策略实例

注：疾病＝高血压，治疗＝抗血小板药或抗血凝药，研究类型＝随机对照试验

此外，该系统综述的制作者还利用类似的策略对其它主要文献库进行了检索，共检索到3044篇文献，经过筛选，最后发现只有4项研究符合预先制定的合格标准。可见，该文献检索检出的绝大多数文献是无关的研究。

进行系统的文献检索是系统综述之所以叫做系统综述的重要原因之一。系统综述的文献检索是繁杂的、费时费力的，是此类研究最耗费时间的一个部分，但它是一项系统综述成败的关键，也是系统综述最后结果可信可靠的关键。因此，如果没有做好系统检索文献的准备，建议不要考虑进行此类研究。

原文出处：唐金陵, 杨祖耀. 第十四章: 系统综述与Meta分析. 见: 李立明主编. 流行病学. 第一卷. 第三版. 北京: 人民卫生出版社, 2015.（略有改动）

（本文是全文五个部分的第二部分，未完待续）