临床研究方法基础(3/3):研究中的误差及其控制策略
目录
一、引言
二、研究设计
三、研究的组成和步骤
四、误差及其控制
五、其他研究设计
六、全文概要
四、误差及其控制
无论研究者如何努力,任何流行病学研究都不可能完全消除误差。所谓误差,就是说研究的结果没有完全反映真实,二者之间存在差别。误差可分为两类:系统误差和随机误差。在流行病学里,系统误差一般称作偏倚,随机误差最主要的形式是抽样误差。
偏倚与随机误差不同,如果知道一种偏倚是如何产生的,一般可判断偏倚的方向,即高估了还低估了真实,而随机误差的方向永远是不可知的。降低抽样误差的主要方法是增加样本量,不再赘述。
控制偏倚最有效的方法是研究设计。在设计基础之上,还有一类研究设计可进一步采取的特有的降低偏倚的方法,如随机对照试验中可采取分组隐匿、盲法、和维持原随机分组分析等偏倚控制措施(表8)。这些措施不适用于其他类型的研究,因为如果没有随机分组,这些措施(资料收集者盲法除外)将不再有效。
表8 随机对照试验特有的偏倚控制措施
还有一些偏倚控制方法是所有流行病学研究都可以采取的,如有代表性的研究样本,设立对照,准确可靠的测量,从暴露到结局有足够的时间,以及结局与暴露的测量的彼此独立(表9)。这些偏倚控制措施是所有流行病学研究都应该遵循的原则,包括随机对照试验。
表9 流行病学研究中通用的偏倚控制措施
即使一个研究遵循了以上所有的偏倚控制措施,偏倚还可能会发生,而且一个偏倚就足以严重扭曲研究的结果。如前所述,偏倚可分为三类:混杂偏倚、选择偏倚和信息偏倚。
混杂偏倚的规律比较清楚,如果一个因素与结局有关,而且在比较组间不可比,混杂就会出现。虽然流行病学发明了一整套控制混杂的方法,但是最简单、最有效、最彻底控制混杂的方法是随机分组。但是随机分组只可用于评估医学干预措施,不能用于病因研究。
选择偏倚是由于选择研究对象的方法不当而造成的效应(即两组结局上的差别)估计上的误差,信息偏倚是由于测量研究变量的方法不当而造成的效应估计上的误差。
与混杂不同,选择偏倚和信息偏倚发生的形式很多,没有统一的规律可循,控制这些偏倚只能针对具体的偏倚发生的形式和规律一对一地采取措施,不存在像控制混杂那样的统一的控制所有选择偏倚或信息偏倚的措施。
例如,如果病例对照研究中只纳入现患病例,当目前尚存活的病例和已经死亡的病例在暴露史上存在区别时,或者存活的病例改变了暴露状况,就会在暴露和疾病关系的估计上引起偏倚。控制该偏倚的方法之一是使用新发病例。
因此,控制选择偏倚和信息偏倚的策略是:尽可能了解各种偏倚发生的形式、条件和规律,并采取相应措施进行预防。目前已经认识到的偏倚有100多种,新的尚未被认识的偏倚还在出现。我们只能设法预防已知的偏倚,无法预防未知的偏倚,这正是做好流行病学研究设计细节的困难,也是区分研究人员水平高低和研究设计质量优劣的地方。
五、其他研究设计
本文主要围绕病因和疗效的研究,对流行病学研究方法进行了讨论,表10总结了各种流行病学研究设计及其应用领域。但是,本文在现况研究、生态学研究(ecological study)、基因-疾病关系研究、经济学评价、群体遗传学研究、定性研究、传染病暴发调查等方面着墨很少。虽然本文的很多内容对这些研究有借鉴之处,但是它们有一定的特殊性,关于它们的系统介绍请参考有关专著。
表10 流行病学研究方法及其可应用的主要应用领域
本文有必要对诊断研究做一个简单介绍。对诊断方法临床应用的初步研究是关于准确性的研究,是目前有关诊断方法研究的主要部分。诊断的准确性系指诊断方法可以正确区分疾病状况的能力。疾病状况可分为有病和无病两种,诊断区分有病状况的能力叫灵敏度(sensitivity),区分无病状况的能力叫特异度(specificity)。比如,在200个病人中180个诊断检查阳性,提示疾病存在,灵敏度则为90%,在100病人中会漏诊10个病人;在300无该病的人群中285个检查阴性,提示疾病不存在,特异度则为95%,在100个非病人中有5个人会被误认为有病。
作为一项检查,90%的灵敏度和95%特异度是很难得的,但是这并不能直接说明该项检查在所有临床场景中都是足够有用的。假如这是脑部CT影像识别脑垂体瘤的准确性,如果任何无症状和体征的人群中脑垂体瘤的发生率为万分之一,那么一般体检中,100万个“正常人”人中会有100个患者,90个会被检出,999900无病的人有5%会被误诊为有垂体瘤,共49995人。
根据CT影像判断,100万个人中有50085人(即90+49995)会被认为患有脑垂体瘤,其中98.23%的人都是假阳性,很多可能会因此做进一步病理学检查,但98.23%的人不会从病理学检查中受益。就此意义上讲,用CT在健康人中筛查脑垂体瘤似乎是不可取的。
六、全文概要
循证医学实践需要的证据主要来自系统的有组织的流行病学研究,学好循证医学需要掌握流行病学的基础知识和技能。现代流行病学是在人群中研究有关健康、疾病和医疗服务一般规律的学问和艺术。它的基本或最小研究单位是作为一个个体的人,研究的问题是医学实践直接面对的应用性问题,因此其结果可以直接用于指导和影响医学实践。
流行病学的主要研究设计类型包括病例系列、生态学研究、现况研究、病例对照研究、队列研究、随机对照试验、系统综述等。研究的目的决定研究结果的实践意义,可用资源和伦理限制决定一个研究的可行性,研究方法决定研究结果的真实性。一种研究设计可以用于研究多种临床问题;由于资源和伦理的限制,每种临床问题都有对应的最优可行的研究设计。
研究旨在获得真实的研究结果,但是任何研究都或多或少存在偏倚,不可能观察到绝对真实的结果。组间不可比可引起混杂偏倚,纳入研究对象的方法和程序不适当可引起选择偏倚,信息不准确、不可靠、不一致可引起信息偏倚。做好流行病学研究设计的目的就是围绕回答的研究问题采取各种方法降低误差。增加样本量可以提高结果估计的稳定性,但不能减少偏倚。
流行病学研究结果的可信度首先取决于研究的设计框架,其次取决于一般流行病研究控制偏倚的方法,再次取决于一类研究设计特有的偏倚控制措施。