第四讲 临床医学科研常用的研究方法(二)
临 床 科 研 基 本 方 法
第四讲 临床医学科研常用的研究方法(二)
董 卫 中国医科大学第一临床学院临床流行病学教研室
队列研究有关暴露与疾病关联强度的指标有相对危险度(RR) 、归因危险度(AR) 、归因危险度百分比(AR %) 、人群归因危险度(pAR) 及人群归因危险度百分比(pAR %) 。
RR(relative risk) = p1/ p0 = I1/ I0 ;
AR(Attributable risk) = p1 - p0 = I1 - I0 ;
AR %(Attributable risk percent)= (p1 - p0) / p1 ×100 % = ( I1 - I0) / I1 ×100 %
pAR(population attributable risk= pt - p1 = It - I1 ;
pAR %(population attributable risk percent)= (pt - p1) / pt ×100 %。
pt 为全人群某病发病率或死亡率,p1 为人群中暴露于某因素的比例。RR 是根据样本而得出的暴露与疾病的点估计值,用点估计推断总体的范围应计算RR 的95 %可信区间,若是危险因素时应强调RR95 %可信区间的下限,若是保护因素时应强调RR95 %可信区间的上限,若有跨越1 时,下结论应慎重。
RR95 %可信区间的计算(Woolf 法) :
Var ( InRR) = 1/ a + 1/ b + 1/ c + 1/ d ;
InRR 的95 %可信区间= InRR ±1. 96 √Var ( InRR) 。
求其反自然对数即为RR 的95 %可信区间。队列研究易受到失访偏倚影响,应引起足够的认识。
病例对照研究(Case - Control study) 也是分析流行病学的主要方法之一,应用于探索疾病的危险因素。优点:省钱、省时、省人力、出结果快。原理为:
病例对照研究的特点:属于观察性研究、无干预;设立对照;由果因的研究;不能证明疾病暴露的因果关系,仅探索疾病的可疑危险因素,为进一步研究疾病的因果关系提供线索。病例:患有研究疾病的人群。对照:未患有研究疾病的人群。
1 、病例的选择:根据国际、国内诊断病人的标准选择符合标准的病人。选择时要考虑病例的代表性,如病例来源于何级医院、诊断水平(病理、分子水平、X光) 等;最好是新发病例,因其回忆准确,信息可靠。
2 、对照的选择:最好与病例的人群来源一致,代表无该病的随机样本。可以是同一医院或其他医院诊断为其他疾病的病人(非同一系统病例) ;可以是邻居,同一居住地的非病例;可以是社区人口的非病例或健康的抽样(最具代表性) ;也可以是病例的配偶、同胞、亲属、同事等。选择对照组时应注意:尽可能包括各种疾病的病例,但不应包括已明确研究因素与疾病有关联的病种,如:研究吸烟与肺癌时,选择气管炎的患者为对照,其结果可能降低效率。还应尽可能选择患病时间短的病人作对照,以保证过去暴露的准确性和稳定性。对照提供信息与病例要可比,否则易产生回忆偏倚。
3 、确定样本含量大小取决于: (1) 研究因素在对照人群中的估计暴露率; (2) 该因素导致的RR 或OR(odds ratio ,病例对照研究的指标- 比值比) ; (3)α水平(假阳性率) ; (4) 把握度(1 -β,β为假阴性率) 。
当病例、对照两组人数相等但不匹配时:
N = 2 ?p ?q (Zα + Zβ) 2/ (p1 - p0 ) 2 ,N 为病例或对照的样本数,总样本量应是此得数的2 倍,Zα、Zβ 可查表获得α及β值对应的标准正态分布数。p1 、p0 为病例组、对照组某因素暴露率。?p = (p0 + p1) / 2 ,?q = 1 - ?p 。
临床常用1 :1 配对研究的样本量估计公式为:
m = [ Zα/ 2 + Zβ √p (1 - p) ]2/ (p - 1/ 2) 2 ,p = OR/(1 + OR) ≈RR/ (1 + RR) ,m 为需要结果不一致的对子数。M = m/ p0q1
4 、研究因素的选择要紧紧围绕研究目的:如吸烟与肺癌关系的研究,不但要调查研究对象吸烟与否,还要深入地调查吸烟的持续时间、每日吸烟量、吸入深度、吸烟种类、戒烟时间、配偶吸烟情况等。每项变量的定义要尽可能采用国际或国内的统一标准,如规定吸烟为每天超过1 支持续1 年以上者。变量的测量分定性指标,如吸烟、不吸烟等;定量指标,如吸烟每天10 支以下、11~20 支、20 支以上等;还有半定量指标。
5 、数据资料整理分析时首先要对原始资料进行再核查:描述性研究只能计算出各种特征的构成和比重,说明本研究人群而不能外推。对病例组和对照组某些基本特征是否相似或齐同要进行均衡性检验,目的是考核两组的可比性,即除研究因素外,其他各特征是否相似、相同。频数匹配时应描述匹配因素的频数比例。见表1 。
在病例对照研究中表示疾病与暴露之间联系强度的指标为比值比(odds ratio ,OR) ,所谓比值是指某事物发生的可能性与不发生的可能性之比,公式为:OR= ad/ bc。
病例组暴露率:a/ m1 = 30/ 100 = 0. 3。
对照组暴露率:b/ m0 = 45/ 200 = 0. 225。
χ2= (ab - bc) 2n/ m1m0n1n0= (30 ×155 - 45 ×70) 2/ 75 ×225 ×100 ×200 = 2
P > 0. 05 ,即差别不显著,不能认为母孕期放射暴露与其子患白血病有关。
计算暴露后疾病的关联强度:
RR 值,即暴露人群发病率与非暴露人群发病率之比。即(a/ n1) / (c/ n0 ) ,但RR 值只能在队列研究中求得,病例对照研究用OR 值(比值比或称优势比) 来替代RR 值:
OR = (a/ m1/ c/ m1) / (b/ m0/ d/ m0) = ad/ bc = (30 ×155) / (45 ×70) = 1. 48
相对危险度比值的意义:暴露因素组是非暴露因素组发病或死亡的倍数。
RR = 1 暴露疾病无关联;
RR > 1 疾病的危险度↑,呈“正”关联,是该疾病的危险因素。
RR < 1 疾病的危险度↓,呈“负”关联,是该疾病的保护因素。
下结论时应注意结合具体情况,特别强调估计值的可信区间。
常用OR 95 %的可信区间,不是点估计而是估计总体OR 在什么范围(计算方法同前) 。
本例:
Var (LnOR) = 1/ 30 + 1/ 45 + 1/ 70 + 1/ 155 = 0. 0763 ;
LnOR(95 %CI) = Ln1. 48 ±1. 96 √0. 0763 = 0. 392 ±0. 5414 = 0. 9334~ - 0. 1494 ;
exp (0. 9334 , - 0. 1494) = 0. 86~2. 54 。
结论:下限小于1 ,即母孕期放射暴露未必导致其子患白血病。
处理混杂因素的干扰时需分层分析。分层分析时需计算各层OR 值(当两层OR 值接近时说明不是混杂因素) ,计算总OR ,计算总χ2 检验,估计总OR 值的95 %可信区间。
常见偏倚及其控制:
病例对照研究中常见的选择性偏倚有入院率偏倚、存活病例偏倚、暴露偏倚、转诊偏倚时间效应偏倚等;测量性偏倚有回忆偏倚、调查偏倚等;混杂偏倚。
偏倚的控制:设计时要随机选择对象,尽量用新病例等,实施时要完善的调查表,认真培训调查员,采用盲法等,分析时采用分层分析、标准化、多因素分析等。
病例对照研究的优点:对疾病可较快得到危险因素的估计,既可检验假设的因素,又可探索因素,省财力、人力、物力、易组织实施。不足:不适于人群低危险因素暴露,不易克服选择性偏倚、回忆偏倚,混杂不易控制,暴露与时间先后关系难判断。
其他常用的研究方法还有随机对照研究、序贯设计、横断面研究(现况调查) 等,在此不一一介绍。
号外,号外,号外。。。。。。。
你想和高手请教临床科研的知识吗?
你想要认识更多的临床科研朋友吗?
现在有这么一个微信群等着你的加入,赶快行动吧!
可以加微信13738062354或者pj1989zzj为好友,注明加群,就会拉你进群的。