唐金陵:病因、病因模型与因果关系推断(六):流行病学常见指标释义
目录
第一节 病因的基本概念
第二节 病因学说与病因模型
第三节 充分病因-组分病因模型
第四节 发现和验证病因
第五节 因果关系推论
第六节 流行病学常见指标释义
一、发病率和效应指标
二、相对危险度
三、效应修饰作用
四、归因危险度
五、疾病的潜隐期
流行病学常见指标释义
本文是“唐金陵:病因、病因模型与因果关系推断”一文的扩展部分,旨在利用第三节介绍的组分病因-充分病因模型的理论,解读疾病发病率、效应指标、交互作用、归因危险度和疾病潜隐期等几个常见流行病学指标的理论含义和实践价值。
一、发病率和效应指标
发病率 (incidence) 是流行病学病因研究的基础。但是,暴露于某组分病因的人群的发病的机会与其互补病因有关,似乎并没有反映暴露的致病强度。
举例说明,假设一个疾病只有一个充分病因,该充分病因只有两个组分病因A和B,且两组分病因在人群中的分布是独立的。那么,既无A也无B的人群的发病率为0%,同时暴露于A和B的人群的发病率则为100%。进一步假设,人群中暴露于A的人数为10%,暴露于B的人数为2%。整个人群中同时暴露于A和B的人数则为2%×10%=0.2%,因此总人群的发病率为0.2%(图11)。
图11 人群中组分病因的分布与发病危险的关系
有意思的是,在A暴露者中有B的概率是2%,因此A暴露人群的发病率为2%;同理,在B暴露者中有A的概率是10%,因此B暴露人群的发病率为10%。在具有某组分病因的人群中,疾病的发病率取决于其互补病因出现的概率的高低。因此,暴露于常见病因的人群的发病率将低于暴露于罕见病因的人群的发病率。
同理,作为效应大小的指标,暴露组和非暴露组的率差和率比的大小与暴露本身也无关,而是取决于暴露的互补病因的普遍程度,互补病因越常见,效应就越大,反之亦然(图11)。换言之,对于同一个疾病来说,常见病因的效应将小于罕见病因的效应,即罕见病因的相对危险度将大于常见病因的相对危险度,绝对危险度也是如此。
二、相对危险度
相对危险度 (relative risk)的大小还取决于一个疾病其它充分病因的多少和普遍程度。举例说明,假设一个疾病有很多充分病因,其中一个充分病因只有两个组分病因A和B,而其它充分病因都不需要A和B。同时我们还假设,A在人群中的暴露率为15%,B的暴露率为5% ,其它充分病因的暴露率为0.5%,A、B以及其它充分病因在人群中的分布相互独立。
那么,既无A也无B的人群的发病率则为0.5%;A暴露人群的发病率取决于B的概率,等于需要A的充分病因引起的发病和既不需要A也不需要B的其它充分病因引起的发病之和,即5.0%+0.5%=5.5%;同理,B暴露人群的发病率取决于A的概率,等于15.0%+0.5%=15.5%。
由此估算,A暴露人群与非暴露人群的发病率之差RDA=5.5%-0.5%=5.0%,B暴露人群的率差RDB=15.5%-0.5%=15.0%。同理可得,A暴露人群的相对危险度RRA=5.5%÷0.5%=11.0,B暴露人群的相对危险度RRB=15.5%÷0.5%=31.0。
现在我们假设其它条件不变,但其它充分病因的发生概率不是0.5%而是5.0%,相对应的RD则保持不变,RDA=(5.0%+5.0%)-5.0%=5.0%, RDB=(15.0%+5.0%)-5.0%=15.0%,但RR则明显缩小,RRA=(5.0%+5.0%)÷5.0%=2.0,RRB=(15.0%+5.0%)÷5.0%=4.0。
以上结果发现,RD不再受其它充分病因多寡的影响,而RR则进一步取决于其它充分病因的多寡,其他充分病因越常见,一个暴露的RR就越低,反之亦然。一个典型的例子是血压对心血管病作用的RR随年龄的增加而降低的现象,这可能不是由于血压的作用随年龄增加而减小了,而是因为心血管病的其它充分病因随年龄增加而大大增加了。
这个推测似乎从RD上得到了验证,由于RD不随其它充分病因的多寡而变化,血压对心血管病作用的RD随年龄的增加而增加的现象,说明血压的作用随年龄增加很可能是增加的,或更确切地说是血压的互补病因随年龄的增加大大增加了。
重要的是,这个现象使得相对危险度作为测量病因作用大小或关联强度的指标似乎失去了其意义,因为相对危险度和病因没有关系,而是由该因素互补病因的相对常见程度决定。尽管如此,除去一个病因,RD所显示的可预防的病例的绝对数以及RR显示的可预防的病例的相对数却是真实的,其实践意义还是明显的。
三、效应修饰作用
效应修饰作用是流行病学的重要概念之一。效应修饰作用(effect modification)又叫交互作用(interaction)。由于模型选择的不同,交互作用可分为相加性交互作用和相乘性交互作用。使用RR测量发现的交互作用是相乘性交互作用,用RD测量发现的交互作用是相加性交互作用。同理,使用Logistic模型、Cox模型和Log-linear模型等因变量基于对数的回归方程所发现的交互作用都是相乘性交互作用。
基于同一研究,相乘性交互作用模型和相加性交互作用模型的结果经常是不同的,甚至是方向相反的。哪一种模型是对的?
为了回答这个问题,下面我们将使用充分病因-组分病因模型,推测交互作用存在的条件,并以此分析一个模型的优劣。假设因素A和因素B之间可能存在交互作用,并假设需要A因素的充分病因为A+UA,需要B因素的充分病因为B+UB,需要A和B的充分病因为A+B+UAB,既不需要A也不需要B的充分病因的总和为Z。这里,U为A或B所有互补病因的总和。我们再假设:
RA =仅暴露于A的人群的发病率
RB =仅暴露于B的人群的发病率
RAB =同时暴露于A和B的人群的发病率
RZ =既无暴露于A也无暴露于B的人群的发病率
RD =以RZ为对照组计算的率差
RR =以RZ为对照组计算的率比
那么,如不考虑充分病因之间的竞争,同时暴露于A和B的人群的发病率
如前所述,仅暴露于A的人群的发病率等于需要A的充分病因引起的发病和既不需要A也不需要B的其它充分病因引起的发病率之和,那么完全由于需要A的充分病因引起的发病率则等于RA-RZ。同理,在B暴露者中,完全由于需要B的充分病因引起的发病率则等RB-RZ。
公式1中RAB指同时暴露于A和B的人群的发病率,是该疾病以下所有充分病因引起的发病的总和:(RA-RZ)指需要A的充分病因在人群中引起的发病率,(RB-RZ)指需要B的充分病因在人群中引起的发病率,RZ指既不需要A也不需要B的充分病因在人群中引起的发病率,X指同时需要A和B的充分病因在人群中引起的发病率。公式1也可以转换成以下等式:
从生物学意义上讲,交互作用需要两个因素一起“工作”才能产生,如果两个因素根本没有一起“工作”,交互作用则不可能发生。因此,如果交互作用存在,两个因素必然有机会“在一起发挥作用”。显而易见,在充分病因-组分病因模型里,如果两个因素不在同一个(或多个)充分病因的组分病因,就不可能产生交互作用。换言之,如果发现存在同时需要两个因素的充分病因,就是交互作用存在的证据。
因此,如果可以证明以上公式里X项根本不存在,即A+B+U的充分病因不存在,也即同时需要A和B的充分病因在人群中引起的发病率为零,就可以否定交互作用的存在。如果A+B+U的充分病因不存在,公式2则可改写为:
式中(RAB-RZ)=RDAB,(RA-RZ)=RDA,(RB-RZ)=RDB
因此,交互作用不存在的条件可以简写为
如果将公式3两端同除以RZ,交互作用不存在的条件可以用RR表示:
如果RDAB=(RDA+RDB),说明不存在交互作用;如果RDAB>(RDA+RDB),说明存在正交互作用,两个因素一起时可加强彼此的作用;相反,如果RDAB<(RDA+RDB),说明存在负交互作用,两个因素一起时可减弱彼此的作用(框1)。
由公式4和公式5发现的交互作用属于相加性交互作用,由此说明相乘性交互作用是没有生物学根据的,只是统计上交互作用。另外,循证医学也认为决策应该基于绝对效应,而不是相对效应,二者的结论不谋而合。
四、归因危险度
归因危险度(attributable risk percent, ARP)是流行病学用来测量暴露的致病作用占所有致病因素总效应(或总发病率)的百分比,常用于说明去除该病因后可降低暴露人群有关疾病发病的百分数。然而,当把多个因素的归因危险度相加时,会出现超过百分之百的现象,提示去除这些因素可以预防超过百分之百的发病,比如遗传、环境和生活方式造成的癌症的ARP总和大于100%,这显然是荒谬的。
充分病因-组分病因模型可以很好地解释这个问题。多个病因累加ARP超100% 是由于累加的是组分病因的ARP而不是充分病因的ARP。假设某疾病有三个充分病因,充分病因之间享有共同的组分病因,比如病因A存在于所有三个充分病因里(表7)。但是,现实中我们不可能知道有多少充分病因,也不知道每个充分病因里包含的组分病因有哪些,所以不可能估计每个充分病因的ARP,如果可以,它们ARP之和必然等于100%,不多不少(表7)。
表7 充分病因的归因危险度百分比及其总和
现实中我们能知道的只是一个疾病的一个或多个组分病因,我们能够计算的也只是这些组分病因的ARP。从充分病因-组分病因模型可以说明,任何一个组分病因的ARP等于它参与的所有充分病因的ARP之和,比如一个必然病因一定参与所有的充分病因,因此其ARP总和等于100%,再加上其它组分病因的ARP,多个组分病因的累加ARP就一定超过100%。
多个病因ARP 超过100%原因是由于组分病因可能同时“服务于”多个充分病因,组分病因的累积ARP势必重复累加了其参加的所有充分病因的ARP,致使累积ARP很容易超过100%。累加的组分病因越多,超过100%的可能性越大,超过100%的量也越大。如表8所示,该疾病10个组分病因的ARP总和等于500%。
表8 不同组分病因的归因危险度百分比及总和
五、疾病的潜隐期
潜隐期指初次暴露到发病的时间。在传染病里,潜隐期被称作潜伏期,一般认为一个传染病的潜伏期的长短是固定的,是一个传染病的特征,由病原体这个必要病因决定的特征,对诊断和确定隔离时间等十分重要。但是对于慢性非传染性疾病,潜隐期的概念是模糊的,似乎并没有太大的使用价值。该现象可以用充分病因-组分病因模型解释。
假设某疾病只有一个充分病因,该充分病因包含8个组分病因(见下),且8个组分病因必须按照以下的组合和顺序依次发生,疾病才能发生:
那么,该疾病的潜隐期将不是一个固定的特征,而是随着病因的不同而不同,对于病因X来说可能是很多年,但对于K来说就是零或很短。这样,潜隐期不再是一个疾病固定的特征,是一个与其病因更相关的现象。
一个疾病往往有很多充分病因,而且一个组分病因可能在多个充分病因里“工作”,如果不同充分病因需要该组分病因“工作”的时间点是不同的,那么以该组分病因定义的潜隐期也将是不同的。因此对很多慢性非传染性疾病来说,潜隐期没有传染病潜伏期那样重要的价值。
(全文完)
本文节选自:唐金陵. 第五章:病因、病因模型与病因推断(第三节第二部分,即第97~100页). 见:李立明. 流行病学 (第三版). 人民卫生出版社,2014.
编辑:冯琦、黄蔚然、傅晓红
长按上方二维码关注我们