查看原文
其他

临床研究讲座:流行病学数据分析基础(4/6):识别和分析交互作用与剂量反应关系

唐金陵 临床研究与循证医学 2022-03-25

目录

第一节  概述

第二节  流行病学专题研究数据的分析

一、描述研究对象随研究进程的数量变动

二、对变量进行分类和整理

三、描述基线资料

四、估计结局事件发生的频率

五、估计效应的大小

六、估计可信区间

七、识别和控制混杂

八、识别和测量交互作用

九、识别和测量剂量反应关系

第三节  队列研究数据分析实例

第四节  常规收集的流行病学数据的分析

第五节  本章总结


八、识别和测量交互作用


(一)识别和测量交互作用


当两个或多个因素同时作用于一个结局时,可能产生交互作用(interaction),又叫效应修饰作用(effect modification),修饰作用指第三种因素对暴露与结局关系强弱或暴露在结局上作用大小的影响或修饰。暴露和结局外的第三种因素叫效应修饰因素(effect modifier)。识别和测量效应修饰作用的分析方法主要包括分层分析和回归分析。


举例说明。假设某研究的主题是吸烟和冠心病的关系,年龄是可能的效应修饰因素。如果年龄和吸烟的确存在交互作用,或年龄修饰吸烟对冠心病的作用,那么吸烟对冠心病作用的大小或吸烟和冠心病关系的强弱在不同年龄组应存在真实的差异,首先应表现在统计学显著的异质性,而不是仅仅由于机遇产生的。


可见,识别交互作用,一致性检验又是关键。如果异质性检验显示差异有显著性(p≤0.05),说明可能存在交互作用,即效应修饰因素各层的真实效应可能不同。这时,没有一个单一的效应值可以代表各层的效应,因此估计无混杂的总效应将不再具有意义,重要的是描述交互作用,即分别报告各层的效应。如果修饰因素和效应大小有一定的趋势或形态,如表5中吸烟和冠心病关系的RR随年龄增加而降低,则可进一步模拟和描述有关趋势或形态,如表5中的交互作用可使用相关分析和回归分析来描述二者间的线性关系。


表5 不同龄分组吸烟和冠心病关系的相对危险度


区别交互作用和混杂的关键也在于一致性检验。如果异质性检验显示差异无显著性(p>0.05),说明可能不存在交互作用,即可疑的效应修饰因素各层的真实效应可能是相同的,可以用一个加权平均效应值来表达,如果这个平均效应值又与粗效应值一致,说明无混杂,反之,则说明粗效应存在混杂。


交互作用不同于混杂。混杂是粗效应值估计里存在的一种偏倚,是需要控制和消除的。而交互作用指效用的大小随第三因素暴露强度或剂量的变化而变化的现象。当交互作用存在时,粗效应是否存在混杂已不重要,也无法判断,因为各层效应不同,不存在一个真实无偏的总效应可以与粗效应进行比较来判断混杂的存在。因此,当发现交互作用时,结果报告的重点是交互作用,而不是对混杂的控制。


交互作用具有重要的实践意义。比如,随机对照试验的亚组分析(即分层分析)发现某药物在男性病人中十分有效,而在女性中没有明显的作用,显示药物和性别有交互作用,该证据对未来用药使用十分重要:女性应避免使用此药。又如,某暴露在儿童可引起严重疾病,而在成年人中没有明显的害处,说明该暴露和年龄间存在交互作用,儿童应是主要保护对象,应该尽可能避免暴露于该因素。


另外,在多元回归分析里,检验交互作用的存在需要在回归方程里加入至少三个变量:暴露、效应修饰因素,以及由这两个可能的交互因素的乘积形成的新因素(或简称交互项),回归方程提供的对交互项的显著性检验就等于分层分析里的异质性检验,如果有显著性,说明交互作用可能存在。多元回归的优点是,分析交互作用时可以同时控制其他因素对交互作用分析的影响。


(二)交互作用的相对性


交互作用是一个十分重要的现象。但是,有趣的是,交互作用是相对的,在同一个研究里,既可以存在,同时又可以不存在,存在与否取决于使用什么效应指标进行分析。


举例说明。在一个虚拟的前瞻性研究里,暴露是吸烟和石棉接触史,结局是肺癌,三个变量均为二分变量。按照吸烟和石棉接触史,可将研究对象分成四组,各组肺癌的发病率如表6所示。设吸烟和肺癌的关系为主效应,以RR估计效应的大小,则有石棉接触史和无石棉接触史的人群中吸烟与肺癌关系的RR均为10,说明吸烟和石棉暴露间无交互作用。但是,相应的RD则为45和9,说明二者之间存在明显的交互作用。


关于交互作用,表6显示的现象不是一个特例,而是一个普遍现象。如图3所示,暴露组和非暴露组的发病率(注意不是效应)都随效应修饰因素的暴露剂量的增加而增加,但是暴露组和非暴露组的发病率之差(即RD)却是一条与横轴平行的直线,说明RD随效应修饰因素的变化维持不变,不存在交互作用。但是,暴露组和非暴露组的发病率之比(即RR)却随效应修饰因素的增加而降低,说明存在交互作用。图4展示了一个相反的例子,即RD存在交互作用,RR不存在交互作用。


表6 虚拟肺癌发病率:交互作用与效应指标的关系

注:表中的发病率的单位为10万分之一。资料来源:Rothman KJ. Modern Epidemiology. 1st ed. Chapter 15 Interaction between Causes. Boston: Little, Brown and Company, 1986.311-326



图3  有相对交互作用,无绝对交互作用


图4  有绝对交互作用,无相对交互作用


基于RR(或其他相对效应指标)测量的交互作用一般叫乘积性交互作用(multiplicative interaction),而基于RD(或其他绝对效应指标)测量的交互作用叫累加性交互作用(additive interaction)。除非暴露对结局没有任何作用,即主效应RR=1 或RD=0,否则,基于相对指标和绝对指标发现的交互作用总是不同的,不是量的不同,就是质的不同,甚至质和量都不同。


另外,值得注意的是:多数分析二分结局变量的回归分析(如Logistic回归和Cox回归等)检验的都是乘积性交互作用,而非累加性交互作用。


(三)决策应基于绝对效应


如果交互作用是一个相对的现象,如何利用可能矛盾的信息进行实践和决策呢?研究表明,决策应基于累加性交互作用,而不是乘积性交互作用。


举例说明。美国实际的资料显示(表7),吸烟对冠心病的作用与年龄存在交互作用,且在相对效应和绝对效应上存在矛盾,累加交互作用和乘积交互作用方向相反:吸烟的相对作用随年龄增加而降低,而绝对作用随年龄增加而增加。对决策者来说,乘积性交互作用提示,控烟预防冠心病的作用在年轻人大于老年人,预防的重点应放在青年人。然而,累加性交互作用的提示则刚好相反。从可预防的绝对死亡数来看,在35岁~44岁年龄组每10,000人可预防5例,而在65岁~74岁年龄组可预防39例,后者是前者的近8倍。说明依据相对效应指标进行决策可能导致的错误。依据绝对效应指标进行决策则可得出正确的结论:预防的重点应放在中老年人。


表7  吸烟对冠心病的作用在不同年龄组的差异(美国)

注:年死亡率的单位是万分之一。资料来源:Doll R, Hill AB. Natl Cancer Inst Monogr 1966;19:205-268.


(四)累加性交互作用的条件


设既无暴露于因素A也无暴露于因素B的人群为对照组,暴露于A因素的人群的率差为RDA,率比为RRA;暴露于B因素的人群率差为RDB,率比为RRB;同时暴露于因素A和B率的人群的率差为RDAB,率比为RRAB。那么,无累加交互作用的条件为:


(1)RDAB=RDA+RDB,或者

(2)(RRAB-1) = (RRA-1) + (RRB-1)


当以上等式两边的结果不等时,说明存在累加性交互作用。当RDAB>(RDA+RDB)时,可能存在正交互作用,即两因素相互加强彼此的效应;当RDAB<(RDA+RDB)时,可能存在负交互作用,即两因素相互削弱强彼此的效应。


测量交互作用大小的指标有很多,累加性交互作用的大小常用以下指标来测量:


(1)交互作用的绝对值(absolute interaction,AI):AI=RDAB-RDA-RDB。AI表示A和B间交互作用所引起的额外发病率,AI=0说明A和B间无交互作用,AI>0说明A和B的交互作用增加发病率,AI<0说明A和B的交互作用降低发病率。例如,AI=0.20说明A和B的交互作所产生的额外发病率的绝对值为20%,即每100人中可增加20个发病。


(2)交互作用的相对值(relative interaction,RI):RI =(RRAB-RRA-RRB+1)/ RRAB。RI表示A和B间交互作用所引起的额外发病率占同时暴露于因素A和B的人群的总发病率的百分比。RI波动在+1和-1之间,RI=0说明A和B间无交互作用,RI>0说明A和B的交互作用增加发病率,RI<0说明A和B的交互作用降低发病率。例如,RI=0.20说明A和B间交互作用所引起的额外发病率占同时暴露与因素A和B的人群的总发病率的20%。


九、识别和测量剂量反应关系


随暴露强度的增加暴露效应发生变化的现象叫做剂量反应关系(dose-response relation)。剂量反应关系的存在是对暴露和结局因果关系真实性更强的支持。同时,剂量反应关系也是医学实践需要的重要信息,如用于疾病(如高血脂和高血压)诊断切点的确定。识别和测量的分析方法主要包括分层分析和回归分析。


如表8的虚拟资料所示,肺癌的发病危险随着每天吸烟支数的增加而增加,说明吸烟量与肺癌危险存在剂量反应关系。与交互作用不同,在剂量反应关系里不存在第三个因素,分层是以暴露的剂量进行的。对剂量反应系的进一步分析包括对此关系的显著性检验和形态描述和模拟。若存在明显的直线关系时,可采用相关分析或线性回归模型,此时有关的显著性检验比一般的异质性检验更贴切也更敏感。


表8  吸烟的数量与肺癌的剂量反应关系(虚拟数据)


(本文是全文六个部分的第四部分,未完待续)



原文出处:唐金陵. 第二十章: 流行病学研究数据统计分析概述. 见: 李立明 主编. 《流行病学》. 第一卷. 第三版. 北京: 人民卫生出版社: 2015: 369-397.


作者:唐金陵,广州市妇女儿童医疗中心临床研究总监、香港中文大学流行病学荣休教授


编辑:唐惠、邬德华


唐金陵教授《临床研究方法学文章汇集》 | 2019-11-27


系统综述中的统计分析(5/5):Meta分析软件与分析实例


临床研究讲座:流行病学数据分析基础(1/6):目的、原则和内容


临床研究讲座:流行病学数据分析基础(2/6):估计主效应


临床研究讲座:流行病学数据分析基础(3/6):识别和控制混杂



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存