查看原文
其他

SPSS详细教程:相对危险度(RR)的计算

豆沙包 医咖会 2019-07-01

医咖会既往的推文中,专门介绍了OR和RR的基本概念以及区别,详见:


我们推送过“计算OR值的SPSS教程”,今天再来介绍一下如何用SPSS来计算RR,当然也可以手算,详见后文介绍。

一、问题与数据

研究者想探索吸烟与肺癌间的关联,即吸烟者患肺癌的风险是否比不吸烟者高以及高多少。研究者从一般人群中随机抽样700名调查对象建立前瞻性队列研究。调查对象的吸烟状态为吸烟或不吸烟。在研究开始时,所有调查对象均未患肺癌。研究者随访10年记录调查对象是否患肺癌。


因此,研究者可以分别得到患肺癌的吸烟者、未患肺癌的吸烟者、患肺癌的不吸烟者和未患肺癌的不吸烟者的人数,据此可以计算吸烟组与不吸烟组的风险差异。


本例中代表吸烟状态的变量为smoking_status,吸烟赋值为1,不吸烟赋值为2;代表随访期肺癌发病与否的变量为lung_cancer,患肺癌赋值为1,未患肺癌赋值为2。


部分数据截图如下,左侧为原始数据,右侧为按不同吸烟状态和患肺癌与否统计的汇总数据。


二、对问题的分析

为计算相对危险度(RR),需要满足以下假设:

  • 假设1:因变量和自变量均为二分类变量。

  • 假设2:各观测间相互独立。


接下来将详细介绍如何计算相对危险度。

三、SPSS操作

1. 数据准备


如果研究者使用原始数据,则跳过数据准备步骤,直接计算相对危险度;如果使用按不同吸烟状态和患肺癌与否来统计得到汇总数据,则需要添加权重,步骤如下。


(1) 点击主菜单Data > Weight Cases,如下图:

 


点击后出现Weight Cases对话框,如下图:


 

(2) 勾选Weight cases by选项,激活 键和Frequency Variable: 框,如下图:


 

(3) 将变量freq选入Frequency Variable框,如下图:


 

(4) 点击OK键,为数据加权。


2. 相对危险度的SPSS操作


(1) 点击主菜单Analyze > Descriptive Statistics > Crosstabs,如下图:


 

点击后出现Crosstabs对话框,如下图:


 

注意:如果使用频数统计的数据文件,Crosstabs对话框如下图:


 

(2) 将自变量smoking_status选入Row(s)框,因变量lung_cancer选入Column(s)框,如下图:


 

注意:如果使用频数统计的数据文件,Crosstabs对话框如下图:


 

(3) 点击Statistics键,出现Crosstabs:Statistics对话框,如下图:


 

(4) 勾选Risk,如下图:


 

(5) 点击Continue键,返回Crosstabs对话框。


(6) 点击Cells键,出现Crosstabs:Cell Display对话框,如下图:


 

(7) 勾选Percentanges区域的Row,如下图:


 

(8) 点击Continue键,返回Crosstabs对话框。


(9) 点击OK键,生成结果。

四、结果解释

1. 描述性统计分析


在报告相对危险度前,研究者应该先查看基本的一些统计量,了解数据特征。本例中在smoking_status*lung_cancer Crosstabulation表,如下图:


 

首先,表中可看到在350名吸烟者中患肺癌的人数,如下图高亮:


 

随访期间29名吸烟者患肺癌,即8.3%(29÷350*100%=8.3%)的吸烟者患肺癌。


注意:表中仅保留了一位小数,SPSS会自动计算相对危险度;如果研究者想得到更多小数位数手动计算的相对危险度,则双击smoking_status*lung_cancer Crosstabulation表,如下图。可观察到8.3%变为8.285714%。


 

其次,还能看到350名不吸烟者中患肺癌的人数,如下图:


 

随访期间9名不吸烟者患肺癌,即2.6%(9÷350*100%=2.6%)的不吸烟者患肺癌。研究者想得到更多小数位数手动计算的相对危险度,也可以如上操作,2.6%变为2.571429%,如下图:


 

从smoking_status*lung_cancer Crosstabulation表中可以得到初步结论:与不吸烟者相比,吸烟者患肺癌的风险更高。


研究者可以汇报:本研究随机抽样700名调查对象,吸烟者和不吸烟者各350名,吸烟者患肺癌的比例(8.3%)高于不吸烟者(2.6%)。


当然,研究者也可以选择分别汇报患肺癌的吸烟者、未患肺癌的吸烟者、患肺癌的不吸烟者和未患肺癌的不吸烟者的人数。


2. 相对危险度


相对危险度结果可以在Risk Table表中查看,如下图高亮显示。



注意:表中高亮显示的为“For cohort lung_cancer=Yes”行,不是“For cohort lung_cancer=No”,因为研究者感兴趣的是吸烟对患肺癌的影响。

 

吸烟者患肺癌的相对危险度是3.222,95%置信区间为1.548到6.707。95%置信区间说明研究者有95%的把握说明人群中真实的相对危险度在1.548和6.707间。


如果研究者手动计算相对危险度,则需要吸烟者患肺癌的比例即0.08285714和不吸烟者患肺癌的比例即0.02571429。将两个比例输入到相对危险度计算公式,如下图:


 

如果相对危险度大于1且95%置信区间不包括1,说明暴露组发生疾病的风险高于非暴露组,是结局的危险因素。本例中相对危险度3.222说明吸烟者患肺癌的风险高出不吸烟者222%。研究者还可以计算超额危险度,公式如下,其中RR为相对危险度。



 本例中,超额危险度则为:



如果相对危险度小于1且95%置信区间不包括1,则意味着暴露组患病风险降低,是结局的保护因素。例如,相对危险度为0.34,代表与非暴露组相比,暴露组研究对象发生疾病的风险降低66%,计算如下。负号代表发生疾病的风险降低。



如果相对危险度的95%置信区间包括1,说明暴露组与非暴露组发生疾病的风险差异无统计学意义。


提示:研究者必须把自变量smoking_status选入Row(s),因变量lung_cancer选入Column(s)。如果选反,则会出现如下结果。



上表中相对危险度为1.574,95%置信区间上下限也分别变为1.297和1.910。因此,研究者需注意选对自变量和因变量。


综上,研究者可以汇报:本研究随机抽样700名调查对象,吸烟者和不吸烟者各350名,吸烟者患肺癌的比例(8.3%)高于不吸烟者(2.6%)。与不吸烟者相比,吸烟者患肺癌的相对危险度为3.222(95%置信区间为1.548-6.707)。

五、撰写结论

如果相对危险度95%置信区间不包括1,可以汇报:


本研究随机抽样700名调查对象,吸烟者和不吸烟者各350名,吸烟者患肺癌的比例(8.3%)高于不吸烟者(2.6%)。与不吸烟者相比,吸烟者患肺癌的相对危险度为3.222(95%置信区间为1.548-6.707),且有统计学意义。


如果相对危险度95%置信区间包括1,可以汇报(另外列举一个例子)


有900名永久性房颤病人随机分配至两组,每组450名,一组使用降低脑卒中风险的新药,另外一组使用常规药物。使用新药的房颤病人中11人(2.4%)患脑卒中,使用常规药物病人24人(4.7%)患脑卒中。与使用常规药物的房颤病人相比,使用新药的病人患脑卒中的相对危险度为0.524(95%置信区间为0.256-1.074),没有统计学意义。


(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)


更多阅读

1.【合集】36种统计方法的SPSS详细操作

2. 总结:那些可以评价干预措施效果的指标们

3. OR、RR、HR...还没搞清楚?那是因为你还没看过这个!

医咖会微信:medieco-ykh

关注医咖会,轻松学习统计学~


有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。如果想进群,添加小咖时请注明“加群”二字。


点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存