查看原文
其他

生存资料的Cox回归分析(1) - 问题与数据

2016-09-05 聂晓璐 张耀文 医咖会

本期“一条知识”的主角来自:上期“短视频”栏目中介绍的LEADER研究(2型糖尿病患者中,利拉鲁肽的使用和心血管疾病的关系),其统计方法中提到的“Cox比例风险模型(Cox回归)”。

问题与数据

某研究者拟观察某新药的抗肿瘤效果,将70名肺癌患者随机分为两组,分别采用该新药和常规药物进行治疗,观察两组肺癌患者的生存情况,共随访2年。研究以死亡为结局,两种治疗方式为主要研究因素,同时考虑调整年龄和性别的影响,比较两种疗法对肺癌患者生存的影响是否有差异。变量的赋值和部分原始数据见表1和表2。


表1.  肺癌患者生存的影响因素与赋值


表2. 两组患者的生存情况


对数据结构的分析

该研究以死亡为结局,治疗方式为主要研究因素,每个研究对象都有生存时间(随访开始到死亡、失访或随访结束的时间),同时考虑调整年龄和性别的影响。欲了解两种疗法对肺癌患者生存的影响是否有差异,可以用Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归)进行分析。


实际上,Cox回归的结局不一定是死亡,也可以是发病、妊娠、再入院等。其共同特点是,不仅考察结局是否发生,还考察结局发生的时间。


在进行Cox回归分析前,如果样本不多而变量较多,建议先通过单变量分析(KM法绘制生存曲线、Logrank检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。即使样本足够大,也不建议把所有的变量放入方程直接分析,一定要先弄清楚各个变量之间的相互关系,确定自变量进入方程的形式,这样才能有效的进行分析。


单因素分析后,应当考虑应该将哪些自变量纳入Cox回归模型。一般情况下,建议纳入的变量有:1)单因素分析差异有统计学意义的变量(此时,最好将P值放宽一些,比如0.1或0.15等,避免漏掉一些重要因素);2)单因素分析时,没有发现差异有统计学意义,但是临床上认为与因变量关系密切的自变量。


(敲黑板:上面两段蓝色字体部分是重点,重点,重点!!!)


本期Cox回归分析的内容拆成了三部分。可点击左下角“阅读原文”,查看第二部分的内容。在第三部分的内容结束后,我们还做了个关于此文章的小调研,麻烦各位活动下手指~


医咖会微信

medieco-ykh

微信二维码
长按即可关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存