查看原文
其他

生存分析,怎么呈现结果图表?

2017-05-08 大仙儿 医咖会

生存分析是临床研究中一种常用方法,主要用来处理考虑发生时间的二分类结局变量。结局可以是死亡、疾病发生或任何其他感兴趣的二分类结局事件。如果我们同时关心结局发生的时间,那么可以将此类数据统称为生存数据。


生存数据一般是正数,且很少是对称分布。在临床研究中,我们需要规范生存数据分析结果的报告形式,这样才能更好地回答研究问题。以下是生存分析需要报告的几个重要部分。

结局定义

结局定义明确至关重要。例如结局可设定为①任何原因导致的死亡;②疾病进展;③某种疾病的确诊。对于这些结局需要提供更加具体的信息,例如:疾病进展如何定义?由谁测量?是否包括死亡在内?具体判断标准?为了便于读者对研究结果进行评价和比较,通常还需要描述结局资料获取的方式(比如前瞻性随访、公开资料获取、医疗数据、自发报告等)。

测量起始时间

测量的起始时间即生存分析的时间起点。在临床试验中通常将随机化的时间作为起始点,在观察性研究中可能是研究对象进入试验的时间、出生日期或某些重要事件发生的时间,如第一次心梗、手术或疾病确诊的日期。


对时间起点的选择应当慎重。临床试验将随机化时间作为测量起点,在样本量较大时可以保证组间可比。对于观察性研究来说,将测量起点设定为某些重要事件发生的时间比设定为进入研究的时间可能更好。在生存分析的结果报告中应当报告测量起点。

危险集(At Risk)

危险集,即某个时间点有发生结局风险的所有人的集合。如果观察对象在研究开始之后的某个时间点,既没有发生结局事件,也没有退出研究,那么该研究对象处于该时刻的危险集中。生存曲线通常用来描述不同时点的危险集以及发生结局的人的比例(即结局发生率)。需注意的是,在危险集中人数比较少时,结局发生率的估计是不准确的,这种情况通常出现在随访的后期,也就是生存曲线的末端部分。

截尾(Censoring)

研究中未必能够观察到所有患者的结局,这些患者将被截尾。例如研究要观察的结局是死亡,但是研究结束时仍有部分患者存活,这些患者的数据不完整,无法得知其确切的发生结局的时间,即为截尾数据。生存分析中要求截尾是随机的,结果中描述患者截尾的原因有助于读者判断该条件是否成立。

生存数据的表格呈现

1. 基线数据


结果要首先报告患者的基线特征信息。表中既要报告各组人数和相应比例,也要报告患者的随访时间。表1中列出了Framingham研究的基线特征供大家参考。


表1. 基线特征示例


2. 描述性结果


报告中应给出生存时间的描述性结果,可参考以下形式:


表2 生存时间描述示例

生存分析的图形呈现

1. Kaplan-Meier图


Kaplan-Meier图(图1)是生存分析中最常见的图,它呈现了不同组间患者生存概率随时间的变化,能够很好地描述生存过程。

图中纵轴为生存概率,或者可理解为未发生结局的患者比例。横轴为随访时间。


2. 累积发病率图(Cumulative incidence plot)


累积发病率图(图2)也可以表现组间的生存过程。该图在事件发生比例较低时比较有用。当关注的结局与其他结局存在“竞争关系”时,即只能观察到其中一种结局时也会采用该图。例如研究者要研究的结局是归因于心梗的死亡,但这些患者很可能会在发生心梗前因其他原因死亡,因此能观察到的结局比例不会很高。累积发病率是将各时点的发病率相加,在观察起始点时累积发病率为0,并随着时间逐渐增高,与Kaplan-Meier图相反。

除非结局发生的比例比较低,导致Kaplan-Meier图中各组曲线区分不开,否则应尽量使用Kaplan-Meier图。


统计学精彩教程回顾

1. SPSS详细操作:生存资料的Cox回归分析

2. 生存曲线比较:KM法及Log Rank检验

3. Cox回归中,等比例假定不满足,该怎么衡量治疗效果?

医咖会微信:medieco-ykh

关注医咖会,轻松学习统计学!


有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。


点击左下角“阅读原文”,看看既往小伙伴们都提出了哪些问题,以及该如何去解决,也许正好有你疑惑的问题呢~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存