JAMA子刊:每日步行7千-1万步最能预防早死? 这个有意思结果如何被证明?
The following article is from 医学论文与统计分析 Author 郑老师
通过进一步亚组分析,研究团队还发现每天行走步数对死亡风险的影响会因性别有所差异,在此次研究中,与低步组相比,每天步数大于7000的参与者中女性的死亡风险更低。
在另一方面,研究团队对行走强度与全因死亡率进行了Cox回归分析,分析结果显示:无论步数调整如何,行走的强度和全因死亡率之间都没有关联,也就是说,不管是走得快还是走得慢都与死亡风险无关。
队列研究,无论是历史性队列研究,还是前瞻性队列研究,都是一回事,从记录暴露因素开始,跟踪一段时间,得到相应的健康结局。
这篇文章的暴露因素首要暴露因素是步行步数,次要暴露因素是步频,该研究的终点结局是是否死亡,但是它由于是随访研究,结合阳性终点事件,就形成了生存时间,所以它的统计分析结局是OS(0verall Survival)。
队列研究如何去分析和论文写作呢?并且,一般来说队列研究的暴露因素是二分类数据,但是本文暴露因素却是定量数据。那么定量数据的暴露因素如何去分析呢?
统揽全文,这篇JAMA子刊展示了定量变量为暴露因素的队列研究的一套公认、成熟、可模仿的统计解决方案。这包括包括回归分析、趋势性检验、限制性立方条样图、亚组分析、敏感性分析、缺失数据填补、多模型构建策略、交互分析,一应俱全。
这套组合拳实在高明,玩出花来了!
首先,明确下研究人群、研究因素和研究结局
研究人群:年轻人冠状动脉风险发展 (CARDIA) 研究队列的2110名年龄在38岁到50岁之间的参与者,57.1%为女性。
暴露因素:2005年至2006年期间通过佩戴加速度计测量其每日步数。
研究结局:OS,即生存时间,这个生存时间实际上包括了一个定量变量(时间)和一个二分类结局(是否死亡)
大家来看关键的暴露因素。一般情况下,在队列研究中,暴露因素一般是分类变量(分为暴露组和对照组),那么对于定量的变量的步数?如何去分析呢?
定量暴露因素,有一套非常有意思的统计分析策略,包括三个统计分析技术,第一,将定量数据分为若干组,以某一组为对照进行哑变量设置设置分析。本例每日行走步数分为低步数组(每天<7000步)、中等步数组(每天7000-9999步)和高步数组(每天≥10000步)。第二,进行定量数据趋势性分析;第三,采用限制性立方条样图描述步数与结局的非线性趋势。本文,三者都具备。
文章写道:Tests for trends across step groups were examined using ordinal values. Restricted cubic splines with knots set at the 10th, 50th, and 90th percentiles of the steps/d distribution examined the dose-response association with mortality.
在结局方面,由于观察性研究,必须要采用回归分析控制混杂偏倚。由于结局是生存时间资料,因此采用Cox回归来控制混杂偏倚。
如何构建回归模型控制混杂呢?本研究采用了目前比较流行的多模型策略--构建多个Cox模型,然后每次模型纳入的协变量是不全相同的,先少后多,先原因后近因,看看是哪个可能因素造成了混杂偏倚。
我们可以下方的表格看到了很多信息,第一,这是Cox回归,因此计算了HR值,第二,研究以<7000为对照进行分析,第三,构建了三个Cox回归,第四,进行了趋势性分析。结果表明,中等步数(7000-9999)显著降低死亡风险(HR, 0.28[95%CI, 0.15-0.54]]),高步数(>10000) 也将降低死亡风险(0.45 [95%CI, 0.25-0.81])
第一可以从上面表格的HR值来看,显然中等的7000-9999步,HR值远远小于高步数,所以7千-1万步最能预防,第二,就要借助于下方这一幅目前比较流行的图了!限制性立方样条图!可以看出,随着步数的增加,死亡风险先降后升!
不过,需要提醒各位,这里所说的7千-1万步最能预防早死,相对于另一组别>10000而言,实际上,从上图来看10000-11000之间的效果最好。
上面就是研究的主分析结果了。研究还开展了亚组分析,结果发现,女性7千-1万步效果更为明显。
队列研究必然包括缺失值,所以缺失值处理是必要的的,因此该文介绍:
另外一个常见的分析是敏感性分析,来探讨结果的稳健性。一把来说是要么针对不同的数据,要么采用不同的模型,来探讨结果的稳健性.该文开展了3个敏感性分析,包括剔除前面两年内死亡的对象(不同数据),开展是包括时依协变量在内的Cox回归(不同方法)、纳入饮食变量(不同方法)。
很多朋友开展类似的队列研究了,因此可能会有共鸣。很多的没有经历过大型队列研究数据分析,也可以了解下。
队列研究一般有其基本的套路,当暴露因素是定量数据时,本文介绍的就是最成熟的套路。
这也是被广泛接受的套路,其中包括的技术,虽然看起来有点难,但是都是容易学习的,建议诸位有兴趣把这套统计分析策略都掌握,然后你会发现,医学研究,特别是观察性研究的统计方法,也就那么回事!