查看原文
其他

JAMA子刊:每日步行7千-1万步最能预防早死? 这个有意思结果如何被证明?

The following article is from 医学论文与统计分析 Author 郑老师


行走是一项常见的运动方式。近期,来自马萨诸塞大学的领导团队就通过长期的随访研究证实了每天运动步数和全因死亡率的关系。这篇题为《Steps per Day and All-Cause Mortality in Middle-aged Adults in the Coronary Artery Risk Development in Young Adults Study》的文章近日发表在了《JAMA》子刊上,文章显示:中年人每天步数只要超过7000步就能降低全因死亡风险,但是也并不是走路越多效果越好。


这是一项非常有意思的公共卫生研究,是一项前瞻性的队列研究。我想很多人对于如何证实步行与死亡的关系非常感兴趣。由于这个研究在研究设计和统计方法分析都属于成熟且常规的方法,我今天就来分析分析文章。如果有兴趣学习这篇文献,请到公众号下载。

研究论文概述

为了探究步数和强度是否与中年人的过早死亡有关,研究团队选取了年轻人冠状动脉风险发展研究中的2110名成年人作为研究对象,这些参与者的平均年龄为45.2岁。参与者在2005年至2006年期间佩戴仪器以记录每人每天的步数和强度,经过平均10.8年的随访,团队对参与者2020年和2021年的数据进行了分析。
研究结果发现,较高的每日步数与较低的全因死亡率风险相关,根据数据分析显示,与每天步行少于7000步的低步组参与者相比,每天至少走7000步的人的死亡风险显著降低,降幅约为50%到70%,但是,每天走超过10000步并不会进一步地降低死亡风险。这说明,每天步行超过7000步能够使人更长寿,但是凡事讲究适量,同样的,每天走路步数适量就行,这与我们认为的运动多多益善的观点大相径庭。

通过进一步亚组分析,研究团队还发现每天行走步数对死亡风险的影响会因性别有所差异,在此次研究中,与低步组相比,每天步数大于7000的参与者中女性的死亡风险更低。

在另一方面,研究团队对行走强度与全因死亡率进行了Cox回归分析,分析结果显示:无论步数调整如何,行走的强度和全因死亡率之间都没有关联,也就是说,不管是走得快还是走得慢都与死亡风险无关。

一篇值得学习的队列研究文章

队列研究,无论是历史性队列研究,还是前瞻性队列研究,都是一回事,从记录暴露因素开始,跟踪一段时间,得到相应的健康结局。

这篇文章的暴露因素首要暴露因素是步行步数,次要暴露因素是步频,该研究的终点结局是是否死亡,但是它由于是随访研究,结合阳性终点事件,就形成了生存时间,所以它的统计分析结局是OS(0verall Survival)。

队列研究如何去分析和论文写作呢?并且,一般来说队列研究的暴露因素是二分类数据,但是本文暴露因素却是定量数据。那么定量数据的暴露因素如何去分析呢?


统揽全文,这篇JAMA子刊展示了定量变量为暴露因素的队列研究的一套公认、成熟、可模仿的统计解决方案。这包括包括回归分析、趋势性检验、限制性立方条样图、亚组分析、敏感性分析、缺失数据填补、多模型构建策略、交互分析,一应俱全。


这套组合拳实在高明,玩出花来了!


首先,明确下研究人群、研究因素和研究结局

研究人群:年轻人冠状动脉风险发展 (CARDIA) 研究队列的2110名年龄在38岁到50岁之间的参与者,57.1%为女性。


暴露因素:2005年至2006年期间通过佩戴加速度计测量其每日步数。


研究结局:OS,即生存时间,这个生存时间实际上包括了一个定量变量(时间)和一个二分类结局(是否死亡)


大家来看关键的暴露因素。一般情况下,在队列研究中,暴露因素一般是分类变量(分为暴露组和对照组),那么对于定量的变量的步数?如何去分析呢?


如何分析定量暴露因素?

定量暴露因素,有一套非常有意思的统计分析策略,包括三个统计分析技术,第一,将定量数据分为若干组,以某一组为对照进行哑变量设置设置分析。本例每日行走步数分为低步数组(每天<7000步)、中等步数组(每天7000-9999步)和高步数组(每天≥10000步)。第二,进行定量数据趋势性分析;第三,采用限制性立方条样图描述步数与结局的非线性趋势。本文,三者都具备。


文章写道:Tests for trends across step groups were examined using ordinal values. Restricted cubic splines with knots set at the 10th, 50th, and 90th percentiles of the steps/d distribution examined the dose-response association with mortality.


如何开展回归分析?

在结局方面,由于观察性研究,必须要采用回归分析控制混杂偏倚。由于结局是生存时间资料,因此采用Cox回归来控制混杂偏倚。


如何构建回归模型控制混杂呢?本研究采用了目前比较流行的多模型策略--构建多个Cox模型,然后每次模型纳入的协变量是不全相同的,先少后多,先原因后近因,看看是哪个可能因素造成了混杂偏倚。



回归分析的结果

我们可以下方的表格看到了很多信息,第一,这是Cox回归,因此计算了HR值,第二,研究以<7000为对照进行分析,第三,构建了三个Cox回归,第四,进行了趋势性分析。结果表明,中等步数(7000-9999)显著降低死亡风险(HR, 0.28[95%CI, 0.15-0.54]]),高步数(>10000) 也将降低死亡风险(0.45 [95%CI, 0.25-0.81])



为什么7千-1万步最能预防早死?

第一可以从上面表格的HR值来看,显然中等的7000-9999步,HR值远远小于高步数,所以7千-1万步最能预防,第二,就要借助于下方这一幅目前比较流行的图了!限制性立方样!可以看出,随着步数的增加,死亡风险先降后升!



不过,需要提醒各位,这里所说的7千-1万步最能预防早死,相对于另一组别>10000而言,实际上,从上图来看10000-11000之间的效果最好。


上面就是研究的主分析结果了。研究还开展了亚组分析,结果发现,女性7千-1万步效果更为明显。


好的队列研究,还需要做点什么?

队列研究必然包括缺失值,所以缺失值处理是必要的的,因此该文介绍:



另外一个常见的分析是敏感性分析,来探讨结果的稳健性。一把来说是要么针对不同的数据,要么采用不同的模型,来探讨结果的稳健性.该文开展了3个敏感性分析,包括剔除前面两年内死亡的对象(不同数据),开展是包括时依协变量在内的Cox回归(不同方法)、纳入饮食变量(不同方法)。



闲来郑语

很多朋友开展类似的队列研究了,因此可能会有共鸣。很多的没有经历过大型队列研究数据分析,也可以了解下。


队列研究一般有其基本的套路,当暴露因素是定量数据时,本文介绍的就是最成熟的套路。


这也是被广泛接受的套路,其中包括的技术,虽然看起来有点难,但是都是容易学习的,建议诸位有兴趣把这套统计分析策略都掌握,然后你会发现,医学研究,特别是观察性研究的统计方法,也就那么回事!


更多阅读:
TED:久坐伤身,知多少?
每天多少运动量能抵消久坐的危害?
统计学很无聊?谷歌统计学家带你证明
全文图解 | WHO身体活动和久坐行为指南


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存