查看原文
其他

统计方法如何表达:来自文章“孕产妇玩手机影响孕周期和新生儿体重吗?”

老郑 医学论文与统计分析 2022-10-07

       最新一期,《美国流行病学杂志》,荷兰Utrecht University大学的研究团队,基于4个人群队列分析,探讨了孕产妇玩手机的频率是否影响孕期时长和新生儿体重。


     上一篇“孕妇玩手机影响孕期长短和新生儿体重吗?《美国流行病学》杂志揭示最新发现”中,老郑对该论文进行了科普性的介绍。本篇着重对该论文的统计学方法进行讲解,与大家一起共勉进步!


01--总体概况

       该研究是队列研究,且是4个队列的汇总分析。暴露因素是孕产妇使用手机的频率,分为未使用、低频率、中频率、高频率,具体分布如下。该研究的结局变量较多,包括定量数据的Birth weight、定性数据的Low birth weight、High birth weigh、Preterm birth、Postterm birth等,还包括生存时间数据Gestational age at birth。


02--论文统计策略

       队列研究探讨暴露因素与结局的关系,常用的方法是采用回归分析的方法,剔除混杂因素。因此,根据他们的结局特征,预计将采用线性回归、logistic回归和COX比例风险模型进行评价。其主要的混杂因素包括以下文字介绍的变量:


03--统计方法解读

      我们结合该文的英文表述,来看看本文的分析策略。特别注意:多学习论文的统计学表达!特别提醒:优秀英文文章,统计学方法讲得非常详细,请保持耐心!

第一段

      这段话说明什么?数据需要进行整理,最重要的是缺失数据填补。本文采用的方法是MICE,也就是多重填补方法。

第二段:

      数据填补完了之后,就是一般的统计描述和统计推断。它的统计描述方法是均数和构成比,差异性比较有卡方、Fisher确切概率法,和Wald方法。诸位,这段文字所介绍的方法,是医学统计学最常用的。因此,请记住,这段文字的表述方法。

第三段:

     在这段文字中,你们看到几个关键词吗?multiple linear regression models、Cox proportional hazards models、logistic regression。这三个词语就是上文提到的线性回归、COX回归和logistic回归方法。除了介绍不同结局指标的一些回归方法之外,这段文字还介绍了,为了符合回归分析条件所做的一些工作:线性回归的正态性问题和COX回归方法等比例问题。最后,还介绍了暴露因素的对照组是谁,怎么定义的。

第四段

       本段文字是核心的统计学内容。本论文是4个队列结果汇总分析,因此采用的是meta分析的随机效应模型。随机效应模型也分为两个方法,第一将暴露因素设置对照组,也就是暴露因素进行哑变量设置计算OR值或者HR值;第二,将暴露因素作为连续性变量纳入分析,这样的P值是趋势性检验的结果。诸位,趋势性检验,中文论文不多见,但在英文论文里很常见,所以请了解下。

第五段

      Sensitivity analysis?敏感性分析 ?什么鬼?我怎么没有见过!没有见过!但是,如果你有兴趣写医学SCI论文,敏感性分析是标配。

      所谓的敏感性分析,它的意思是,论文做了一些统计学分析,但这些统计学方法本身带有一定的偏性,我们想看看偏性有多大。比如,本文就做了6点敏感性分析。前几点如下:

    1)论文为了探讨多重填补的影响,因此做了一个全完整记录的统计分析。也就是他们剔除了所有缺失信息的对象,再做个结果,看看和多重填补结果差别大不大,如果差别很大,说明多重填补的结果不是那么可靠。

    2)作者把暴露因素从分四组变成分两组,看看是否也有统计学差异。如果分四组可以证明暴露因素与出生结局的关系,说明结果是可靠的。

    3)我们说低出生体重可能不仅是暴露因素带来的,也可能是早产儿带来的,所以这里把人群限制在非早产儿,看看低出生体重和暴露因素因果关联系是否存在。

    4) 。

 

      你现在有点明白了吗?敏感性分析,就是看看论文的主要结果是不是具有稳定性,受不受数据质量与统计学方法的影响。

      敏感性在国内杂志的论文几乎很少见到。顶级的医学SCI论文中,敏感性分析却往往是标配。 所以学习医学统计学,还是要了解下敏感性分析方法。不懂别急,诸位多学习几篇文献,慢慢就能领悟它的精髓了。

第六段

       最后一段介绍统计软件。本论文应用的是R语言。其中,这里面有个R语言包是“tableone”。还记得么,我在公众号也提过这个包的强大功能:三行情书! 爱上R语言的最大理由之一:R语言分分钟形成规范“三线表”。请坚持看完,必有体会!

04--总结

      总结下这篇顶级论文的统计学套路。它的文章主要包括了以下统计学方法:

第一,  数据整理,包括缺失值填补

第二,  统计描述和差异性比较

第三,  回归分析方法

第四,  meta分析方法

第五,  标敏感性分析。每篇《美国流行病学杂志》专著几乎都有。

第六,  统计软件。

      最后,请问你收获了多少?积少成多,跟着老郑学习英文论文的统计学表达方法,是不是也不错呢?有兴趣关注英文原文的,请点击“阅读原文”。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存