医学论文中如何描述统计方法和统计结果
本文内容来自《中华流行病学杂志》2019年第40卷第1期,作者为严若华和彭晓霞教授,原题目为《医学期刊统计报告要求的详述与解读》。将这篇文章分享给医咖会的伙伴们,希望大家能从领域大咖的见解中有所收获,指导医学研究之路。
(感谢彭晓霞教授的授权)
该文结合已发表的研究论文,从研究设计、统计分析与结果报告3方面涉及的统计学问题入手,进行逐条解读,以阐明医学论文应达到的统计报告要求。之前小咖分享了研究设计部分(一表总结:医学期刊的统计报告要求),今天我们继续分享统计分析和结果报告要求。
统计分析
1、缺失值的处理:
缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。
例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。
2、数据的预处理:
实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。
3、变量分布特征描述:
确定统计分析使用的变量,并针对每一个变量的分布特征进行描述,是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求,但作者往往套用常用方法,如:连续变量符合正态分布时,采用均数(标准差)描述,否则采用中位数(四分位间距)描述;分类变量采用频数(百分比)描述等。
事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的报告连续变量的均数和分类变量的构成比。
4、主要分析(primary analysis):
指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。
在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。
例如,瑞舒伐他汀试验采用意向性分析(intention to treat)数据集,通过计算OR值及其95%CI来评价术后房颤发生风险在试验组与对照组间的差异,置信区间包含1说明研究结果不拒绝原假设,即两组的术后房颤发生风险相等;考虑到重复测量的需要,采用协方差分析比较两组术后6~120 h肌钙蛋白Ⅰ释放曲线下面积的对数,并计算其均值的绝对差异及其95%CI来评价围术期心肌损伤情况在试验组与对照组间的差异,置信区间包含0说明研究结果不拒绝原假设,即两组的围术期心肌损伤情况相同。
在观察性研究中,通常采用多因素统计模型来控制混杂,此时应明确定义因变量、自变量及潜在的混杂变量或效应修正因子,描述变量转换的方法和变量筛选的过程,并预先说明论文报告哪一种统计模型的结果。如果采用读者并不熟悉的统计分析方法,还应详细介绍该统计分析方法的原理。
例如,CKB采用Cox比例风险回归模型分析水果摄入与心血管事件之间的关联,因变量为心血管事件,包括心血管死亡、主要冠状动脉事件、出血性卒中、缺血性卒中、其他缺血性心脏病和其他脑血管病;
自变量为水果摄入频率,即每天、4~6 d/周、1~3 d/周、每月、极少或从不;分层变量为年龄、性别和地区;同时模型调整了基线的混杂变量;
为了帮助多个暴露类别之间的比较,研究采用浮动绝对风险的方法(floating-absolute-risk method)估计危险比的变异程度,并与传统的不浮动绝对风险的方法进行比较。
5、其他分析:
如果研究在主要分析之外,还进行了其他辅助分析(ancillary analysis),如敏感性分析(sensitivity analysis)或亚组分析(subgroup analysis),应在统计分析部分给予充分说明。
如果是事后分析(post-hoc analysis),应考虑潜在的Ⅰ类错误膨胀问题。例如,瑞舒伐他汀试验在主要分析的基础上,根据基线年龄(≤60岁或>60岁)、性别、他汀用药史(是或否)等变量分亚组比较主要结局指标在试验组与对照组间的差异。但是,由于该亚组分析在研究设计时已预先设定(pre-specify),因此无需对显著性水平进行调整。
6、多重比较:
除了常规使用的统计分析方法外,作者还应特别注意多重比较的问题。
例如,瑞舒伐他汀试验设置了两个平行的主要结局指标:术后房颤和围术期心肌损伤,原则上应调整显著性水平以控制总体Ⅰ类错误概率。然而,由于研究假设两个主要结局指标同时达到组间差异有统计学意义才算试验阳性,且在估算样本量时已对此给予了充分考虑,因此无需考虑多重检验的问题(without allowance for multiple testing)。
7、Ⅰ类错误概率与统计软件:
医学论文应对统计检验的Ⅰ类错误概率(单/双侧)及统计软件进行说明。例如,两部分数据分别采用SAS 9.3和Stata 13.0软件进行分析,所有检测均为双侧检验,P<0.05为差异有统计学意义。
结果报告
1、研究对象的纳入流程:
医学期刊推荐使用研究对象流程图来描述研究对象的纳入流程、研究实施过程中的失访或无应答、以及最终的统计分析数据集等信息,见图 1。研究对象流程图的展示可以为研究对象是否存在选择偏倚、研究结果的可外推范围等提供重要证据。
图1 瑞舒伐他汀试验的研究对象流程图
注:a患者可能被多种原因排除;b接受手术患者的百分比;所有生化测量的缺失值百分比范围为5.0%~7.5%,除了sCD40L(17.5%)
2、基线数据比较:
医学期刊通常要求分组报告基线变量的分布特征,但在组间比较时可以不做假设检验,不标注P值,见表 2。因为,在大样本研究中,绝对差异的微小改变都可能造成统计学显著,而该差异本身并不一定具有临床意义。另一方面,在样本量较小的随机对照试验中,即便采用了严格的随机分组策略,仍会有个别变量无法达到组间可比,此时,如果预先对基线数据进行组间比较,作者可能会选择性不报告组间差异有统计学意义的变量,而导致选择性报告偏倚。
表2. 瑞舒伐他汀试验的研究对象基线特征(节选)
3、效应估计与置信区间:
医学论文在报告统计结果时不应仅依赖于P值,还应给出量化的效应估计结果,同时评价其测量误差或不确定性,如报告95%CI(如有必要,可根据显著性水平对置信系数进行调整。因为P值无法反映关于效应大小和估计精度的重要信息,只能说明统计学意义,而损失对临床意义的表达。
SAMPL指南建议研究者给出临床意义的最小界值,以帮助读者根据点估计及置信区间判断研究的临床意义。中华流行病学杂志则提出,当P值小于Ⅰ类错误概率时,应说“组间差异有统计学意义”,而不应说“组间有显著性差异”。例如,CKB在评价研究因素对结局的发生风险时,报告了危险比及其95%CI。
4、结果与方法一一对应:
医学论文应保证研究结果与方法一一对应,如:在方法中介绍了基线的统计描述与组间比较的具体方法,应在结果中对基线数据进行相应的描述与比较;在方法中说明了研究的主要分析方法,应在结果中对主要结局指标的估计或假设检验结果进行报告;在方法中提出了其他分析,包括敏感性分析、亚组分析等,应在结果中罗列出相应内容。
例如,瑞舒伐他汀试验在方法部分说明研究将对主要结局指标、次要结局指标分别进行组间比较,并对主要结局指标进行亚组分析;在结果部分则依次报告了相应结果。
5、伤害:
需要注意的是,无论是试验性研究还是观察性研究,都有可能存在伤害研究对象的风险。医学论文应如实报告研究过程中发生的伤害。
例如,噻托溴铵试验报告了试验组与对照组的不良事件发生情况:除了轻度不良事件(如口咽不适)外,其他不良事件、严重不良事件和死亡发生率的组间差异均无统计学意义。
6、P值的报告规范及保留小数位数:
不同医学期刊对P值的报告规范有不同要求。例如,NEJM规定,除非研究设计需要进行单侧检验,如非劣效性试验,其他报告的P值均应为双侧。P值大于0.01应报告小数点后两位;P值在0.01到0.001之间应报告小数点后三位;P值小于0.001应报告为P<0.001。在分层分析中,只需报告层间比较差异有统计学意义的P值,而不需报告所有层间两两比较的P值。
CMJ(Engl)规定,应使用大写斜体,并报告P值的精确值(如果P值在0.001~0.05之间时)。中华医学杂志规定,应尽可能给出具体的P值。中华流行病学杂志规定,应给出P值的实际数值,并保留3位小数。在使用不等式表示P值时,选用P>0.05、P<0.05和P<0.01即可满足需求,无须细分P<0.001或P<0.000 1。
可以看出,目前医学期刊对P值的报告尚无统一规范,导致一些研究仅给出P值与显著性水平之间的不等关系,而不体现量化的数值(如P>0.05);一些研究则盲目追求P值的精度,而保留不必要的小数位数(如P=0.0357)。
7、统计表规范:
统计表可以简明、高效地展示研究的关键信息。ICMJE对统计表的要求包括:依照正文的引用顺序连续编码,并确保每个表都在正文中被引用;设置简短清晰的表标题,使读者可以直接理解表中内容而无需阅读上下文;设置简短清晰的纵标目与横标目,并在脚注中解释标目涉及的细节问题;在脚注中解释所有表中的非标准缩写,同时明确变异特征,如标准差或标准误;如果表中用到其他来源的已发表或未发表的数据,应获取许可并充分引用,见表 2。
8、统计图规范:
统计表用于展示数据的精确数值,而统计图则提供对数据的全面评估。ICMJE对统计图的要求包括:依照正文的引用顺序连续编码,并确保每张图都在正文中被引用;如果图片已经发表,应获取许可并充分引用;如果存在符号、箭头、数字或字母用于标记图片,需在图例中逐一解释,见图 1。不同杂志还会对图片的格式和大小进行进一步要求。统计图表达方式的创新有助于读者快速掌握研究的核心结果。
9、图表内容不重复:
医学论文的图表内容不应重复,且不应在文中复述图表中的所有数据;应仅强调或总结最重要的结果。
例如,瑞舒伐他汀试验在结果部分依次用图表展示了基线、主要结局指标及亚组分析、共同主要结局指标和次要结局指标的相关内容。
总结
本文从研究设计、统计分析、结果报告3方面涉及的统计学问题入手,对医学期刊的统计报告条目及内容进行归纳,并借助试验性研究和观察性研究论文,对其进行逐条解读,以阐明医学论文统计报告应达到的基本要求。
本文发现,英文医学期刊普遍参考ICMJE提出的“医学期刊学术著作实施、报告、编辑和发表建议”及EQUATOR协作网发布的针对多种研究设计类型的报告声明等规范性文件,对于医学研究的统计报告已有详细规定。
而中文医学期刊通常采用编辑部自行刊发的对统计学方 法的要求,虽然对统计分析的格式和内容有具体说明,但并不充分,建议根据国际规范完善现行的统计报告要求。
需要注意的是,本文介绍的统计报告条目是不同研究设计类型均可能涉及的共性问题,当研究者在进行论文撰写时,应根据自身的研究设计类型、研究目的与学术期刊要求选择参考适用的条目,而非逐一报告。本文有望帮助研究者了解医学研究的统计报告要求,从而切实提高医学论文的统计报告质量。
内容来源:严若华,彭晓霞. 医学期刊统计报告要求的详述与解读[J]. 中华流行病学杂志, 2019, 40(1): 99-105.
更多阅读
点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址:http://www.mediecogroup.com/,查看全部统计教程。有问题快加小咖微信(xys2019ykh),拉你进入统计讨论群!