查看原文
其他

多图示例:试验结果的图表该如何展示数据?

2017-07-18 赵桐 医咖会

在精心设计并辛苦完成试验后,完美而专业地展示你的结果与数据,才能使你的研究获得应有的价值,为你的全部工作画上完美的句号。


在此,根据《Journal of the American College of Cardiology》上发表的文章《Making Sense of Statistics in Clinical Trial Reports: Part 1 of a 4-Part Series on Statistics for Clinical Trials》,我们精心准备了一个系列,来全面而具体地说明各种类型数据与结果的正确总结与展示方法。


通常来说,试验成果的展示,至少应该包括3个部分的内容:基线(Baseline)数据、结局数据及试验信息(Trial profile)。而在结果数据部分,你的数据很有可能包含3种类型,即二分类频数资料、计量资料以及时间-事件数据。


在该系列的第一篇文章中,我们将介绍基线数据、试验信息以及结局数据中二分类频数资料的展示方法,而在本系列的第二、三篇文章中将分别介绍结局数据中计量资料以及时间-事件数据的展示方法和注意事项。

一、基线(Baseline)数据展示

基线(Baseline)数据是所有类型的试验所必须要提供和展示的信息,具有描述研究所纳入的样本特征、标示研究所关注的变量等重要作用。


基线(Baseline)数据的展示多以表格的方式进行,以各种变量的名称为表格每行的标题,而不同的组名为表格每列的标题,需要涵盖的变量包括人口学资料、可能影响结局事件的变量以及相关的医疗记录,每列提供一个组别的数据,在RCT中没有必要提供合计数据或进行组间差异比较


下方提供一个研究的表格作为范本,数据的展示方法、可能遇到的情况及相关注意事项标注在相应位置(表1)。

(点击图片可查看清晰大图)

二、试验信息(Trial profile)展示

试验信息(Trial profile)也是需要展示的部分,用以清晰直观的描述在试验进程中各个时间点的操作,以及在各个操作过后各组人数的变化及原因,方便读者对研究有直观的了解。


试验信息(Trial profile)多以流程图的形式进行展示,按照时间和操作顺序排列,清晰列出每一部分的人数,需要展示的重要操作节点至少应包括随机分组、完成随访及数据分析


下图展示的是一个研究中所提供的试验信息(Trial profile)图,作为示例范本供参考,可行的展示方式多种多样,样式不用局限于示例,但主要信息要清晰地提供出来(图1)。

(点击图片可查看清晰大图)

三、结果数据展示:二分类频数资料

作为系列中的第一篇文章,本文要介绍的内容是3种结局数据类型中的一种,即二分类频数资料的展示方法,另外两种类型的结局数据:计量资料以及时间-事件数据的展示方法和注意事项,将在本系列的第二、三篇文章中分别进行介绍。


二分类频数资料在试验研究中经常被涉及,例如:性别、各种事件发生与否等,是结果展示中的重要组成部分,主要结局数据表格和副作用表格均包含大量二分类资料。


在主要结局数据表格中,与基线(Baseline)数据形式类似,同样是以各种变量或事件的名称作为表格每行的标题,而不同的组名为表格每列的标题,不同之处在于需要增加两列,分别报告效应指标的大小和P


值得注意的是,在事件的展示中,许多研究的主要终点为复合终点,此时需同时在下方依次提供各个事件单独发生的数量与百分比。


效应指标需要包括点估计值与区间估计。在这里,强调一下区间估计的重要性,并解释一下点估计值与区间估计的关系:点估计可以得到一个具体的数值,表示结果的大小,而这一结果存在很大程度的不确定性,区间估计即可表达这种不确定性,通常用95%置信区间(Confidence Interval)。


95%CI的含义是重复多次研究,其中95%的研究的95%CI包含真实值。之所以选择95%,主要是为保证研究的一致性,方便与他人研究进行比较,因为大部分的研究都选择了95%这一数值;同时,与通常设定的显著性水平0.05保持一致,方便与P<0.05进行关联。样本量越大,这种不确定性越小,置信区间越窄,点估计值估计越精确。因此,单独报告点估计值是不够严谨的,需要同时报告区间估计的结果。


下图同样提供一个研究的表格作为范本,注意事项标注在旁(表2)。

(点击图片可查看清晰大图)

 

对于研究的效应分析可以用到多种不同的效应指标,表3总结了各个效应指标的概念及计算方法。通常,两个组别时,先列好数据的四格表,计算发生率,再进行相应的效应指标计算。

(点击图片可查看清晰大图)


效应指标包括绝对数(如危险度差(Risk difference, RD/Difference in percentages)、需治疗人数(Number needed to treat, NNT)等)和相对数(如相对危险度(Relative risk, RR)、相对危险降低(Relative risk reduction, RRR)和比值比(Odds ratio, Relative odds, OR)等)两类。相对数指标具有统计学优点,且对于不同类型的人群的一致性较好,结果易于推广,而绝对数指标则更有实际价值和意义。


(详见:总结:那些可以评价干预措施效果的指标们

 

此外,除了要报告详细记录和主要结局指标外,安全性信息也要进行报告,安全性表格也多为二分类资料。


与主要结局事件表格类似,同样是以各种变量或事件的名称为表格每行的标题,而不同的组别为表格每列的标题,不同之处在于只需要进行组间差异性检验,报告P值的大小。


下图即为一个研究中所展示的安全性表格,作为内容与样式的参考(表4)。

(点击图片可查看清晰大图)


本系列的第一篇内容到此结束,关于结局数据3种形式中的另外两种类型:计量数据以及时间-事件数据的展示方法和注意事项,将在本系列后续两篇文章中依次呈现,请继续关注。


参考文献

1. J Am Coll Cardiol 66(22):2536–2549

2. N Engl J Med 2014;371:993–1004. 

3. N Engl J Med 2013;369:1317–26. 

4. Lancet 2014;384:1849–58. 

5. N Engl J Med 2013;368:1303–13. 


相关阅读

1. 论文中统计描述要注意的诸多细节,听听杂志主编怎么说!

2. Meta分析的几种图形示例和绘图建议

3. 论文统计图表常见的那些错,附大量实例!

医咖会微信:medieco-ykh

关注医咖会,涨姿势!


我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。


点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存