一、问题与数据
某肿瘤科大夫希望了解CT对某肿瘤的诊断准确性,他查阅了很多国内外文献,发现文献中各研究样本量都偏小,且对该方法的准确性评价结果不一,因此想通过Meta分析的方法对其准确性进行较为可靠的评价。通过对相关文献的检索,共获得以下数据:
表1 部分研究数据
变量意义及赋值情况如下:
表2 变量意义与赋值情况
二、对数据结构的分析
要进行诊断试验准确性的Meta分析,至少应当收集真阳性、假阳性、假阴性与真阴性的人数。然而,Meta分析并不是简单的进行数据的加权合并,因为各研究结果不同的原因通常不仅仅是因为样本量小造成的结果不稳定,还可能是因为研究的设计、执行等多方面的因素存在差异所导致,因此Meta分析的一个重要的任务便是对可能的因素进行探讨,找出文献结果不一的原因,这也是证据评价的过程。
表1中,是否是前瞻性研究(predesign)、金标准是否是同一个(samemth)、是否详细描述待评价试验(index)、是否详细描述金标准(reftest)和是否详细描述待评价人群(subject)是本研究中研究者认为可能的影响因素。
三、Stata分析与结果解读
1. 安装分析包
一般认为,诊断试验准确性的数据异质性比较明显,因此推荐使用随机效应模型进行分析。Stata中有专门针对诊断试验准确性Meta分析的分析包midas和metandi,均是采用两水平的随机效应模型进行分析。由于后者不支持meta回归功能,因此本文仅介绍midas包的使用。
在command窗口,依次输入以下命令,安装必需的分析包:
ssc install midas
ssc install mylabels
2. 数据录入
在Stata窗口点击数据编辑按钮,弹出数据编辑窗口。
在变量名位置双击,弹出新建变量窗口。
如果变量是字符型,则变量类型(Variable type)选择str,是数值型则选择double(小数)或int(整数)。设定好变量名后,从excel中将数据复制到新建变量窗口中即可,部分数据如下图。
3. 合并点值
点值:点值指的是灵敏度、特异度、阳性似然比、阴性似然比和诊断比值比。一般诊断试验判断阳性、阴性的标准变化时,其准确性也会发生变化,因此点值的合并适用于各原始数据都来自于同一阈值的情况。
在command窗口中输入以下命令:
midas tp fp fn tn, res(sum)
回车后,结果界面会输出上述五个指标的合并值及置信区间。
4. 绘制森林图
森林图可以直观地展示纳入的各研究的结果差异情况。
command窗口中输入以下命令:
midas tp fp fn tn, id(author year) ms(0.75) ford fors bfor(dss)
回车后,Stata输出图形如下:
命令中的0.75是设定森林图中黑点大小的,读者可以自己换做其他数值。
从森林图中可以看出,灵敏度的Q检验P<0.01,说明纳入研究间的异质性有统计学意义,I2统计量为78.58%,说明异质性占比较大(I2超过50%即认为异质性较为明显)。同样特异度的Q检验P=0.01,说明纳入研究间的异质性有统计学意义,而I2统计量为43.57%,说明有轻度的异质性。
(注:Q检验用来从统计学角度说明异质性是否存在,而I2统计量用来衡量异质性的大小,一般Q检验的P值越小,I2统计量越大。)除了运用统计学方法对异质性进行描述外,作者还可以直接通过森林图各数值的排列整齐情况进行定性的判断,该方法相对主观,可以与统计学方法相结合。
另外,Stata输出的图形可以进入编辑模式进行详细设置(如插入标题,调节字体等)。
5. 合并ROC曲线
当各研究诊断试验阳性、阴性判断标准存在差异时(判断阈值不同),对点值直接合并来衡量诊断试验的准确性大小并不合适,此时可以计算ROC曲线下面积(AUC)来衡量准确性在所有可能阈值下的平均水平。但在实际情况下,各原始研究有时不会明确告知其采用的判断阈值,故阈值是否一致有时很难判断,即便是各研究明确说明采用了某同一阈值,由于实际操作时的客观或主观差异,实际阈值也可能不同。因此ROC曲线还可以用来判断各纳入研究实际阈值是否存在明显差异(是否存在明显阈值效应)。
所谓阈值,是指判断诊断结果阳性还是阴性的标准。标准不同时,实验的灵敏度和特异度会发生变化。通常标准越宽松,灵敏度越高,特异度越低,(1-特异度)则越高。所以,当综合考察纳入的各个诊断试验原始研究时,如果随着灵敏度增大,1-特异度也增大,可以提示这些诊断试验原始研究采用了多个标准。存在多个标准则称为存在阈值效应。
在command窗口中输入以下命令:
midas tp fp fn tn, plot sroc(both)
首先从ROC图来看,灵敏度的变异程度更大,而特异度要小一些。森林图及I2统计量也能说明此特征。另外ROC图中,各数据点呈现“肩臂”状,提示纳入的各研究可能存在阈值效应。所谓“肩臂”状,是指灵敏度随着(1-特异度)增大而增大,各点呈曲线趋势,类似于人的肩膀。Stata结果显示,曲线下面积(AUC)大小为0.88。
需要注意的是,如果从纳入的研究中无法明确得知各研究的判断阈值是否不同,一般点值和ROC曲线都要进行合并。此时的ROC曲线用于探索是否存在此种效应,以确定合并的点值所代表的意义,并给出整体上的准确性衡量指标(AUC)。如果可以明确得知存在阈值效应,那么合并的点值仅是各纳入研究所采用的阈值下灵敏度、特异度或其他点值指标的平均值,此时如果通过点值进行两种诊断试验准确性的比较就会存在可比性的问题。
6. Meta回归
Meta回归是用来探究异质性来源的重要手段。Stata可对分类型或连续型自变量进行单因素的回归分析(实际上就是亚组分析)。
command中输入如下命令:
midas tp fp fn tn, reg(prodesign samemth index reftest subject)
reg后的括号中为要回归的自变量。Stata会分别给出灵敏度和特异度的单因素回归结果:
结果给出的是每个自变量所分成的亚组单独合并的结果,以及亚组间差异的统计学检验P值。
同时给出图形:
从结果看出,对于灵敏度,仅有subject变量有统计学意义(P=0.01),说明对待评价人群特征描述详细的和不详细的研究得到的灵敏度结果存在统计学的显著不同,而对于特异度,五个自变量均有统计学意义。
7. 发表偏倚评价
已发表的研究结果可能和未能发表的研究结果存在差异,可以对此进行发表偏倚的检验。在command窗口输入以下命令:
midas tp fp fn tn, pubbias
Stata会给出漏斗图,且不对称检验结果P<0.01,说明发表偏倚检验结果显著。
注意,对于诊断试验准确性的Meta分析,发表偏倚的检测方法仅限于Deek’s法,其他方法假阳性率太高(如干预类研究常用的Egger、Begg、Harbord和 Peters检验)。
四、结果汇总
CT诊断某肿瘤灵敏度合并值为0.73,95%CI(0.64-0.80),特异度合并值为0.85,95%CI(0.82-0.88),AUC为0.88,95%CI(0.85-0.91)。
五、总结与拓展
1. 诊断试验准确性的Meta分析过程与其他Meta分析过程一致,但具体的分析模型存在明显不同。
2. 诊断试验准确性的Meta分析模型比较多,相应软件也比较多,各有优缺点。Meta-disc软件操作非常简单,但其功能也较为有限。Stata中midas的meta回归无法同时调整多个变量,若要实现此功能,需使用SAS软件nlmixed过程,具体程序可以参考Cochrane官网发布的诊断试验Meta分析指南第十章(http://methods.cochrane.org/sdt/handbook-dta-reviews)。要进行高质量的诊断试验准确性Meta分析,推荐阅读该Cochrane指南。
(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)
Meta分析精彩回顾
2. 诊断试验准确性的Meta分析怎么做?(Meta-disc软件)
研究进展精彩回顾
关注医咖会,一起学习研究方法吧~
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。诚邀各位伙伴加入我们创作内容,请和小咖联系,和大家分享你喜爱的临床研究以及有用的研究方法学知识。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。