为了深入分析诊断结果,你应该了解下阳性预测值!
拿到一个人的阳性诊断结果,这个人是不是一定患病了?回答当然为“不是”。一个诊断试验会有假阳性和假阴性,假阳性即实际未患病的人,被诊断为阳性的概率。说到假阳性和假阴性(灵敏度和特异度)时,我们是在评价诊断试验,也就是已经知道了目标人群的患病状态,来评估一个诊断试验的准确性。
然而,实际临床实践中,我们事先并不知道,而是需要根据一个诊断结果来判断目标个体是否真正患病。换句话说,临床医生拿到一个诊断结果时,应当考虑:诊断阳性结果的人,有多大的可能是真正患病的人?
为了回答这个问题,我们需要了解阳性预测值(positive predictive value, PPV),即诊断结果阳性的人群中,真正患病的人的比例。
一、什么是阳性预测值
一项诊断试验有1000位受试者,其中100人有病,900人没病。经诊断试验检查,180人结果阳性,820人结果阴性(表1)。
表1. 诊断试验分布情况举例
这个诊断试验中,180人结果阳性,但真正患病的人只有80人,即阳性预测值为:
阳性预测值=真正患病的人/诊断结果阳性的人=80/(80+100)×100%≈44%
同样地, “如果诊断试验的结果是阴性,那么有多大的可能没患病?”这就是与阳性预测值相对应的概念:阴性预测值(negative predictive value, NPV),即诊断结果阴性的患者中,真正不患病的人的比例。仍用上面的例子,该诊断试验中有820人为阴性,其中只有800人没病,即阴性预测值为:
阴性性预测值=真正不患病的人/诊断结果阴性的人=800/(800+20)×100%≈98%
阳性预测值与阴性预测值的性质相反,但原理类似,由于篇幅的限制,本文重点介绍阳性预测值的特点。
二、阳性预测值与患病率的关系
假设有10000例受试者,他们患有两种疾病,一种疾病的患病率为1%,另一种患病率为5%。我们同时使用灵敏度为99%,特异度为95%的诊断试验对这些受试者进行诊断(表2)。以第一种疾病为例,患病率为1%,那么10000位受试者中有100人患病。灵敏度为99%,该诊断试验可以检测出100例患者中的99位;同时,特异度为95%,该诊断试验可以诊断出9900例非患者中的9405位,从而计算出假阳性患者数为495例。因此,该诊断试验的阳性预测值为99/(99+495)≈17%。
根据同样的计算方法,我们可以得出针对第二种患病率为5%的疾病,阳性预测值为51%。
表2. 阳性预测值与患病率的关系
由此可见,当诊断试验的特异度和灵敏度不变时,人群患病率越高,阳性预测值越高。并且,在患病率较低时,阳性预测值随患病率增大而上升的趋势更快(图1)。
图1. 95%灵敏度与95%特异度诊断试验中患病率与阳性预测值的关系
三、为什么要关注阳性预测值与患病率的关系?
正如上文所述,患病率越高,阳性预测值越高。如果我们在高危人群中进行诊断试验,我们能够得到更为高效的结果,避免人力、物力的浪费。同时,诊断试验在临床应用中,我们也需要根据患病率来深入分析结果。
以产检羊水α-fetoprotein(AFP)水平判断脊柱裂为例,羊水AFP在孕妇中的分布如图2。这一指标为双峰分布,正常妊娠集中在图的左侧,异常妊娠集中在图的右侧。但是,和其他双峰分布指标类似,羊水AFP的分布也存在重叠,很难分辨羊水AFP在重叠部分(C1-C2)的婴儿是否患有脊柱裂。
图2. 正常妊娠和脊柱裂妊娠中羊水AFP的分布
既往有研究回顾分析了10000名孕妇,并将她们分为出现过脊柱裂妊娠的高危孕妇和未出现过脊柱裂妊娠的低危孕妇。因为出现过脊柱裂妊娠的妇女更有可能再次分娩脊柱裂患儿,所以该研究将这些女性定义为高危孕妇。而低危孕妇多是因为其他疾病接受羊膜穿刺术的孕妇,如唐氏综合症等,没有脊柱裂妊娠风险但是有羊水AFP指标。该10000名孕妇的具体情况如表3。
表3. 根据羊水AFP水平分别判断高危和低危孕妇出现脊柱裂妊娠的情况
根据表3我们可以看出,在同样的试验条件下,低危孕妇的阳性预测值远低于高危孕妇。即使低危孕妇的AFP试验结果阳性,她们出现脊柱裂妊娠的可能性也很小。因此,我们在临床上拿到诊断试验结果时,应根据其人群患病率,综合判断结果的真实性。
四、阳性预测值与特异度的关系
以一项有1000位受试者的诊断试验为例,该试验人群患病率为20%,有200人患病,800人没病。灵敏度为50%,特异度也为50%,计算得到阳性预测值为20%,如图3。
图3. 阳性预测值与特异度的关系模拟-1
大家都知道疾病在人群中的患病率在很多时候都不能改变。那么,如果我们想要提高诊断试验的阳性预测值,我们应该怎么做呢?
根据上述例子,患病率和特异度不变,仅将灵敏度增加到90%会有什么样的变化呢(图4)?
图4. 阳性预测值与特异度的关系模拟-2
我们发现,仅改变灵敏度,阳性预测值从20%增加到31%。
那么,患病率和灵敏度不变,仅将特异度增加到90%又会有什么样的变化呢(图5)?
图5. 阳性预测值与特异度的关系模拟-3
可见,仅改变特异度,阳性预测值从20%增加到56%。在相同情况下,提高特异度比提高灵敏度更有助于提高阳性预测值。
五、为什么提高特异度,更有助于改善阳性预测值呢?
一般情况下,人群患病率不会太高。而当患病率比较低时,整个人群中患者数很少,即使提高灵敏度也不会大幅增加真阳性人数,所以对阳性预测值的改变较小。同时,非患者数很多,提高特异度会大幅减少假阳性人数,所以对阳性预测值的改变较大。
举一个相对极端的例子。假设一个诊断试验有10000名受试者,人群患病率为10%,灵敏度为100%。当我们将特异度从70%增加到95%时,我们可以看到阳性预测值从27%增加到69%,如表4。
表4. 阳性预测值与特异度的关系
六、对医院内患者进行诊断时,如何定义“患病率”?
实际上,对医院内患者进行的诊断,不同于对一般人群的筛查,因为这时候两个人群的“患病率”是不同的。临床医生考虑一个诊断的阳性预测值时,“患病率”不是人群中真实的患病率,而应该是本院内接受这个诊断的所有人中,患病人数的比例。
检测羊水AFP水平诊断脊柱裂妊娠时,对于一个心血管科见长的医院,其待检人群中,容易发生脊柱裂妊娠的高危孕妇的“患病率”是较低的,该医院收治的孕妇大多数可能是低危孕妇;而对于一个妇产科见长的医院,其待检人群中高危孕妇的“患病率”是较高的,因为该医院收治的孕妇,已经通过其它医院的“初筛”,收治的更可能是高危孕妇。
因此,假设用同样的检测技术、同样的检测人员、同样的医生,对于检测羊水AFP水平诊断脊柱裂妊娠,在两家医院得到的阳性预测值、阴性预测值是不同的。
可见,诊断试验的阳性预测值与灵敏度、特异度和患病率都有关。了解阳性预测值,有助于我们深入分析临床结果,了解患者的真实情况。
精彩回顾
医咖会微信:medieco-ykh
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群,和其他小伙伴们一起交流学习吧。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。