疾病预测模型构建好了,临床实践中如何应用和解释呢?
Heart最近发表了一篇综述《Graphics and statistics for cardiology: clinical prediction rules》[1],作者以心血管风险评分(CVD risk factor)为例探讨了如何借助统计图优势构建疾病的预测模型,并提出了6个重要步骤。(表1)
表1. 疾病预测模型的构建
我们聊到风险评分模型的构建和评价,模型都建好了,是不是就可以马上就用了?答案是还不够。事实上,我们得到的是一个数学公式,总不能让临床大夫们都恶补一堆模型什么的,再人手拿一个科学计算器狂按吧。所以风险评分模型还必须方便应用和解释。
常见的风险评分应用一般有三种形式:
第一种,热图(heatmap),例如来自欧洲SCORE项目的10年致死性CVD风险评分(图1)[2]。图1中,风险评分中关键变量——年龄、性别、收缩压、胆固醇以及是否吸烟被组合成热图,并且给出了每种色块的风险区间,颜色越深代表致死性CVD的患病风险越高。大家可以根据自身情况快速锁定色块,并且获知自己的患病风险。
图1. 高风险人群的致死性CVD10年风险预测(基于总胆固醇)
第二种,评分系统(points system),例如我们所熟知的Framingham风险评分(图2)[3]。图2是将复杂的数学模型转化成一个评分系统,不同影响因素不同水平均有相应的评分,并且评分都可以相加和求和。总分越高,对应的患病风险越高。
图2. Framingham风险评分
第三种,列线图(nomogram),例如一项预测乳腺癌患者淋巴结转移可能性的研究(图3)[4]。图3中Points提供每一个影响因素的评分尺度,例如肿瘤大小(MUCGRADE)Ⅰ为0分,Ⅱ为5分…将各影响因素的评分相加,查Total Points可以对应知道淋巴结转移的概率大小。
图3. 乳腺癌患者淋巴结转移风险预测
但是,上述的三种方式仅给出粗略的结果,现在更多是使用计算机应用,例如ASSIGN提供的网页工具(http://www.assign-score.com/estimate-the-risk/),勾选或输入自己的实际情况,立马就会得到你的患病风险评分(图4)。
图4. ASSIGN评分
解决了怎么通过风险评分计算患病风险,我们再来看看实际应用。一个风险评分要想真的应用,首先必须有一个阈值(有时候可能是多个阈值),即高于这个阈值,需要进行临床预防性干预。
如何看到设定不同阈值带来的效应,一个比较好用的方法是通过How-often-that-high图例如,图4展示了使用SHHEC数据获得的ASSIGN评分分布情况,横坐标是发生某结局事件的风险,左侧和右侧纵坐标分别是超过阈值的人群数和相应比例。从图5中能够快速方便的了解到基于不同的阈值,使用他汀类药物预防性治疗CVD预期结果。
图5. How-often-that-high图
比如,将阈值设定在10%,即风险评分≥10%,总人群中将会有超过1/5的女性需要他汀类药物治疗,但是相应的医疗负担将会增加至三倍。当然,如果把阈值设定在20%,相应需要治疗人数明显减少。因此,阈值的设定需要综合考虑治疗水平和治疗负担(绝对是一个技术活儿~~~)。例如,如果某种疾病治疗水平有限,预后较差,那么阈值定的太低,不仅不会改善人群健康,反而会增加人群经济负担。
当然,风险评分在应用时也存在局限性。风险评分是基于现有的数据资料拟合的预测模型,用以预测个体是否患有某种疾病的可能性。问题来了,随着时间的推移,人群是在不断变化的,使用某一个时间段人群资料建立的风险评分,还适不适合若干年后人群的疾病预测呢?显而易见,答案是不确定的。
例如,ASSIGN评分是基于SHHEC1984-1995年研究数据建立的,放到2017年的今天,可能就不太适合芬兰当地的人群疾病预测了。因此,风险评分并不是一成不变的,也需要根据实际情况适时地更新。
此外,风险评分是基于人群数据获得的预测模型,也就是说模型中所纳入的影响因素是对大多数人适用的,但是具体到个人,可能会出现不适用的情况。所以断不可照本宣科,一味死磕风险评分,应结合实际情况和风险评分综合考虑疾病的预测。
参考文献
1. Heart. 2017; 103:538-45.
2. Eur Heart J. 2003; 24:987-1003.
3. Stat Med. 2004; 23:1631-60.
4. Ann Surg Oncol. 2003;10:1140-51.
统计教程精彩回顾
关注医咖会,一起学习统计学!
有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。