SPSS操作：诊断试验的结局是连续变量，如何评价可重复性？

原创 2017-03-29 李侗桐 医咖会

在前面的讲解中，我们已经介绍了符合率和Kappa分析，了解了结局指标是二分类变量（阴性、阳性）诊断试验可重复性的评价方法。

那么，如果诊断试验的结局是连续变量，我们应该如何做呢？

组内相关系数（intraclass correlation efficient, ICC）常用于评价具有确定亲属关系（如双胞胎、兄弟姐妹等）的个体间某种定量属性的相似程度，也应用于评价不同测定方法或评定者对同一定量测量结果的可重复性或一致性。在诊断试验中，我们也常常使用ICC指标评价不同研究者对同一组试验结果进行诊断的可重复性。

一、问题与数据

现假设有2位研究者使用相同的诊断试验分别测量25位受试者的血糖水平。部分原始数据见表1。

表1 部分原始数据

当然，为了评价该诊断试验的可重复性，我们可以设置一个诊断截点，人为地将血糖水平转换成二分类变量，再运用之前讲过的Kappa分析进行判断。但是，将连续变量转换成二分类变量会丢失信息。那我们应该如何做呢？

接下来，我们将向大家介绍诊断试验组内相关系数的分析方法，以SPSS统计软件为例。

二、SPSS分析方法

1. 数据录入SPSS

2. 选择Analyze→ Scale→ Reliability Analysis

3. 选项设置

（1）主对话框设置

我们将待观测的两组数据分别放入Items框中。

（2）Statistics设置

点击Statistics，选中Intraclass correlation coefficient。

Model的设置：

组内相关系数的计算有三种模型，分别是One-way random、Two-way random和Two-way mixed。其中，One-way random模型用于检验每一个受试者的均值是否完全相等，不应用于评价诊断试验的可重复性。而Two-way random模型与Two-way mixed模型相似，它们同时考虑了受试者和研究者的影响，在理论上都可以用于诊断试验可重复性的评价。但是这两种模型结果的推论范围存在差异。Two-way random模型的结果可以推论到所有相似、可能的研究者；而Two-way mixed模型的结果仅限于给定的研究者，不能推论其他。

因此，诊断试验可重复性评价应选择Two-way random模型。

评价类型的设置：

Two-way random模型有absolute agreement和consistency两种计算类型。其中，absolute agreement考虑研究者的系统误差，可用于测量不同研究者是否给予受试者相同的绝对值。而consistency并不考虑研究者的系统误差，仅适用于评价不同研究者之间的评分是否高度相关。

具体来说，如果我们现有2、4、6和4、6、8两组结果，绝对值并不相等，用absolute agreement计算ICC值仅为0.67（只有4、6两个绝对值是相同的）；但是这两组结果却高度相关，用consistency计算ICC值为1（这两组数字高度相关）。

针对诊断试验的可重复性评价来说，我们希望不同研究者得到一致的结果，而不是仅仅是“高度相关”。因此，我们应该选择absolute agreement计算类型。

→ Continue→ 回到主界面→ OK

三、结果解读

SPSS组内相关系数的计算结果有3个表格，我们仅需要重点关注其中一个，如下：

这个表给出了组内相关系数的两种估计结果，Single Measures和Average Measures。这两种估计结果有什么区别呢？Single Measures的分析单位是每个研究者的结果，可以估计单个研究者的情况。而Average Measures的分析单位是多个研究者研究结果的均值，应用范围受到局限。

因此，我们依据Single Measures的估计结果判断诊断试验可重复性评价的组内相关系数，即ICC=0.987（P<0.001）。

四、撰写结论

一般来说，ICC值介于0到1之间。就诊断试验而言，如果ICC值小于0.4，我们认为诊断试验的可重复性较差；如果ICC值大于0.75，那么诊断试验的可重复性较好。

综上，该血糖水平诊断试验的ICC值为0.987（P<0.001），可重复性较好。

推荐阅读

1. Mcgraw K O, Wong S P. Forming inferences about some intraclass correlation coefficients.[J]. Psychological Methods, 1996, 1(4):390-390.

2. Shrout P E, Fleiss J L. Intraclass correlations: uses in assessing rater reliability.[J]. Psychological Bulletin, 1979, 86(2):420.

精彩回顾

1. 听说过诊断试验的灵敏度、特异度，那你听过符合率吗？

2. 诊断试验之Kappa值该怎么算？

4. 多图实例：教你绘制ROC曲线

5. 了解ROC曲线下面积，有这篇文章就够了

医咖会微信：medieco-ykh

关注医咖会，一起学习统计学~

我们建了一个微信群，有临床研究设计或统计学方面的难题？快加小咖个人微信（xys2016ykf），拉你进群和其他小伙伴们一起交流学习。诚邀各位伙伴加入我们创作内容，请和小咖联系，和大家分享你喜爱的临床研究以及有用的研究方法学知识。

点击左下角“阅读原文”，看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单，点击“直接搜索”，查找你想了解的内容。

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！