SPSS操作:多个相关样本的非参数检验(Cochran's Q检验)
一、问题与数据
某康复科医生拟评价康复训练对卒中后患者体能恢复的效果。患者分别在开始康复、康复3个月和康复6个月时进行体能测试。为了保证一致性,三次体能测试内容是一样的,体能测试的结果为“通过”和“不通过”。该医生想知道卒中后患者体能测试的结果为“通过”的比例是否一直上升。
该研究随机选取了63例进行康复训练的卒中后患者,并收集了所有研究对象的开始康复时的体能测试结果 (initial_fitness_test),康复3个月时的体能测试结果 (month3_fitness_test)和康复6个月时的体能测试结果 (final_fitness_test)。结果均为“通过(Passed)”和“不通过(Failed)”的形式(分别赋值为1和2)。部分数据如下图。
其中,Individual scores for each paticipant列出了每一个研究对象的情况,而Total count data (frequencies)则是对相同情况研究对象的数据进行了汇总。
二、对问题的分析
要检验三组或多组相关样本中,分类变量是否存在差异,可以使用Cochran's Q 检验,但需要考虑以下4个假设。
假设1:结局变量为二分类,且两类之间互斥。互斥是指一个研究对象只能在一个分组中,不可能同时出现在两个组中。例如 “安全”和“不安全”,“及格”和“不及格”等。(当变量为连续变量或有序分类变量时,可参考医咖会之前推送过的Friedman检验)
假设2:分组变量包含3个及以上分类,且各组之间相关。(当分组变量只有2个分类时,可使用McNemar’s检验)
假设3:样本是来自于研究人群的随机样本。然而实际中,样本并非都是随机样本。
假设4:样本量足够。当样本量n≥4且nk≥24(k为分组变量数)时,可以采用Cochran's Q检验;否则采用“精确” Cochran's Q检验。
本研究中,结局变量有两个分组且互斥(“通过”和“不通过”),符合假设1;分组变量包含3个分类(开始康复、康复3个月和康复6个月时),各组之间相关,符合假设2;研究对象是随机选取,符合假设3。
那么应该如何检验假设4,并进行比较呢?
三、SPSS操作
3.1 检验假设4:样本量足够
1. 转换数据格式
如果原始数据格式是Total count data (frequencies),则可以跳过此步。如果原始数据格式是Individual scores for each paticipant,则需要将数据转换成Total count data (frequencies)格式。
在主界面点击Data→Aggregate,出现Aggregate Data对话框。将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Break Variable(s)框中。
点击下方Number of cases框,并在Name框中填入“freq”。在Save下方勾选Create a new dataset containing only the aggregated variables,并在Dataset name框中填入新数据集的名字(例如“cochran_q_freq”)。
点击OK,产生新数据集。在新数据集中,可以看到新变量“freq”,代表每一种自变量组合的频数。
2. 数据加权
使用Total count data (frequencies)格式数据,并在主界面点击Data→Weight Cases,弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗口。将freq变量放入Frequency Variable栏,点击OK。
3. 计算样本量
本研究的总样本数N=63,但计算Cochran's Q 检验的样本量时,需要减去三次测试结果都一致的样本数。如下突出显示所示,全部为“Failed”有20例,全部为“Passed”有7例,所以三次测试结果都一致的样本数为20+7=27,Cochran's Q 检验的样本量n=63-27=36。
其次,需要确定nk的大小。由于本研究共有三个分组,所以k=3,nk=36*3=108。
综上,n≥4且nk≥24,符合假设4。
3.2 计算比例
在主界面点击Descriptive Statistics→Frequencies,在Frequencies对话框中,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Variable(s):框中,点击OK。
3.3 符合假设4的Cochran's Q检验
在主界面点击Analyze→Nonparametric Tests→Related Samples,出现Nonparametric Tests: Two or More Related Samples对话框。确认在What is your objective?区域勾选了Automatically compare observed data to hypothesized。
点击Fields,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Fields框中。
点击Settings→Customize tests,勾选Cochran's Q (k samples)。
点击Define Success,在Cochran's Q: Define Success对话框中,点击Combine values into success category,在Success框中填入1(这里是“成功”对应的编码,本例中即为通过体能测试,“Passed”对应的是1,所以这里填“1”)。
点击OK→Run,输出结果。
3.4 不符合假设4的“精确”Cochran's Q检验
当不符合假设4时,需要使用“精确”Cochran's Q检验。在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→K Related Samples,出现Tests for Several Related Samples对话框。
将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Variables框中。在Test Type 下方去掉Friedman,然后勾选Cochran's Q。(如果数据符合假设4,则此时点击OK,结果与3.3部分的操作结果一致)
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
3.5 “精确”Cochran's Q检验后的两两比较
对于符合假设4的Cochran's Q检验(3.3部分),事后的两两比较将在结果解释部分展示(4.2部分)。
对于不符合假设4的“精确”Cochran's Q检验(3.4部分)事后的两两比较,可采用经Bonferroni法校正的多重McNemar检验。
在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Related Samples。在Two-Related-Samples Tests对话框中,依次选择两两比较的变量,分别将变量initial_fitness_test和month3_fitness_test、变量initial_fitness_test和final_fitness_test、变量month3_fitness_test和final_fitness_test选入右侧Test Pairs中。 去掉Test Type下方的Wilcoxon,勾选McNemar。
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
四、结果解释
4.1 统计描述
3.2部分的操作后,得到的频数结果见下图。康复开始、康复3个月和康复6个月时培的体能测试的通过率分别为22.2%、44.4% 和 60.3%。
4.2 符合假设4的Cochran's Q检验及事后两两比较
3.3部分的操作后,得到Cochran's Q检验的结果如下图。
上图中,第一列(Null Hypothesis)是本研究的零假设。第二列(Test)显示本研究的假设检验方法,即Cochran's Q检验。第三列(Sig.)是假设检验的统计结果,即P值。第四列(Decision)是根据假设检验做出的判断,即判断是否拒绝零假设。
本研究Cochran's Q检验的P<0.001,拒绝零假设。即开始康复、康复3个月和康复6个月时,研究对象体能测试结果的差异具有统计学意义。
双击该表,SPSS会自动弹出Model Viewer界面,帮助我们进一步了解Hypothesis Test Summary表的结果。
Cochran's Q检验统计量服从自由度为k-1的 χ2分布。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222, P<0.001。
在该视图下方的View的下拉选项框中,选择“Pairwise Comparisons”,可以得到两两比较的结果。两两比较的方法为Dunn’s检验(经Bonferroni法校正)。
在Pairwise Comparisons图中(此处略),连接线代表两两比较的结果,黑色连接线代表两组间差异无统计学意义,橘黄色连接线代表两组差异具有统计学意义。
下方的表格(如下图)给出了更多的信息:比较的组别、统计量、标准误、标准化的统计量(=统计量/标准误)、P值和调整后的P值。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Sig.一列),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
另外,SPSS也提供了调整后P值(上图中Adj. Sig.一列),其思想还是采用Bonferroni法调整α水平。该列是将原始P值乘以比较次数得到,因此可以直接和0.05比较,小于0.05则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
4.3 不符合假设4的“精确”Cochran's Q检验
3.4部分的操作中,既可以得到Cochran's Q检验的结果,也可以得到“精确”Cochran's Q检验的结果(取决于是否选择Exact选项)。
结果如下图。在Test Statistics表格中,左侧是Cochran's Q检验结果,右侧是“精确”Cochran's Q检验结果。
如果数据符合假设4,则Cochran's Q检验统计量服从自由度为k-1的 χ2分布。左侧表格中的P值为“Asymp. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222,P<0.001。
如果数据不符合假设4,则右侧表格中的P值为“Exact. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为Cochran's Q = 24.222, P<0.001。
4.4 “精确”Cochran's Q检验后的两两比较
当不满足假设4时,3.5部分的操作可得到经Bonferroni法校正的多重McNemar检验的结果。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Exact Sig. (2-tailed)一行),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
五、撰写结论
1. 符合假设4时(即样本量足够)
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义,χ2 = 24.222, P<0.001。
采用Dunn’s检验(经Bonferroni法校正)进行事后的两两比较,康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(调整后P=0.124)。
2. 不符合假设4时
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义, Cochran's Q = 24.222, P<0.001。
运用“精确”McNemar’s检验进行事后的两两比较(经Bonferroni法校正的α=0.0167)。康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(P=0.031)。
(如果想使用文中数据进行练习,请使用电脑打开以下网址:
http://www.mediecogroup.com/method_article_detail/219/
点击左侧“数据下载”免费下载原始数据)
更多阅读
1. SPSS详细操作:配对卡方检验(McNemar’s test)
关注医咖会,轻松学习统计学~
快加小咖个人微信(xys2016ykf),拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。
点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址:http://www.mediecogroup.com/,查看60种SPSS教程。