单因素方差分析,我见过的最详细SPSS教程
一、问题与数据
有研究者认为,体力活动较多的人能更好地应对职场的压力。为了验证这一理论,某研究招募了31名受试者,测量了他们每周进行体力活动的时间(分钟),以及应对职场压力的能力。
根据体力活动的时间数,受试者被分为4组:久坐组、低、中、高体力活动组,变量名为group。利用Likert量表调查的总得分来评估应对职场压力的能力,分数越高,表明应对职场压力的能力越强,变量名为coping_stress。应对职场压力的能力,可以简写为CWWS得分。
研究者想知道,CWWS得分的高低是否取决于体力活动的时间,即coping_stress变量的平均得分是否随着group变量的不同而不同(部分数据如下图)?
二、对问题的分析
研究者想分析不同group间的coping_stress得分差异,可以采用单因素方差分析。单因素方差分析适用于2种类型的研究设计:1)判断3个及以上独立的组间均数是否存在差异;2)判断前后变化的差值是否存在差异。使用单因素方差分析时,需要考虑6个假设。
假设1:因变量为连续变量;
假设2:有一个包含2个及以上分类、且组别间相互独立的自变量;
假设3:每组间和组内的观测值相互独立;
假设4:每组内没有明显异常值;
假设5:每组内因变量符合正态分布;
假设6:进行方差齐性检验,观察每组的方差是否相等。
那么进行单因素方差分析时,如何考虑和处理这6个假设呢?
三、思维导图
(点击图片可查看大图)
四、对假设的判断
1. 假设1:因变量为连续变量;假设2:有一个包含2个及以上分类、且组别间相独立的自变量;假设3:每组间及组内的观测值相互独立。和研究设计有关,需根据实际情况判断。
2. 假设4:每组内没有明显异常值。
如果某个组别中的某些因变量取值和其他值相比特别大或者特别小,则称之为异常值。异常值会影响该组的均数和标准差,因此会对最终的统计检验结果产生很大的负面影响。对于小样本研究,异常值的影响尤其显著,必须检查每组内是否存在明显异常值。
以下将说明如何在SPSS中利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法。
(1) 在主菜单点击Analyze > Descriptive Statistics > Explore...:
出现下图Explore对话框:
(2) 把因变量coping_stress送入Dependent List框中,把自变量group送入Factor List框中:
(3) 点击Plots...,出现Explore: Plots对话框:
(4) 在Boxplots模块内保留系统默认选项Factor levels together,在Descriptive模块内取消选择Stem-and-leaf,在下方勾选Normality plots with tests(执行 Shapiro-Wilk's检验):
点击Continue,返回Explore对话框。
(5) 在Display模块内点击Plots:
如果使用偏度和峰度(skewness and kurtosis)进行正态性判断,则保留Display模块内的默认选项Both或者选择Statistics。
(6) 点击OK,输出结果。
根据如下输出的箱线图,判断每个组别内是否存在异常值。
SPSS中将距离箱子边缘超过1.5倍箱身长度的数据点定义为异常值,以圆点表示;将距离箱子边缘超过3倍箱身长度的数据点定义为极端值(极端异常值),以星号(*)表示。为容易识别,在Data View窗口异常值均用其所在行数标出。本例数据箱线图无圆点或星号,因此无异常值。假如数据中存在异常值和极端异常值,其箱线图如下:
箱线图是一种比较简单和流行的异常值检验方法,当然同样存在一些更为复杂的方法,这里不过多介绍。
接下来,我们介绍如何处理数据中存在的异常值。
导致数据中存在异常值的原因有3种:
(1) 数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验;
(2) 测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程);
(3) 真实的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,但也没有理由将其当作无效值看待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。
需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异常值可能会回归正常。
异常值的处理方法分为2种:
(1) 保留异常值:
1)采用非参数Kruskal-Wallis H检验;
2)用非最极端的值来代替极端异常值(如用第二大的值代替);
3)因变量转换成其他形式;
4)将异常值纳入分析,并坚信其对结果不会产生实质影响。
(2) 剔除异常值:
直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如果其不属于合格的研究对象,应将其剔除,否则会影响结果的推论。
3. 假设5:每组内因变量符合正态分布。
正态性检验有很多方法,这里只介绍最常用的一种:Shapiro-Wilk正态性检验(其他还有偏度和峰度值、直方图等)。在假设4的判断中,我们在Explore: Plots对话框中勾选了Normality plots with tests,输出结果中会给出Shapiro-Wilk检验的结果。
如果样本量较小(<50),并且对正态Q-Q图或其他图形方法的结果诠释不够有把握,推荐采用Shapiro-Wilk检验。每组自变量都会有一个Shapiro-Wilk正态性检验结果。本例结果见如下Tests of Normality表格。
如果数据符合正态分布,显著性水平(蓝框中的Sig.)应该大于0.05。Shapiro-Wilk检验的无效假设是数据服从正态分布,备择假设是数据不服从正态分布。因此,如果拒绝无效假设(P<0.05),表示数据不服从正态分布;如果不能拒绝无效假设,则不能认为数据不服从正态分布。本例中每组正态性检验P值均大于0.05,因此不能认为每组因变量不服从正态分布。
如果样本量大于50,推荐使用正态Q-Q图等图形方法进行正态判断,因为当样本量较大时,Shapiro-Wilk检验会把稍稍偏离正态分布的数据也标记为有统计学差异,即数据不服从正态分布。
如果数据不服从正态分布,可以有如下4种方法进行处理:
(1) 数据转换:对转换后呈正态分布的数据进行单因素方差分析。当各组因变量的分布形状相同时,正态转换才有可能成功。对于一些常见的分布,有特定的转换形式,但是对于转换后数据的结果解释可能比较复杂。
(2) 使用非参数检验:可以使用Kruskal-Wallis H检验等非参数检验方法,但是要注意Kruskal-Wallis H检验和单因素方差分析的无效假设和备择假设不太一致。
(3) 直接进行分析:由于单因素方差分析对于偏离正态分布比较稳健,尤其是在各组样本量相等或近似相等的情况下,而且非正态分布实质上并不影响犯I型错误的概率。因此可以直接进行检验,但是结果中仍需报告对正态分布的偏离。
(4) 检验结果的比较:将转换后和未转换的原始数据分别进行单因素方差分析,如果二者结论相同,则再对未转换的原始数据进行分析。
4. 假设6:进行方差齐性检验,观察每组的方差是否相等。在第五部分SPSS操作中进行判断。
五、SPSS操作
1. 单因素方差分析(ONEWAY procedure)→事后两两比较(post hoc test)
(1) 点击Analyze > Compare Means > One-Way ANOVA:
出现One-Way ANOVA对话框:
(2) 把因变量coping_stress送入Dependent List框中,自变量group送入Factor框中:
(3) 点击Options,出现One-Way ANOVA: Options对话框:
(4) 在Statistics模块勾选Descriptive,Homogeneity of variance test和Welch,同时勾选Means plot:
(5) 点击Continue,返回One-Way ANOVA对话框。
(6) 点击Post Hoc,出现One-Way ANOVA: Post Hoc Multiple Comparisons对话框:
对话框根据方差齐性检验的假设是否满足,分为2个主要区域:
(7) 在Equal Variances Assumed模块内勾选Tukey,在Equal Variances Not Assumed模块内勾选Games-Howell:
注:在Equal Variances Assumed模块内SPSS提供了许多两两比较的方法。例如,LSD法为“最小显著差数法”,是在无校正的前提下,在不同组间进行多次两个独立样本t检验;Bonferroni法是比较流行的方法,同LSD法类似在多组间进行两个独立样本t检验,但是采用了Bonferroni法进行校正。
(8) 可以在Significance level框中修改显著性水平的大小(系统默认为0.05,表示当P<0.05时差异具有统计学意义,可以将其数值修改为0.01)。
(9) 点击Continue,返回One-Way ANOVA对话框。
(10) 点击OK,输出结果。
2. 一般线性模型(GLM procedure)求效应量(偏η2)
(1) 点击Analyze > General Linear Model > Univariate...:
出现Univariate对话框:
(2) 把因变量coping_stress送入Dependent List框中,自变量group送入Fixed Factor(s)框中:
(3) 点击Options...,出现 Univariate: Options对话框:
(4) 在Display模块内勾选Estimates of effect size:
(5) 点击Continue,返回Univariate对话框。
(6) 点击OK,输出结果。
3. 一般线性模型(GLM procedure)→自定义组间比较(custom contrasts)
如果只关心特定组别间的差异,你需要知道如何进行自定义比较(custom contrasts),以及如何对多重比较结果进行调整,这就要用到SPSS软件中的Syntax Editor窗口编写相应程序语句。当满足方差齐性条件时,推荐采用GLM程序进行自定义组间比较。
前2步操作同“2. 一般线性模型(GLM procedure)求效应量(偏η2)”的前2步操作,这里不再赘述。接下来:
(1) 点击Paste,出现IBM SPSS Statistics Syntax Editor窗口:
(2) 在 /PRINT 和 /CRITERIA两行中间,输入 /LMATRIX = group -1 1 0 0:
/LMATRIX= 旨在告诉SPSS我们要做一个自定义假设;group表示将要进行比较的自变量组别;-1 1 0 0表示要进行比较的系数,系数的顺序和SPSS里输入的组别顺序有关:这里从左到右(-1 1 0 0)分别对应着久坐组、“低”、“中”和“高”体力活动组,表示将“低”体力活动组与久坐组进行比较。
注:自定义比较包括了简单比较(simple contrasts)和复合比较(complex contrasts)。简单比较为只比较自变量某两个组别间的差异,需要建立线性比较函数(linear contrast,φ)。它包含一系列系数和每个组别对应的均数,系数取值只能为1,-1,0。我们把要比较的两组的系数分别赋值为1和-1,其他不比较的组别系数赋值为0。
本例中久坐组系数为-1,“低”体力活动组系数为1,其他组别均为0,则是要比较久坐组和“低”体力活动组的CWWS得分差异,看二者的平均CWWS得分差值是否为0(用“低”体力活动组得分减去久坐组得分,即系数为1的组别减去系数为-1的组别,以系数为-1的组别为参照组,系数赋值的正负与研究设计和研究假设有关)。
(3) 用/LMATRIX指令增加另外2种比较:
/LMATRIX = group -1 1/3 1/3 1/3
/LMATRIX = group -1/2 -1/2 1/2 1/2
注:复合比较为比较自变量超过2个组别的组合间的差异,如比较B组与C、D两组的组合间的差异,或C、D两组间的组合与A、D两组间组合的差异。同样采用线性比较函数的方法,某组合的系数赋值为1或-1除以组合内的组数,但是要保证要比较的组间组合与另一组(组合)的所有系数加起来为0,系数赋值的正负与研究设计和研究假设有关。
本例中,/LMATRIX = group -1 1/3 1/3 1/3表示“低”、“中”和“高”体力活动组的组合整体与久坐组CWWS得分差异的比较,/LMATRIX = group -1/2 -1/2 1/2 1/2表示“中”和“高”体力活动组的组合与“低”体力活动组和久坐组组合的比较。
(4) 多重比较的校正
接下来,我们需要校正显著性水平(α),通常也可以校正每次比较的P值和可信区间,得到调整后P值和联合可信区间(simultaneous confidence intervals)。我们首先采用Bonferroni方法对显著性水平α进行校正,公式如下:
调整后α=调整前α ÷ 比较的次数
本例中我们需要进行3次比较,则调整后α=0.05÷3=0.01667。
(5) 箭头标注处为SPSS软件默认的显著性水平α=0.05:
/CRITERIA=ALPHA(.05)
(6) 我们将其改为调整后的显著性水平α=0.1667:
/CRITERIA=ALPHA(.01667)
(7) 在菜单栏点击Run > All:
4. 单因素方差分析(ONEWAY procedure)→自定义组间比较(custom contrasts)
虽然ONEWAY程序有很多缺点,但却是不满足方差齐性条件时唯一可用的方法。前2步操作同“1. 单因素方差分析(ONEWAY procedure)→两两比较(post hoc test)”的前2步操作,这里不再赘述。接下来:
(1) 点击Contrasts,出现 One-Way ANOVA: Contrasts对话框:
(2) 在Coefficients模块中输入第一组比较(如-1 1 0 0)的第一个系数,点击Add:
(3) 在Coefficients模块中输入第一组比较(如-1 1 0 0)的其他系数,点击Add:
(4) 点击Next,输入新的自定义比较组,此时下图中红框区域内将变为 –Contrast 2 of 2–:
(5) 按照之前的方式输入第二个比较组(如-1 1/3 1/3 1/3):
注:Coefficients模块中无法输入分数,最多只能输入3位小数的数值来代替。因此本例中输入0.333代替1/3,但是由于最后总和不等于1(0.333×3=0.999),因此我们将在后面的第(9)(10)步中进行调整。
(6) 继续点击Next,输入新的自定义比较组,此时下图中红框区域内将变为 –Contrast 3 of 3–:
(7) 按照之前的方式输入第三个比较组(如-1/2 -1/2 1/2 1/2):
(8) 点击Continue,返回One-Way ANOVA对话框。
(9) 点击Paste,进入IBM SPSS Statistics Syntax Editor窗口:
(10) 手动增加小数位数,如把小数位数从3位改为10位(0.333改为0.3333333333):
(11) 在菜单栏中点击Run > All:
六、结果解释
1. 基本描述
SPSS会给出自变量每个组别的基本情况统计表,以便对数据有个初步的了解:
各列变量含义对应如下:
基本情况统计表中每一行均代表着group(自变量)不同组别的coping_stress(因变量)统计结果。可以由此判断:1)哪两组间例数(N)相同;2)哪些组的平均得分(Mean)较高或较低;3)是否每组的变异情况相同(Std. Deviation)。
本例中,各组的样本量不相等(范围7-9),并且随着体力活动水平的增加(即自变量group),应对职场压力的能力有上升趋势(CWWS得分,即因变量coping_stress)。例如从“久坐组”到“高”体力活动组,平均得分从4.1513增加为7.5054,但是各组标准差明显不同(范围0.77137-1.69131)。不同体力活动组别的CWWS得分见下图:
2. 方差齐性检验结果
单因素方差分析假设不同组别的因变量变异相等。如果不相等,则会增加犯I型错误的概率。使用Levene's方差齐性检验来检验方差齐的假设,检验结果见如下Test of Homogeneity of Variances表格:
Sig.一列数值代表了检验的P值。如果Levene's检验的差异具有统计学意义(P<0.05),则不满足方差齐的假设;如果Levene's检验的差异无统计学意义(P>0.05),则不能拒绝方差齐的假设。本例中,P=0.120,表示各组方差相等。
3. 满足方差齐性假设的结果
在满足方差齐性假设的前提下,单因素方差分析结果如下:
如果单因素方差分析显示差异具有统计学意义(P<0.05),表示不是所有组的总体均数均相等(至少有一组均数不同于另一组)。如果P>0.05,则表示各组间均数差异无统计学意义。本例中,P值显示为0.000,不代表P值实际为0,而是表示P<0.001。本例各组间(group)的得分(coping_stress)均数差异具有统计学意义。即在不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异具有统计学意义,F(3,27)=8.316, P<0.0005。
以上具体结果来自于下表:
表中各部分的含义如下:
如果经单因素方差分析,差异无统计学意义,则报告如下:在不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异无统计学意义,F(3,27)=1.116, P=0.523。
4. Tukey检验结果
如果事前没有对特定组间差异进行假设,或者关心所有组间的两两比较,则应该进行所有组间的两两比较(post hoc test)。当满足方差齐性的条件时,推荐使用Tukey检验进行组间两两比较。Tukey检验不仅提供了每两个组间比较的P值,也给出了均数差值的可信区间(即Tukey区间)。
注:当各组例数不相等时,Tukey检验可能不太适用,此时应该进行校正后的Tukey-Kramer检验。Tukey-Kramer检验结果偏保守,但适用于各组例数不等的情况,当各组例数相等时,结果与Tukey检验相同。当勾选了Tukey检验,在各组例数不同时SPSS软件会自动给出Tukey-Kramer检验结果。
本例中由于各组例数不等,SPSS软件会进行Tukey-Kramer检验,但以下我们依然称之为Tukey检验。结果见Multiple Comparisons表格:
本例中自变量分为4组,因此会有6种不同的组间组合。当我们要比较久坐组和“低”体力活动组结果时,可以见如下标黄部分。2行均为2组比较的结果,但是均值差值的计算方式不同,故数值相同,但符号相反,均值差值的95%可信区间也是如此。而均数差值的标准误和P值结果,2行是完全一致的。
我们也可以根据之前Descriptives表格的结果,自己手动验证一下:
Multiple Comparisons表中各列名如下:
让我们解读一下标黄的久坐组和“低”体力活动组比较结果:
“低”体力活动组的CWWS平均分比久坐组高1.72762分,P=0.092>0.05,表示两组间差异无统计学意义(即两组间均数差值等于0)。两组间均数差值的95%可信区间为-0.2058~3.6610,该区间范围包括0,等同于P>0.05,差异无统计学意义。
我们再来解读一下标黄的“高”体力活动组和久坐组比较结果:
可以看出,“高”体力活动组的CWWS平均分比久坐组高3.35409分,P=0.001。我们可以报告:“高”体力活动组的平均CWWS得分(7.5±1.2)比久坐组(4.2±0.8)高3.4(95%CI:1.3~5.4),差异具有统计学意义(P=0.001)。
目前许多杂志要求除了列出上述结果,还要报告效应量。计算单因素方差分析的效应量有很多方法,比较推荐的是计算ω2,公式如下:
公式里的各指标见ANOVA表格:
因此,本例的ω2计算结果如下:
本例的效应量ω2=0.42。同样地,我们也可以报告偏η2,在Tests of Between-Subjects Effects表格中group一行,列名为Partial Eta Squared(已标黄):
结果显示,偏η2=0.480。偏η2表示控制了其他自变量后,因变量被某一自变量解释的百分比(单因素方差分析时,即自变量对因变量的解释程度),代表样本的效应量;与偏η2相比,ω2还考虑了抽样误差,可以提供相对准确的总体效应量的估计。
5. 不满足方差齐性假设的结果
当方差不齐时,必须使用校正的单因素方差分析。本例采用Welch方差分析,结果见Robust Tests of Equality of Means表格:
可以报告:不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异具有统计学意义,Welch F(3,14.574)=14.821, P<0.0005。
结果叙述里的指标与Robust Tests of Equality of Means表格对应如下:
每部分的含义如下:
当差异无统计学意义时,我们也可以报告:不同水平的体力活动组间,应对职场压力的能力(CWWS得分)差异无统计学意义,Welch F(3,12.325)=1.316, P=0.523。
6. Games-Howell检验
当方差不齐,而且关心所有组间的两两比较时,推荐采用Games-Howell检验。Games-Howell检验不仅提供了每两个组间比较的P值,也给出了均数差值的可信区间,本例结果见如下Multiple Comparisons表格:
Games-Howell检验的结果解释与Tukey检验相同,这里不再赘述。大家可以参阅第4部分Tukey检验结果的解读。
7. 当方差齐时,自定义组间比较的结果
当我们在GLM程序中的syntax编辑器输入了自定义比较的组别后,我们会得到如下Contrast Results (K Matrix) 表格。此表为久坐组和“低”体力活动组比较的结果,与我们当时输入的比较顺序对应一致。
首先,我们来看Contrast Estimate、Lower Bound和Upper Bound这三行的结果。Contrast Estimate一行结果为1.728,这是所比较的2组间的均数差值,见下图:
均数差值的95% (联合)CI为-0.076~3.531。但是,我们注意到最后一行写的是98.333% CI for difference,和我们表述的95% CI略有差异。这是因为为了使三次比较的总体CI达到95%,每次比较的CI实际会高于95%。
同时,由于之前为了计算联合CI调整了显著水平α,并没有调整P值,因此Sig.=0.021为未调整的P值(调整后P值=报告P值×比较次数,本例为0.021×3=0.063)。如果调整后P值<0.05,两组差异具有统计学意义;如果调整后P值>0.05,两组差异无统计学意义。
第二组比较为久坐组与非久坐组(“低”、“中”、“高”体力活动组的组合)均数的比较(/LMATRIX = group -1 1/3 1/3 1/3),即复合比较的第一组,见下图:
相应结果见如下Contrast Results (K Matrix) 表格:
Contrast Estimate一行结果为2.684,计算方法为2.684= (5.879+7.123+7.505) / 3-4.151。其他结果解释和P值的调整方法与第一组相同。本次比较调整后P值=0.0004,差异具有统计学意义。
第三组比较为2个高水平体力活动组(“中”、“高”体力活动组的组合)与2个低体力活动组(久坐组、“低”体力活动组的组合)均数的比较(/LMATRIX = group -1/2 -1/2 1/2 1/2),即复合比较的第二组,Contrast Results (K Matrix)表格结果见下图:
Contrast Estimate一行结果为2.299,计算方法为2.299= (7.123+7.505) / 2- (5.879+4.151) / 2=7.314-5.015。其他结果解释和P值的调整方法与之前相同。本次比较调整后P值=0.0003,差异具有统计学意义。
注:另一种校正多重比较的方法是将未调整的P值与调整后的显著性水平α进行比较。本例要进行3次比较,故调整后α=0.05/3=0.01667。如果未调整P值<0.01667,则差异具有统计学意义。
8. 当方差不齐时,自定义组间比较结果
当方差不齐时,我们在SPSS软件中使用ONEWAY ANOVA程序来进行自定义组间比较。首先,我们看Contrast Coefficients表格:
该表格列出了我们之前输入的每个自定义比较组的各组别系数。
Contrast Tests表格分为2部分:Assume equal variances(方差齐)和Does not assume equal variances(方差不齐)。我们来看方差不齐的结果,第一组比较(久坐组和“低”体力活动组)的结果,见下图标黄的第“1”行:
Value of Contrast一列结果为1.728,这是所比较的2组间的均数差值,见下图:
两组均数差值的标准误(Std. Error)为0.635,P(Sig. (2-tailed))=0.019。单独看这组自定义的比较(不考虑其他两组自定义的比较),如果P<0.05,两组差异具有统计学意义;如果P>0.05,两组差异无统计学意义。
第二组比较为久坐组与非久坐组(“低”、“中”、“高”体力活动组的组合)均数的比较,即复合比较的第一组,结果见下图标黄的第“2”行:
Value of Contrast一列结果为2.684,这是所比较的2组间的均数差值,其标准误(Std. Error)为0.423,P(Sig. (2-tailed))<0.0005。
第三组比较为2个高水平体力活动组(“中”、“高”体力活动组的组合)与2个低体力活动组(久坐组、“低”体力活动组的组合)均数的比较,即复合比较的第二组,结果见下图标黄的第“3”行:
Value of Contrast一列结果为2.299,这是所比较的2组间的均数差值,其标准误(Std. Error)为0.483,P(Sig. (2-tailed))<0.0005。
如果要同时进行多重自定义比较,我们需要采用Bonferroni方法对显著性水平α进行调整。本例要进行3次比较,故调整后α=0.05/3=0.01667。如果未调整P值<0.01667,组间差异具有统计学意义;如果未调整P值>0.01667,组间差异无统计学意义。本例第一组自定义比较的P=0.019,如果与校正后的α=0.01667比较,则久坐组和“低”体力活动组的差异不再具有统计学意义。
七、撰写结论
1. 当方差齐,方差分析显示组间差异无统计学意义时:
采用单因素方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组(7人)、“低”体力活动组(9人)、“中”体力活动组(8人)、“高”体力活动组(7人)。
经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Levene's方差齐性检验,各组数据方差齐(P=0.120)。数据以均数±标准差的形式表示。
CWWS得分按照从久坐组(4.2±0.8)、“低”体力活动组(5.9±1.7)、“中”体力活动组(7.1±1.6)、“高”体力活动组(7.5±1.2)的顺序增加,但是不同体力活动组间的CWWS得分差异无统计学意义,F(3,27)=1.116, P=0.523。
2. 当方差不齐,方差分析显示组间差异无统计学意义时:
采用Welch方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组(7人)、“低”体力活动组(9人)、“中”体力活动组(8人)、“高”体力活动组(7人)。
经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Levene's方差齐性检验,各组数据方差不齐(P=0.002)。数据以均数±标准差的形式表示。
CWWS得分按照从久坐组(4.2±0.8)、“低”体力活动组(5.9±1.7)、“中”体力活动组(7.1±1.6)、“高”体力活动组(7.5±1.2)的顺序增加,但是不同体力活动组间的CWWS得分差异无统计学意义,Welch F(3,12.325)=1.316, P=0.523。
3. 当方差齐,方差分析显示组间差异有统计学意义,并进行了两两比较时:
采用单因素方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组(7人)、“低”体力活动组(9人)、“中”体力活动组(8人)、“高”体力活动组(7人)。
经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Levene's方差齐性检验,各组数据方差齐(P=0.120)。数据以均数±标准差的形式表示。
不同体力活动组间的CWWS得分差异具有统计学意义,F(3,27)=8.316, P<0.0005,ω2=0.42。CWWS得分按照从久坐组(4.2±0.8)、“低”体力活动组(5.9±1.7)、“中”体力活动组(7.1±1.6)、“高”体力活动组(7.5±1.2)的顺序增加。
Tukey检验结果表明,从久坐组到“中”体力活动组,CWWS平均得分增加2.97(95%CI:0.99~4.96),差异具有统计学意义(P=0.002);从久坐组到“高”体力活动组,CWWS平均得分增加3.35(95%CI:1.30~5.40),差异具有统计学意义(P=0.001);其他组间两两比较的结果差异无统计学意义。
4. 当方差不齐,方差分析显示组间差异有统计学意义,并进行了两两比较时:
采用Welch方差分析方法,判断不同水平体力活动组间的应对职场压力的能力(CWWS得分)是否有差异。受试者被分为4组:久坐组(7人)、“低”体力活动组(9人)、“中”体力活动组(8人)、“高”体力活动组(7人)。
经箱线图判断,数据无异常值;经Shapiro-Wilk检验,各组数据服从正态分布(P>0.05);经Levene's方差齐性检验,各组数据方差不齐(P=0.003)。
不同体力活动组间的CWWS得分差异具有统计学意义,F(3,14.574)=14.821,P<0.0005。CWWS得分按照从久坐组(4.2±0.8)、“低”体力活动组(5.9±1.7)、“中”体力活动组(7.1±1.6)、“高”体力活动组(7.5±1.2)的顺序增加。
Games-Howell检验结果表明,从久坐组到“中”体力活动组,CWWS平均得分增加2.97(95%CI:1.07~4.88),差异具有统计学意义(P=0.003);从久坐组到“高”体力活动组,CWWS平均得分增加3.35(95%CI:1.66~5.05),差异具有统计学意义(P=0.001)。
5. 从无效假设和备择假设的角度出发,当单因素方差分析或Welch方差分析显示组间差异有统计学意义时:
各组间均数差异有统计学意义(P<0.05)。因此,可以拒绝无效假设,接受备择假设。
6. 从无效假设和备择假设的角度出发,当单因素方差分析或Welch方差分析显示组间差异无统计学意义时:
各组间均数差异无统计学意义(P>0.05)。因此,不能拒绝无效假设,不能接受备择假设。
八、绘制图表
最后,我们来学习如何在SPSS软件中绘制柱状图,从而更好地展示展示单因素方差分析的结果,使其更适合于学术发表。
1. 在SPSS软件中生成柱状图
(1) 在菜单栏中,点击Graphs > Chart Builder...:
出现如下Chart Builder对话框:
(2) 在Chart Builder对话框的左下角,Choose from:模块中选择“Bar”:
(3) 在Chart Builder对话框的中下部,出现8个不同的柱状图选项,把左上角的第一个(Simple Bar)拖进上面的主要图表预览窗口,并点击Element Properties:
(4) 出现下图,图表预览窗口的柱状图横纵轴分别显示“X-Axis?”和“Y-Axis?”:
(5) 从Variables:模块中把自变量group拖进“X-Axis?”,把因变量coping_stress拖进“Y-Axis?”:
(6) 在Element Properties对话框中勾选Display error bars,激活–Error Bars Represent– 模块,勾选Confidence intervals,Level (%):设定为95,当然也可以根据需要勾选Standard error或者Standard deviation:
(7) 点击Apply,进行确认。
(8) 如果想改变自变量分组的顺序,在"Edit Properties of: 模块中点击"X-Axis1 (Bar1)"进行设置。
(9) 如果想改变因变量的范围或刻度,在"Edit Properties of: 模块中点击"Y-Axis1 (Bar1)"进行设置。
(10) 在Chart Builder对话框中点击OK。
2. 简单柱状图结果
按照上述操作步骤,生成简单柱状图如下:
图中每个柱子的高度表示各组均值的大小,error bar表示均值的95%CI。SPSS软件会自动生成灰色背景、米黄色柱子的柱状图,但是这种样式的图对于学术文章的发表可能不太适用。我们可以使用SPSS软件的图形编辑工具,得到如下更适用于学术研究的柱状图:
(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)
相关阅读
关注医咖会,轻松学习统计学!
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。
点击左下角“阅读原文”,看看既往小伙伴们都提出了哪些问题,以及该如何去解决,也许正好能帮到你~