查看原文
其他

数据分析,从协方差分析开始

小明同学 SPSS有话说 2022-04-26

问题

实际工作中,其实有很多因素是很难人为控制的,它们的不同水平确实会对结果变量产生了较为显著的影响,如果忽略这些因素,而直接简单的分析其他因素对结果变量的影响,所得出的结果可能存在偏差。为了更加准确的研究控制变量的不同水平对目标变量的影响,应该尽量剔除其他因素对结论的影响。接下来,我们介绍一种统计控制的方法——协方差分析。


相关知识

(1)协变量

协变量(covariate)指与因变量有线性相关并在探讨自变量与因变量关系时通过统计技术加以控制的变量。常用的协变量包括因变量的前测分数、人口统计学指标以及与因变量明显不同的个人特征等。

协变量应该属于控制变量的一种。有些控制变量可以通过实验操作加以控制(如照明、室温等), 也称为无关变量;而另一些控制变量由于受实验设计等因素的限制,只能借助统计技术来加以控制,即成了统计分析中的协变量, 因而属于统计概念。


(2)协方差分析:

协方差分析(analysis of covariance)是关于如何调节协变量对因变量的影响作用,从而更有效地分析实验处理效应的一种统计分析技术。它是对实验进行统计控制的一种方法。其基本思想是将那些人为很难控制的因素作为协变量,并在排除协变量对因变量影响的条件下,分析可控制变量对因变量的作用,从而更加准确地对控制因素进行评价。当只有一个协变量时,称为一元协方差分析;当有两个或两个以上的协变量时,称为多元协方差分析。一般情况下, 协方差分析中的自变量(处理因素)为离散型变量, 因变量和协变量为连续型变量。

协方差分析的应用应该满足的条件包括:受试对象的观测指标满足独立性,各处理组的观测指标均来自正态分布总体,且方差相等。需要控制的协变量(自变量)与观测指标(因变量)之间存在线性关系,且每个组用协变量(自变量)与观测指标(因变量)进行直线回归时,回归直线的斜率相同(即各组回归直线平行)。

操作步骤

问题:分析A和B两种药物对于降压疗效有无差异?其中测得治疗前血压和治疗后的血压,如下图所示。

分析:如果A、B两种药物在治疗后的血压上存在显著差异,不足以说明哪种药物更好,有可能是被试服药前的血压就存在差异。因此,需要将治疗前血压当作协变量,如果符合方差齐性和平行性检验,即可进行协方差分析。

1、【分析】--【一般线性模型】--【单变量】,将组别放入固定因子框、治疗前血压放入协变量框、治疗后血压放入因变量框。如下图所示。

2、【模型】:在指定模型中选择定制,在构建项里先选择主效应,将组别、治疗前血压选中导入右框;然后再选择交互,将组别和治疗前血压同时选中拖入右框。点击【继续】。

3、【选项】:将组别拖入右边框,在显示中选中描述统计和齐性检验。点击【继续】--【确定】。

结果解释

(1)描述统计

描述统计表给出了治疗后血压的部分统计信息,包括两种药物及总的个案数、均值和标准差(描述统计三要素:样本量、均值和标准差)。

(2)方差齐性检验

方差齐性检验结果发现,F=1.189,P=0.285>0.05,根据“大同小异”的原则,尚不能认为两种药物治疗后血压的方差不等,即满足方差齐性的条件(这一步是协方差分析的假设检验2)。

(3)主体间效应检验

主体间效应检验表明,组别*治疗前血压的交互作用不显著,F=0.552,P=0.464>0.05。放入分组变量与协变量的交互项是为了检验各组回归直线是否平行,若交互项结果满足P>0.05,则尚不能认为各组协变量与观测指标之间的回归直线斜率不等。在各组回归直线平行的条件成立时,才可以考虑进一步使用协方差分析。当处理因素与协变量有交互作用,即各组回归直线平行的条件不成立时(P<0.05),应对资料进一步处理或采用其他方法。因此,这一步符合协方差分析的假设检验1。

注意:当发现自变量与协变量的不存在交互作用,需要再次回到【模型】设置窗口,将交互性从右边框拖出,否则可能可能会对模型的变异度分解产生或多或少的影响。重新分析之后,结果如下图。

治疗前血压这一行结果可以反映治疗前血压(协变量)与治疗后血压(观测指标)之间是否存在线性关系的假设检验结果。结果发现,F=5.305,P=0.029<0.05,可以认为治疗前血压与治疗后血压之间存在线性关系,即满足线性关系的条件(这一步是协方差分析的假设检验3)。

组别一行反映各组观测指标调整的均数是否相等的假设检验结果。F=6.763,P=0.015<0.05,说明两种药物在治疗高血压上存在差异。结合描述统计中的均值,A药物的降压效果优于B药物。这一步是协方差分析的假设检验4。协方差分析需要满足前三个假设后,才能够根据假设检验4推断研究问题,否则不能进行协方差分析。


小结

协方差分析是一种把直线回归或多元线性回归与方差分析结合起来的方法,多个协变量间相互独立,且与控制变量之间没有交互影响。分析连续型变量对因变量的影响需要用相关与回归分析。如果分类变量和连续型变量混合在一起分析,则方差分析和相关回归分析都不适用了。协方差分析在这种情况下就派上用场了。将连续性变量设为协变量,扣除它对因变量的影响后,再用方差分析方法来分析分类变量对因变量的影响情况。当然,分类变量也可以作为协变量进行分析。


所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。

授人以鱼不如授人以渔

给我一份数据,还你一个世界

明诚数据工作室 

数据分析 | 远程教学 | 论文指导

统计咨询 | 课程开发 | 技术指导 

温馨提示

数据分析服务:如有数据分析或者一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。

SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!

SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

加入我们:请点击 明诚数据工作室招贤纳士

数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存