SPSS有话说:统计答疑解惑(1)
导 语
Q1: 相关分析不显著,可以做回归分析吗?
Q2: 方差分析总体结果显著,为什么事后两两比较不显著?
Q3:进行回归分析时,结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?
Q4:回归分析时,到底看R2还是调整后R2?
Q5:数据中心化或标准化处理可以减少多重共线性问题?
SPSS有话说
Q1: 相关分析不显著,可以做回归分析吗?
一般而言,相关是回归的基础。两个变量不存在相关,就没有比较继续进行后面的分析。但这种关系仅限于简单线性回归(一个自变量,一个因变量)的情况下。当自变量有多个时,就不再适用。因为多元回归分析中,自变量发生的作用不是独立的,而是与其他自变量一起联合发挥作用,每个自变量的影响都是在控制了其他自变量的基础之上的分析,也就是偏相关的思路。因此,如果一个自变量与因变量无关,但它与其他自变量一起时,是可以对因变量产生显著影响的。
Q2:方差分析总体结果显著,为什么事后两两比较不显著?
在进行方差分析时,有时候会出现总体上的方差检验显著,而事后做两两比较时却发现任意两组之间的差异都不显著。这种结果多数情况之下都表明数据存在一定的问题,尤其是极端值的问题。因此,遇到这个问题时,可以检查数据有没有极端值,以及各个小组内有没有极端值,可以用箱图检查,剔除极端值之后多数都会得到合理解释。
Q3:进行回归分析时,结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?
回归分析是反映变量间关系,而不是比较取值大小,因此不同单位的变量可以直接分析。并且,回归分析一般会给出非标准化系数和标准化系数两个结果,用哪个呢?实际上,非标准化系数就是基于原始数据的结果,因此与原始数据的单位对应,单位不一样,非标准化系数也不一样。但单位的变化并不影响标准化系数(基于标准化数据的结果),因此一般采用标准化系数。如果是要写出回归方程的话,就要用非标准化回归系数。如果是要比较各自变量对因变量的贡献大小,就要用标准化回归系数来比较。
Q4:回归分析时,到底看R2还是调整后R2?
决定系数(R2)是反映模型拟合优度的重要的统计量,为回归平方和与总平方和之比。R2取值在0到1之间,且无单位,其数值大小反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的百分比。R2是最常用于评价回归模型优劣程度的指标,R2越大(接近于1),所拟合的回归方程越优。
虽然R2可以用来评价回归方程的优劣,但随着自变量个数的增加,R2将不断增大,若对两个具有不同个数自变量的回归方程进行比较时,不能简单地用R2作为评价回归方程的标准,还必须考虑方程所包含的自变量个数的影响,此时应用调整后决定系数adjR2。
Q5:数据中心化或标准化处理可以减少多重共线性问题?
数据中心化和标准化在回归分析中的意义是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。中心化不能降低变量之间因共线性而导致的方程估计问题。如果你的数据因高度共线性而导致不可接受的结果,那么即使进行中心化,也于事无补。但是中心化操作也有其好处,具体表现在两方面:一是改变模型中回归系数a、b的大小和显著性检验结果。二是在自变量X和调节变量M的零点没有实际意义的情况下,改善对回归系数a和b的理解。
往期回顾
SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?
SPSS有话说:问卷或量表调查研究需要多少份或要求多大的样本量?
SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提。
SPSS有话说:(分析方法选择)图(常用统计概念)词在手,统计你有
SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析
授人以鱼,不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!