SPSS有话说:多重共线性问题
导 语
根据回归分析的基本假设,自变量之间要求相互独立的。如果某两个或多个自变量之间出现了相关性,导致参数估计出现偏差,或者标准误很大,模型失真,则称为存在多重共线性。
SPSS有话说
概念
多重共线性是指线性回归模型中的自变量之间由于存在高度相关关系而使模型估计失真或难以估计准确。
影响
(1)参数估计的意义不合理
当变量之间高度相关时,可能使回归的结果混乱,甚至会把分析引入歧途,使得各自变量的参数失去了应有的含义,表现出反常现象。例如估计结果本来应该是正的,结果却是负的。因此当模型存在多重共线性时,对回归系数的解释将是危险的。
(2)变量的显著性检验和模型的预测功能失去意义(显著变不显著)
模型存在多重共线性时,参数估计值的方差与标准差变大,从而容易使通过样本计算的t值小于临界值,误导做出参数为0的推断,可能将重要的自变量排除在模型之外。而变大的方差容易使预测值区间预测的“区间”变大,使预测失去意义。
特别提示
对于中介模型,如果中介变量和自变量相关非常高(如高达 0.9,此时 VIF=5.26),则也有多重共线性问题,影响中介效应和直接效应的估计精确度和稳定性(王惠文,吴载斌 孟洁,2006)。对于调节效应模型,变量中心化可以减少非本质的共线性问题(温忠麟,刘红云,侯杰泰,2012)。例如,在叶宝娟、杨强、胡竹菁(2012) 的一项研究中,建模前各变量做了中心化处理,所有自变量的 VIF 均低于1.28,故不存在多重共线性问题。
识别
1)各自变量之间显著相关(使用散点图矩阵和相关系数矩阵)0.6以上;
2)线性关系检验显著(F检验显著),各自变量系数却大多数不显著;
3)回归系数正负号与预期相反;
4)容忍度(tolerance)小于0.1、方差膨胀因子(VIF)大于10或5,则认为自变量之间可能存在多重共线性。
操作步骤
【分析】-【回归】-【线性】-【依次将变量导入对应变量框】-【统计】-勾选【共线性诊断】-【确定】。
根据容忍度大于0.1,方差膨胀因子VIF<5或10。满足以上条件,不存在严重的共线性问题。上例不存在严重的共线性问题。
处理
1)删除相关性很强的两个自变量中的一个,或者删除多个相关性很强的自变量中的几个变量;
2)提取主成分,将多个相关性很强的变量包含的信息浓缩到一个变量中;
3)增加样本量;
4)逐步回归、岭回归、主成分回归。
往期回顾
SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?
SPSS有话说:问卷或量表调查研究需要多少份或要求多大的样本量?
SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提。
SPSS有话说:(分析方法选择)图(常用统计概念)词在手,统计你有
SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析
SPSS有话说:探索性因素分析(EFA)与验证性因素分析(CFA)的区别
SPSS有话说:统计答疑解惑(4)SPSS有话说:统计答疑解惑(5)SPSS有话说:虚拟(哑)变量授人以鱼,不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!