多重线性回归实例
作者:夏雨骄阳 审阅:阿X 封面:自己想吧
对数据进行多重线性回归分析常按照以下步骤:
现研究年收入对数和受教育年限、工作年限的关系,年收入对数为因变量,受教育年限、工作年限为自变量,共计69条数据。
判断方法:通过线性回归-统计-个案诊断,线性回归-保存-勾选学生化删除、库克距离、杠杆值,根据新生成的学生化删除残差、库克距离、杠杆值来判断。
Step1线性回归→【统计】,勾选【个案诊断】→【离群值】
Step2【保存】→勾选【学生化删除】,【库克距离】,【杠杆值】
新生成了三个变量SDE_1(学生化删除残差)、COO_1(库克距离)、LEV_1(杠杆值)。
结果:学生化删除残差的值在-3至3的范围内,库克距离均小于1,杠杆值均均小于0.2,不存在异常值。
(1) 因变量与所有自变量之间是否存在线性关系
Step1线性回归→【保存】→勾选【未标准化】、【学生化】、【学生化删除】,【库克距离】,【杠杆值】
Step2 建立未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图
结果:未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图呈水平带状,满足因变量与所有自变量之间存在线性关系的假设。
(2) 因变量与每一个自变量之间是否存在线性关系
Step1线性回归→【图】→勾选【生成所有局部图】
结果:年收入对数与受教育年限之间存在近似线性关系,年收入对数与工作年限之间存在近似线性关系。
(3) 各自变量之间是相互独立的。
Step1线性回归→【统计】→勾选【共线性诊断】
结果:容差为0.940接近1,VIF为1.064接近1,不存在多重共线性。
(4) 残差近似正态性
Step1线性回归→【图】→勾选【直方图】、【正太概率图】
结果:标准化残差的直方图,符合正态分布,标准化残差的正态概率图,近似一条直线,符合正态分布。
Step1【分析】→【回归】→【线性】
Step2 选择因变量和自变量,【统计】选项卡中“回归系数”选择“估计”,选择“模型拟合度”,单击“继续”,单击“确定”。
结果展示
回归模型:Y=8.918+0.041X1+0.007X2
该表格展示了自变量对因变量的解释程度,即模型拟合程度,可用R^2(决定系数)来衡量。决定系数取值在0-1之间,R^2越大模型拟合程度越高。本案例中R^2=0.031,即受教育年限和工作年限对年收入对数的解释程度为3.1%,解释程度不高。
对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。
方差分析结果:F=1.055,p>0.05,说明模型Y=8.918+0.041X1+0.007X2无统计学意义。
t检验结果:常数项的p值小于0.05,具有统计学意义,X1、X2的回归系数的p值大于0.05,无统计学意义。
扫描下方二维码,回复20180608,可获得本次案例哦~
欢迎添加
数据分析服务微信号:LYJ_312
加入社群添加微信号:spss_shequn