查看原文
其他

多重线性回归实例

helloiamx SPSS学堂 2022-04-26

作者:夏雨骄阳 审阅:阿X 封面:自己想吧

对数据进行多重线性回归分析常按照以下步骤:

1根据研究目的确定因变量和自变量

现研究年收入对数和受教育年限、工作年限的关系,年收入对数为因变量,受教育年限、工作年限为自变量,共计69条数据。


2判断有无异常值

判断方法:通过线性回归-统计-个案诊断,线性回归-保存-勾选学生化删除、库克距离、杠杆值,根据新生成的学生化删除残差、库克距离、杠杆值来判断。

Step1线性回归→【统计】,勾选【个案诊断】→【离群值】

Step2【保存】→勾选【学生化删除】,【库克距离】,【杠杆值】

新生成了三个变量SDE_1(学生化删除残差)、COO_1(库克距离)、LEV_1(杠杆值)。

结果:学生化删除残差的值在-3至3的范围内,库克距离均小于1,杠杆值均均小于0.2,不存在异常值。


3判断数据是否满足多重线性回归假设条件

(1)  因变量与所有自变量之间是否存在线性关系

Step1线性回归→【保存】→勾选【未标准化】、【学生化】、【学生化删除】,【库克距离】,【杠杆值】

Step2 建立未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图

结果:未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图呈水平带状,满足因变量与所有自变量之间存在线性关系的假设。


(2)  因变量与每一个自变量之间是否存在线性关系

Step1线性回归→【图】→勾选【生成所有局部图】

 

结果:年收入对数与受教育年限之间存在近似线性关系,年收入对数与工作年限之间存在近似线性关系。


(3)  各自变量之间是相互独立的。

Step1线性回归→【统计】→勾选【共线性诊断】

结果:容差为0.940接近1,VIF为1.064接近1,不存在多重共线性。


(4)  残差近似正态性

Step1线性回归→【图】→勾选【直方图】、【正太概率图】

 

结果:标准化残差的直方图,符合正态分布,标准化残差的正态概率图,近似一条直线,符合正态分布。


4估计回归模型参数,建立模型

Step1【分析】→【回归】→【线性】

Step2 选择因变量和自变量,【统计】选项卡中“回归系数”选择“估计”,选择“模型拟合度”,单击“继续”,单击“确定”。

结果展示

 

回归模型:Y=8.918+0.041X1+0.007X2

该表格展示了自变量对因变量的解释程度,即模型拟合程度,可用R^2(决定系数)来衡量。决定系数取值在0-1之间,R^2越大模型拟合程度越高。本案例中R^2=0.031,即受教育年限和工作年限对年收入对数的解释程度为3.1%,解释程度不高。


5对模型进行假设检验

对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。

方差分析结果:F=1.055,p>0.05,说明模型Y=8.918+0.041X1+0.007X2无统计学意义。

t检验结果:常数项的p值小于0.05,具有统计学意义,X1、X2的回归系数的p值大于0.05,无统计学意义。

扫描下方二维码,回复20180608,可获得本次案例哦~

欢迎添加

数据分析服务微信号:LYJ_312

加入社群添加微信号:spss_shequn



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存