简单线性回归假设条件(四)
作者:小王子的狐狸 审稿:阿X 封面:在路上
前面的文章中,大家都了解了回归假设的3个条件:即,因变量和自变量之间存在线性关系、具有相互独立的观测值、随机误差的正态性以及异常值检测。
本文进一步为大家介绍简单线性回归的假设条件四,主要围绕:标准化残差和标准化预测值图形绘制。
标准化残差做图:是指选中复选框表示保存标准化后的残差;可以绘制出直方图和正态图,并将标准化残差的分布同正态分布二者之间进行对比。
标准化预测值绘图:选中复选框表示标准化后的预测值。
SPSS操作
案例介绍:20名中学生身高体重的分布数据。如图1.1。
图1.1 身高体重数据
Step01:选择“分析——回归——线性”,弹出对话框,如图1.2。
图1.2 线性回归对话框1
Step02:将体重作为因变量,身高作为自变量,得到图1.3。
图1.3 线性回归对话框2
Step03:选择右侧的“图”按钮,将DEPENDNT选择入区域2,ZRESID选择入区域1,并且勾选标准化残差图的“直方图”和“正态概率图”,如图1.4所示。
图1.4 线性回归:图对话框1
Step04:同样地,要绘制标准化预测值的图形,需要选择下一个(如区域1),将“*ZRESID”选入Y轴,将“*ZPRED”选入X轴,见区域2。如图1.5所示。
图1.5 线性回归:图对话框2
PS:*ZRESID表示标准化残值、*ZPRED表示标准化预测值。
Step05:完成上述操作步骤后,点击“继续”按钮。并选择右侧“保存”按钮,选中“标准化”复选框。如图1.6。
图1.6 线性回归:保存对话框
Step06:上述过程都完成之后,最后会得到4个图形,即标准化残差直方图(图1.7)、标准化残差正态P-P图(图1.8)、关于因变量的标准化残差图(图1.9)、标准化预测值图(图2.0)。
图1.7 标准化残差直方图
图1.7是一个标准化残差直方图,横轴表示与回归相联系的标准化残差,纵轴表示残差的评率,并且右上,我们可以看到标准差和平均值。本例中,是符合正态分布的。
图1.8 标准化残差正态P-P图
图1.8 是标准化残差正态P-P图,横轴是实测累计概率,纵轴表示预期累计概率。图中,这些点都分布在对角线附近,说明符合正态分布,结果同直方图的结果一致。
图1.9 关于因变量的标准化残差图
图1.9是关于因变量的标准化残差,本例中反映了体重作为因变量其散点图的标准化残差。以纵轴0点为对称轴,各散点平均分布在其附近,没有明显的偏正或偏负,说明中学生的体重、身高之间的线性关系是正确的。
图2.0 标准化预测值图
图2.0是关于标准化预测值的标准化残差,横轴表示与估计回归方程相联系的标准化预测值,其信息读取等同于图1.9。
最后,可以得出数据集的新变量列出的结果,如图2.1。其中,zpr_1表示预测值的计算结果,zre_1表示残差的计算结果。
图2.1 残差与预测值的计算结果
今天就介绍这么多了,欢迎留言,扫描下方二维码,回复20180530,可获得本次案例哦~