查看原文
其他

加权最小二乘法

helloiamx SPSS学堂 2022-04-26

作者:红豆牛奶 审阅:阿X 封面:自己想吧


通过前面的学习我们知道,线性回归的假设条件之一为方差齐性,若不满足方差齐性(即因变量的变异程度会随着自身的预测值或者其它自变量的变化而变化)这个假设条件时,就需要用加权最小二乘法(WLS)来进行模型估计。加权最小二乘法(WLS)会根据变异程度的大小赋予不同的权重,使其加权后回归直线的残差平方和最小,从而保证了模型有更好的预测价值。


01

非明确权重

例子:某品牌要定位商品人群,拟研究其销售额与人均收入的关联性,收集了15个区域购买此产品人员的收入,在此区域购买此产品的销售额,各区域内的调查人数,试用线性回归分析。(此例题假设方差不齐,只为了讲解操作步骤,不具有实际意义。)

操作步骤step1分析—回归—权重估算。

step2.将销售额选入【因变量】,收入选入【自变量】,人数选入【权重变量】,【幂的范围】系统默认为-2+2,步长为0.5,也就是说拟合指数为-2-1.5-1-0.500.511.52,会构建9个方程,且从中选取一个最佳的拟合指数,呈现出最好的效果。

ps:在实际工作中,可以根据残差散点图来设定幂的范围,若残差散点图中,方差不齐且标准化残差的变异程度会随着标准化预测值的增大而增大,则幂的范围为正值,可将幂的范围设定为0—5,步长为0.5;反之亦然。

step3.选择【选项】,勾选将最佳权重保存为新变量。

结果:

在输出视图中看对数似然值这个图,列出了9个拟合指数,及其对应的对数似然值,其中右上方带a的数字,为最佳拟合指数。在本例中为-0.5 ,即权重按照1/人口-0.5的函数关系来计算权重。

并在数据视图中出现一列新的变量WGT_1,为生成的每一项的权重系数。

step4.做线性回归分析,分析—回归—线性,【因变量】选入销售额,【自变量】选入收入,【WLS权重】选入WGT_1,具体假设检验过程、结果不再赘述。

需要注意:用加权最小二乘法得出的结果,在进行线性回归分析时,R方往往会小于普通最小二乘法的R方,但这不代表加权后模型的拟合程度比之前的差,此时可以不比较二者的R方。


02

有明确的权重

有以下两种方法:

1.个案加权(数据—加权个案—勾选加权个案,填入相应需要加权的变量),然后做线性回归分析。

2.在线性回归中直接选入(分析—回归—线性—在【WLS权重】中选入权重)。


扫描下方二维码,回复20180613,可获得本次案例哦~

欢迎添加

数据分析服务微信号:LYJ_312

加入社群添加微信号:spss_shequn


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存