加权最小二乘法
作者:红豆牛奶 审阅:阿X 封面:自己想吧
通过前面的学习我们知道,线性回归的假设条件之一为方差齐性,若不满足方差齐性(即因变量的变异程度会随着自身的预测值或者其它自变量的变化而变化)这个假设条件时,就需要用加权最小二乘法(WLS)来进行模型估计。加权最小二乘法(WLS)会根据变异程度的大小赋予不同的权重,使其加权后回归直线的残差平方和最小,从而保证了模型有更好的预测价值。
01
非明确权重
例子:某品牌要定位商品人群,拟研究其销售额与人均收入的关联性,收集了15个区域购买此产品人员的收入,在此区域购买此产品的销售额,各区域内的调查人数,试用线性回归分析。(此例题假设方差不齐,只为了讲解操作步骤,不具有实际意义。)
操作步骤:step1分析—回归—权重估算。
step2.将销售额选入【因变量】,收入选入【自变量】,人数选入【权重变量】,【幂的范围】系统默认为-2至+2,步长为0.5,也就是说拟合指数为-2、-1.5、-1、-0.5、0、0.5、1、1.5、2,会构建9个方程,且从中选取一个最佳的拟合指数,呈现出最好的效果。
step3.选择【选项】,勾选将最佳权重保存为新变量。
结果:
在输出视图中看对数似然值这个图,列出了9个拟合指数,及其对应的对数似然值,其中右上方带a的数字,为最佳拟合指数。在本例中为-0.5 ,即权重按照1/人口-0.5的函数关系来计算权重。
并在数据视图中出现一列新的变量WGT_1,为生成的每一项的权重系数。
step4.做线性回归分析,分析—回归—线性,【因变量】选入销售额,【自变量】选入收入,【WLS权重】选入WGT_1,具体假设检验过程、结果不再赘述。
需要注意:用加权最小二乘法得出的结果,在进行线性回归分析时,R方往往会小于普通最小二乘法的R方,但这不代表加权后模型的拟合程度比之前的差,此时可以不比较二者的R方。
02
有明确的权重
有以下两种方法:
1.个案加权(数据—加权个案—勾选加权个案,填入相应需要加权的变量),然后做线性回归分析。
2.在线性回归中直接选入(分析—回归—线性—在【WLS权重】中选入权重)。
扫描下方二维码,回复20180613,可获得本次案例哦~
欢迎添加
数据分析服务微信号:LYJ_312
加入社群添加微信号:spss_shequn