查看原文
其他

主成分回归分析在SPSS中的实现

学术无界 学术无界 2019-06-30

中国移动

11:27

100 %

微信(2)

学术无界

Hi,听说今晚“小白计量组”要登场?

对呀,对呀。

计量小白表示好激动、好期待~

要想看到更多计量推文,可以关注“学术无界”,锁定每周六的推文,当然也可以申请加入“小白计量组”啦~

好的,已关注“学术无界”,并和小编取得联系了。对了,今晚推什么呢?

今晚讲“主成分回归在SPSS中的应用”,准备好喔,要放大招了~



一、标准化处理

分析—描述统计—描述,将需要进行标准化处理自变量选入变量框,如果要作回归分析,则也需要将因变量选入变量框。


注:SPSS描述指令中采用的是Z标准化,也称标准差标准化,它是将变量中的观察值(原数据)减去该变量的平均值,然后除以该变量的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1,也是spss中最常用的标准化方法。






补充:其他标准化方法,可以通过“计算变量”求得标准化变量

注:公式(1)(2)(3)(4)来自《现代地理学数学方法》(第二版),徐建华,高等教育出版社,2002。







二、主成分分析

分析——降维——因子分析,把Z标准化后的数据选入变量框,在“描述”中选中“KMO和Bartlett的球形度检验”,在“抽取”的“方法”中选择“主成分”,在“输出”中选中“未旋转的因子解”和“碎石图”,在“抽取”中选择“基于特征值大于1”(也可以选择“因子的固定数量”,根据分析内容需要而定),在“旋转”中选择“最大方差法”,在“得分”中把“保存为变量”和“显示因子得分系数矩阵”都勾选上。

三、结果分析

   

(1)KMO和Bartlett检验

如果出现KMO和Bartlett的值太小或者不合适的情况,就需要看公因子方差表中是否有变量的提取值过小,先将提取值较小的变量剔除或用其他变量替换,再用主成分分析得到新的KMO和Bartlett检验值,如果不满足,需继续调试,直到合适。

(2)公因子方差

(3)解释的总方差

经过最大方差法旋转后,旋转平方和载入的累积%一般要大于85%。

(4)旋转成分矩阵

在旋转成分矩阵中,提取三个主成分所包含的变量

(5)成分得分系数矩阵

主成分得分系数矩阵可以说明各主成分在各变量上的载荷,从而得出各主成分的表达式,注意在表达式中各变量已经不是原始变量,而是标准化变量:

四、计算得分

综合得分=(FAC1_1 * 31.228 + FAC2_1 * 28.407 + FAC3_1 * 27.582) / 87.217

五、主成分回归

按默认的方法进行回归分析,可根据具体情况而选择回归分析方法和检验方法等。

六、结果汇总

为了用标准化的自变量来表示回归方程,由前三个主成分的系数向量组成的矩阵和主成分回归系数系数估计量,得到:

这样就求出了标准化变量前的系数,进而有:

注:操作说明比较简略,主成分分析和回归分析每种方法、每个命令的含义在SPSS教材中都会有相应的说明(如《SPSS统计分析高级教程(第二版)》张文彤,董伟,高等教育出版社),可以通过学习和自己操作更深刻每个命令的含义。


本操作说明存在错误或不当的地方,还望各位同仁批评指正,谢谢!


大家可以在公众号后台回复“主成分回归”,获取彩蛋!


推文期数:2018094

责任编辑:卢雅焱,刘亮,李飞

                王根茂,钱祥炎,李静           

推文审核:张天舒,梁龙武 ,骆丹云

总审核:学术无界顾问团

下期预告:考研咨询|2019考研政治变化点汇总

往期回顾:

地理探测器及其在人文地理学中应用

BCL教师节献礼|他们竟然将全国网格的多维度城市活力数据都共享了!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存