因素分析的结果解读
作者:Jingle 审核:X 封面:自己想吧
前面我们已经介绍了因素分析的基本原理和操作步骤,本部分介绍如何解读因素分析的结果。
举个栗子:现在要对30个省、自治区的经济发展状况进行排序,经济发展状况可通过6个指标进行衡量,分别是①GDP ②居民消费水平 ③固定资产投资 ④职工平均工资 ⑤商品价格指数 ⑥工业总产值。可得这是一个综合评价问题,各指标间存在数值关联,且各指标重要性也有所差异,因此我们通过因子分析找出能综合主要信息的少数几个随机变量并对其进行排序分析。
依次选择【分析】--【降维】--【因子分析】打开因子分析主对话框;
选择【描述】-【系数】和【KMO和Bartlett球形检验】回到主对话框;
选择【抽取】-【相关性矩阵】和【碎石图】回到主对话框;
选择【旋转】-【最大方差法】和【旋转解】回到主对话框;
选择【得分】-【保存为变量】【回归法】和【显示因子得分系数矩阵】回到主对话框;
选择【选项】-【按大小排序】和【取消小系数】回到主对话框;
在主对话框点击【确定】,分析结果及解读如下:
因素分析结果解读
1、图1 为六个原始变量之间的系数矩阵,可见变量之间确实存在一定的相关性,存在信息的重叠,进行因子分析有一定的必要性。
图1
2、图2为KMO和Bartlett球形检验结果,Bartlett检验表明,sig.为0.000,拒绝各变量独立的假设。KMO检验变量间的偏相关是否较大,KMO值大于0.7代表因子分析效果较好,小于0.5则表明不适合运用因子分析,此题KMO值为0.583,说明各变量间信息重叠程度不是特别高,可以尝试进行因子分析。
图2
3、图3给出公因子方差,表示原来六个变量中所含原始信息被提取的公因子所表示的程度,提取程度表明公因子对各变量的解释能力是较强的。
图3
4、图4 为各成分的方差贡献率和累计贡献率,只有前两个主成分的特征根大于1,SPSS默认提取前两个主成分,前两个主成分的累计方差贡献率为83.730%,因此,选择前两个主成分可以对30个省市、自治区的经济发展状况进行描述和排序。
图4
5、图5为碎石图,可以帮助我们判断各因子的重要程度,纵轴为特征根大小,横轴为因子序号,由图可见前两个因子位于陡坡,作用明显,后四个因子形成平台,特征根小于1,作用较弱,因此考虑前两个公因子即可。
图5
6、图6为成份矩阵表,反映各因子在六个变量上的载荷,各因子对各变量的影响度依次为:
Zx1=0.844F1+0.507F2+ε1
Zx2=0.706F1-0.545F2+ε2
Zx3=0.913F1+0.306F2+ε3
Zx4=0.598F1-0.661F2+ε4
Zx5=-0.604F1+0.540F2+ε5
Zx6=0.791F1+0.505F2+ε6
图6
7、图7为旋转成分矩阵。因子旋转是通过改变坐标轴位置,重新分配各个因子所解释的方差比例,使其载荷系数更接近1或0,能更好地解释和命名变量。旋转后的因子不改变模型对数据的拟合程度,也不改变各个变量的公因子方差,使因子结构变得更简单。由旋转成分矩阵可以看出,第一个公因子(Factor1)主要从GDP、工业总产值和固定资产投资来反映经济发展状况,可将其命名为总量因子;第二个公因子(Factor2)主要从职工平均工资、居民消费水平和商品价格指数来反映经济发展状况,可将其命名为消费因子。
图7
8、图8为成份得分系数矩阵。据此得出各公因子的表达式为:
F1=0.387Zx1 - 0.040Zx2 + 0.328Zx3 - 0.108Zx4 + 0.062Zx5 + 0.374Zx6
F2=-0.094Zx1 - 0.392Zx2 + 0.016Zx3 - 0.428Zx4 - 0.371Zx5 - 0.102Zx6
图8
9、依次选择【转换】-【计算变量】,考虑各公因子对应的方差贡献率比例为权数计算综合得分(见图4),生成一个新变量“Score”,代表各地经济发展状况的总体水平,如图9所示。再将“Score”进行降序排列,如图10所示。可得到30个省、自治区的经济发展情况排序,经济发展状况的前五名如图11所示。可以看到广东综合得分最高,排名第二的上海主要依靠消费因子在拉动经济水平,排名三四的江苏、山东则主要依靠总量因子拉动,各个因子有明确的含义,综合比较结果可以很好的解释各地区整体经济发展的优点和劣势,有利于各区域有针对性的确定发展方向和目标。
图9
图10
图11
学堂君的历史合辑:
欢迎添加
【数据分析服务】微信号:LYJ_312
【社群服务助手】微信号:spss_shequn
扫描下方二维码,回复20180729,可获得本次案例哦~