查看原文
其他

【量化研究】主成分分析和因子分析的SPSS实现比较

2016-06-20 计量经济学服务中心

计量经济学服务中心  ID: jingjixue100 

计量经济学服务中心,专注于人文社科和经济管理,关注论文指导、软件操作、研究方法、建模分析、数据服务!关注知识,发现价值!


主成分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛,可以解决经济、教育、科技、社会等领域中的综合评价问题。


主成分分析采用降维的思想,将研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。


因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。


但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。本文就此对主成分分析和因子分析的异同进行比较,并在SPSS和DPS软件上如何实现给予说明。


一、主成分分析与因子分析的异同点

两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数;4、合成方法一致:都没有考虑原始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。

两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、实际意义:主成分没有实际意义;公因子有实际意义;4、应用:主成分侧重信息贡献、影响力综合评价;因子分析侧重成因清晰性的综合评价。

二、SPSS上的实现
1、主成分分析在SPSS上的实现
(1)将原始数据无量纲化。传统主成分分析进行无量纲化处理的方法是“中心标准化”,这在SPSS中通过Analyse-Descriptive Statistics-Descriptive中Save standardized values as variables执行。但是,该方法把各指标的方差化为1,这就消除了各指标变异程度上的差异,进而从丢失一部分信息的数据中提取主成分是不可取的。可以采用“均值化”或“初始化”的方法进行处理。(2)Analyse-Data Reduction-Factor Analysis,弹出Factor Analysis对话框。(3)Descriptives:Correlation Matrix框中选Coefficients,Statistics框中选Initial solution。(4)Extraction:Method框中选Principal components;Analyze框中选Correlation matrix;Display框中选Unrotated factor solution;Extract框中选Eigenvalues over,数值为0;Maxium Iteration for convergence中默认值为25。(5)结果显示在Output中:提取“Total Variance Explained”中主成分的累计贡献率大于等于85%的主成分个数;“Component Matrix”中第i个主成分的列向量除以相应特征根的平方根后就得到这个主成分的变量系数向量,可以利用“Transform-compute”来实现。(6)写出主成分表达式及主成分命名:利用(5)中的结果写出主成分表达式,Fi=x1×a1i+x2×a2i+……+xp×api,其中x1、x2、……、xp是无量纲化处理后的向量,a1i、a2i……、api是第i个主成分的变量系数向量;根据“Component Matrix”中第i列中系数绝对值大的对应变量对Fi命名。(7)写出综合主成分:其中 为第i主成分的贡献率。可利用“Transform-compute”来实现。

2、因子分析在SPSS上的实现。

(1)—(4)步同主成分分析;(5)Rotation:Method框中选Varimax(方差最大法);Display框中选Rotated solution;Maxium Iteration for convergence中默认值为25。(6)Scores:选中Save as variables;Method框中选Regression;选中Display factor score coefficient matrix。(7)结果显示在Output中:提取“Total Variance Explained”中特征值累计贡献率大于等于85%的因子个数;“Rotated Component Matix”为因子载荷阵B。(8)求因子得分函数并对因子命名:因子得分函数为,Zi=x1×bi1+x2×bi2+……xp×bip,其中bi1、bi2、……bip为Output中“Component Score Coefficient Matrix”的第i列向量;将因子载荷阵B中的第i列绝对值大的对应变量归为一类,并命名。(9)求综合因子得分值,其中vi/p,为Output中“Total Variance Explained”中的“Rotation Sum of Squared Loadings”栏下的“% of Variance”列。(10)对综合因子得分进行排序。

由以上可以看出,在用SPSS实现主成分分析和因子分析时,是从因子旋转开始有所不同的,主成分分析不用进行因子旋转,也不用计算因子得分,而因子分析通过进行因子旋转,使得公因子上有较大的载荷,因子的意义更加明显。


热门图文TOP5

1、【原创·大秦学术·第二期】学术论文写作方法——基于实证研究的视角

2、Stata : 论文中数据分析的一把利剑

3、本科硕博科研论文常去的网站

4盘点史上最牛的博士论文

5、中心已经正确的打开,等你来阅读



·END·

计量经济学服务中心

计量经济学服务中心



学术问题,一对一专家解决

打造中国最大的人文社科+经管类学术交流学习平台

论文指导、软件操作、学术技能、数据分析等,一起见证学术力量

见证学术力量

让知识更有价值

让学术更有价值

学术小组QQ群:219246913(500人大群)

打造中国最好的Eviews/SPSS/STATA/SAS/R咨询群,做最好的学术交流群!


点击图片进一步了解中心

点击左下角阅读原文可以了解更多中心专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存