相关分析:傻傻分不清楚?
点击上方蓝字,关注:
政治学与公共管理定量方法学习 微信公众号
“好吃懒做”的假期结束,华丽变身大四狗的小编,看着校园里的小鲜肉们,不禁感叹岁月流逝,老泪纵横(口水直流.gif)。突然,一条来自学妹的微信使小编鸡血满格,心想是时候爆发#学长力#了!于是在各种想象中点开信息:
——学长,我想对调查问卷的数据做相关分析,可又是积差相关,又是等级相关的,用哪个好呀?
额…不管怎样,作为“负责任”的学长,我还是决定好好回答这个问题。
认真脸.jpg
一、积差相关
积差相关是我们的老相识了,我们中学就见过它。相信你看到下面的相关系数公式就会想到那段“黑暗时光”了:
积差相关系数也叫Pearson相关系数或动差相关系数。这种分析适用于:
①两个变量都是由测量获得的连续性数据,即等距或等比数据。
②两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态。
③必须是成对的数据,而且每对数据之间是相互独立的,即各自互不影响。
④两个变量之间呈线性关系。
举个栗子,可以在“农村居民家庭人均纯收入”和“城镇居民家庭人均可支配收入”两者之间计算Pearson 相关系数,并得到统计显著性检验的结果。
二、等级相关
以等级次序表示的变量之间的相关。适用于:
①虽然是连续数据,但变量总体上不服从正态分布,
②数据是顺序的。
主要有:斯皮尔曼等级相关、肯德尔W系数、肯德尔U系数,前者用于只有两列变量的情况,后两者用于三列及三列以上变量的情况。
以Spearman 等级相关为例,来进一步介绍一下。当两个变量值以顺序、等级排列(顺序变量、等级变量)时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,可采用Spearman等级相关系数来测量。比如可以计算城镇居民家庭平均每人全年可支配收入(x)和城镇居民家庭平均每人全年消费性支出(y)两者之间的Spearman 等级相关系数,并得到统计显著性检验的结果。
Spearman等级相关系数是这样计算的:设有配对样本观察值x和y,RX表示x的等级,RY表示y的等级,d= RX-RY,于是
到这里,你就可以知道,SPSS做相关分析时,下面的选项是做什么的了。
三、质量相关和品质相关
质量相关适用于一列变量为等比或等距的测量数据,另一列变量是按性质划分的情况。包括点二列相关、二列相关、多系列相关。我们可以由一次测验的卷面总分和一道问答题的得分的数据,用质量相关求该问答题的区分度,即求该题得分与总分的相关程度,也就是说该题的答对答错是否与总分有一致性。
品质相关适用于两个变量均为分类数据时,比如某高校不同师生对学校某项改革政策的态度、青年大学生的性别与对心理测验态度的关系等。
四、偏相关分析与典型相关
偏相关是指在多个变量中,剔除了(控制了)其中的一个或若干个变量的影响后,两个变量之间所存在的相关关系。比如以2016年我国31 个省市出口商品、国内生产总值和实际利用外资的相关统计数据为依据,研究出口商品与国内生产总值的关系。
典型相关研究的则是一个变量组的综合结果与另一个变量组的综合结果之间是否存在相关。比如,通过对“科技投入”(包括经费支出额、科学家工程师构成等变量)以及“科技产出”(包括发明专利授权量、高技术产品出口额等变量)两组变量的典型相关分析来研究两者之间存在的内在关系。
写到这里,开头的问题终于回答完了。
小编太懒,写不动了
【本期主要参考】
范柏乃、蓝志勇,《公共管理研究与定量分析方法》,科学出版社,2013年版.
【荐稿投稿】请电邮至pspa_qrm@163.com,请注明文章来源或作者信息。
可以扫码关注哦^—^