菜鸟也爱数据分析之SPSS篇——Spearman等级相关
作者:小王子的狐狸 审稿:在路上 封面:自己想吧
什么是等级相关
等级相关,也称为秩相关,属于非参数统计方法,但对原变量的分布不作要求。适用于那些不服从正态分布的资料,还有总体分布未知和原始数据用等级表示的资料。
为什么要运用等级相关?
实际中,如果遇到定类变量或者定序变量的“相关系数”,就需要用到Spearman(斯皮尔曼)等级相关系数和Kendall(肯德尔)的tau相关系数。本文就Spearman等级相关进行介绍。
Spearman等级相关系数
(1) Spearman等级相关系数适用于定序变量与定序变量之间的相关系数。计算公式为:
其中,di=(xi-yi), xi和yi分别是两个变量按大小(或优劣)排序的秩,n是样本的容量。
Tips:与简单相关系数一样,Spearman等级相关系数的取值范围也为:[-1,1],绝对值越大,相关性越强。rs为正数时,则认为存在正的等级相关;rs为负数时,则认为存在负的等级相关。同理,rs=1时,则表明两个变量的等级完全相同,存在完全的正相关。反之亦然。
(2)计算统计量的值与制定统计决策
如果样本数n≤10,并且rs的绝对值大于等于“Spearman等级相关系数检验临界值表”(见文章最后的附录)中显著水平α的临界值,即统计量落在否定域中,拒绝零假设,Spearman等级相关系数显著;否则,接受零假设,Spearman等级相关系数不显著。
如果样本数n>10,则根据rs计算统计量
的值,在显著水平为α时,统计量的值落在否定域{t||t|>tα/2(n-2)}中,拒绝零假设,Spearman等级相关系数显著;否则,接受零假设,则Spearman等级相关系数不显著。
Spearman等级相关系数的spss操作
以“某10个品牌的知名度和售后服务质量”为例,运用Spearman等级相关系数进行检验变量品牌知名度和变量售后服务质量之间的相关性。具体数据如图1。
图1 某10个品牌的知名度和售后服务质量排序数据图
Step1: 选择“分析—相关—双变量”,弹出对话框“双变量相关性”,将变量“品牌知名度排位”和变量“售后服务质量评价排位”移至右侧“变量”框中,“相关系数”复选框勾选“斯皮尔曼”,显著性检验默认不变。如图2。
图2 “双变量相关性”对话框
Step2:完成变量和选项设置后,单击确定。得到非参数相关性检验结果。如图3。
图3 斯皮尔曼等级相关检验系数结果
结果分析
本例的样本n=10,参照Spearman等级相关系数检验临界值表,得到的结果相关系数为0.879>0.648,表明拒绝零假设,Spearman等级相关显著,说明提高售后服务质量,有利于增加品牌知名度。显著性水平为0.001<0.05,表明两变量之间的正向关系很显著。
附录:
大家可以动手试试当样本量n>10时,spss操作大同小异,关键可以增强心理体验。
扫描关注下方二维码,回复“20180313”,可获得操作数据。