数据分析,从非参数检验开始
问题
前面介绍的处理连续数据的统计分析方法为参数检验,参数检验对于总体的分布有一定的要求,参数检验的条件较为严格,如t和F的独立性、正态性和方差齐性。当资料不满足时,理论上运用上述方法会有一定的误差,如果不用t和F,还有没有其他方法进行补充或替代呢?接下来,我们介绍非参数检验的相关知识。
相关知识
非参数检验是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
参数检验与非参数检验的比较:
非参数检验分类:
1、 单样本非参数检验方法:
SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。
2、 两样本非参数检验方法:
(1)两独立样本的非参数检验
在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。
(2)两相关(配对)样本的非参数检验
两相关样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。
SPSS提供的两相关样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。
3、 多样本非参数检验方法:
(1)多独立样本的非参数检验
多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指按独立抽样方式获得的多组样本。
SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。
(2)多相关(配对)样本的非参数检验
多相关样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。
SPSS中的多相关样本的非参数检验方法主要包括Friedman检验、CochranQ检验、Kendall协同系数检验等。
操作步骤
问题:分析不同性别学生的肺呼量(mmL)是否有差异?
分析:性别为二分变量,肺呼量为连续变量,如果符合正态性、独立性和方差齐性,我们应该想到前面介绍的独立样本t检验;因为非参数检验使用范围更广,我们也可以用两独立样本的非参数检验。
步骤:【分析】--【非参数检验】--【旧对话框】--【2独立样本】;如下图所示,将肺呼量放入检验变量,性别放入分组变量,并定义组为1和2,检验类型默认。点击【确定】运行。
结果解释
如下图所示,曼-惠特尼U=4089.5,威尔科克森W=44275.5,其对应的Z为-18.894,P=0.000<0.05,根据“大同小异”的原则(大于0.05不显著,小于0.05显著),男女生的肺呼量差异具有统计学意义,其中男生的均值为420.41,女生的均值为156.45,因此,男生的肺呼量高于女生。
小结
如果数据符合参数检验的条件,尽量优先选择参数检验,当条件不符合时才采用非参数检验。因为,非参数检验没有利用原始数据的具体数值信息,仅考虑了其位次(等级或符号秩),因此,非参数检验的效度没有参数检验高。非参数检验涉及的知识点比较繁多,难以一次性讲完,本次仅对其中一种检验进行讲解,我们下次再见。
所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。
授人以鱼不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析方面的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!