菜鸟也爱数据分析之SPSS篇——单样本柯尔莫戈洛夫—斯米诺夫检验
作者:小王子的狐狸 审稿:在路上 封面:自己想吧
大家
什么?柯尔莫戈洛夫—斯米诺夫检验?这名字也太长太难记了。
不要紧张,他可以简称为K-S单样本检验。
SPSS学堂
那什么是K-S单样本检验呢?
是指通过一组观测数值,判断样本总体是否服从某种特定的理论分布,属于非参数检验方法。这些理论分布在SPSS操作中有:
①正态; ②均匀; ③泊松; ④指数。
下面就以某36辆车的“耗油量数据”实例来检验在显著性5%的水平下,是否服从正态分布。数据如图1.1所示。
图1.1 耗油量数据
SPSS操作
Step01:选择“分析——非参数检验——旧对话框——单样本K-S检验”,得到“单样本柯尔莫戈洛夫—斯米诺夫检验”对话框,如图1.2。
图1.2 单样本柯尔莫戈洛夫—斯米诺夫检验对话框1
Step02:将变量“耗油量(升/百公里)”移至右侧“检验变量列表”框中,点击右上方“选项”,选择“描述”,如图1.3;检验分布勾选“正态”,如图1.4。
图1.3 单样本K-S:选项对话框
图1.4 单样本柯尔莫戈洛夫—斯米诺夫检验对话框2
Step03:单击“确定”,得到结果,如图1.5和1.6。
图1.5 描述统计结果
图1.6 单样本柯尔莫戈洛夫—斯米诺夫检验结果
结果解读
图1.5对变量“耗油量”的平均值、标准差、最小值和最大值进行了描述。
图1.6中,给出了相应的检验统计量。从表中可以看出,渐进显著性P值为0.011,小于显著性水平5%,故拒绝原假设。也由此判断该部分车辆耗油量数据不服从正态分布。
当然,单样本K-S检验不止可以检验样本数据是否服从正态分布,还可以进行泊松分布、均匀分布以及指数分布的检验。你们可以动手试试哦。
关注下方二维码,在公众号中输入“20180219”即可获得操作数据。