作者:小王子的狐狸 审稿:在路上 封面:自己想吧
1. 什么是卡方检验呢?
卡方检验是一种判断样本是否符合特定分布的非参数检验方法,用于检验观察值与期望值是否吻合。
2. 原理
卡方检验的原假设H0为:样本所属的总体分布与理论分布无显著差异。
公式中,f0是实际观察频数,fe是期望频数。当观察频数与期望频数越接近,χ2值越小,不能拒绝原假设(零假设);观察频数与期望频数相差越大,χ2值越大,越没有证据支持原假设。
由于卡方检验是奠定在皮尔逊定理的基础上的,要求样本量要足够大,所以使用时建议样本量不应小于30,同时每个单元中的期望频数不能太小。
3. SPSS操作
以人们对数字有没有特别的偏好为例,以50名受访者为观察对象,在数字6-9中选择一个数字。
(1)卡方检验对话框
选择“分析”—“非参数检验”—“旧对话框”—“卡方”命令,弹出“卡方检验”对话框。如图1.1所示,“检验变量列表”框中移入了本次例子中需要比较的变量“prefernumber”。
图1.1 “卡方检验”对话框
Tips:检验变量列表中,可以选择多个变量,SPSS会分别对各个变量进行卡方检验。
(2)设置相应选项
“期望范围”选项组
“期望值”选项组
该选项组用于设置总体中各分类所占的比例,包括“所有类别相等”和“值”选项。“所有类别相等”是系统默认选择,即检验总体是否服从均匀分布;若选择“值”,则用户需输入指定分组的期望值。需要注意的是:值输入的顺序要与检验变量递增的顺序相同。
“精确”按钮
若单击“精确”按钮,则弹出如图1.2所示的“精确检验”对话框。
图1.2 精确检验对话框
精确检验用于设置计算显著性水平的方法,有3种方法:
仅渐进法:系统默认设置,表示显著性水平的计算基于渐进分布假设。渐进方法要求足够大的样本容量,如果样本容量偏小,该方法将会失效。
蒙特卡洛法:一般用于不满足渐进分布假设的巨量数据。使用时,应在“置信度级别”和“样本数”输入相应数据。
精确:该方法可以得到精确的显著性水平,但是缺点是计算量过大。用户可以设置相应的计算时间,如果超过该时间,SPSS将自动停止计算并输出结果。
若单击“选项”按钮,则打开如图1.3所示。
图1.3 选项对话框
“选项”对话框包括“统计”和“缺失值”两个选项组。
“统计”选项组:用于设置输出的统计量,包括“描述性”和“四分位数”两个复选框,本例就选择了“描述性”框。
“缺失值”选项组:该选项组用于设置缺失值的处理方式,包括“按检验排除个案”和“成列排除个案”两个单选项,前者是指如果指定多个检验,将分别独立计算每个检验中的缺失值;后者表示从所有分析中排除任何变量具有缺失值的个案。
(3)分析结果输出
本例中,得出如图1.4、1.5和1.6的结果。
图1.4描述统计结果
图1.4给出了“个案数”、“平均值”、“标准差”、“最小值”和“最大值”等描述性统计量;
图1.5 卡方检验频数表
图1.5 给出了实际个案数、期望个案数以及残差值。
图1.6 卡方检验统计表
图1.6给出了相应的检验统计量。从表中可以看出,渐近显著性P值为0.451,我们不能拒绝原假设,所以认为人们对数字6-9没有特别偏好。
后面的文章会给大家一一介绍拟合度检定、适合度检定、同质性检定等。
关注下方二维码,在公众号中输入“20180226”即可获得操作数据。