SPSS有话说:遇到缺失值怎么办?删除还是替换?
导 语
在SPSS中如果数据包含缺失值,会导致具体变量计算和分析时实际有效样本数据减少,不管是pairwise delete还是listwise delete的缺失值处理方法。另外,如果用Amos做结构方程模型,分析变量存在缺失值的话拟合指数会报告不全(如GFI、AGFI缺失)。因此,处理缺失值是非常重要的环节。
SPSS有话说
缺失值的处理大体上有两种方法:第一,删除有缺失值的个案;第二,缺失值替换。
哪一种方法好呢?如果样本量本身很大,那么删除个案法影响不大;但如果样本量不是很大,而存在缺失值的变量又很多,删除法会使样本量明显减少,对研究不利。那是不是缺失值替换就好呢?也不尽然。因为如果某个变量存在比较多的缺失值,用均值替换显然对结果影响很大。此外,如果一个个案本身有多个缺失值,比如10%以上的题目存在缺失值,那么这个个案数据判断为无效个案会更好。
这里又涉及到一个问题,缺失值比例多大可以认定为无效数据呢?个人认为,单纯从数量的角度来看,一个个案有10%以上的变量存在缺失值的话就可以判断该个案数据无效。但有时候我们不能笼统看缺失值的数量和比例,还要看缺失值的分布问题,例如心理学、教育学、管理学量表是分多个维度的,如果缺失值分散于不同的维度,那么较大比例的缺失值可能对整体个案数据影响不大;但如果缺失值集中于某个维度或一两个维度,简单说,同一个维度中有多个缺失值,那么比例较小的缺失值也可以导致整个维度无效,以至于整个个案样本数据无效。
那么,我们如何判断整个样本数据中有多少个变量或题目存在缺失值,以及有多少个个案的数据存在缺失值,每个个案存在缺失值的变量个数是多少?方法其实很简单,采用SPSS的“统计个案内数值个数”功能即可。
缺失值的有关操作处理请参考 数据分析,从缺失值开始。
往期回顾
SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?
SPSS有话说:问卷或量表调查研究需要多少份或要求多大的样本量?
SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提。
SPSS有话说:(分析方法选择)图(常用统计概念)词在手,统计你有
SPSS有话说:探索性因素分析(EFA)与验证性因素分析(CFA)的区别
授人以鱼,不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!