查看原文
其他

SPSS有话说:遇到缺失值怎么办?删除还是替换?

小明同学 SPSS有话说 2022-04-26

导   语

在SPSS中如果数据包含缺失值,会导致具体变量计算和分析时实际有效样本数据减少,不管是pairwise delete还是listwise delete的缺失值处理方法。另外,如果用Amos做结构方程模型,分析变量存在缺失值的话拟合指数会报告不全(如GFI、AGFI缺失)。因此,处理缺失值是非常重要的环节。


SPSS有话说

缺失值的处理大体上有两种方法:第一,删除有缺失值的个案;第二,缺失值替换。

哪一种方法好呢?如果样本量本身很大,那么删除个案法影响不大;但如果样本量不是很大,而存在缺失值的变量又很多,删除法会使样本量明显减少,对研究不利。那是不是缺失值替换就好呢?也不尽然。因为如果某个变量存在比较多的缺失值,用均值替换显然对结果影响很大。此外,如果一个个案本身有多个缺失值,比如10%以上的题目存在缺失值,那么这个个案数据判断为无效个案会更好。

这里又涉及到一个问题,缺失值比例多大可以认定为无效数据呢?个人认为,单纯从数量的角度来看,一个个案有10%以上的变量存在缺失值的话就可以判断该个案数据无效。但有时候我们不能笼统看缺失值的数量和比例,还要看缺失值的分布问题,例如心理学、教育学、管理学量表是分多个维度的,如果缺失值分散于不同的维度,那么较大比例的缺失值可能对整体个案数据影响不大;但如果缺失值集中于某个维度或一两个维度,简单说,同一个维度中有多个缺失值,那么比例较小的缺失值也可以导致整个维度无效,以至于整个个案样本数据无效。

那么,我们如何判断整个样本数据中有多少个变量或题目存在缺失值,以及有多少个个案的数据存在缺失值,每个个案存在缺失值的变量个数是多少?方法其实很简单,采用SPSS的“统计个案内数值个数”功能即可。

缺失值的有关操作处理请参考 数据分析,从缺失值开始


往期回顾

SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?

SPSS有话说:心理学量表总体或分维度用总分还是均分表示?

SPSS有话说:问卷或量表调查研究需要多少份或要求多大的样本量?

SPSS有话说:统计检验中的边缘显著及其转化处理

SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提。

SPSS有话说:如何用SPSS分析调查问卷和撰写调查报告?

SPSS有话说:(分析方法选择)图(常用统计概念)词在手,统计你有

SPSS有话说:问卷、量表或实验数据分析的研究框架

SPSS有话说:你收集的数据可靠吗?——信度分析

SPSS有话说:你收集的数据有效吗?——效度分析SPSS有话说:你编制或修订的题目有效吗?——项目分析SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析

SPSS有话说:探索性因素分析(EFA)与验证性因素分析(CFA)的区别

SPSS有话说:问卷中的人口学变量是否要用?以及如何选用?

SPSS有话说:李克特五点计分调查问卷的选项如何设置?


授人以鱼,不如授人以渔

给我一份数据,还你一个世界

明诚数据工作室 

数据分析 | 远程教学 | 论文指导 

统计咨询 | 课程开发 | 技术指导 

温馨提示

数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。

SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!

SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

加入我们:请点击 明诚数据工作室招贤纳士。

数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存