作者:小王子的狐狸 审阅:在路上 封面:自己想吧
如何在成千上百万个数据中标识重复个案
倾听你声
不知道大家有没有听说过这么一种说法,大意就是:一件事或者一个技能,如果我们能花上10000个小时,那么不想专业都难。要是我们每天能花半个小时学习一个小技能,那是不是离专业就近了一步呢。
本文就带大家来学习一个小技巧,如何运用SPSS标识重复个案。我们都知道在Excel中,通常会用到“筛选”功能来选出指定条件相同的单元格。
那么在SPSS中,如何在成千上百万个数据中筛选出重复的个案呢? 小编就是要告诉你,几个步骤轻轻松松搞定。
Step1:当然是导入或者打开数据,前面文章已经介绍到了不同格式的文件如何导入到SPSS中。(如果错过了之前文章的伙伴,可以进入公众号查看历史消息。)
本文,选择了某超市双十一当天的交易明细部分数据。如图1.1。
图1.1 某超市双十一交易明细
Step2:选择“数据”菜单下的“标识重复个案”,弹出相应对话框。如图1.2。
图1.2 标识重复个案对话框
Step3:在上个步骤的基础上,将左边的所有变量都移至右边“定义匹配个案的依据”中,其他的选项没有特殊要求的可保持默认,如图1.3。单击“确定”即完成。
Tip:在第3步,左边的变量移至右边框中时,可按住第一个变量,然后用Shift键同时按住最后一键,搞定所有变量。图1.3 标识重复个案对话框2
Step4:完成之后,就会出现一个新变量“最后一个基本个案”,如图1.4。
图1.4 标识重复个案结果展示
Step5:然后,右击“最后一个基本个案”变量,选择“升序排序”,这时就会将重复个案展现在最前面了。
图1.5 标识重复个案结果(去除值标签)
Step6:选中“最后一个基本个案”下的变量值为0的个案,鼠标右键,“清除”,就将重复的个案删除了。
以上就是本文的如何标识重复个案的操作步骤,是不是很简单呢,只要找到“标识重复个案”的功能键就可以啦。
快来动手操作下吧。
有问题可在下方留言哦。
1最后,需要数据的伙伴可在公众号下,输入“20180108”即可获取哦。