SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提
导语
重要的事情说三遍!了解数据类型是进行相应统计分析的前提。不同的数据类型对应的统计分析方法不同,例如,卡方检验、T检验和方差分析均是差异检验的重要方法,但是三者所针对的数据类型不同。除了之前介绍的连续数据和离散数据,数据类型还可以怎么划分?
SPSS有话说
根据数据所反映的测量水平,可以将数据分为称名数据、顺序数据、等距数据和等比数据。四种数据的特点如下:
(一)称名数据(名义变量)
又称名义数据,按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例如,按照性别将人口分为男、女两类,按肤色分为白种人、黄种人、棕种人、黑种人四类,按洲别分为亚洲人、欧洲人、美洲人、非洲人、澳洲人五类。
(二)顺序数据(顺序变量、等级变量)
又称等级数据,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:人可以根据年龄分为幼年、少年、青年、中年、壮年、老年等类。满意程度可分为非常满意、比较满意、没有不满、不满意、很不满意几类。
(三)等距数据(连续变量)
又称间隔数据,是对事物类别或次序之间距离的测度。该数据类型通常使用自然或物理单位作为计量尺度。例:30°C和20℃之间相差10℃,-30°C和-20℃之间也是相差10℃。再比如,1等星比2等星亮10倍,0等星比1等星亮10倍,-1等星又比0等星亮10倍。等距数据可以进行加、减运算,不能进行乘、除运算。其原因为等距数据中没有绝对零点(等距数据中的“0”是作为比较的标准,不表示没有)。
(四)等比数据(连续变量)
又称比率数据,由于等比数据有绝对零点(定比尺度中的“0”表示没有,或者是理论上的极限)。因此,不仅可以进行加减运算,还可以进行乘除运算。例如,绝对温度300K(27℃)时理想气体的体积273K(0℃)时的1.1倍,温度比也是1.1倍,则绝对温度和体积都是等比数据。一般来说,等比数据不可能取负值。一般也不会取零值,因为要么就是不存在了,要么就是极限情况。如,绝对零度只能无限接近,不可能完全达到。如果一个物体的体积为零,那么它要么不存在,要么是数学中的抽象概念,比如,几何中的点、线、面的体积都为零。而一个人的年龄为0时呢?作为社会学意义上的人,可以认为它是极限(开始);作为生物学上的人,则是等距数据的。
但在实际统计分析中,各种统计检验的使用条件中,等距数据和等比数据是一样的,因此,等比数据被归入等距数据中。这也解释了你在SPSS的数据类型中只能看到三种类型,即名义、有序和标度。
往期回顾
SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?
授人以鱼不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!