查看原文
其他

直线相关还是秩相关? | 30天学会医学统计与SPSS公益课(Day15)

郑老师 医学论文与统计分析 2023-10-23

30天打卡学习医学统计与SPSS

本课程是高校医学统计学教授的公益、免费公开课!如假包换!我将每天推送视频和文字教程,讲授基于医学数据的各种统计分析策略。如果你能跟得上节奏,我相信在一个月后,您将会掌握医学数据分析方法。
1.9分钟视频介绍:为什么推荐您学习这门课?
2. 课程所需的SPSS全套视频、数据库、讲义下载2021年如何学习医学统计学?无偿奉上我们精心制作的医学统计学全套资料
3.“高校公益免费课程新一期” 详细介绍:公益课程“30天学会医学统计与SPSS”再次开课,欢迎入群学习!
如果您真的能够坚持,发送关键词“打卡”,加入微信学习群吧。骗人?不存在的。你们能够学会医学统计学,我将视为这是一种成就。
此外面向医务工作者,我们也开设“统计跟学课程【学不会全额退款】:面向医务工作者的“30天学会分析医学数据”新一期课程即将开课
更多培训请点击查看:R、Meta、重复测量、量表分析


Day 15:相关分析:直线相关VS秩相关

隶属第四章:现况调查的统计分析策略


本日学习任务

1. 微信群内视频1段 (共32分钟)2. 公众号公开推文1段: Day 153. 微信群内测试题4. SPSS实操和群内讨论
欢迎加入高校公益免费群全面学习医学统计学与SPSS应用(发送关键词“打卡”到公众号)

无论实验性研究还是观察性研究,都少不了相关分析的身影,尤其是现况调查和队列研究。在现况调查中,相关分析往往可以用于多个指标之间的关联性分析,是数据探索性分析必要的工具(下图)。

现况调查的分析过程及相关分析的位置


相关分析特指一种可以研究两个变量相关性大小与有无的方法。常见的相关分析包括直线相关分析与秩相关分析。

直线相关VS秩相关分析


直线相关和秩相关均用于探讨两个变量的是否存在着关联,且可以提供相关系数来分析相关性的强弱。

两者存在着异同,具体可见下表:
1. 直线相关分析是以均数为基础的参数检验,秩相关分析是以秩次为基础的非参数检验

2. 在变量要求上,直线相关分析要求双变量正态定量变量,秩相关分析要求双变量定量或者等级,一般倾向于用于至少一个变量为偏态或等级变量的关联性分析。

3.直线相关分析主要用于探讨直线关系的有无,曲线相关时,直线相关系数r值和P值均不能反映真实的相关性。因此,必须有两个变量必须有线性趋势(如下图)。秩相关分析相关则不一定意味着一定是直线相关。无论哪种相关,都可以开展直线相关分析,其结论是否可靠,前提是散点图线性趋势是否存在。
3.1 若直线相关趋势存在,根据变量的特征选择直线或者秩相关分析。
3.2 若直线相关趋势不存在,直接弃用直线相关分析
3.3 若直线相关趋势不存在,秩相关统计分析显示存在着相关,可以认为存在着相关,但不能说直线相关
总的来说,直线相关分析特点是灵敏,在线性趋势明显、正态分布的情况下,直线相关分析容易获得阳性结果;但是在存在异常值、偏态分布数据时,过于灵敏的结果反而不是好事,此时,秩相关分析一如既往稳健。因此,双变量正态或者近似正态分布时,可优先考虑直线相关,但是至少有一个是等级或者偏态分布的资料,推荐秩相关分析。

相关分析的内容


相关分析内容包括计算相关性程度、判断相关性的有无。

计算相关性程度一般便是计算相关系数。相关系数分为总体相关系数和样本相关系数r。
•总体相关系数ρ:若ρ≠0, 称变量存在着相关;若ρ=0, 则简称两变量不相关。
•样本相关系数r :往往用来代替总体相关系数

总体相关系数是关于总体人群的两个变量相关性,也是研究所想知道的指标。但统计分析能够计算的,只能是样本相关系数r值,而用r来代替总体反映两个变量的相关性程度。

•r的取值范围为|r|≤1,绝对值大小表示两变量之间直线联系的密切程度。
•当r为负值时,表示当一个变量的取值增大时,另一个变量的取值减小,即呈相反的变化方向,称为负相关;当r为正值时,表示两个变量的变化方向一致,称为正相关。
•所以相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。


相关性强弱不代表相关性有无。相关分析另一主要任务,是猜测总体是否存在相关。猜测总体需要开展假设检验,目的是探讨总体ρ是否等于0,这一步即探讨相关性是否真实存在(相关性的有无)。

相关分析总体ρ的假设检验采用t检验,探讨H0:ρ=0是否成立。若P<0.05,则拒绝H0,接受H1:ρ≠0, 总体上相关性成立,P>0.05,还不能说相关性成立。

相关分析的步骤


根据相关分析的对数据的要求、统计分析的内容,相关分析必须要结合一下步骤进行,缺一不可:

第一步,绘制散点图,看线性趋势。若线性趋势不成立,弃用直线相关分析。
第二步,定量变量的正态性判断。一般可以通过绘制直方图结合正态性检验完成。
第四步,计算相关系数r。
第五步,开展假设检验,判断总体相关性的有无。

实例分析


•例1:现有15例糖尿病患者,测得每位患者的胰岛素和血糖水平。问题:糖尿病患者胰岛素和血糖水平有无关系?数据详见lincorr.sav



•例2:为评价尿液黄曲霉素与居民肝癌的关系,某疾控中心调查了肝癌死亡率,并对黄曲霉素进行了检测,结果如下,黄曲霉素与肝癌死亡率是否相关?详见rankcorr.sav



•例3:为为评价尿液黄曲霉素与居民肝癌的关系,某疾控中心调查了肝癌死亡率,并对黄曲霉素进行了检测,肝癌死亡率分为高(3)、中(2)、低(1)三档、黄曲霉毒素含量也分为高、中、低,黄曲霉素与肝癌死亡率是否相关?见rankcorr1.sav



1


案情分析

三个案例均研究两个变量的关联性,其中案例1、案例2,两变量均为定量数据,案例3为等级数据。无论定量数据或者等级数据相关性,可以考虑相关分析。


2


统计分析策略

按照相关分析的步骤,首先需要考虑的是变量的线性关系和正态性问题。

散点图
可以看出,三个案例两个变量的关系存在着线性趋势

正态性问题:
案例1:从正态性和直方图可以判断正态性条件符合。


案例2:从正态性和直方图可以判断正态性条件不符合。

案例3:等级资料直接开展秩相关,无须正态性判断。

因此,案例1可以采用直线相关分析,案例2、3应采用秩相关分析

相关分析方法SPSS操作



1


相关分析入口

直线相关分析与秩相关分析SPSS分析入口:分析-相关-双变量




2


相关分析主界面

 直线相关分析与秩相关分析主界面如下,可以分布选择直线相关分析(①Pearson)或者秩相关分析(②Spearman).



33

线性相关分析


案例1的线性相关分析界面:同时选择“胰岛素”和“血糖”进入右选框,选择“Pearson”

案例1的分析结果:结果显示,胰岛素与血糖值的关联性存在着统计学差异(r=0.878,P<0.001)


4


秩相关分析入口

案例2的秩相关分析界面:同时选择“肝癌发病率”和“黄曲霉素含量”进入右选框,选择“Spearman”

案例2的分析结果:结果显示,肝癌发病率与黄曲霉素含量的关联性具有统计学差异(r=0.721,P=0.019)

案例3的秩相关分析界面:同时选择“肝癌发病率”和“黄曲霉素含量”进入右选框,选择“Spearman”。

案例3的分析结果:结果显示,肝癌发病率(等级)与黄曲霉素含量(等级)的关联性无统计学差异(r=0.465,P=0.176)。

相关分析方法SPSS操作


1.近似正态分布时、或不严格直线关系时,秩相关分析不弱于直线相关分析。

一般正态分布情况下,直线相关分析检验效能略高于秩相关分析,但是遇到近似正态分布时、或不严格直线关系时,仍然可以用直线相关分析开展统计,但是也可以用秩相关分析来开展相关分析,且相关性程度r值可能更好,P值更小,比如案例1属于近似正态分布,但直线相关系数0.878,而秩相关系数为0.911。

2. 偏态分布、存在极端值时,直线相关分析结论不可靠
在案例2中,如果如果我们采用直线相关分析,结果是r=0.906,比秩和相关分析的r大。

秩和相关分析的r=0.721,小于直线相关分析。

那么,我们能用直线相关分析吗?当然不行!虽然直线相关分析的r更大,P值更小,但是偏态分布或者存在着极端值的数据,不能采用线性相关分析。

3. 等级变量之间的相关性,kendall检验了解一下
相关分析界面中,还存在着Kendall检验,该方法专用于等级变量与等级变量的相关分析,其结果与秩相关分析结果相似。因此,案例3可以用Kendall相关分析来探讨。

结果显示,肝癌发病率(等级)与黄曲霉素含量(等级)的关联性无统计学差异(r=0.381,P=0.206)。


最后提醒:要学习本推文的完全对应的课程视频,请发送关键词“打卡”入群高校公益免费课程群来学习吧。

-本讲结束-


更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.2006-2020中国卫生统计年鉴完整合集免费下载
6.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
7.“如何在90分钟学会统计分析?” 来下载PPT学习吧!还有免费直播视频
特别提醒:上述列表资源每天限分享和下载一个。

培训通告

2021年,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班。如果您有需求,不妨点击查看:

来参加吧,通俗易懂的统计培训课:R、SPSS、Meta、重复测量以及量表分析

如果您觉得文章不错,
为我们打“call”,
点击“分享”吧



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存