卢沙野大使接受法国LCI电视台直播专访

【少儿禁】马建《亮出你的舌苔或空空荡荡》

外交部迅速反应:严正抗议美冻结全国人大14位副委员长资产,中方将反制

达赖叛逃时把人皮、头骨法器都送给了谁(胆小慎入)

列宁会如何看待宝马MINI“冰淇淋事件”

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

SPSS 统计分析策略(8):随机区组设计方差分析​

郑老师 医学论文与统计分析 2022-10-07

第8讲 实验性研究定量数据统计策略(8):

随机区组方差分析


配对t检验针对两组配对设计的定量数据比较,在一些动物实验中甚至是临床试验,不是配成2组,而是配成多组,称之为配伍设计。俗话说,二人成对,三人成伍,多组数据的匹配设计,t检验就不合适了(为什么?);配伍设计,现在通用讲法是随机区组设计 (Randomized Block Design)!


随机区组设计


先将受试对象按条件相同或相近分成m个区组(或配伍组),每个区组有k个受试对象,再将其随机地分配到k个处理组中,称之为随机区组设计,保证组间分布均衡。



随机区组设计和配对设计一样,最大的优点是它可以保证非常好的可比性,而均衡可比的各处理组比进行比较分析,探讨干预措施与结局的因果关系,结论更可靠。


实例分析


某研究者将24名贫血患儿按性别、年龄及贫血程度相同或相近原则分成8个区组group(b=8)。每区组中三名儿童用随机的方式分配给A、B、C三种不同的治疗方法treat(处理组,k=3)。结局指标为治疗后血红蛋白的增加量y(g/L)。请问不同的疗法对血红蛋白含量是否有改善。数据见quzu.sav




1



思考

这个案例需要思考:

-该研究属于何种类型的研究设计

-如果是匹配设计,是配伍还是配对?

-结局变量属于什么类型的变量?

-正态性问题如何考虑?



2



案情分析

可以看出,这组数据,属于配伍设计,一共24个个体,分为8个队伍(称之为区组),每一个区组都是类似同一个模子造出来一样(性别、年龄及贫血程度相同或相近原),是不是和配对设计同一个道理?每个区组内三个个体随机分配到三组中,最后的结果就是中医、西医、饮食疗法三组人群特征非常之相似!(这就是配伍设计的最大优点)。



4



统计分析策略

本研究研究结局是定量数据,多组定量数据的比较用什么方法?不能再用t检验了,而是方差分析!

 

多组配伍设计或者随机区组设计、定量数据的比较,基本的方差分析不推荐使用(原因后文会介绍),应该采用随机区组方差分析。

 

与之前介绍的方差分析不同,随机区组方差分析双因素方差分析(two-way ANOVA)。先前介绍的方差分析只有一个因素,因此叫做(One-way ANOVA)。与简单的方差分析相似,随机区组方差分析一般也要正态性、方差齐性,它一般要求不同处理组、不同区组的数据符合正态、方差齐的条件。


首先,正态性问题,方差分析对资料正态性 的要求等价于要求残差服从总体均数为0的正态分布,因此随机区组方差分析只要对残差数据进行正态性检验即可(如何检验,稍后介绍)。


方差齐性问题方面,随机区组方差分析要求在结局指标发生变化时,方差分析模型的残差都是方差齐性的,具体可以通过残差图进行分析。


总结来说,


如何利用SPSS进行随机区组方差分析



1



随机区组方差分析入口界面

分析-一般线性模型 -单变量



2



随机区组方差分析对话框

随机区组方差分析界面相对比较复杂,本文稍作介绍。

①因变量即为结局变量,固定因子要放入研究因素。本例是group(区组因素)和treat(实验因素)


②模型:“模型”界面如下:

具体操作上,选择① 构建项。“构建项”意味着选择方差分析要纳入的研究因子。一般随机区组方差分析均选择“构建项”,也就是人工筛选因子。不推荐以“全因子”方式纳入因子。“全因子”意味着电脑纳入所有的因子进入模型(包括交互效应)。在②因子与协变量中,将group(区组因素)和treat(实验因素)通过选择③的“主效应”放入到右侧选框中(不要选择交互)



③事后比较。当存在着多个组别时,SPSS可以帮助进行多重比较,比如本例处理组(treat)有三组,可进行三组两两比较,选择bonferroni的方法进行。


④保存选项中,可以选择一系列指标,最常用的便是标准化残差值。后期可以对标准化残差自开展正态性检验,绘制直方图,看起是否的符合残差正态的要求


⑤选项中重点是开展方差齐性研究。①齐性检验在随机区组方差分析将是无结果。②残差图,可以大致看出不同结局时(本例是不同血红蛋白含量),残差方差是否相似。③可以进行异方差检验(和方差齐性检验相似)。本题选择的是布劳殊-帕甘法(Breusch-Pagan ),也可以选择怀特法(White)。



3



统计分析结果与解释



随机区组设计方差分析存在着多个结果。

第一个结果,方差分析的结果。本结果重点是group和treat的显著性(P值)。其中不同区组组对血红蛋白的影响存在着统计学差异(F=16.6,P<0.001),不同处理组对血红蛋白的影响存在着统计学差异(F=7.49,P=0.006)。


第二个结果,异方差检验结果。该研究原假设为“误差方差不依赖独立变量值”,若P>0.05,则表明方差齐。本题P=0.093, 说明方差齐性条件成立。方差齐性问题可通过残差图进一步显示。


第三个结果:残差图。残差图一般是绘制标准化残差和结局指标预测值(预测值=真实值减去残差)的散点图。可以看出随着结局指标的预测值增加,残差的分布趋向于离散,和异方差检验结果遥相呼应(P=0.093,差一点异方差现象成立)。


第四个结果,多重比较。采用bonferroni的方法进行多重比较,结果发现1vs2 无统计学差异(P=1.000),1vs3 有统计学差异(P=0.033),2vs3 有统计学差异(P=0.008)。


第五个结果,残差及正态性检验。由于上文的spss操作点击了计算残差,数据库中会增加一列名为“ZRE_1”的变量,即为Y的标准化残差


对于标准化残差,可以进行进一步进行标准化残差的正态性检验


结果如下,夏皮洛威尔克(SW)检验结果显示,P=0.347,残差正态性符合。直方图也显示其正态性特点。


结果及表格的规范表达


根据上表,我们可以得到以下的规范的结论:

规范文字:中医疗法血红蛋白改变量为10.88±6.71g/L,西医疗法血红蛋白改变量为12.13±9.06g/L,饮食疗法血红蛋白改变量5.75±10.00g/L,在调整了区组因素后,三组不同处理方法对血红蛋白的影响存在着统计学差异(F=7.49,P=0.006)。其中,与饮食组相比,中医疗法、西医血红蛋白改变量较大(P>0.05),中医疗法和西医疗法的影响无统计学意义(P>0.05)


规范的统计表(其中一种形式)为:


随机区组方差分析的注意事项


1.随机区组方差分析是多因素方差分析最基本的方式
多因素方差分析针对多种形式的医学研究设计,比如析因设计、重复测量设计、交叉设计、正交设计。随机区组设计是最简单的一种方式,它采用的是配对和随机分组相结合的方式,有效地推动了处理因素各水平的均衡可比性。

2. 要掌握随机区组方差分析,必须了解残差
本篇文章,多次出现残差一词,初学者可能不了解残差。因此,这里稍作介绍。

方差分析是对数据变异程度归属的一种研究,或者是探讨到底一组数据的变异,哪些因素造成的,它们负责了多少,或者它们解释了多少。

比如,本例,所有血红蛋白的增加量最少是-7,最大是25,数据变异明显,那为什么会发生变异呢?其中一部分原因就是不同疗法,比如中医、西医效果很高,饮食效果不太好,造成数据差异明显;另外不同区组的数据也不同,也增加了数据的变异。但是在这种情况下,总变异减去区组变异和处理因素变异后不会等于0,因为仍然有部分变异是没法解释的,这剩下的无法解释的变异就是误差,也就是所说的残差一。毕竟客观事物变异是无法完全被我们解释的。

通俗来讲,残差是客观世界和我们统计分析时人造模型的差异。就如地球仪和地球的区别。

实际上,所有的统计分析都在以不同地方式在解释数据的总变异,包括t检验、F检验、秩和检验,但都不能完美解释数据的总变异,而留有尾巴。

一般来说,一个模型中,残差越小越好。越小意味着我们统计结果对客观世界理解更深一步。假如我们在造一个地球仪,如果残差很小,那么意味着地球仪与地球非常逼真。同时,一般来说,常用的统计学方法要求残差独立、要求残差不随着结局指标的改变而改变,残差是正态分布的。

3.随机区组方差分析可以提高统计分析的检验效能
检验效能即一项研究的真阳性率,也就是当结果为真,被统计学检验发现为真的比例,意味着P<0.05出现的概率。检验效能主要受到样本量的影响,而不同统计学方法影响也很大。比如两组正态分布数据的比较,t检验较两样本秩和检验,容易得到阳性结果,意味着t检验检验效能比较高。而存在着区组的情况下,随机区组方差分析比一般的单因素方差分析检验效能要高。

比如,本题,如果我们采用一般的方差分析,将得到以下结果:处理因素的P>=0.319,意味着处理因素的不同水平不再具有统计学意义。

不妨再拿出随机区组方差分析的结果,此时treat的P值=0.006。随机区组方差分析P值更小,这是为何?


实际上,方差分析的基本原理是将各因素的均方除以残差的均方得到F值,在此基础上判断P值大小。单因素和多因素方差分析,处理因素的均方不变,均为91.29,但是随机区组方差分析,残差均方变小了。随机区组方差分析的区组变异程度(1418.50)加上残差的变异程度(170.750)就是等于单因素方差分析的残差的变异程度(1589.25),因此,随机区组解释了一部分的数据的总变异,减少了残差的变异。因此处理因素的F值增大了,P值就相应减小。

总的来说,多因素方差分析比单因素方差分析在多数场合检验效能更高,更值得推荐。

4.随机区组方差分析正态性和方差齐性的条件
随机区组方差分析原则上要求数据呈正态性、方差齐性。方差齐性和正态性,指的是残差正态性、残差不随着结局变量大小发生改变而变异程度发生改变。
这两个条件一般情况下符合最好,当然实际操作过程中 ,只要正态性、方差齐性问题不是太突出,随机区组方差分析都都可以正常使用。

SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开
https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=419&isprivate=false&cateid=102

SPSS课程录屏



-本讲结束-,敬请阅读同期R语言教程推文-


SPSS教程(点击相应链接学习)

1. 每周一讲,全方位的SPSS 教程粉墨登场

2. SPSS教程学习准备:“研究设计”视频

3. 正态性检验(SPSS详版SPSS简版

4. 两样本t检验(SPSS详版SPSS简版

5. 两样本秩和检验(SPSS详版SPSS简版

6. 多样本F检验(SPSS详版SPSS简版

7. 多重比较(SPSS详版SPSS简版

8. 配对设计统计分析(SPSS详版


课程资料包括视频、讲义、练习数据集、R语言代码可通过关注公众号,发送关键词“SPSS”至公众号,即可获得免费下载。课程资料将随文章同期更新


本公众号在传播统计学知识的同时,也放置了一些常用的资源来方便大家科研。有资源全部免费下载,有兴趣的朋友可以关注下载。

1.  医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!

2.  如何让excel绘制出精美的统计图?EXCEL  插件来帮忙!

3.  最新!2019年卫生健康统计年鉴来了!2006-2019中国卫生统计年鉴合集下载

4.  不做实验如何利用临床数据库发表论文?精选临床预测模型视频合集

5.  重磅推荐:全网最全的医学统计相关软件,免费下载,均已破解

6.  如何制作与分析量表?中英文权威书籍来帮忙。

7.【统计视频】 流行病学与统计学完美结合:公共健康数据分析

8.  推荐几本临床研究方法的经典书籍

9.【资源下载】如何让excel绘制出精美的统计图!欢迎分享下载

10.“医学统计学”初学者福音,权威教材经典SPSS视频教程


欢迎关注,本号为论文写作与统计学习社群

有统计问题或科研合作请关注后加小编微信

文章有问题?点此查看未经处理的缓存