卢沙野大使接受法国LCI电视台直播专访

【少儿禁】马建《亮出你的舌苔或空空荡荡》

外交部迅速反应:严正抗议美冻结全国人大14位副委员长资产,中方将反制

达赖叛逃时把人皮、头骨法器都送给了谁(胆小慎入)

列宁会如何看待宝马MINI“冰淇淋事件”

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

SPSS 统计策略(12):多组率、构成比比较的统计方法(卡方和Fisher法)

郑老师 医学论文与统计分析 2022-10-07

第12讲 实验性研究分类数据统计策略(2):

多组率、构成比比较的统计分析


从第11文开始,介绍实验性分类数据结局的统计分析方法。第11文介绍了两组二分类结局的比较,即两组率的比较,俗称四格表资料的统计分析。分类数据除了2*2的交叉表之外,还有诸多其他形式,比如多组率的比较、2组构成比的比较、甚至多组构成比的比较。它们数据结构更为复杂,虽都采用卡方检验为主要方法,但细节方面与两组率的分析上有所区别。

实例分析


案例1:某医院用三种方案治疗急性无黄疸型病毒肝炎254例,观察结果见下表,问三种方案治疗急性无黄疸型病毒肝炎的有效率是否不同?数据详见Hepatitis.sav




案例2:为了解血型分布与胃癌及消化性溃疡病的关系,某单位进行了调查,试比较各组血型构成有无差别?



案例3:为了不同孩子的意外伤害,分别比较了有行为问题的儿童和无行为问题的儿童的数据,请问两组儿童意外伤害类型的分布上有无差异?



1



案情分析

上述3个例子结局均为分类数据(效果、血型、意外伤害类型),汇总数据形成的三线表称为多行多列交叉表或者行列表。区别就在于,案例1结局为二分类结局,案例2为多分类结局,案例3则是2组多分类结局。因此,第1个例子为多个率的比较,第2个例子为多个构成比的比较,第3个例子则是2个构成比的比较。



2



统计分析策略

多行多列交叉表数据的分析,或者说多个率、构成比,乃至两个构成比的比较,四格表资料的分析策略一样,均可以考虑卡方和Fisher确切概率方法进行。


但是细节方面,与四格表资料的分析策略有所不同。


第一,多行多列交叉表分析没有校正卡方。具体应用条件如下:

1.不超过20%单元格的理论频数(期望频数)T < 5时,可使用卡方检验进行比较。

不超过20%的T < 5,卡方检验


2.如果超过20%单元格的理论频数(期望频数)T < 5,或者至少一个T<1,此时采用的是Fisher确切概率法。

至少1个单元格T <1 ,Fisher确切概率法


第二,多个率、多个构成比的卡方检验存在多重比较的步骤

多个率、多个构成成比较,就如方差分析一样,当P<0.05时,只能说明总体上存在着统计学差异,还不能说任意两组都有差异,需要多重比较进行进一步分析。


总的来说


利用SPSS进行卡方和Fisher法检验


本文SPSS以第一个为例开展多行多列资料的统计分析。


案例1:某医院用三种方案治疗急性无黄疸型病毒肝炎254例,观察结果见下表,问三种方案治疗急性无黄疸型病毒肝炎的有效率是否不同?数据详见Hepatitis.sav



1



交叉表分析入口界面

分析-描述统计 -交叉表



2



交叉表分析对话框

在“交叉表”对话框中,分别选择分组变量和结局变量到“行”和“列”中。


①、②:行” 和 “列”分别放哪个变量没有规定,结果是一致的(分组变量可以放“行” ,也可以放“列”中)。值得注意的是,多组数据分析需要进行多重比较时,”行” 要放结局变量,“列”放入分组变量。


③ 精确:点击选择“精确”选项,进行Fisher确切法检验


统计:选择“卡方”,进行卡方检验


⑤单元格:①选择计算百分比中的行与列,不必同时选择,选择一项即可。一般建议与交叉表的分组变量所在的”行”“列”位置一致。②比较列比例:进行多重比较,开展不同列两两比较较(因此,上文操作中,分组变量要放在“列”选框)。




3



统计分析结果与解释

结果主要为2张表格。

第1表:分组统计描述结果,分别给出,各处理组的结局,包括发生数以及相应的百分比。本例西药有效率51%,中药43.8%,中西药79.7%,百分比竖状排列。


第2表:卡方和Fisher确切检验的结果。该结果同时展示了卡方、和Fisher确切概率分析结果(无校正卡方),也显示了总样本量、理论(期望)频数的情况。


首先要关注理论(期望)频数。理论(期望)频数在表格下方第一个注释a。注释a前半句说的是多少单元格期望计数小于5,后半句指出最小期望计数。注释a将决定采用卡方检验还是Fisher确切概率法。


卡方检验,不超过20%的格子理论频数(期望频数)T < 5时,选择第一行的“皮尔逊卡方”,得到卡方值①,选择P值(渐进显著性双侧)②。


Fisher确切概率法,如果超过20%的格子理论频数(期望频数)T < 5,或者至少一个T<1,选择第三行的“费希尔精确检验”,选择P值(精确显著性双侧)①。


对于本例,样本量254,0单元格(0%)期望计数小5,最小为31.76,应选择一般的卡方检验,卡方值22.808,P<0.001。两组人群的有效率存在着统计学差异。


多重比较的结果。在卡方检验基础上,采用Bonferroni 方法进行多重比较。结果在统计描述结果中,如下表所示。诸位请注意,下表绝对数旁边标准了a、b。这两个符号即多重比较的结果。凡是标注同一个字母者,组间没有统计学差异。比如,第一列和第二列全部标准a值,说明它们没有差异(P>0.05),而第三列标注了b,说明它和第一列和第二列不是“一伙”的,与第一列、第二列均存在着统计学差异(P<0.05)。

结果及表格的规范表达


根据上表,我们可以得到以下的规范的结论:

规范文字:西药治疗急性无黄疸型病毒肝炎有效率为51.0%(51/100),中药治疗急性无黄疸型病毒肝炎有效率为43.8%(35/80),中西药治疗急性无黄疸型病毒肝炎有效率为79.7%(59/74),三组数据总体均数存在着统计差异(c2 =22.8,P<0.001)。西药有效率与中药相比,无统计学差异(P>0.05),中西药与西药、与中药均存在着统计学差异(P<0.05)。

规范的统计表(其中一种形式)为:


总结与拓展知识


1.四格表卡方和多行多列资料在统计分析策略的区别


•四格表

Øn≥40,T ≥ 5,卡方检验;Øn≥40,至少一个1≤T ≤ 5 ,卡方校正检验;

Øn<40或至少1个T <1 ,Fisher确切概率法。


•多行多列表

Ø卡方检验:行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数

Ø否则采用Fisher确切概率法。


因此,多行多列表格没有校正卡方的统计推断方法。


2. 多组率或构成比比较必须精简行列数

很多开展多行多列交叉表统计分析时,往往形成了超过3*3的格子数,比如5*4、4*6等。比如,要分析比较不同文化程度与满意率的关系,得到以下结果:

这是5*3交叉表,在实际分析中并不罕见。很多问卷调查的原始数据,数据很分散,由于选项类别比较多,比如问教育经历时,答案不止5类,还可以是6类,7类,如果原始数据直接拿来做卡方分析时,往往形成多行多列的交叉表,而结果往往不容乐观。原因如下:第一,多行多列表格在数据陈列上密密麻麻,看得人眼花缭乱,更看不透其数据的分布规律。这样的统计报告,很难得到读者的认可。第二,由于数据分散,单元格数量增加,无论是卡方检验还是Fisher法,不容易得到阳性结果。


因此,对于过多的行列表,必须开展整合或删除工作。可以考虑两种策略,第一种,可以合并属性相似,且样本量都较少的行或者列,比如本例的初中和高中可考虑合到一处。第二种方式,删去不必要的行或者列。本例中,“不知道的人群可以考虑删除,它的存在可能干扰“不满意和“满意的统计学差异性。


诸位,当你们拿到一份原始数据时,千万别直接开展卡方检验,请认真思考如何整理数据,如何精简行、列,使得行列数控制在一定的数量以内,比如行列表总的单元格数不能超过10格,一般限制在3行、或者3列及以内为妙。


3. Fisher检验卡壳了怎么办? 

多行多列资料,单元格过多,会造成Fisher方法无法得到结果。我依然以“不同文化程度与满意率”的关系为例(将样本量乘以10),开展统计分析。


然后,Fisher就卡壳了,无法计算,同时造成卡方检验结果耗费长时间才能得到。



这种情况,主要原因就是计算机运算能力有限,分析大样本多行多列资料时,搞不定Fisher检验方法。


有以下几种策略可以解决本问题:(1)不要进行精确检验 ;(2)行列合并或删除精简行列数;(3)选择蒙特卡罗精确法:



SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开
https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=431&isprivate=false&cateid=102

SPSS课程录屏


-本讲结束-

SPSS教程(点击相应链接学习)

1. 每周一讲,全方位的SPSS 教程粉墨登场

2. SPSS教程学习准备:“研究设计”视频

3. 正态性检验(SPSS详版SPSS简版R语言版

4. 两样本t检验(SPSS详版SPSS简版R语言版

5. 两样本秩和检验(SPSS详版SPSS简版R语言版

6. 多样本F检验(SPSS详版SPSS简版R语言版

7. 多重比较(SPSS详版SPSS简版R语言版

8. 随机区组方差分析(SPSS详版

9. 小统计大文章(上)(SPSS详版

10. 小统计大文章(下)(SPSS详版

11. 两个率比较的统计方法SPSS详版


课程资料包括视频、讲义、练习数据集、R语言代码可通过关注公众号,发送关键词“SPSS”至公众号,即可获得免费下载。课程资料将随文章同期更新


本公众号在传播统计学知识的同时,也放置了一些常用的资源来方便大家科研。有资源全部免费下载,有兴趣的朋友可以关注下载。


1.  医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!

2.  重磅资源:100本“临床试验与统计学方法”英文书籍大放送!

3.《中国统计年鉴》1978-2019,巨量呈现40年全国各行业指标(包括卫生、人口在内)!

4.  公共卫生研究必备:5次国家卫生服务调查100万居民分析报告

5.  重磅推荐:全网最全的医学统计相关软件,免费下载,均已破解

6.  如何制作与分析量表?中英文权威书籍来帮忙。

7. 重磅推出2019年45份大健康产业研究报告

8. 最新Win和MAC版统计软件SPSS 26.0、Stata16.0和Graphpad prism8.0

9.精选R语言入门学习资源:视频+文档,初学者者必备!

10.中国70年人口变化数据:1949-2018《中国人口就业统计年鉴》

欢迎关注,本号为论文写作与统计学习社群

有统计问题或科研合作请关注后加小编微信

文章有问题?点此查看未经处理的缓存