总体率的95%置信区间估计基本方法和软件操作
本文来源:
郑卫军, 何凡. 总体率的95%置信区间估计基本方法和软件操作[J]. 预防医学, 2020, 32(5): 539-540.
请点击文末“阅读原文”查看下载文章PDF原文。请需要计算率的置信区间的朋友,多引用本文,非常感谢。
第11讲 实验性研究分类数据统计策略(3):
率的95%置信区间估计
统计结果中,置信区间的地位不亚于假设检验的P值。诸多高水平医学杂志,普遍推荐使用总体参数的置信区间来表达统计分析结果。目前,常用的统计软件SPSS,可快速进行总体均数的置信区间估计。但如何估计总体率(包括单个率和率差)的置信区间,对于研究者而言仍然是个问题。无论是观察性研究还是实验性研究,根据定性变量计算总体率置信区间是统计分析不可或缺的部分。因此,本文拟通过简单文字来描述计算率的总体95%CI置信区间的主要方法,以及常用软件的操作(SPSS和R语言)过程。
1.率的置信区间估计常用方法
单个率的置信区间估计方法超过7种[1],率差总体置信区间估计方法则更多。《医学统计学》教材通常提供了两种方法:查表法和正态近似法。
1.1 查表法
当样本含量(n)较小,如n≤50,特别是样本率(p)接近0或1时,可以采用查表法获得单个率的总体95%和99%可信区间。不过,现实统计分析,不可能依赖教材表格,必须借助软件。实际上,查表法源于总体率的基本统计学方法:Clopper& Pearson精确法[2]。
1.2正态近似法
率作为统计描述指标,其分布(或者说计算率的分子)呈现二项式分布。当n足够大,p和1-p均不太小时(一般要求np与n(1-p)均大于5),样本率的抽样分布近似服从正态分布。因此,也可以用正态分布理论估计单个率的总体可信区间。该方法相应的公式如下:
1.3 率差的正态近似法
医学研究两组数据率差的总体95%CI置信区间估计,公式如下:
2.案例分析
2.2 正态近似法公式计算总体率置信区间
本例中n=120,p=0.783,代入公式计算得Sp=0.0376,因乳腺癌总体检出率的95%可信区间为0.783±1.96×0.0376,即(70.9%,85.7%)。
2.3 应用SPSS软件计算总体率置信区间(精确法)
SPSS可进行精确法和正态法近似操作。正态法适合汇总数据(行列表格式,具体操作入口:SPSS中“描述”——“比率”),由于篇幅限制,不作介绍。本文介绍如何利用SPSS 25.0软件基于精确法进行置信区间估计。
(1)SPSS操作过程:
①选择“分析”--“非参数检验”--“单样本”
②字段:选择结局变量(乳腺癌检测结果)到右侧选框中;
③设置:选择“定制检验”—“比较实测二元概率和假设二元概率”,点击“选项”;
④选项中选择“克洛珀-皮尔森”,即Clopper& Pearson精确检验:
②置信区间:双击结果界面,在左下方列表选择“置信区间汇总视图”,即得到结果。
SPSS教程(点击相应链接学习)
5. 两样本秩和检验(SPSS详版、SPSS简版、R语言版)
7. 多重比较(SPSS详版、SPSS简版、R语言版)
8. 随机区组方差分析(SPSS详版)
9. 小统计大文章(上)(SPSS详版)
10. 小统计大文章(下)(SPSS详版)
11. 两个率比较的统计方法(SPSS详版)
12.多个率、构成比比较的方法(SPSS详版)
课程资料包括视频、讲义、练习数据集、R语言代码可通过关注公众号,发送关键词“SPSS”至公众号,即可获得免费下载。课程资料将随文章同期更新
1. 医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!
2. 重磅资源:100本“临床试验与统计学方法”英文书籍大放送!
3.《中国统计年鉴》1978-2019,巨量呈现40年全国各行业指标(包括卫生、人口在内)!
4. 公共卫生研究必备:5次国家卫生服务调查100万居民分析报告
5. 重磅推荐:全网最全的医学统计相关软件,免费下载,均已破解。
8. 最新Win和MAC版统计软件SPSS 26.0、Stata16.0和Graphpad prism8.0
10.中国70年人口变化数据:1949-2018《中国人口就业统计年鉴》