计算率或率差的95%可信区间：公式和SPSS教程都有！

查看原文

其他

计算率或率差的95%可信区间：公式和SPSS教程都有！

Original 张耀文医咖会 2021-01-15

临床研究中，经常要计算某个样本的率（proportion），以及根据样本的率估算总体率的95%可信区间（Confidence Interval，CI）。样本率的计算很容易，那如何计算估算总体率的95%CI呢？

对于此类二项分布的数据，如果“数据量足够大”，一般可以使用正态近似法估算总体率的可信区间。

那如何才是“数据量足够大”呢？这个没有统一的标准。有学者推荐若以相对误差控制在10%左右为实际可接受标准，则使用正态近似法估计总体率95%可信区间的近似条件为 :

1）当 n×p=5时，样本率应在40%-60%之间；

2）当 n×p=10时，样本率应在20%-80%之间；

3）当 n×p=15时，样本率应在1%-99%之间。由于1%-99%几乎包括了二项分布率的实际应用范围，且在此条件下的可信度与1-α水平相当，故n×p=15为应用近似法的“理想条件”[1]。

1、单个率及其95%CI

也可以使用各种软件计算率及95%CI，一个在线工具是VassarStats

（ http://vassarstats.net/index.html ）。

在VassarStats的主界面点击Proportions→The Confidence Interval of a Proportion即可计算。不同的是该在线工具使用不是正态近似法，而是Wilson法，同时与手工计算取舍小数点不同，所以计算结果略有差别。

2、两个率的差及率差的95%CI

使用VassarStats工具计算时，可在VassarStats的主界面点击Proportions→The Confidence Interval for the Difference Between Two Independent Proportions。

3、SPSS计算

SPSS没有现成的模块计算率或率差的95%CI，但可以通过编程界面实现。将数据录入SPSS并且指定95%CI对应的值zcrit=1.96(可取任意变量名)。

打开Syntax界面，输入以下程序即可计算完成。

最终得到的结果如下。

实际上，SPSS的Syntax中编写程序，还是使用正态近似法的计算公式，还不如手工（或使用EXCEL计算）方便。

参考文献

1. 刘沛. 正态近似法计算二项分布总体率 95%可信区间的应用条件研究. 中国卫生统计, 2004.

想要原始数据练习的小伙伴，可以到医咖会官网进行下载！

http://www.mediecogroup.com/

更多阅读

1. SPSS详细教程：Cox回归中，连续变量的PH假定检验

2. SPSS教程：手把手教你设置哑变量及解读结果！

3. SPSS详细教程：含时间依存协变量Cox回归模型（时依系数法）

由医咖会与心联乔治心脏健康研究中心（HHRC）联合建立的心血管研究协作网络及数据共享平台（CDS）已经上线！

目前开放共享的数据为“中国房颤注册研究”，共有2.5万多房颤数据，欢迎来申请使用数据，发表SCI论文！

平台网址：

https://cds.mediecogroup.com/

点击左下角“阅读原文”，看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址：http://www.mediecogroup.com/，查看全部统计教程。

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！