计算率或率差的95%可信区间:公式和SPSS教程都有!
临床研究中,经常要计算某个样本的率(proportion),以及根据样本的率估算总体率的95%可信区间(Confidence Interval,CI)。样本率的计算很容易,那如何计算估算总体率的95%CI呢?
对于此类二项分布的数据,如果“数据量足够大”,一般可以使用正态近似法估算总体率的可信区间。
那如何才是“数据量足够大”呢?这个没有统一的标准。有学者推荐若以相对误差控制在10%左右为实际可接受标准,则使用正态近似法估计总体率95%可信区间的近似条件为 :
1)当 n×p=5时,样本率应在40%-60%之间;
2)当 n×p=10时,样本率应在20%-80%之间;
3)当 n×p=15时,样本率应在1%-99%之间。由于1%-99%几乎包括了二项分布率的实际应用范围 ,且在此条件下的可信度与1-α水平相当 ,故n×p=15为应用近似法的“理想条件”[1]。
1、单个率及其95%CI
也可以使用各种软件计算率及95%CI,一个在线工具是VassarStats
( http://vassarstats.net/index.html )。
在VassarStats的主界面点击Proportions→The Confidence Interval of a Proportion即可计算。不同的是该在线工具使用不是正态近似法,而是Wilson法,同时与手工计算取舍小数点不同,所以计算结果略有差别。
2、两个率的差及率差的95%CI
使用VassarStats工具计算时,可在VassarStats的主界面点击Proportions→The Confidence Interval for the Difference Between Two Independent Proportions。
3、SPSS计算
SPSS没有现成的模块计算率或率差的95%CI,但可以通过编程界面实现。将数据录入SPSS并且指定95%CI对应的值zcrit=1.96(可取任意变量名)。
打开Syntax界面,输入以下程序即可计算完成。
最终得到的结果如下。
实际上,SPSS的Syntax中编写程序,还是使用正态近似法的计算公式,还不如手工(或使用EXCEL计算)方便。
参考文献
1. 刘沛. 正态近似法计算二项分布总体率 95%可信区间的应用条件研究. 中国卫生统计, 2004.
想要原始数据练习的小伙伴,可以到医咖会官网进行下载!
http://www.mediecogroup.com/
更多阅读
由医咖会与心联乔治心脏健康研究中心(HHRC)联合建立的心血管研究协作网络及数据共享平台(CDS)已经上线!
目前开放共享的数据为“中国房颤注册研究”,共有2.5万多房颤数据,欢迎来申请使用数据,发表SCI论文!
平台网址:
https://cds.mediecogroup.com/
点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址:http://www.mediecogroup.com/,查看全部统计教程。