查看原文
其他

实例教程:样本量计算之横断面调查+分类变量

2016-10-20 张耀文 医咖会

医咖会之前推送了三篇样本量计算的文章,很多小伙伴直呼不过瘾。今天上映样本量计算包教包会第四集:结局指标是分类变量的横断面调查,该咋计算样本量呢?


小兵:小咖,今天科主任让我写个课题申请书,我们想开展一个横断面调查,目的是调查北京市40岁及以上人群的高血压病患病率。如果我用简单随机抽样的话,应该怎么计算样本量啊?


小咖:计算结局指标是分类变量的横断面调查所需要的样本量时,首先要给出置信度(Confidence Level),一般可选取置信度1-α=0.95。


此外,还需要根据既往文献或预试验的结果,给定两个参数:①总体比例(高血压病患病率)的估计值;②总体比例(高血压病患病率)估计值的容许误差。


小兵:高血压病患病率的估计值我已经查过文献了,大约是30%。但是,什么是容许误差啊,这个怎么估计?


小咖:容许误差表示的是总体比例(北京市40岁及以上人群的高血压病患病率)与样本比例 (样本人群的高血压病患病率)的绝对差值不超过该值。容许误差的确定,取决于你对结果精确性的要求,容许误差越小,样本量越大。一般可尝试性地选取总体比例估计值的0.1倍、0.2倍等。比如你可以取30%的0.1倍,即容许误差为3%。


我总结一下你的问题:研究者拟开展一项横断面调查,调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果,估计该年龄段人群中的高血压病患病率为30%。规定允许误差为3%,置信度1-α=0.95,则至少应该调查多少人?


小兵:你总结能力这么强,你家人知道吗?


小咖:这总结能力就是家里人教的^_^


好了,接下来我们看看PASS 11软件怎么计算。


1、选择Proportions→One Proportion→Confidence Interval→Confidence Interval for One Proportion




 2、Find (Solve for)中选择N(Sample), Confidence Level (1-Alpha)中选择0.95,Confidence Interval Width (Two-Sided)中填入0.06,P (Proportion)中填入0.3。其它选择为默认选项后,点击RUN。

 



敲黑板!注意啦:Confidence Interval Width (Two-Sided)是指可信区间的宽度,即可信区间的下限到上限的值,而容许误差是可信区间一半的宽度。本研究的容许误差为3%,则可信区间的宽度为6%(即两倍的容许误差),因此在Confidence Interval Width (Two-Sided)中选择0.06。


3、结果解读




PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要关注以下一列:


Sample Size (N):样本量。本研究需要928例研究对象。


小兵:好,我明白了。我也学小明写个总结。


本研究为横断面调查,目的是调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果,该年龄段人群中高血压病患病率大约为30%。规定容许误差为3%,置信度1-α=0.95,利用PASS 11软件计算得到需要调查的样本量N=928例。假定研究对象的无应答率为10%,则需样本量N=928÷0.9=1031例。假定问卷合格率为90%,则共需样本量为N =1031÷0.9=1146例。


小咖:看你写的这么好,我再送你一张图,你感受一下。

样本量计算包教包会精彩回顾:

1. 手把手教你计算样本量

2. 样本量计算之RCT遇到连续变量

3. 5张动图告诉你样本量是咋变化的

医咖会微信:medieco-ykh长按二维码关注我们吧

小伙伴们建了一个微信群~~~有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群,和其他小伙伴们一起交流学习吧。


点击左下角“阅读原文”,了解更多医咖会既往推送的内容。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存