实例教程：样本量计算之横断面调查+分类变量

查看原文

其他

实例教程：样本量计算之横断面调查+分类变量

Original 2016-10-20 张耀文 医咖会

医咖会之前推送了三篇样本量计算的文章，很多小伙伴直呼不过瘾。今天上映“样本量计算包教包会”第四集：结局指标是分类变量的横断面调查，该咋计算样本量呢？

小兵：小咖，今天科主任让我写个课题申请书，我们想开展一个横断面调查，目的是调查北京市40岁及以上人群的高血压病患病率。如果我用简单随机抽样的话，应该怎么计算样本量啊？

小咖：计算结局指标是分类变量的横断面调查所需要的样本量时，首先要给出置信度（Confidence Level），一般可选取置信度1-α=0.95。

此外，还需要根据既往文献或预试验的结果，给定两个参数：①总体比例（高血压病患病率）的估计值；②总体比例（高血压病患病率）估计值的容许误差。

小兵：高血压病患病率的估计值我已经查过文献了，大约是30%。但是，什么是容许误差啊，这个怎么估计？

小咖：容许误差表示的是总体比例（北京市40岁及以上人群的高血压病患病率）与样本比例（样本人群的高血压病患病率）的绝对差值不超过该值。容许误差的确定，取决于你对结果精确性的要求，容许误差越小，样本量越大。一般可尝试性地选取总体比例估计值的0.1倍、0.2倍等。比如你可以取30%的0.1倍，即容许误差为3%。

我总结一下你的问题：研究者拟开展一项横断面调查，调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果，估计该年龄段人群中的高血压病患病率为30%。规定允许误差为3%，置信度1-α=0.95，则至少应该调查多少人？

小兵：你总结能力这么强，你家人知道吗？

小咖：这总结能力就是家里人教的^_^

好了，接下来我们看看PASS 11软件怎么计算。

1、选择Proportions→One Proportion→Confidence Interval→Confidence Interval for One Proportion

2、Find (Solve for)中选择N(Sample)， Confidence Level (1-Alpha)中选择0.95，Confidence Interval Width (Two-Sided)中填入0.06，P (Proportion)中填入0.3。其它选择为默认选项后，点击RUN。

敲黑板！注意啦：Confidence Interval Width (Two-Sided)是指可信区间的宽度，即可信区间的下限到上限的值，而容许误差是可信区间一半的宽度。本研究的容许误差为3%，则可信区间的宽度为6%（即两倍的容许误差），因此在Confidence Interval Width (Two-Sided)中选择0.06。

3、结果解读

PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要关注以下一列：

Sample Size (N)：样本量。本研究需要928例研究对象。

小兵：好，我明白了。我也学小明写个总结。

本研究为横断面调查，目的是调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果，该年龄段人群中高血压病患病率大约为30%。规定容许误差为3%，置信度1-α=0.95，利用PASS 11软件计算得到需要调查的样本量N=928例。假定研究对象的无应答率为10%，则需样本量N=928÷0.9=1031例。假定问卷合格率为90%，则共需样本量为N =1031÷0.9=1146例。

小咖：看你写的这么好，我再送你一张图，你感受一下。

样本量计算包教包会精彩回顾：

1. 手把手教你计算样本量

2. 样本量计算之RCT遇到连续变量

3. 5张动图告诉你样本量是咋变化的

医咖会微信：medieco-ykh长按二维码关注我们吧

小伙伴们建了一个微信群~~~有临床研究设计或统计学方面的难题？快加小咖个人微信（xys2016ykf），拉你进群，和其他小伙伴们一起交流学习吧。

点击左下角“阅读原文”，了解更多医咖会既往推送的内容。

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…