“我的研究是基于量表的调查,如何计算样本量?”
统计小食系列
(2)当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格
统计小食(6)
无论是课题设计、还是毕业设计,对样本量的计算越来越重要,为此,本公众号也详细陈列了各种样本量计算的方法。但往往碰到实际的问题时,纸面的方法仍然给我们足够的帮助。
我碰到很多关于样本量的计算的咨询,觉得最需要解释也最有意思的问题就是:
郑老师,我在做一个基于医院病人的调查。问卷调查涉及了3个量表,那么我的调查样本量应该是多少?是不是量表总条目数的至少5-10倍?
这个问题中,有个“量表中条目数的5-10倍”,是很多人在查阅文献得到数据,那么实际上是否正确呢?
实际上,考虑这个问题要从多个角度去阐述,而重点是研究目的,否则查阅文献的结果会带来误导。
首先,我们要明确整个整个研究设计的主要指标或者主要结局指标是什么?是3份量表的哪一份?这个结局指标的是决定样本量计算的关键指标
其次,我们再要考虑量表中条目数和样本量的关系。一般情况下,为了实现量表具有较好的信效度,一份量表测量份数要达到总条目数的5-10倍以上(这是量表研究约定成俗的,文献出处暂时不可考)。因此如果我们有三份量表,量表条目分别是10、20、30,那么样本量应该以条目最大的量表为基础计算,至少是30*5,150份以上,但不是60*5!
第三,光总条目数和样本量,是远远不够的。基于总条目数计算样本量只是在量表测试中才有要求,而在应用中还要考虑更多的。还要考虑什么呢?必须考虑结局指标的类型、研究设计、和统计学方法!
结局指标类型方面,我们必须要基于主要指标开展研究与分析。主要指标一般是某一份量表的总得分,那么便是定量数据;也有可能是算出量表总得分后,再转换为二分类定性数据:比如我们基于量表调查患者抑郁情况,然后根据界值把人群划为抑郁者和非抑郁者。两种结局指标指标类型的样本量计算方法显然存在着区别。
在研究设计上,必须要甄别,这个研究是横截面调查(了解分布为主)还是病例对照研究和队列研究(了解病因为主),三种方法有不同的样本量计算方法。
统计方法对样本量也有影响,一般情况下,量表分析常见的方法,仍然是线性回归分析或者logistic回归分析,线性回归分析一般对样本量的要求是自变量个数的5-10倍以上,logistic回归分析一般要求是阳性例数是自变量个数的5-10倍。
总结,基于量表研究样本量计算较为复杂!如何选择,那便是从各种对样本量有要求的条件中,要求最大的那个样本量。为此,我做一个技术路线图来帮助诸位:
最后,关于如何计算样本量,请阅读公众号系文章:
【合集】本公众号科研与统计精品文章推荐
欢迎关注本公众号,我们是资源的搬运工,所有科研资源全部免费下载:
1. 医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!
2. 重磅资源:100本“临床试验与统计学方法”英文书籍大放送!
3.《中国统计年鉴》1978-2019,巨量呈现40年全国各行业指标(包括卫生、人口在内)!
5. 公共卫生研究必备:5次国家卫生服务调查100万居民分析报告
6. 重磅推荐:全网最全的医学统计相关软件,免费下载,均已破解。