查看原文
其他

“我的研究是基于量表的调查,如何计算样本量?”

郑卫军 医学论文与统计分析 2022-10-07

统计小食系列

(1)数据不是正态分布还能做t检验吗? 

(2)当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格

(3)基本统计研究七宗罪,你犯了几条?来投个票吧

(4)方差分析后两两比较,究竟应该用哪种方法?

(5)再论“数据不是正态时,是否可以采用t检验?”


统计小食(6)


无论是课题设计、还是毕业设计,对样本量的计算越来越重要,为此,本公众号也详细陈列了各种样本量计算的方法。但往往碰到实际的问题时,纸面的方法仍然给我们足够的帮助。


我碰到很多关于样本量的计算的咨询,觉得最需要解释也最有意思的问题就是:

郑老师,我在做一个基于医院病人的调查。问卷调查涉及了3个量表,那么我的调查样本量应该是多少?是不是量表总条目数的至少5-10倍?


这个问题中,有个“量表中条目数的5-10倍”,是很多人在查阅文献得到数据,那么实际上是否正确呢?


实际上,考虑这个问题要从多个角度去阐述,而重点是研究目的,否则查阅文献的结果会带来误导。


首先,我们要明确整个整个研究设计的主要指标或者主要结局指标是什么?是3份量表的哪一份?这个结局指标的是决定样本量计算的关键指标


其次,我们再要考虑量表中条目数和样本量的关系。一般情况下,为了实现量表具有较好的信效度,一份量表测量份数要达到总条目数的5-10倍以上(这是量表研究约定成俗的,文献出处暂时不可考)。因此如果我们有三份量表,量表条目分别是10、20、30,那么样本量应该以条目最大的量表为基础计算,至少是30*5,150份以上,但不是60*5!


第三,光总条目数和样本量,是远远不够的。基于总条目数计算样本量只是在量表测试中才有要求,而在应用中还要考虑更多的。还要考虑什么呢?必须考虑结局指标的类型、研究设计、和统计学方法!


结局指标类型方面,我们必须要基于主要指标开展研究与分析。主要指标一般是某一份量表的总得分,那么便是定量数据;也有可能是算出量表总得分后,再转换为二分类定性数据:比如我们基于量表调查患者抑郁情况,然后根据界值把人群划为抑郁者和非抑郁者。两种结局指标指标类型的样本量计算方法显然存在着区别。


在研究设计上,必须要甄别,这个研究是横截面调查(了解分布为主)还是病例对照研究和队列研究(了解病因为主),三种方法有不同的样本量计算方法。


统计方法对样本量也有影响,一般情况下,量表分析常见的方法,仍然是线性回归分析或者logistic回归分析,线性回归分析一般对样本量的要求是自变量个数的5-10倍以上,logistic回归分析一般要求是阳性例数是自变量个数的5-10倍。


总结,基于量表研究样本量计算较为复杂!如何选择,那便是从各种对样本量有要求的条件中,要求最大的那个样本量。为此,我做一个技术路线图来帮助诸位:


最后,关于如何计算样本量,请阅读公众号系文章:
【合集】本公众号科研与统计精品文章推荐


欢迎关注本公众号,我们是资源的搬运工,所有科研资源全部免费下载:

1.  医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!

2.  重磅资源:100本“临床试验与统计学方法”英文书籍大放送!

3.《中国统计年鉴》1978-2019,巨量呈现40年全国各行业指标(包括卫生、人口在内)!

4.  2006-2018中国卫生统计年鉴合集

5.  公共卫生研究必备:5次国家卫生服务调查100万居民分析报告

6.  重磅推荐:全网最全的医学统计相关软件,免费下载,均已破解

7.  如何制作与分析量表?中英文权威书籍来帮忙。

8. 重磅推出2019年45份大健康产业研究报告

9. SPSS经典教程:张文彤SPSS初级+高级操作视频



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存