如何正确计算临床研究样本量-临床研究必备工具:蓝气球
临床研究关键在于早期的设计,而研究设计最关键的一环在于有效设定样本量。而对于大部分刚脱离实验室的年轻医师来说,学习计算可靠有效的样本量往往涉及到错综复杂的统计学与临床研究背景知识,望而却步。
样本量计算到有多重要?
2016年,新英格兰专门针对临床研究的主要结局提出了11个重要衡量指标(Pocock S J, Stone G W. Theprimary outcome is positive—is that good enough?[J]. New England Journal ofMedicine, 2016, 375(10): 971-979.)。
问题1 P<0.05是不是强有力的差异证据?
问题2 临床治疗的获益有多大?
问题3 设定的临床主要结局是不是对临床重要
问题4 次要临床结局是不是支持该临床研究的结论?
问题5 如果区分亚组,研究结论在重要的亚组之间是不是也是符合趋势的
问题6 临床研究是否具有足够的样本量?
问题7 该临床研究是不是提前终止?
问题8 治疗的安全问题是不是抵消了相关的治疗效果?
问题9 治疗效果和治疗安全性之间是不是有患者的特异性存在影响?
问题10 临床研究和执行上是不是有缺陷?
问题11这些结果是否适用于其他机构的患者
可以看出,刨掉其他研究思路相关的问题,临床研究的样本量一直是研究设计阶段的关键环节。而且它也是几乎每一个reviewer会质疑的焦点。
所以,掌握样本量计算是通向临床研究的必经之路。
在介绍工具之前,简单说明一下关于临床样本量统计中涉及到的四个关键的统计学参数的意义。
第一个参数,δ:指的是两种临床研究对象(治疗、技术、分析策略等)的预设认定的差异值。简单说就是δ值超过了多少值,算是两者在临床意义上有差异(也就是说这个临床研究的阳性结果出来了)。一般情况,δ是预先设计者设定,但必须有前期的临床研究数据作为参考和依据。此外,δ的大小直接决定了临床研究所需样本量的大小。
第二个参数,α:指的是统计学中允许犯Ι类错误的概率。这个是经典的统计学概念,在涉及临床研究时请务必确认α值指的是单侧还是双侧。因为这与临床样本量也是直接挂钩。
第三个参数, 1-β:指的是期望的检验效能,或者称之为把握度。其中,β指的是允许犯II类错误的概率。一般在临床研究设计中,通常会设定1-β的值为0.75以上,最好是0.8-0.9为佳。
第四个参数,σ:总体标准差。一般情况用样本量的标准差替代。样本量的变更主要受这四个可变参数影响。当然,还有其他的参数,一般参考经典值,对具体个案的样本量设计影响不大。
所以,在基本敲定了以上的参数后,一个随机对照的临床研究的样本量计算就差不多了。后续就依据设计的内容选用相应的设计分组,比如完全随机方法等。不过,由于具体的临床背景限制,随机对照研究要远比其他种类的研究费时费力费钱。所以在计划时就应该有长期的心理准备。
那么,具体如何进行有效的临床样本量设计呢?
在这里,推荐一款在线免费的临床样本量计算工具,蓝气球(http://www.blueballon.cn/Sample/index.html)。这款工具可以根据你输入的参数,结合你所需求的临床研究类型,即时提供数据。
在样本量计算页面,可以看出,只需要提供四个值即可完成样本量计算。
当然,还要依据具体临床研究设计的方案来选择,比如计量资料、计数资料的样本量计算,以及细分到非劣效性检验等种类等等。
总结,随着临床研究的重要性和支持力度逐步提升,年轻医师一手要抓基础研究,一手还要抓临床研究。而最适合快速切入临床研究的点就是掌握临床样本量的计算。
相关阅读:
临床研究的福音:用Excel来计算样本量!
文章解读、基金设计,扫我吧