SCI教程:样本量的基础知识
在临床研究的设计阶段,下面两个问题是研究者特别感兴趣的:一是,为了在希望的把握度(power)下得出具有临床意义的差异,需要多少样本含量(samplesize)?二是,如果由于预算问题或某些医学考虑,只能对一个小样本进行研究,所得出的结果有多大的把握度?为了回答上述问题,基于一项研究的主要目的,样本含量和把握度的计算是必需的。在临床研究方案设计过程中,样本含量估算扮演着重要角色。
首先应该明确的是什么是把握度,这个概念很多人不清楚。如果想要弄懂这个概念,就要弄懂一类错误和二类错误。一类错误就是假阳性,这个怎么记呢?我老是这样想,每个研究者都希望得出阳性结果,所以假阳性的结果容易得出,所以排第一,所以是一类错误。因此二类错误就是假阴性。而把握度就是1-假阴性。样本含量估算的重要意义在于,合适的样本含量有助于我们用最合理的资源发现有意义的临床差异,如果这个差异确实存在的话。过少的样本含量难以准确回答试验所研究的科学问题,而过多的样本含量是巨大的资源浪费。
样本含量估算方法必须基于明确设计方法、假设检验和主要目的指标的特性。例如,临床研究中平行对照设计、交叉对照设计、Williams设计、序贯设计、连续测量设计等都有不同的样本含量估算方法;主要目的指标是计数资料或计量资料需要不同的样本含量估算方法;基于计量资料的t检验和F检验,基于计数资料的卡方检验和Fisher’S精确检验等都有不同的样本含量估算方法;差异性检验、非劣效性检验和等效性检验也有不同的样本含量估算方法,等等。
通常来说样本含量变化的基本影响因素包括:
检验水平(a),也就是一类错误,统计推断拒绝了实际上成立的无效假设(H0)。一类错误的概率用a表示,故又称a错误。在这里,一类错误指的是,组间差异实际上不存在,统计推断的结果,却错误地承认组间差异的存在,又称假阳性。进行统计推断时,研究者需要对容许犯工型错误的大小作出规定,通常是a≤0.05,因为在这一范围内,若作出拒绝H0的推断,其所犯的I型错误概率已很小,故承认这一推断的正确性。检验水平a值越小,所需样本含量越大。
就是把握度,这个概念,我们在上面已经简单的介绍过了。通常来说二类错误设为0.1或者0.2,也就是说把握度通常设为80%或者90%。把握度越高,所需样本量也越大。
变异,简单的讲就是你的样本构成的性质。如果你的样本构成是单一的,所需的样本量就较少,如果你的样本构成是多元的,则所需样本量就较大。例如你的样本只含有脓毒症休克,就比含有脓毒症休克又有严重脓毒症所需的样本量少。
临床有意义的差值。简单的讲就是临床意义的大小。举个例子,如果你比较某个药物的有效率,一个有效率80%,一个有效率30%,那么你所需的样本量肯定少。如果两个药物的有效率一个60%,一个40%,那你所需的样本量肯定多。
单侧还是双侧。这个就是检验的方式不同。通常来说,如果你可以确定其中某个药物的有效率高于另一个药物可以采用单侧,如果不确定,或者目前没有研究,你就采用双侧,按照正态分布的观点来看,单侧检验要比双侧检验所需的样本量少。一般非劣和优效检验使用单侧。
中秋佳节之际,中国急危重症网以及急诊医学资讯以及临床研究与meta分析微信公众号祝愿所有朋友身体健康,工作顺利,万事如意,阖家欢乐,中秋节快乐!