有点意思,世界上最简单的统计学差异性检验方法
统计学最常见的统计学检验就是两组数据之间的差异性方法。比如两组均数、两组率、两组偏态分布数据的比较等。
常见的方法有t检验、卡方检验、z检验、LogRank检验。
其实这些方法,计算公式都挺复杂的。比如比较两组均数的t检验,公式可见下方所列,难以理解,比较复杂。
有没有简单容易理解的公式?著名的医学杂志BMJ,于2006年由英国著名生物统计学家Stuart J Pocock,写了一篇文章。他列了一个公式来比较1:1随机对照研究不同组率之间有没有差异。这个公式有点意思。
简易公式如下:
a代表一组干预组的发生阳性事件的人数,b代表另外一组对照组的发生阳性事件的人数,通过公式可以算出z值,而z值可以通过z值的小概率事件界值来判定到底a和b的差距是不是小概率事件,P值是否大于0.05。比如 z > 1.96 意味着 P < 0.05 ,z > 2.58则 P < 0.01。
Pocock觉得这种换算其实在RCT研究中挺可靠,理由是在1:1随机对照研究中,两组样本量相差无几,因此可以直接考察两组阳性人数的差别来探讨阳性率差异性。同时,由于往往很多时候,阳性事件的发生率都20%以内,因此,可以拿阳性数据直接进行比较--因为此时阳性发生数将呈现Poisson分布(上述公式就是基于Poisson分布的两组人群的比较方法)。然后,你只要花15秒钟就可以手动判定你的结果是否是阳性结果!
这样的公式和复杂统计方法比较结果差别多大?特别是与生存分析,比如logRank检验或者Cox分析这样难以掌握的方法相比,差别大吗?
我们来看几个例子。
第一个是VIGOR临床试验,主要比较罗非昔布与萘普生两种药物对患者患者发生严重血栓性心血管事件发生的影响。通过生存分析logRank分析得到P=0.0016, HR=2.37。两组患者阳性发生数分别是45和19,那么如果采用上面的简易公式,z = (45 − 19)/√45+19= 3.25, 得到 P = 0.0012, HR=2.37 。相差无几。
第二个案例是 MOXCON临床试验。比较莫索尼定相对安慰剂在造成心衰患者死亡的影响。在期中分析时时,共发现46例和25例死亡患者,如果通过简易公式可以得到z = (46 − 25)/√46+25= 2.49, P = 0.013。随后采用的是logRank检验则得到非常相似的结果P=0.012。
甚至这一简易公式可以用来进行meta分析。在一项紫杉醇洗脱支架和西罗莫司洗脱支架比较的研究中,通过简易公式z = (142 − 95)/√142+95= 3.05, P = 0.002,而通过复杂统计方法得到P=0.001,几乎一样。
我也多次强调,临床研究往往可以“小统计大文章”。上述公式,虽然很难直接拿过来开展正式场合的统计分析,但是可以作为非统计人员进行初步估计、大致判定统计分析结果一种方法。
正如作者所言:
最后如果你有兴趣,可以下载BMJ这篇原文章来学习学习。
【文献获取方式】:关注公众号,发送关键词“文献阅读”至公众号,无需分享推文,即可获得电子书的地址。
更多实战课程