干货 | 各种统计方法,如何对号入座?
特别福利:关注解螺旋微信号,回复关键词“12月”,可索取12月资源包:结肠癌文献视频讲解+SPSS软件及使用教程。
作者:解螺旋.叶子
转载请注明来源:解螺旋,医生科研助手
大家在写试验论文的时候,经常会对茫茫多的数据头痛不已,很多时候都是老鼠拉龟——无从下手,根本不知道该用哪种统计方法来处理。今天我们就来整理下,对于各类的试验数据都该用何种统计方法。
在得到数据的第一件事就是要分辨这个数据是计量资料还是计数资料。计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。计数资料的特点是:对每组观察单位只研究其数量的多少,而不具体考虑某指标的质量特征,属非连续性资料。如将研究人群按照血型分为O型、A型、B型和AB型来统计各型的人数。
两组样本数据
计量资料分析有两种:单因素和多因素。首先来说下简单的单因素比较,当要比较两组样本均数时首先要进行正态分布检验,之后才能进一步分析。
在样本与总体比较时,适用单样本t检验。
当设计数据是一一对应(配对资料),研究者关注个对的差值时,可以用配对t检验(变量的差值要服从正态分布)。
若两个样本的数据是完全随机化设计的,要用独立样本t检验(两样本都服从正态分布,且方差齐)。
只有服从正态分布的数据才能使用t检验!
如果样本数据不服从正态分布的话,那就只能用非参数检验,但其检验效能低于参数检验。
样本数据为配对资料时,用符号秩和检验。
样本数据为完全随机资料时,用Wilcoxon秩和检验。
只在不服从正态分布时使用,检验效能较低。
多组样本数据
当有两个以上样本的数据时,就不能再使用t检验了。这时候就要用到F检验,也就是SPSS里面的方差分析(ANOVA)。ANOVA应用的条件也和上面t检验一样,需要各组样本均服从正态分布,各样本的方差齐。
要比较多组完全随机的数据之间有无差异,可以用单因素方差分析(one-way ANOVA)。
多个完全随机数据组两两比较时,常用q检验(Nweman-Keuls test)。
多组数据是配对资料时,用两因素方差分析(two-way ANOVA)。
同样的,多组样本数据有一组不服从正态分布或不满足方差齐性时,就不能用ANOVA,也要使用非参数检验。
多组完全随机样本用Kruskal-Wallis秩和检验。
多组配对样本用Friedman秩和检验。
多因素分析一般都用回归分析,包括直线回归和Logistic回归。
计数资料里最常见的2×2表资料和R×C表资料。
2×2表资料
2×2表资料的统计分析是用卡方检验,但是需要根据不同的情况来做不同的处理。这里n代表表内的样本量,T代表理论数。
当n≥40,所有T≥5时,可以直接用卡方检验。
当n≥40,且有1≤T<5时,用连续性校正公式计算。
当n<40,或T<1时,要用Fisher法计算。
R×C表资料
R×C表资料也是用卡方检验,不过还有几点注意事项。
卡方检验的理论数T不能太小(<1),且1≤T<5的格子数不超过格子总数的1/5。
多个构成比的比较所得结论为有统计学差异,也只能说各组的构成比与总的构成比不全相等,并不说明各组之间也有差异。若要进行多重比较,需要用x2分割法检验。
对于有序R×C表资料属于等级资料,如临床检验结果分为-、+、++、+++,疼痛等症状的严重程度分为0(无疼痛)、1(轻度)、2(中度)、3(重度)等。就不宜使用卡方检验,宜选用秩和检验中的Kruskal-Wallis检验。
最简单来说就是下面这张图。
(点击左下角阅读原文了解详情)
回复关键字,查看你感兴趣的内容:
回复“SCI专栏”查看相关文章
回复“国自然专栏”查看相关文章
回复“信号通路专栏”查看相关文章
回复“CNS专栏”查看相关文章
回复“实验工具专栏”查看相关文章
回复“统计”查看数据统计相关文章
回复“国自然1”查看国自然科学问题分析
解螺旋为您科研出谋划策:临床基础科研方法论,实用经验分享,实验和数据统计工具应用、SCI论文投稿技巧,信号通路专栏,肿瘤,基因,蛋白等热门领域研究进展.....