查看原文
其他

基本统计研究七宗罪,你犯了几条?来投个票吧

Pro Zheng 医学论文与统计分析 2022-10-07


统计小食(3)


随着统计教育的普及,对于科研工作者来说,统计分析看起来慢慢变得不再是问题了,统计描述、t检验、方差分析,乃至多重比较、卡方检验貌似都可以通过SPSS统计软件分析快速形成。但统计分析有一些问题还是容易犯错,有些是原则性的问题、有些则是小细节问题,我列举基本统计研究的几个问题,称之为七宗罪。

1、项目与论文研究设计,没有考虑样本量的计算

之所以把这个问题摆在第一位,是因为这个问题基本上十之八九就没有很好考虑,无论是一个项目的申报书、还是一个毕业论文的开题、一篇论文分析,均没有考虑好样本量的多少?经常采用30、40、60例这样齐整的样本量,怎么来得?自己想想的。更不要说动物试验了!其实动物试验也需要估算样本量,不能因为动物不值钱,动物也有伦理的!


比如有下文,没有样本量计算方法,怎么设定60例呢?为什么就是60例呢?即便60例足够,也不严谨!

2、所有定量数据,统计描述都用均数±标准差


你见过什么时候中文的学术论文,定量数据采用中位数和四分位数描述了?太少太少了!大家都喜欢用均数±标准差。但你没有考虑,均数能否代表着这一堆数据吗?你没有发现有些时候标准差远远大于均数?有时候数据有好一些异常值?固定思维模式要改改了,很多时候中位数和四分位数间距反而能够更好体现数据的特征。


一般情况下,判断数据是不是正态分布的简易方法是,当指标只能取正值或只能取负值时,“标准差接近或大于均值时数据不是正态分布成立”。


一旦出现现象,就不能用均数±标准差了,否则论文发表会被审稿人发现。


比如下文,用均数±标准差,显然不合适。

3、所有定量数据的比较,都采用t检验

早些年这一现象非常普遍,现在随着统计思维的普及,很多人知道了偏态数据差异性比较时候采用非参数秩和检验来代替。但总的来说,基本上采用t检验来进行两组定量数据的差异性比较仍然是固定思维?如果没有你数据分析之前没有考虑数据正态性的问题,没有考虑两组数据方差是否相似,那么就容易犯错。再次强调:严重偏态分布的数据用秩和!秩和!秩和!

 

4、无论什么样的分类数据的比较,一直都是卡方检验

卡方检验是用来毕竟不同组数据之间率或者构成比有无统计学差异。没有错,率的比较是采用卡方。但有没有考虑过你的卡方条件是否符合呢?当样本量较小,或者某一行或者一列数据太少的时候,卡方检验不好使用,应该是用Fisher!

这里说一下,建议以后少用卡方,多用Fisher,因为Fisher才是最准确的!哪一种场景下都没有错!


比如:下列表格,属于样本量较少的情况,应该用FIsher确切概率法

又比如:试验组和对照组的癌症特征比较,也应该用Fisher确切概率法


这里强力建议: 多分类数据差异性比较,Fisher确切概率法才是首选,不要过于依赖卡方检验


5、方差分析多重比较,用t检验

这宗罪早些年很多,如今已经被死死遏制在较低的犯罪水平,凡事讲到方差分析都要提到,两两比较不要用t检验!你现在还犯错?那不应该呀!两两比较要采用类似于LSD, Bonfferoni、tukey、SNK的方法,推荐使用Bonfferoni方法,相对保守的一种方法。

 

6、P值小于0.05,被认为有显著性差异,P值小于0.01,被认为有极其显著性差异

P<0.05英文名字是statistical significance 没有错,但是由于显著性差异给人带来误导(感觉组别与组被之间的差异很大),现在医学研究不再强调显著性差异,P<0.01更不能说差异极其显著。无论   P<0.05还是P<0.01,只能说,差异具有统计学意义或者具有统计学差异。


比如下文,其统计文字描述是不妥当的

 


又例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P<0.001”,则认为甲药极显著地优于乙药;若得到“P<0.01”,则认为甲药非常显著地优于乙药;若得到“P<0.05”,则认为甲药显著地优于乙药。


7、没有遵循随机化、对照、重复原则评价处理因素的作用

无论是t检验、卡方、秩和、方差分析的分析结果,其结论是否可靠均需要严谨的设计。只有在随机化设计、合理均衡对照、一定样本量的基础上,通过假设检验的方法得到的结果,才能够被认为是处理因素发挥作用。而随意分组、自身前后配对研究、甚至空白对照,都没法证明处理因素的作用。观察性研究比如调查研究,差异性的统计分析方法更说明不了什么问题,只能说组与组有差别!


例如:

这是一项回顾性队列研究,所有180病例为医院手足口病的住院患者。按患者是否应用中药治疗分为常规治疗组(对照组)与中药治疗组(治疗组)。比较中、西医治疗的效果。结果方面,两组患者的有效情况采用卡方检验,差异有统计学意义(P<0.01),该论文认为中医药治疗效果较好。显然这样的结论不妥当,不够严谨。 


 最后,来投个票吧。基本统计方法,你犯了几宗罪?


更多阅读:

1.数据不是正态分布还能做t检验吗?  | 统计小食

2.当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格

3.怎么样才能在顶级医学杂志发表Meta论文? 一起来解剖最新川大华西医院BMJ 杂志Meta分析报告

4.重磅:十大资源免费速递,总有一种是你想要的!为2020年国家自然基金助力!

5.【周一资源下载】如何让excel绘制出精美的统计图!欢迎分享下载

6.【周一资源下载】医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门变成高手!


诸位,本公众号现在已经形成包括“样本量估算方法”“医学研究进展”“论文的统计表达方法”“统计视频”(R、医学统计学、妙趣统计学)、“科研工具合集”、“如何分析真实世界临床研究数据”等系列,有兴趣同仁们可以关注。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存