查看原文
其他

【2035】松哥带您分享一篇文章带来的若干思考【荐荐荐】

松哥统计 精鼎统计 2023-03-23




缘起

昨天收到一个既往学员的统计咨询,松哥发现这是一个非常好的问题,于是便整理此期,希望与大家一起分享学习。11


问题截图如下图表1:

问题1:本例应该用什么统计分析方法?

问题2:该作者下面的每个卡方是如何算出的,是否正确?

问题3:该问题可以有哪些思考?


原文文章《大剂量伐昔洛韦联合针刺治疗带状疱疹的临床观察》,中国药房2016 年第27 卷第26 期。



案例说明:



本例一看数据即是属于成组设计的2组,试验效应指标为等级资料。按照原作者文中的表述,观察组总有效率97.9%,对照组90.7%,进行了两组总的疗效比较。同时又对痊愈、有效、好转和无效进行了单独的比较。


松析1:

具备一定统计基础的人,看到这样的数据,认为疗效为等级资料,作者采用的卡方检验,肯定错了。


其实未必,因为作者比较的总有效率之间的差异,根据其研究的目的,数据就已经变为二分类,有效和无效了,数据格式变为如下图:

SPSS数据录入格式如下:



SPSS卡方检验(成组四格表资料卡方检验)结果如下:得到结果卡方=4.645,P=0.031,与原作者卡方=4.722,P=0.030,基本相同,如果有错,作者错了,松哥没错,呵呵!


松析2:

原作者,又对每个子项进行卡方检验,得到相应的卡方和P值,是怎么算出来的呢?松哥估计,他是再次分割,以痊愈为例,重新切割为下图:分为痊愈与未痊愈的二分类,然后继续进行四格表资料卡方。是不是的呢?

松哥再次进行卡方验证,得到下图结果:卡方=10.545,P=0.001,与原作者分析结果一模一样,看来原作者就是这么分析的。

但是这样子做对不对呢,松哥认为这种做法似乎不妥,因为研究变量的类型一般就为3类,根据3类进行方法选择,作者将疗效痊愈、显效、好转、无效分为4个变量,然后进行分析,等于一个问题分成4个,进行4次检验,肯定会增大I类错误的发生概率。故这种做法松哥表示不太认同。有点乱用统计分析方法之嫌。

松析3:

如果是比较2组的疗效有无差异,松哥认为采用非参数检验的效果应该更好。有人会认为,分成有效和无效,进行卡方,,就像本例一样,不是也挺好的吗?


其实,等级资料包含的数据信息要高于二分类资料,当我们降等级降为二分类进行分析,就已经损失了很多的信息。


本例如果采用非参数检验,下图为原作者的数据表。


采用非参数检验的方法,发现Z=-3.285,P=0.001。结合秩均值,得出观察组的疗效优于对照组。这和卡方检验的结果一致。



可是松哥认为,非参数检验得到的结果包含的信息更多。不信请看下表,下表数据如果按照作者的做法分为有效和无效,那么观察组和对照组的有效率还是97.9%和90.8%。卡方检验的结果还是一致,认为观察组比对照组有效。可是观察组真的比对照组好嘛?


当松哥采用非参数检验分析时,发现观察组秩均值=109.54,对照组=85.46,并且P=0.001。竟然认为对照组比观察组疗效要好哦。


松析4:

也有人会说,是否可以用有序Logistic回归进行分析,不也可以吗?松哥认为,选什么方法,应该考虑研究目的,本例研究目的是比较两组的疗效是否有差异。那就应该采用差异性检验分析方法中的t、F、卡方、非参数。Logistic的确可以分析出观察组相对于对照组的OR值,但并不是反映其差异的分析方法,也不能够回答研究值目的。


松析5:

就这个案例,如果仅仅比较两种方法有效率的差异,可以考虑合并后的卡方检验;但要想知道两种方法的疗效差异,则应该采用非参数秩和检验。如果研究观察组干预措施相对于对照组的风险比值,可以采用Logistic回归。


松哥统计说

有人说:统计就是为了折磨人而生的,对于缺乏统计思维的人而言,也许是吧。学习统计必须先学统计思维,否则真的容易走火入魔,而自废武功。


突然想到一个问题,对于本例,您认为是有效率有差异比较有意义,还是两组疗效有差异有意义呢?欢迎留言讨论。


OK,本期到此,感觉对您有用,还请分享转发,我是松哥,一个有点唠叨的统计老师!



精鼎数据分析联盟,期待您的加盟!在数据处理方面,欢迎您来投稿!


SPSS系列文章列表【2】

【若有用,请分享!】

【2034】松哥松哥告诉我,中位数95%可信区间怎么做?

【2033】如何让SPSS根据自身数据库行号产生ID特征变量

2032】SPSS如何实现百分数的平方根反正弦变换

【2031】相关样本非参数检验如何实现两两事后比较

【2030】多元回归中交互作用的评价

【2029】SCI编辑让我报告LSD-t检验的t值,可是SPSS没有啊,怎么办?

【2028】配伍组设计,二分类资料如何进行统计分析?

【2027】如何利用SPSS计算总体率与总体均数的95%可信区间

【2026】SPSSS如何实现哈迪-温伯格平衡(Hardy-Weinberg equilibrium)法则检验

【2025】R×C列联表(分类数据)的统计分析方法选择与SPSS实现

【2024】SPSS实现LD50/LC50计算

【2023】Kappa一致性与组内相关系数(ICC)应用辨析【推荐】

【2022】层次分析法帮你选股票

【2021】简单效应的SPSS实现

【2020】这种主成分得分图SPSS能够实现吗?

【2019】卡方分割无需手动,SPSS自动可实现啦!

【2018】重复测量资料SPSS实战篇

【2017】SPSS输出结果统计表与统计图的专业性编辑及三线表定制格式赠送!

【2016】卡方检验之SPSS实现简约版(视频)

【2015】t检验之SPSS实现简约版(视频)

【2014】SPSS中如何设置哑变量

【2013】SPSS快速入门之SPSS常用3界面介绍

【2012】分层回归之SPSS实践

【2011】SPSS直接物理拆分为两个文件

【2010】倾向性评分(PSM)的SPSS24.0实战

【2009】如何SPSS实现随机分组

【2008】趋势性卡方检验专题讨论

【2007】2个因素均为重复测量数据方差分析

【2006】为什么配对样本t检验,SPSS结果默认输出相关性

【2005】SPSS软件作图如何去除顶部与右边边框

【2004】如何让SPSS自动按照四分位数间距分组某变量【技巧】

【2003】SPSS23两独立样本t检验的简易算法

【2002】太伤自尊,以为学会了,现在用SPSS连两独立样本t检验都做不好

【2001】SPSS作图坐标轴不过原点的解决办法

----------------------------------------------


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存