论文统计图表常见的那些错,附大量实例!
1、“率”与“构成比”的混用
【原文1】600 例烧伤患儿中,210 例早期有休克症状,其中3岁以下者110例,占52%;3岁以上者100例,占48%,年龄越小,休克发生率越高,随着年龄逐渐增长,机体调节机能及其对体液丧失的耐受性会逐步改善。(《中华烧伤杂志》2000年发表)
【原文2】
表1. 101例术后病人对探视时机、探视时段的需求
(《中华护理杂志》2001年发表)
【分析】“率”是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。“构成比”即比例,是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的的比重。二者都是相对指标,计算公式相似,但是存在本质区别。
原文1中,210例发生早期休克患儿中,3岁以下的占52%,3岁以上占48%,实际上是构成比,而文中却将其误认为“发病率”,得出了“年龄越小,休克发生率越高”的结论,明显是错误的。如果要计算不同年龄段的休克发生率,则计算公式应为(某年龄段发生休克的患儿数/该年龄段可能发生休克的患儿总数)×100%。
原文2表格中的相对数实际上也是“构成比”,“百分率”的表述方式并不准确,应该改为“构成比”。
2、分母太小不适合计算比例
【原文】环丙沙星治疗实验感染动物鼠疫疗效观察:表2结果表明治疗组30只动物全部存活,治愈率为100%。(《中国地方病学杂志》2005年发表)
表2. 环丙沙星治疗实验感染动物鼠疫疗效观察
【分析】原文中统计表的主要问题在于计算相对数的分母太小。分母太小,会使结果显得过分夸张,易失真,不能正确反映事实情况,给人造成错觉。一般来说,只有当观察的研究对象数量足够多的时候,计算相对数才比较稳定,才能反映真实的情况。
研究中对照组的动物数仅有3只,“治愈率为0”的表达显然是不合适的。此外,表2要表达的是两组治疗疗效的差异,“攻击剂量”是对实验动物进行感染的剂量,文中也明确说明了两组动物的攻击剂量是一样的,因此攻击剂量没有必要出现在表格中。
3、表格中数据内容不明确
【原文】
表3. 各组猪右膈叶矽肺病变范围比较
(《中华劳动卫生职业病杂志》1997年发表)
【分析】该表格存在的问题有以下几方面:①表格中的数据所代表的含义不明确,很难理解“病变范围分级(%)”的含义。实际上,数据所代表的的含义是“病变范围不同级别的例数在该组的构成比”,但是原文的表达方式不容易让人理解。②考虑到样本量较少,因此并不适合计算相对数,建议直接用例数表示即可。③研究的样本量太小,并不适合用卡方检验。
4、统计表注释的明显错误
【原文】
表4. 两组患者治疗前后生化指标检测(n=50,
(《中国临床研究》2016年发表,截取部分数据)
【分析】根据表格下的注释,*表示的是与对照组相比P<0.05的情况,但是表格最后一行对照组数据中,血清C-反应蛋白这一项也标有*,但是显然这是错误的,因为对照组无法与自身相比较。
5、统计表内容设计不合理
【原文1】非治疗动物(对照组)的观察:未经过治疗的3只实验动物分别于感染后2~6天全部死亡,动物解剖后于各脏器均分离到鼠疫菌,为特异性死亡。其细菌学检验结果见表5。(《中国地方病学杂志》2005年发表)
表5. 死亡动物检菌结果
【分析1】表5的问题在于表格的内容与标题不相符。标题明确是“死亡动物”的检菌结果,治疗组并没有死亡动物,而表格中对于治疗组的死亡时间写为“0”,检菌结果均标为“-”,容易让人对治疗组的检菌结果产生误解,显然这是不正确的。根据文中的表述,对照组只有3只动物,建议不需要表格,可以直接用文字表述3只动物的死亡时间与脏器感染鼠疫菌的情况即可。
【原文2】左氧氟沙星与环丙沙星分别治疗61例和63例敏感菌所致细菌性感染,以中度感染为主,取得了满意的疗效。左氧氟沙星组痊愈率和有效率分别为67.21%和90.16%,环丙沙星组分别为65.08%和80.95%(表6),统计学比较无显著性差异(P>0.05)。
表6. 临床疗效比较
(《中国抗生素杂志》2002年发表,截取部分数据)
【分析2】表6的目的是为了表明两组在治疗感染效果方面的不同,是对两组整体情况进行的统计分析,实际上运用的是表6中的“合计”的数据,而并非是针对不同的感染进行比较,整篇文章也不涉及对不同感染情况的其他研究分析,因此在绘制统计表时,没有必要把每一种感染的情况逐一罗列,可以将表6修改为表7形式,使统计表看起来更加简单、明了。
表7. 试验组和对照组在临床疗效上的比较(例(%))
同时要注意的是,统计表就如完整的一句话,有其描述的对象(主语)和内容(宾语),通常主语作为横标目,宾语作为纵标目,因此在该例中,将“组别”设为横标目,“临床疗效”设为纵标目。而对于表格中出现的痊愈率、有效率及P值则可以用文字进行描述。
6、统计图的错用
【原文1】TNF-α的变化如图1所示,从图1中可以看出 TNF-α水平在治疗后有明显降低。(《中华口腔医学杂志》2003年发表)
图1. 牙周基础治疗前后血清TNF-α的变化
【分析1】线图适合于描述某统计量随另一连续型数值变量变化而变化的趋势,常用于描述某统计量随时间变化的趋势。原文1中的图是为了表示15名病例在治疗前后的TNF-α的水平,横轴表示的是病例编号,很显然各个病例是独立的,不存在连续性,因此使用线图是不准确的。如若统计图中确实需要体现“病例编号”,则可以运用复式条图,横轴为病例编号,纵轴为观察指标,如图2(该图数据并非原文数据,仅为举例使用)。
图2. 牙周基础治疗前后血清TNF-α的变化
【原文2】
图3. 男女组内及组间的骨龄比较
图4. 各组不同青春期样本的构成比
(《中华口腔医学杂志》1999年发表)
【分析2】条图是用相同宽度的直条长短表示相互独立的统计指标的数值大小和他们之间的对比关系。原文中图3是为了表明MH、MG等5个组的骨龄,该5组(分组因素)相互独立,应该采用条图。但是此图存在的问题在于代表各组的直条相互紧紧排列在一起,而没有间隔开,是不合理的。在绘制条图时,要求各直条宽度相等,间隔一般与直条等宽或为其一半。
第二,本研究是根据性别及下颌尖牙牙龄进行的分组,该图的标题为“男女组内及组间的骨龄比较”,“组内”及“组间”的描述容易产生误解,建议改为“不同组的骨龄比较”。第三,“MH:MF MG:MF FH:FG MH:FH各组间比较均P<0.05”的描述不应该放在统计图与标题之间,而应该在正文中进行描述。
原文中图4采用了复式条图,来说明各组不同青春期的构成比。而复式条图一般适用于有一个统计指标、两个分组因素的情况,显然并不适合用在此处。该资料可以选择百分比条图,描述各组中不同类别所占的构成比。另外,在MH组、FH组、FG组三组中,每组3个数据之和并不是100%(分别为99.5%,99.7%,104%),可能是笔误所致。
相关阅读
赶快关注医咖会吧!
有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),加入医咖会统计讨论群,和小伙伴们一起交流学习吧。我们诚邀各位小伙伴加入我们,一起创作有价值的内容,将知识共享给更多人!
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。