查看原文
其他

优雅秀出你的t检验,提升Paper逼格! | 协和八

2016-07-14 田菊 协和八

小编按 经过了这么多集的学习,相信大家已经对 t 检验了如指掌了吧!今天就由田菊师姐教我们如何描述 t 检验结果~

讲了这么多集关于 t 检验的知识,相信你们对统计检验有了更深入的了解,再也不会被轻易地被一些不靠谱的结果糊弄住了。

另外一方面,学习统计检验的原理也是为了能在我们自己写论文的时候准确地描述实验结果。如果不能把辛辛苦苦搜集来的实验数据清晰地表达出来,导致自己的结论不能很快地被读者理解,真对不起自己花那么多的时间做实验。

描述 t 检验的结果可以通过文字列出关键数据,也可以通过做图来表示;前者更准确,后者更直观,通常会两者结合。

我们从下面的例子开始我们的统计「八股文」之路。

用单样本 t 检验对比了格格巫包子的重量与标准包子重量(50g)的区别,发现格格巫包子的重量(平均值=45g,标准差=3g,95% 置信区间 [ 43.8g,46.2g ] )与标准值 50g 有显著区别( t (25)=4.2, p < 0.001 )。

从例子我们可以看到,总结 t 检验的结果首先要说明到底做了什么类型的检验(单样本 t 检验,成对样本的 t 检验,还是独立样本的 t 检验;如果搞不清楚可以参考就是要实用!t 检验的七十二变)。

光说明检验类型还不够,还要说清楚数据到底是针对什么的测量,如果是对比两组数据,最好说清楚每一组具体的实验条件。

说明检验的背景之后,就可以总结结果了。

首先可以通过数据的平均值标准差来简单描述一下数据,最好还能像例子里面一样加上 95% 置信区间,这样可以方便读者判断效应大小,效应的概念可以参考只讲 p 值,不讲效应大小,都是耍流氓!。通过平均值和标准差以及对比的标准值,对结论感兴趣的读者可以直接估算出衡量效应大小的 Cohen 氏 d 值。当然,我们也可以直接给出该结果。

下一步根据 p 值的大小来判断是否有显著性区别,通常 p 值小于 0.05,拒绝原假设,认为数据与标准值有显著区别或者实验组数据与对照组数据有着显著区别。

t 检验的结果除了要给出 p 值,通常也会给出 t 统计量以及自由度(在单样本情况下是等于样本量减 1,在独立样本且两个样本方差相等的情况下等于总样本量减 2)。根据我们之前在想玩转t检验?你得从这一篇看起讲过的,有了自由度,t 统计量的分布就能确定,结合样本给出的 t 统计量大小其实就可以计算出精确的 p 值。

因为 p 值的具体数值对结论并不是很重要,所以在论文里面一般只给出 p 值的范围即可。通常会把 p 值在分为四个区间:p<0.001, p<0.01, p<0.05,p>0.05。注意后一个区间并不包含前一个,例如 p=0.00005 的情况会写作 p<0.001 而不会写作 p<0.01。

有一个例外是如果 p 值接近显著性的临界值,比如 p=0.045 的情况,最好还是写出 p 的具体数值而不是 p<0.05。

不过话说回来,如果看到很接近 0.05 的 p 值,读者难免会怀疑结果的真实性。所以遇到这种模棱两可的 p 值,最好还是再重复两次试验验证一下,得到的结果会更可信。 

对于我们需要在统计结果报告中给出的这些数字,一般的统计软件都会自动输出,只需将它们按照前面例子里的格式写出。不同的杂志对统计结果的格式会有不同的要求,投稿前要记得检查一下杂志的具体要求,或者翻一下杂志近期发表的文章。

我们可以看到,在论文里面描述结果其实非常简单,甚至不需要对 t 检验有什么深入的认识,那为什么我们要写前面那么多期的文章来讲解原理呢?

学会原理,我们才能选用最适当的统计检验,并理解这些统计结果的准确含义,同时更好的解读自己的结果和他人的结果,做起科研来也会更有信心。

除了用文字描述数据,做图往往也很重要。现在很多读者(甚至审稿人 )在看文献的时候并没有时间仔细地阅读文字,而是直接扫一眼图表。所以用图表清晰地表现结果就至关重要了。

好的图要直白清晰,并且尽可能地包含多的信息

表达同样的一组数据,我们可以用散点图标出所有的数据点,也可以用箱线图表示中位数、四分位数以及极端值(箱线图具体可以参考数据到手了,第一件事先干啥?),或者用简单的柱状图(高度代表数据平均值,一般还用误差线标记样本的标准差),见下图的例子。



不难看出,从信息量的角度,散点图>箱线图>柱状图。因为散点图包含了数据的所有信息,箱线图可以大概表现出数据的分布,包括偏态和异常值的信息,而柱状图的信息只有平均值和标准差,并没有提供比文字更多的信息。 

当然,也不是信息量越多的图越好,当数据点比较多(几十个或以上时),点会开始重合,变成难以辨认的一团黑点,这样反而不能清晰地展示结果,这时用箱线图会比较好。

虽然箱线图比柱状图信息更多,但目前很多发表的论文都倾向于用柱状图。为了阻止这一歪风邪气蔓延,现在不少学术杂志已经开始规定用箱线图或者散点图代替简单的柱状图。

说实话我还真没想出来什么情况下柱状图会比箱线图更合适。假如出于某些原因一定用柱状图,不要忘了标清楚柱状图的误差线是标准差( standard deviation, 缩写为 sd 或者 std ),还是测量标准误差(standard error of the mean,缩写 se 或者 sem )。后者是前者除以 √n,这里 n 是样本量,所以测量标准误差比较小。咱们读文献的时候也要看清楚了,不要误把测量标准误当作标准差。

如果是成对样本 t 检验的情形,用散点图还可以清晰地展现每一对数据是否都一致地增加或者减少。

假设我们想知道 30 周的小鼠是不是比 20 周的更重,于是测量了 7 只小鼠在这两个时间点的体重,由于对每个样本测量了两个值进行比较,所以这里的数据是成对数据

在下图中,B-D 这三个是用散点图展现了三种不同的假想情况下的数据, 左栏数据点代表小鼠 20 周体重,右栏数据代表 30 周体重,一条线连接的数据点都是成对样本,来自同一只小鼠。


图片来源https://evolutionliteracy.com/category/video/page/2/

A 为柱状图(误差线为测量标准误差),B-D 为散点图(B:每一对都上升;C:有些上升,有些下降,D:某几个值上升很多,其它没有太大变化),注意 B-D 组数据都对应 A 的柱状图。

不难看到,在 B 中,所有小鼠的体重都有所增长;在 C 中,有些小鼠体重增长,而另一些小鼠却「为伊消得人憔悴」了;而在 D 中,一些小鼠体重增长,另一些小鼠则体重基本保持不变。显然,这三种情形非常不一样,但如果我们用柱状图来描绘这群小鼠在两个时间点的平均体重和标准误差,我们将会得到完全一样的柱状图(即 A 中所示)! 

这说明了不同的成对数据可以有相似的柱状图,用散点图不但可以反映数据点真实趋势,而且可以突出成对对比,体现出到底有多少对数据支持结论。B 图的数据显然比 C 和 D 图更强烈地支持小鼠 30 周的体重大于 20 周的体重这一结论。


最后,统计显著性也常常会用星星(*)在图上表示。通常 *** 表示 p<0.001,** 表示 0.001<p<0.01,* 表示 0.01< p<0.05,对于 p>0.05 的情况,通常可以标注为 n.s 或者 p>0.05,如下图所示。


图片来源 http://www.cell.com/neuron/abstract/S0896-6273(15)00722-9

***表示 p<0.001,n.s 表示没有显著区别,红色为实验组,黑色为对照组。

难怪周围有些小伙伴们会视星星如生命。但是希望一直关注「说人话的统计学」的读者们不要唯星星是从,毕竟一个结果是否有意义还要看效应大小


回复「统计学」可查看「说人话的统计学」系列合辑,

或点击下方标题可阅读本系列全部文章

>> 干货 <<<

你真的懂p值吗?

做统计,多少数据才算够?(上)

做统计,多少数据才算够?(下)

提升统计功效,让评审心服口服!

你的科研成果都是真的吗?

见识数据分析的「独孤九剑」

贝叶斯vs频率派:武功到底哪家强?

数据到手了,第一件事先干啥?

算术平均数:简单背后有乾坤

正态分布到底是怎么来的?

想玩转t检验?你得从这一篇看起

就是要实用!t 检验的七十二变

不是正态分布,t 检验还能用吗?

只有15个标本,也能指望 t 检验吗?

样本分布不正态?数据变换来救场!

数据变换的万能钥匙:Box-Cox变换

t 检验用不了?别慌,还有神奇的非参数检验

只讲 p 值,不讲效应大小,都是耍流氓!

用置信区间,就是这么(不)自信!

如何确定 t 检验的置信区间

>>> 自检 <<<

妈妈说答对的童鞋才能中奖

统计学的十个误区,你答对了吗?

>>> 番外篇 <<<

说人话的统计学:一份迟来的邀请


五年执医 三年模拟

精选每日一题

更多精选题可回顾历史推送文末

题目来源:考研西医综合全真模拟试卷

本期主播:保健药酒

作者:田菊

编辑:黑草乌叶



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存