查看原文
其他

sxr 2018-05-23


前言

我们在科学研究过程中,进行统计学分析,总要拿着P值去报告结果,P值究竟什么意思呢?P值大小对我们有多重要,今天小编就扒一扒p值到底该如何对待。



从p值出生说起
前世

P值得历史可以追溯到1770年,数学家拉普拉斯在处理50万左右的生育数据时,发现男性的生育率超过女性,对于这个无法解释的“超越”,他计算了一个叫做“P值”的东西,以确定这个“超越”是真实的(Stigler 1986, P.134)。

今生

很多统计学家误以为关于P值的正式文献是费雪发表的,其实不然,最早在文献中正式阐述P值及其计算的,是统计学家Karl Pearson,你可能不了解他,但是他的Pearson卡方检验你一定知道,这篇关于卡方检验的文章当时被发表在《哲学杂志》上,文章中一同被介绍的,还有一个被叫做“P值”的东东,见史料。



风靡

P值能风靡学术界这么多年,费雪是第一推手,被他推动的除了P值,还有被称为“费雪学派”(Fismatchherian)的假设检验思想。简单介绍下他的思想:

如果我们想要match检验一个样本是否来自某个分布已知的总体,首先要建立一个“原假设”(null hypothesis),比如,下图的例子我们假设该样本来自正态总体N(m0,σ),那么原假设为:

H0:m=m0

但实际上我们得到的样本均值不是m0,而是,那么Fisher他老人家当时的想法是:在一个样本均值为m0的正态总体中,抽样得到这个均值为的样本的几率会有多大?我要是能计算出这个概率,就知道“这个样本来自该总体”这件事有多靠谱了,如果概率太小,就认为是不靠谱的事情,那么就可以认定这个假设是错的。这就是假设检验里的“小概率事件原理”,这个概率就是后来风靡学术界的“P值”,一般认为概率小于5%,就是不靠谱的事情,则需要拒绝原假设。

到此为止,Fisher大神只字未提“备择假设”,也从没说任何关于“接受”某个假设的事情,在Fisher的检验哲学里,

1、检验是基于无限总体中抽出的一个(注意是一个)样本;

2、显著性检验的基础是基于原假设而得出的假想概率,这些检验不能导出任何关于真实世界的概率论断。

因此,费雪以及他的P值检验思想,从来没有涉及到“备择假设”的概念,没有被认为可以用来证明某个假设是对的。




但是咱们做数据分析的过程中经常会遇到明显结果很好但是得不到一个很好的p值,真是为p值小于0.05,0.01伤透了心,当我们得到了p值小于0.05或0.01时,心里暗自高兴,晚饭还能多吃点,那么该怎么看待这些矫情的p值呢。

P<0.05或P<0.01:是指实验组(干预组)与对照组研究结局之间差异具有统计学意义。

   那么两者有啥区别呢?有人说P<0.01说明差异更大,P<0.05说明有差异可是不大,那就错了。比如说一个男人和一个女人,差异就已经摆在那里了,不会因为你<0.05或者<0.01而发生变化;那两者到底说明什么呢?如果我们做试验发现二者差异P<0.05,是指我们有95%的把握认为男人和女人有差异;P<0.01是指我么有99%的把握认为男人和女人有差异,也就是说P<0.01比P<0.05得到的结果更加可靠,而差异就在那里,不会因为p值不同而变化。

p值不显著该如何
有时候p值就是不显著,此时咱们是不是该放弃治疗了呢,其实未必,关键看你的研究目的,如果你发明一种简单方便的治疗方案,和目前的复杂昂贵的治疗方案之间进行比较,结果P>0.05,那不是你该仰天大笑呢?因为虽然P>0.05,认为两组间的差异无统计学意义,可是却说明你的方案可以和经典方案相提并论,岂不是更加说明你的方案是很好的方案呢。生物学意义和统计学意义的纠缠

(1)P<0.05准确的理解为组间差异具有统计学意义。是指从统计学角度认为组间数据来自不同的总体,或者从属于不同的分布,从而存在差异。但是有统计学意义不等于就有生物学意义。比如说某降压药可以降低高血压患者血压值3mmHg(P<0.05),说明该降压药确实可以降低3mmHg血压值,但没有生物学意义,因为生物学上要求降压药降低8mmHg才有临床意义。

(2)有生物学意义也不一定就有统计学意义

    假如一种A药可以提高艾滋病患者的CD4水平,但只能提高10个/mm3,虽然经过统计学分析P>0.05,但对于一个晚期艾滋病患者而言,能提高一点是一点。

(3)没有统计学意义也会有生物学意义

    比如说你发明了一种方法治疗狂犬病,40例患者中你居然治愈1例,那统计学分析与既往资料比较差异无统计学意义(P>0.05),然而从专业上来说你做了一件绝对有生物学意义的事情。因为你做出了零的突破,是一件里程碑的事情。

(4)总结:统计学意义与生物学意义一定要结合起来看哦。


欢迎关注生信人



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存