河南南阳收割机被堵事件:官员缺德,祸患无穷

极目新闻领导公开“记者毕节采访被打”细节:他们打人后擦去指纹

突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

退休后的温家宝

突发!北京某院集体罢工!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

用统计学解释一次核酸检查为阳性但患病的概率不到10%

糖甜甜甜 DataGo数据狗 2022-07-01
如何判断和确诊是否感染新型冠状病毒肺炎?此前曾有患者在诊断中经历三次、四次甚至更多次样本检测才能发现核酸阳性进而确诊。而治愈出院的标准是,体温正常3天、呼吸道症状改善,在连续两次核酸检测且两次采样间隔24小时的情况下,两次阴性。在诊断过程中,连续两次检测是为了避免操作可能出现的一些失误,比如采样样本不好或者是“假阴性”。那么这里从统计学的角度计算,为何需要复查两次才能确诊患病。

条件概率和全概率

这里先介绍一下条件概率,描述的是事件 A 在另一个事件 B 已经发生条件下的概率,记作 , A 和 B 可能是相互独立的两个事件,也可能不是:

 表示 A,B 事件同时发生的概率,如果 A 和 B 是相互独立的两个事件,那么:


上面的推导过程反过来证明了如果 A 和 B 是相互独立的事件,那么事件 A 发生的概率与 B 无关。稍微做一下改变:


考虑到先验条件 B 的多种可能性,这里引入全概率公式:


这里  表示事件 B 的互补事件,从集合的角度来说是 B 的补集:

贝叶斯公式

在条件概率和全概率的基础上,很容易推导出贝叶斯公式:


看上去贝叶斯公式只是把 A 的后验概率转换成了 B 的后验概率 + A 的边缘概率的组合表达形式,因为很多现实问题中  或  很难直接观测,但是  和  却很容易测得,利用贝叶斯公式可以方便我们计算很多实际的概率问题。

例子

这里用平时常见的例子来计算,假设某种疾病在所有人群中的感染率是0.1%,医院现有的技术对于该疾病检测准确率为 99%(已知患病情况下, 99% 的可能性可以检查出阳性;正常人 99% 的可能性检查为正常),如果从人群中随机抽一个人去检测,医院给出的检测结果为阳性,那么这个人实际得病的概率是多少?

很多人会脱口而出99%,这里混淆了两个事件的后验概率,即:如果用 A 表示这个人患有该疾病,用 B 表示医院检测的结果是阳性,那么 表示的是「已知一个人得病的情况下医院检测出阳性的概率」,而我们现在问的是「对于随机抽取的这个人,已知检测结果为阳性的情况下这个人患病的概率」,即 。

我们可以用贝叶斯定理来计算这个人实际得病的概率:


其中:

  • ,被检测者患病的概率

  • ,被检测者未患病的概率

  • ,已知患病的情况下检测为阳性的概率

  • ,已知未患病的情况下检测为阳性的概率

将上面的概率代入到贝叶斯公式中,可得:


这个公式在这里的实际意义是什么?让我们用图来解释(这里的概率已四舍五入):

从贝叶斯的角度来看,随意选取的一个被测者,由于信息并不充分,未检测之前有假阳性P(ACB)、真阳性P(AB)、假阴性P(ABC)和真阴性P(ACBC)四种可能,这些可能性由检测技术和该疾病的感染率决定,当检测结果为阳性的时候,只剩下真阳性和假阳性两种可能,而真阳性的概率仅为假阳性的十分之一,贝叶斯公式在这里的实际意义是:
这里有两个结论可以解释为什么需要复查,一是即使被医院检测为阳性,实际患病的概率其实还不到10%,有很大可能是假阳性。二是很多人会认为一次检查显示为阳性但患病的概率为9%这个概率比较小,是否可以忽略认为没有患病,但是这里要注意一个概率的值,即随机抽取一个人患病的概率为0.1%比较小,而对于随机抽取的这个人,已知检测结果为阳性的情况下这个人患病的概率为9%,9%/0.1%=90,那么做一次检查显示阳性,患病的概率已经提升了90倍。所以据以上两个结论证明往往需要复检来确定是否真的患病,让我们再来计算初检和复检结果都为阳性时,患病的可能性。假设两次检查的准确率相同,都是99%,这里令 B 为第一次检测结果为阳性,C 为第二次检测结果为阳性,A 为被检测者患病,那么两次检测结果都是阳性患病的概率可以表示为:


其中:

  • ,被检测者患病的概率

  • ,被检测者未患病的概率

  • ,已知患病情况下连续两次检测结果为阳性的概率

  • ,已知未患病情况下连续两次检测结果为阳性的概率

代入后可得:


可见复检结果大大提高了检测的可信度,联系上面的图,复检大幅减少假阳性的可能(0.01->0.0001),大幅增加真阳性的可能(0.09->0.9)从而提高阳性检测的准确性。

扫描二维码即可关注

文章有问题?点此查看未经处理的缓存