查看原文
其他

天才的诡辩和学界的反驳

Insight Lab 百步优解 2024-03-22

编者按:

2023年秋学期,在北京大学预防医学专业本科《卫生统计学》课程中,给同学们布置了围绕“相关-关联-因果”进行讨论的课后作业,几位同学的“小作文”让我眼前一亮,遂请助教协助组织联合写作,形成了“天才的诡辩——否认吸烟致癌的统计学大师”一文。从统计学天才Fisher的逸事中深入了解“因果推断”,知识中不乏趣味,有点儿意思。因篇幅较长,遂分为4个推送与各位看官共享。



天才的诡辩——否认吸烟致癌的统计学大师


I. 吸烟与肺癌的关联性研究背景

II. 统计大牛R. A. Fisher简介

III. 天才的诡辩和学界的反驳

IV. 深层思考——因果推断


 III. 天才的诡辩和学界的反驳






写给《The BMJ》的信



根据Hill和Doll的病例对照研究在1954年发布的研究报告,《The BMJ》于1957年6月29日发表社论,肯定了吸烟对健康的危害,并认为有必要在公众中广为宣传此事... (But the hazards to health and life are undeniable, hazards which must be brought home to the public by all the modern devices of publicity…)。当时学界只是证实了吸烟和肺癌存在相关关系,社论里这种草率肯定的态度引发了Fisher的不满,于是他在1957年向《The BMJ》写了一封信(Letter to Editor)(图8)[9]。在这封信中他认为Doll和Hill以及很多其他统计学家的调查研究还不足以说明吸烟会导致肺癌,吸烟与肺癌的关系亟待进一步研究(None think that the matter is already settled. The further investigation seems, however, to have degenerated into the making of more confident exclamations, with the studied avoidance of the discussion of those alternative explanations of the facts which still await exclusion.)。吸烟是否会导致肺癌亟待进一步研究,并在之后给出了自己反对的两点理由:



(1)吸烟和肺癌的相关关系并不代表因果关系,或许早期的肺癌是吸烟的诱发因素,肺部的某些炎症使人们想通过吸烟来缓解。



(2)吸烟与肺癌之间可能并没有因果关系,只是有一个尚未知晓的共同的影响因素,这种影响因素可能是个体基因型的差异:某种特定的基因型既影响人们的吸烟行为,又影响他们患肺癌的风险。这个观点被称为“共同原因”假说。



Fisher的假说确有道理,且并不容易被证伪。因为要证伪它,就需要找到那个未观测的基因,或者排除所有可能的基因,这在当时的技术水平下,是非常困难的。而且,Fisher也不是一个好说服的人,他对于任何反对他的观点的证据,都会进行各种各样的质疑和反驳,这让很多人对他的观点感到无奈和沮丧却又无可奈何。


图8 Fisher写给《The BMJ》的信



写给《Nature》的信



这之后,Fisher为了巩固他的“共同原因”假说的观点,继续进行研究,并在1958年向《Nature》的编辑写了一封信阐述自己的理由(图9)。


图9 Fisher写给《Nature》的信



信中有这样一张表格[10]:

图10 Fisher写给《Nature》的信中的数据



这是他从Hill和Doll研究中整理出的男性和女性被研究者吸烟时吸入和不吸入烟雾者患肺癌情况的数据,通过这些数据,他得出了一个惊人的事实:男性吸烟者中,将烟雾吸入肺中的人相比于不吸入烟雾而只经过口腔的人,它们的患肺癌的风险竟然降低了10%!于是他以戏谑的口吻写道:“…then inhalers may congratulate themselves of reducing the cancer incidence by over 10 percent, using a very simple, and even enjoyable, method of prevention.”



Fisher认为,不同的吸烟类别,如香烟、雪茄、烟斗等,可能是由于吸烟者的个性不同而选择的,而不是随机的。这意味着吸烟者和非吸烟者在基因水平上是不均衡的的,这就导致了研究的偏倚,也可以说明他的“共同原因”假说是有一定道理的。



此外,Fisher还搬出了一名德国教授v. Verschuen向他提供的研究数据来佐证自己的观点(图10):


图10 v. Verschuen教授提供的数据



图10上方表格是同卵和异卵双胞胎在吸烟习惯上的相似与否的对子数。从中可以得出同卵双胞胎的吸烟习惯确实比异卵双胞胎更相似(同卵双胞胎的基因型相同)。但是双胞胎在多数情况下是一起生活的,他们可能会对彼此的习惯产生影响,进而使习惯趋同。



那么在Fisher看来第二张表格(图10下表)的数据就很好地反驳了这一点——这张表格是出生后被分开和未被分开的同卵双胞胎吸烟习惯是否相似的对子数。数据表明,吸烟习惯不能归因于双胞胎在出生后是否分开,也就是说,吸烟的习惯不是互相影响所致。这在一定程度上说明基因型是影响吸烟习惯的一个因素,也为Fisher的“共同原因”假说提供了重要的依据。



学界的反驳



然而,就如本文标题所说,这些都是Fisher的经不住推敲和历史考验的诡辩。随着时间推移,新的研究结果和推论逐一推翻了Fisher的“谬论”。



1 “共同基因所致虚假因果关系”假说的后续进展



“共同原因”假说在当时是一个合理的假说,很难被直接证伪。但是随着统计学和动物实验等对吸烟肺癌关系研究的不断进展,共同基因假说不断遇到困难,需要修改。共同基因假说被不断修正,到了一个不再令人信服的临界点,于是大家更愿意相信吸烟和肺癌的因果关系。



实验方面表明,烟草焦油对实验动物有致癌性,烟草烟雾破坏支气管的微观结构——纤毛,从烟焦油和烟雾中已分离出30余种致癌物质。这些证据都正面支持了吸烟和肺癌的因果关系,反面增加了共同基因假说的疑点。



统计学方面发现,过去几十年间肺癌癌症死亡率持续上升,烟管和雪茄烟草对口腔和喉部癌症的影响很大、但对肺癌没有影响,戒烟人群肺癌死亡率较低。这些发现也很难在共同基因假说下被解释清楚。



所以,fisher的假说是合理的假说,但是有错误的地方,就是认为有这个共同基因,认为这个基因有那么大的作用,cornfield不等式就是反对该假说最有力和最普遍有用的论据之一。



2 新的统计方法的提出



Fisher在1959年出版的《吸烟与癌症(Smoking and Cancer)》著作中,指出了Doll和Hill的研究的方法学上的缺陷,认为选择偏倚、混杂因素、信息偏倚不可忽略。Doll和Hill的研究数据提示,抽烟时过肺相比于不过肺会降低10%的患肺癌的风险,这是违背常理的,提示结果存在偏倚。



Doll和Hill对此亦有解释:研究对象可能没有正确理解这个问题。于是他们在之后的更大规模的队列研究中删掉了这个问题。Fisher所发现的吸烟过肺与肺癌风险的负相关也被后人解释为一种由偶然性所导致的统计分析所要承担的假阳性风险。



后世提出来的新理论新方法,如Cornfield 不等式、Rubin因果模型、Hill因果推断准则、Pearl的结构方程模型等,都试图从观察性研究中进行因果关系的推断[11]。



(1)Cornfield 不等式:Jerome Cornfield 通过简单的数学证明,得到了如下的不等式,文献中也称为 Cornfield 不等式:RREU≥RRED.[12]。直观解释就是,若“共同基因”假说成立,则“吸烟者有某个基因 U存在”的概率是 “不吸烟者有某个基因 U存在”的概率的 9 倍多;换句话说,如果共同基因假说成立,那么这个假定的基因导致吸烟者中的肺癌患病率必须至少是非吸烟者的十倍,才能解释吸烟与肺癌之间的关联。根据 Cornfield 进一步的逻辑,由于吸烟更多的是一个社会性的行为,很难想象吸烟的行为能够对于某个基因的存在与否有着 9 倍的预测能力。Cornfield不等式由此反驳了Fisher的“共同基因”假说,指出这个假定的基因有那么大的作用是不合理的。



(2)Rubin因果模型:潜在结果框架是一种用来描述和推断因果关系最成熟、应用最广泛的的统计方法之一,也被称为Rubin因果模型。潜在结果框架的基本思想是,对于每个个体,存在多个潜在结果,分别对应于不同的潜在干预状态。然而,只有一个潜在结果是可以观测到的,即实际发生的干预状态下的结果,其他的潜在结果是无法观测到的,即反事实(counterfactual)结果。因此,要估计干预的因果效应,就需要估计反事实结果 [13]。通过对潜在结果框架的三个基本构成要件——潜在结果、稳定性假设和分配机制——进行分析,我们可以得到因果效应的结果和因果效应参数。



潜在结果模型通过关注分配机制等,在有限的条件下使观察性研究贴近试验性研究,也是判断因果关系的重要标准,是因果理论体系中的重要构成部分。



(3)Hill因果推断准则:1962年多尔(Doll)和希尔(Hill)提出用流行病研究结果判断病因的5条标准,1965年又将此标准增加为9条,由时间顺序、关联强度、剂量反应关系、结果的一致性、实验证据、合理性、生物学一致性、特异性、相似性[14]组成。Hill的因果判据所列条例是系统地判断因果关系的证据,常用于医学中的因果推断。



以上9个标准中,关联强度、剂量反应关系以及时间顺序是判断因果关系的必要条件和特异条件。必要的意思是它们必须存在,如果不存在,就可以否定因果关系的存在;特异的意思是这三个条件是确立因果关系特有的条件。而其他6项条件是有关研究之间的信息或流行病学研究之外的知识,是非特异的条件,是科学推论中使用的一般性标准,其中结果的一致性最为重要。它们又是非必要的条件,即缺乏任何一项或所有6项,都不能足以否定因果关系的存在。另外,所有9项条件都不是充分条件,即使两个事件的关系满足了所有9项条件,也不能百分百肯定它是因果关系。



20世纪末,循证医学出现,在证据评估的问题上选择了系统综述(systematic review) 和meta分析(meta-analysis) 提供的思路和方法。系统综述可以說是对Hill准则的科学的、系统的、定量的应用和发展,并明确提出对原始研究质量进行严格的评估。



3 “同卵双胞胎佐证共同原因假说”的否定



Fisher所举例子可见,同卵双胞胎的吸烟习惯一致性高于异卵双胞胎,且同卵双胞胎是否分开生活,其吸烟习惯无差异,佐证有影响吸烟习惯的基因存在。如果这些基因的变异和肺癌风险相关,那么这些基因的存在可能造成吸烟和肺癌的虚假关系。



以子之矛,陷子之盾,何如?首先,他引用的双胞胎研究,数量有限,结果的可靠性不足;研究没有考虑到其他可能影响吸烟习惯的众多因素,例如:社会经济地位、教育水平、文化背景等;如果Fisher所谓的吸烟习惯驱动基因与肺癌之间存在因果关系,那么同卵双胞胎中,吸烟者应该比非吸烟者有更高的肺癌风险,这一点并没有得到证实。可见,Fisher用以反驳的论据也“漏洞百出”。



总结



综上所述,Fisher的三个论据在后续研究的完善下,都不能有效地反驳吸烟与肺癌之间的因果关系。Fisher的质疑,虽然在当时引起了一些争议,但也促进了对吸烟与肺癌关系的更深入的探索。在Fisher之后,还有许多其他学者使用了不同的研究设计和统计分析方法,对Doll和Hill的研究进行了进一步的检验和评价,都在不同程度上支持了Doll和Hill的结论,即——吸烟是肺癌的主要危险因素。今天,吸烟与肺癌之间的因果关系已被广泛地认可。Fisher的思辨精神在一定程度上亦值得我们学习。



贡献:北京大学公共卫生学院预防医学专业本科生曹颖、胡珀宁、黄哲、李赛卓、宁越、唐诗隽参与写作;北京大学公共卫生学院流行病与卫生统计学博士研究生杜敏(助教)、 南京中医药大学魏良敏参与修改;北京大学公共卫生学院预防医学专业本科生刘雨田负责推送排版;文心一言在引导下提供了部分文字素材;写作指导、文字修改和审阅:北京大学魏永越老师。欢迎提供修改意见、联系转载。



参考文献:(上下滑动浏览)

[9] 英国医学杂志。吸烟与肺癌[J].英国医学杂志, 1957, 2:43, 297-298.

[10] 费舍尔RA.吸烟:癌症争议:一些评估证据的尝试 [M].爱丁堡和伦敦:奥利弗和博伊德,1959年。

[11]耿直. 观察性研究与混杂因素[J]. 统计与信息论坛,2004,19(5):13-17,封三. DOI:10.3969/j.issn.1007-3116.2004.05.003.

[12] Cornfield J、Haenszel W、Hammond EC 等。吸烟与肺癌:最近的证据和对一些问题的讨论。1959.[J].国际流行病学杂志:国际流行病学协会官方杂志,2009,38(5):1175-1191. DOI:10.1093/ije/dyp289.

[13] 唐纳德·鲁宾[J].Journal of the American Statistical Association.1986,81(396).961-962.DOI:10.1080/01621459.1986.10478355 .

[14] 希尔,奥斯汀布拉德福德。环境与疾病:关联还是因果关系?英国皇家医学会杂志,2015,108(1):32-37.DOI:10.1177/0141076814562718.




继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存