天才的诡辩——否认吸烟致癌的统计学大师
编者按:
2023年秋学期,在北京大学预防医学专业本科《卫生统计学》课程中,给同学们布置了围绕“相关-关联-因果”进行讨论的课后作业,几位同学的“小作文”让我眼前一亮,遂请助教协助组织联合写作,形成了“天才的诡辩——否认吸烟致癌的统计学大师”一文。从统计学天才Fisher的逸事中深入了解“因果推断”,知识中不乏趣味,有点儿意思。因篇幅较长,遂分为4个推送与各位看官共享。
天才的诡辩——否认吸烟致癌的统计学大师
I. 吸烟与肺癌的关联性研究背景
II. 统计大牛R. A. Fisher简介
III. 天才的诡辩和学界的反驳
IV. 深层思考——因果推断
I. 吸烟与肺癌的关联性研究背景
吸烟?肺癌?两者间的恩怨
吸烟会导致肺癌,这在今天看来已是不争的事实。各式各样严谨详实的研究已经从各个方面论证了吸烟可导致肺癌的观点。然而,在二十世纪中叶及之前,吸烟与肺癌的关系还蒙着神秘的面纱(图1)。接下来就请各位读者跟我们一起见证,在这场旷日持久的论战中,人们如何在探究与争锋中揭开这层面纱。尤其是天才统计学家Ronald Aylmer Fisher (R. A. Fisher) 作为反对吸烟致癌的一方,又是如何精彩诡辩的。
图1 上世纪的中外香烟广告
(图片源自互联网)
二十世纪中叶,英国的死亡登记系统显示,尽管大部分癌症的患者数明显减少,但死于肺癌的人数正逐年显著增加;越来越多国家的统计数据为这一趋势提供了有力佐证。有人猜测可能是人口老龄化、诊断水平提高等所致,但以上原因无法解释为什么偏偏只有肺癌的死亡率在显著上升[1]。部分科学家提出两种合理猜测:(1)空气污染加剧;(2)烟草消耗增加[2]。由于在该时间段观察到了烟草消耗与肺癌死亡率的同步上升(图2),研究者们开始重点关注吸烟与肺癌之间的关系,并开展了一系列的调查研究。
图2 肺癌死亡率和烟草消费量变化趋
(图片源自Our World in Data)
在众多的研究者中,其成果最具影响力的,是由英国的著名医生Richard Doll 和著名统计学家Austin Bradford Hill 结成的二人组(图3)。
图3 Richard Doll(左)和Austin Bradford Hill(右)
(图片源自互联网)
Doll出生于1912年10月28日,他的流行病学生涯始于战后服役,因研究消化性溃疡的病因引起了Hill的注意。当时,许多人认为两次世界大战之间癌症死亡人数的显著上升只是由于更先进的诊断方法所致。但是,1948年,Percy Stocks和Ernest Kenneway成功说服了医学研究委员会(MRC)调查这一问题[3]。
为此,MRC求助于Hill,随后Hill招募了Doll作为团队的统计学家,两人一起获得了大量患有和不患有肺癌者的详细吸烟史。1950年,他们报告了这一发现。
与对照组(未患有肺癌者)相比,肺癌患者(病例组)中吸烟者占比显著高于未患有肺癌者(对照组),重度吸烟者的占比亦相对较高,这使他们“有理由”怀疑吸烟是导致肺癌的“一个原因,也是一个重要原因”。这一设计方法被称为病例对照设计。
扩展知识点:病例对照研究,是通过比较患某病者与未患该病的对照者暴露于某可能危险因素的百分比差异,来分析这些因素是否与该病存在联系的研究方法。是一种回顾性研究。[4]
事实上,二人调查了非常多的肺癌潜在相关因素,如性别、城乡居住地、家庭供暖方式、吸烟类型(卷烟还是烟叶),等。在他们所开展的大大小小若干项病例对照研究中,比较典型的有如下几项:
(1)通过观察649例男性和60例女性肺癌患者以及相同数量和性别比的非肺癌患者的吸烟习惯,并仔细地排除了其他可能的影响因素后,可以认为肺癌患者中吸烟的比例更高,且重度吸烟者比例也更高(图4);
(2)被误诊为肺癌患者的群体中,吸烟习惯与非肺癌患者群体基本相同,说明观测者的主观成见并没有影响调查结果的客观性[2];
(3)通过调查1357例男性和108例女性肺癌患者,并各设置同等数量的对照组病人(不患肺癌),发现在确诊前10年,肺癌病人不仅吸烟人数比对照组多,且多数肺癌病人平均每日吸烟量比对照组病人大。
图4 Doll和Hill的病例对照研究结果
汇总多项结果得出:吸烟者患肺癌的“风险”远高于不抽烟者[5](图5,发表于The BMJ的研究论文)。
图5 Doll和Hill的病例对照研究论文首页
Doll和Hill二人对吸烟与肺癌的关系研究不止于此。Doll和Hill创新性地在非传染病领域进行队列研究。从1951年起,二人向英国的医生发放问卷希望得知他们的吸烟情况,共回收了四万余张有效问卷。之后他们对这些医生进行了长达二十年的追踪观察。队列研究得出的结论与病例对照研究不谋而合,都说明吸烟者肺癌发病率更高。提示:戒烟,再晚也不算晚,戒得越早健康获益越大(图6)[6]。
戒烟时间
图6 戒烟早晚与肺癌死亡率的关系
扩展知识点:队列研究,是将某一特定人群按是否暴露于某可疑因素或暴露程度分为不同组,追踪观察两组或多组成员结局(如疾病)发生的情况,比较各组之间结局发生率的差异,从而判定这些因素与该结局之间有无因果关联及关联程度的一种研究方法。是一种前瞻性研究。[7]
当然,美国烟草公司等利益相关方随即声称“不相信吸烟有害健康”。社会上也有很多对于这些研究的质疑和批判,他们批评病例对照研究这一回顾性设计上的局限性,质疑队列研究可能受到某些潜在因素的影响而导致误导性的结果[8]。这其中最有代表性的就是统计学大师R. A. Fisher。
贡献:北京大学公共卫生学院预防医学专业本科生曹颖、胡珀宁、黄哲、李赛卓、宁越、唐诗隽参与写作;北京大学公共卫生学院流行病与卫生统计学博士研究生杜敏(助教)、 南京中医药大学魏良敏参与修改;北京大学公共卫生学院预防医学专业本科生刘雨田负责推送排版;文心一言在引导下提供了部分文字素材;写作指导、文字修改和审阅:北京大学魏永越老师。欢迎提供修改意见、联系转载。
参考文献:(上下滑动可浏览)
[1] 姜垣, 李强, 刘瑞玲. 吸烟导致肺癌证据确凿 [J]. 抗癌之窗, 2008, (2): 28-29.
[2] Doll R, Hill AB. 吸烟与肺癌的初步报告[J].《世界卫生组织简报》, 1999, 77(1):84-93.
[3] 金伦·理查德·多尔 (1912–2005) [J].自然, 2005, 438:41.
[4] 百度百科. 病例对照研究[EB/OL].
https://baike.baidu.com/item/%E7%97%85%E4%BE%8B%E5%AF%B9%E7%85%A7%E7%A0%94%E7%A9%B6/6540786#reference-1
[5] 钱宇平, 詹思延. 流行病学研究实例 [M]. 北京: 人民卫生出版社, 1984.
[6] 娃娃 R,希尔 BA。医生死亡率与吸烟习惯的关系初步研究[J].英国医学杂志:2004, 328(7455):1529-1533.
[7] 百度百科. 队列研究[EB/OL]. https://baike.baidu.com/item/%E9%98%9F%E5%88%97%E7%A0%94%E7%A9%B6?fromModule=lemma_search-box#reference-1
吸烟与肺癌的研究:慢性病流行病学史上的里程碑[J].耶鲁生物学与医学杂志, 1990, 63(1):29-46.