唐金陵:病因、病因模型与因果关系推断(四)
目录
第一节 病因的基本概念
第二节 病因学说与病因模型
第三节 充分病因组分病因模型
第四节 发现和验证病因
一、发现病因的法则与方法
二、穆勒的因果关系推论法则
三、穆勒法则与流行病学研究设计
第五节 因果关系推论
第四节 发现和验证病因
一、发现病因的法则与方法
病因模型仅仅指出了病因存在的范围以及病因之间和病因与疾病之间的关系,但并不能用来作为现实中发现病因的方法。因果关系是一个抽象的概念,一个不可直接观察的现象,只能通过对其特征的观察而进行推论。时间顺序、关联关系和因变性是因果关系的三个必要特征,因此也是寻找因果关系的理论基础。在如何观察因果关系三个条件存在与否的问题上,1843年英国哲学家约翰˙穆勒(John Stuart Mill)提出了研究因果关系的5个逻辑归纳法则(简称穆勒法则,Mill’s Canons),它们分别是求同法、求异法、同异共用法、剩余法和共变法,这些法则是依据因果关系的基本特征提出的,为现实中发现和验证因果关系提供了可依的法则(表4)。所谓发现因果关系,就是依据穆勒法则,设计研究方案,并依此收集有关因果关系三个条件存在的证据,最后对证据进行评估,推论因果关系存在的可能性(图9)。
表4 穆勒法则与其对应的流行病学研究设计理念
穆勒法则 | 对应的研究设计理念 |
求同法 | 病例系列:病人共有的因素 |
求异法 | 病例-对照的概念:病人有、非病人缺的因素 |
同异共求法 | 病例对照研究,队列研究 |
共变法 | 剂量反应关系 |
剩余法 | 个案发生原因推测,主要病因推测 |
因果关系的三个条件是寻找病因的理论基础,穆勒法则是现实中寻找病因的可操作的逻辑法则。从设计上讲,探索因果关系的流行病学研究就是依据穆勒法则在人群中收集有关因果关系三个基本条件证据的方法(表4)。下面我们将展开讨论穆勒法则及其与流行病学研究设计的关系。另外,还须强调,所谓“发现”病因,是指如何寻找未知的病因(如吸烟是否引起肺癌),而不是根据已知的病因推断某已经发生的事件的具体原因(如该病人肺癌是否由吸烟引起的)。
图9 研究病因的理论、法则与方法
二、穆勒的因果关系推论法则
(一)求同法
求同法(method of agreement)认为,考察某现象出现的不同场合,如果各个不同场合除一个条件相同外,其他条件都不同,那么,这个相同的条件可能就是某研究现象的原因。
在病因研究中,如果所有患同一疾病的病人都具有某一共同的因素,而且其他因素并非每个病人都有,该因素可能是该疾病的病因。例如,发现所有腹泻的学生当天中午都在同一食堂吃过酸奶,因此酸奶可能是腹泻的病因。
但是,该法则中“其他因素都不同”的假设在现实中很难成立,患同一疾病的病人共有的因素会很多,它们绝大多数不是某疾病的病因。比如,腹泻的学生当天在同一食堂都吃过另外3种食品,等等,该法则并不能肯定酸奶是学生腹泻的原因。因此,不能就依此一项法则确定因果关系的存在。
(二)求异法
求异法(method of difference)认为,比较某现象出现的场合和不出现的场合,如果这两个场合除一点不同外,其他情况都相同,那么这个不同点就是这个现象的原因。
在病因研究中,如果未患某病的个体与患有某病的个体相比,除了某一因素以外,其他因素均相同,那么这个因素可能是该病的病因。求同法关注的是患某病的人是否都具某共同特征,求异法则是通过比较患者和非患者在某特征上的差异。比如两个同学一同就餐,一个同学发生腹泻,另一个没有,两个同学那餐饭吃的唯一不同食物是酸奶,那么酸奶可能是导致腹泻的原因。
同样,求异法中病人和非病人之间“其他因素都相同”的假设现实中也很难成立。比如,两个同学在很多其他方面可能都不一样,求异法不能排除这些因素而肯定酸奶是这次腹泻的原因。更重要的是,该法则没要求这个差异是可重复的,因此也不能就依此一项法则确定因果关系的存在。
(三)同异共求法
同异共求法(joint methods of agreement and difference)(或简称共求法)认为,如果某被考察的现象出现的各种场合只有一个共同的因素(求同),而这个被考察的现象不出现的各个场合都没有这个共同的因素(求同),那么,这个共同的因素(多次求异)就是被考察现象的原因。
在病因研究中,当患病个体中均具有而且只具有一个共同因素,非患病个体中均没有该因素,即患病组和非患病组相比,唯一区别就是该因素,那么该因素有可能是该病病因。例如,发现腹泻的学生都吃过酸奶,而在同一食堂就餐但没发生腹泻的学生都没有吃酸奶,酸奶可能是腹泻的病因。
共求法不是求同法和求异法简单的联合使用,它是围绕同一个可疑因素的两次求同和多次求异的联合使用。共求法是在同一个研究中引入对照的逻辑基础,大大提高了求同法或求异法初步锁定的原因的可能性。
(四)共变法
共变法(method of concomitant variations)认为,当某一现象存在一种变异或发生一种变化时,另一现象相应存在变异或随之发生变化,且不论后者的变异和变化是什么,那么二者间可能存在因果关系。
最简单的变化是从无到有或从有到无,这是共求法里已经解决的问题。因此,共变法强调的是对剂量-反应关系的考量,当剂量-反应关系存在时,因果关系存在的可能性更大。
上述例子中如果吃酸奶多比吃酸奶少的学生腹泻更严重或者发病率更高,说明共变关系的存在,因果关系存在的可能性更大。
(五)剩余法
剩余法(method of residue)认为,如果某一复合现象已确定是由某种复合原因引起的,把其中已确认有因果联系的部分减去,那么,剩余部分也必有因果联系。例如,居里夫人及其丈夫为了研究一批沥青铀矿样品中是否含有值得提炼的铀,对其含铀量进行了测定,并发现有几块样品的放射性甚至比纯铀的还要大。利用剩余法推测,在这些沥青铀矿中一定存在别的放射性元素,而且这些未知的放射性元素含量非常低,用普通的化学分析法测不出来。量低且放射性强,说明该元素的放射性远远高于铀。据此推理,又经过多年的努力,他们终于在这些沥青铀矿样品里发现了放射性比铀强400倍的钋。
在病因研究中,剩余法很少可用作直接发现病因的逻辑指导,但对于判断是否已经发现了一个疾病的主要病因却有帮助。如果发现一个疾病的多个已知病因的累积归因百分比很低(如低于10%),说明不能由这些已知病因解释的“剩余”病例占大多数,由此可推测该疾病的重要病因还没有被发现,探索新病因的研究是有意义的。相反,如果发现一个疾病的多个已知病因的累积归因百分比接近100%,说明不能由这些病因解释的“剩余”病例已经很少,由此可推测已发现的病因是该疾病的主要病因,如果它们又都是容易干预的因素,探索新病因的研究的意义已经不太大了。
剩余法也可以用于推测个案事件发生的原因。例如,如果心血管病发生原因主要是高血压、高血脂和糖尿病,如果一个人已经发生了冠心病,但他既没有高血脂也没有糖尿病,那么该病人很可能有高血压。
三、穆勒法则与流行病学研究设计
求同法是病例系列的原理,求异法引入了对照的概念,但二者结论的可靠性较低,主要可以用来产生假设。共求法奠定了病例对照研究、队列研究和随机对照试验的理论基础,是进一步验证假设的准则。
但是,鉴于穆勒法则提出的年代以及当时人类对因果关系的认识,原始的求同法、求异法和共求法可能只适用于研究完全病因(或既必要又充分的病因),如天花。天花病人一定感染过天花病毒,从未得过天花就一定没有感染过天花病毒,因为其他病原体不会引起天花,天花也没有隐性感染。
然而,根据现代医学对疾病病因的认识,尤其是对于慢性非传染性疾病,几乎所有的病因都是既不必要也不充分的组分病因,而且一种疾病又存在多种充分病因,因此穆勒原始的求同法、求异法和共求法中最基本的假设是不成立的,不能用来有效地确证或否定一个因素是否为某疾病的原因。因为不是必要病因,当某个病因不存在时,由于其他充分病因的存在,疾病还是可能发生,这时,“如果所有同一疾病的病人都具有某一因素”的假设将不会成立,比如很多心肌梗死的患者没有高血压。因为不是充分病因,一个病因的存在只增加发病的危险,并不一定引起疾病的发生,这时,“如果所有未患某疾病的病人都没有某因素”的假设也不会成立,比如很多感染过结核杆菌者不会发生结核病。
由此可见,穆勒的求同法、求异法和共求法只适用于研究充分且必要的原因或极强的因果关系,不能直接用来研究慢性非传染性疾病的病因。必须进行以下修订,才能具有更大的现实意义:如果很多同一疾病的病人都具有某一因素,多数未患某疾病的人都没有该因素,而且该因素的发生频率在患病者和非患者之间病者存在差异,该因素很可能是该病的病因。这个修正的核心是将“所有”改成了“很多”或“多数”,穆勒法则因此就从决定论走向了概率论,病因和疾病的关系也就从必然变成了或然。
穆勒的这三个法则是逻辑上的推理,没有明确界定事件之间的时间关系,似乎观察完全可以从结果开始。由于疾病(或结果)已经发生,仅仅比较病例和对照的暴露比,是快捷省事的方法。然而,依此法则的研究只能建立疾病和可疑病因之间的关联关系,若没有因在先果在后的时间先后顺序,没有果随因变化而变化的特征,关联关系将不成为因果关系。这是穆勒法则没有明显指出的地方。
为了确证因果关系的存在,在利用穆勒法则研究因果关系时,必须明确两个事件在时间方向上的关系。队列研究设计正是切中并解决了穆勒法则里时间和方向不明的问题。队列研究从因开始,在果没有发生的情况下,观察果随后的发生情况,然后看果是否随因的不同而不同。因此,队列研究观察的关联关系具备了因先果后的时间顺序关系,提供了因果关系中时间顺序证据,发现的病因就更可能是真实的。
然而,即使是队列研究发现的关联关系,还不能排除另外一种可能,即观察到的果随着因发生的变化不是由于因引起的,而是由其他因素造成的。一个最明显的可能就是混杂,即暴露组和非暴露组发病率的区别不是由于可疑病因引起的,而是由于两组之间其他致病因素的不可比造成的。解决的办法就是控制混杂,但是观察性的队列研究对混杂的控制程度是有限的,而且当混杂因素未知时无法进行。暴露组和非暴露组发病率区别的另一个解释是偏倚,包括选择偏倚和信息偏倚,是所有流行病学研究都可能存在的。
随机对照试验与队列研究最重要的区别是比较组形成方式的不同。在队列研究里,研究只能观察自然形成的暴露人群和非暴露人群,自然形成的比较组不能保证它们之间其他可能影响结果的因素是可比的。随机对照试验利用随机分组的方法,保证了比较组之间的可比性,彻底排除了混杂,发现的因果关系的可靠性高于队列研究。因此,随机对照试验是在人群中验证因果关系最可靠的方法。
但是,由于伦理上的考虑,我们只能人为地向人群施加有益的因素(如治疗或去除一个致病因素的干预),不能施加有害的因素(如致病因素),因此随机对照试验只能用来评估治疗和干预的效果,不能用来直接研究疾病的病因。队列研究是在人群中验证病因的最可靠的方法,也常被用于研究治疗的不良反应。
以上分析可见,穆勒法则是流行病学研究设计的逻辑基础,也提示了不同研究设计的使用顺序,求同法(如由此衍生的病例系列研究)可用于形成病因假设。共求法和共变法(如由其衍生的病例对照研究)可以用来初步验证病因的存在。对照来自求异法,也是共求法和共变法必然包含的一个概念,是研究因果关系不可缺少的准则。队列研究和随机对照试验有机融合了穆勒的四个法则,并同时考证了因和果的时间顺序和因变性,是在人群验证因果关系最可靠的方法。
总之,推论因果关系三个条件存在与否的穆勒法则就是寻找病因的逻辑法则,收集这三个条件存在的证据的方法就是寻找病因的研究,依据研究结果判断这三个条件存在与否的程序就是病因推论的过程(图9)。流行病学研究就是按照穆勒法则的原理,在人群中收集病因三个条件的证据,并以此推论医学中因果关系的存在(表4)。
原文出处:唐金陵. 第八章: 病因及其发现和推断. 见: 詹思延. 流行病学. 第八版. 北京: 人民卫生出版社, 2017.
编辑:冯琦、傅晓红、黄蔚然
长按上方二维码关注我们