查看原文
其他

NEJM:随对照试验的真实魔力与真实世界证据的虚构神话

唐金陵 临床研究与循证医学 2022-03-25
2020年2月13日,新英格兰医学杂志(The New England Journal of Medicine)刊登英国牛津大学Rory Collins爵士和Richard Peto爵士联名发表的长篇评述文章:随机对照试验的真实魔力与真实世界证据的‍‍‍‍虚构神话。


Rory Collins爵士是牛津大学群体健康系主任,英国皇家科学院院士,牛津大学内科学与流行病学教授,UK Biobank 的PI和首席执行官,世界著名心血管病流行病学家。Richard Peto,爵士,英国皇家科学院院士,牛津大学群体健康系统计学与流行病学教授,世界著名学者Doll爵士和Hill爵士的高足。90年初我曾在该系工作和学习。‍‍‍‍
该文章指出,把基于大型电子病历数据库的非随机分组的观察性分析(以下简称非随机分组的大型观察性研究或大型观察性研究),作为新的和现有治疗方法的有效性和安全性的“真实世界证据”来源,正在被推崇为随机对照试验的替代方案。对于临床已经广泛使用的药物和器械,此类观察性研究会有大量治疗过的病人可用,有潜力发现罕见的不良反应,且出错的可能性比较小,因为这些罕见不良反应的相对危险度一般会很高,不易完全被偏倚掩盖或扭曲。非随机分组的观察性研究也可以发现那些比较明显的在最初没有想到的结局上的治疗好处。

但是,由于大量固有的潜在偏倚,在治疗无效或只有中等效果时(如当相对危险度≤2.0时),大型观察性研究往往是不可信的。这时,大型观察性研究或者会错误地报告有统计学显著意义的但并非真实因果关系的结果,或者会错误地漏掉具有足够临床价值的效果。要证明一项治疗无效或只有中等效果,必须依靠有足够样本量的随机对照试验,才能保证结果的科学性和可信性。

 

仅仅依靠观察性研究,存在安全性和有效性评估不足的风险。例如,被评估的治疗方法或多或少会都会被给予预后风险偏高或偏低的患者。这在临床上是合理的,因为疾病严重程度和其他伴随状况正好都是影响治疗选择的重要决定因素。即使可以控制所有已知的混杂因素,一个没有差异的发现或是一个具有统计学显著性差异的结果可能完全还是残余混杂的结果,因为目前还没有任何一种统计学调整方法可以肯定地排除观察性研究中的所有混杂。实证研究也发现,同一治疗的观察性研究和随机对照试验的结果经常不一致,进一步证明了观察性研究的不可靠。

 

例如,丹麦一项人群大数据现实世界观察性研究发现,他汀治疗可增加癌症风险15%,且调整了所有已知的混杂因素,而另一些观察性研究则发现该药可以降低癌症的风险。然而,总结了多个随机对照试验(共逾万人)的结果Meta分析确定,服用他汀药与癌症发病和死亡风险都没有关系。也有相反的情况:大量随机对照试验确定,他汀药可以降低心血管病死亡风险,但是丹麦这项观察性研究却错误地认为该药可增加心血管死亡风险。

 

随机对照试验的主要“魔力”在于它可以平衡研究组间可影响结局的各种混杂因素,确保治疗组和无治疗组在结局上的差异是治疗效果的无偏估计。对于主观性结局,如疼痛或心情,还可进而采用盲法避免偏倚,这在利用临床数据库的观察性研究中是不可能的。另外,随机对照试验对依从性和随访的严格要求,使用维持原随机分组的数据分析方法,是进一步减少偏倚的措施。这些偏倚控制措施是随机对照试验特有的、观察性研究做不到的,因此是随机对照试验科学性高于观察性研究的原因所在。

 

作者还认为观察性研究的外推性高于随机对照试验的论点也是值得商榷的,因为外推性建立在相对治疗效果的生物学普遍性之上,而不是病人谱的宽度之上,更不用说观察性研究不具备良好的外推性所必要的内部真实性。

 

作者也指出,人们对非随机分组的观察性研究的兴趣,部分源于使用随机对照试验评估医学干预的费用和复杂性的不断增加。在过去25年中,管理临床试验的规则和相关机构的数量大幅增加,目的是为了提高试验参与者的安全性和结果的可靠性,初衷是好的,但也导致了临床试验沉重的“官僚负担”。然而,对管理规则的重视,而不是对科学规则的重视,未必提高了临床试验的质量和病人安全,但确实增加了研究的复杂性和困难,使得成本大大增加。

 

文章最后指出,用不可靠的大数据观察性研究替代可靠的随机对照试验,是应对官僚负担、复杂性、费用攀升等问题的错误解决方案。与之相反,作者认为我们必须坚持随机对照试验的原则,并对如何利用电子病历等新技术来提高随机对照试验的效率和质量,提出了几点建议:

 

◾制订新指南:基于科学原则,重点关注可能对结果可靠性产生重大影响的原则,如随机分组、分组隐匿、盲法、提高依从性、提高随访率,以及维持原随机分组分析;通过与试验监管者、研究者、患者和资助者的合作,制订适用于多种不同类型试验的新准则。


◾加速病人招募:通过电子病例和专病队列,加速患者征募;减少纳入和排除标准的过度限制,一来招募病人更容易,二来也可增加结果外推的病人谱宽。


◾提高数据质量:通过互动式电子病例报告系统,确保数据收集的完整性和一致性,提高对治疗方案和安全程序的依从性;通过实时检测和分析本地病人的数据,提高患者安全性和研究效率。


◾提高随访效率:通过链接电子病历系统,减少失访,促进结局的长期随访;利用新技术(如智能手机和数字传感器),扩大治疗安全性和有效性结局的评价范围。

 

总之,在评估医学干预措施效果的问题上,大数据现实世界研究不能替代随机对照试验。现实世界大数据可用以提高随机对照试验的效率和质量,更可在研究医学干预措施副作用、药物在非预期结局上的益处、老药新用等方面发挥独到的作用,是这类研究的真实优势所在。

 

文献出处:Collins R, Bowman L, Landray M,et al. The Magic of Randomization versus the Myth of Real-World Evidence[J]. NEngl J Med, 2020, 382(7):674-678. DOI: 10.1056/NEJMsb1901642. PMID: 32053307.

扩展阅读:‍

再论观察与实验: 大数据现实世界研究不能取代随机对照试验


编译:唐金陵,广州市妇女儿童医疗中心临床研究总监、《英国医学杂志》高级临床研究编辑、香港中文大学流行病学荣休教授


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存