随机对照临床试验(1/5): 概述

Original 唐金陵江宇临床研究与循证医学 2022-03-25

收录于话题

随机对照试验是测试医学干预措施效果最严谨、最可靠的科学方法。这是几百年来医学积攒的智慧，是科学逻辑和方法在医学实践中的应用，是医学实践之所以能站到科学肩膀之上的理由。随机对照试验的研究证据已渗透到了临床实践的所有角落。否定对随机对照试验的信念，一个人就站到了现代科学医学的对立面，他将失去思考和行动的罗盘，他的信念将会与现代医学格格不入。

目录第一节概述一、定义二、发展简史三、研究实例四、基本框架五、常见名词和概念第二节随机对照试验设计的原理第三节随机对照试验的立题第四节追踪随访和资料收集第五节统计分析和疗效估计第六节样本量的大小和估计第七节随机对照试验设计的变异第八节随机对照试验中的质量控制第九节随机对照试验中的伦理问题第十节随机对照试验与实验研究

随机对照试验是最严谨的流行病学研究设计，是测试医学干预效果的金标准。本文介绍了随机对照试验的起源、发展、定义、原理、方法及设计的变异，并比较了观察和实验研究的特征和区别。各种研究类型都可以用来测试疗效，只是适用的阶段不同。早期探索适合用简单快速的研究类型，进一步论证需要更严谨的研究，确认疗效需要随机对照试验。值得注意的是，预期的疗效越小，需要的设计就越严谨，需要的样本量也越大。疗效特别显著时，无对照的研究就足以确认其存在。大型随机对照试验只是用来确认微小疗效的存在，不可过于强调它的地位。

第一节. 概述

一、定义

随机对照试验（randomized controlled trial, RCT）是一种常用的流行病学研究设计，是在人群中进行的、前瞻性的、对医学干预措施效果的测试。它首先把研究对象随机分配到不同的比较组，每组施加不同的干预措施，然后通过适当时间的随访观察，比较组间重要临床结局发生频率的差别，以定量估计不同措施的作用或效果的差别。除对照和随机分组外，随机对照试验通常还会采用分组隐匿、安慰剂、盲法、提高依从性和随访率、使用维持原随机分组分析等控制偏倚的措施。随机对照试验是目前在人群中最后验证医学干预措施效果存在与否及其大小的最严谨、最可靠的科学方法。

病因和疾病的关系，以及治疗和转归的关系，都属于哲学上的因果关系。在研究因果关系的问题上，病例对照研究和队列研究只能观察自然或研究对象自己选择形成的暴露对健康的影响，暴露与否，以及暴露的多少，研究者不可干预。其结果是，由于暴露的背景因素不同而形成的比较组之间不存在必然的可比性，组间不可比造成的混杂是观察性研究的天然缺陷。

与前述两种研究相比，随机对照试验的最大特点是，研究者用特定的方式，即随机的方式，将研究对象分成两组或多组，随机分组形成的比较组之间的背景因素可达到均衡分布，彼此几乎完全可比，完美解决了队列研究和病例对照研究中的混杂问题。在流行病学研究设计的科学性上，随机对照试验是队列研究之上的一次跳跃性提高。随机对照试验是最严谨的流行病学研究设计类型，是评估医学干预效果最严谨的研究类型。

虽然在研究因果关系方面，随机对照试验高于队列研究，但是由于伦理的限制，随机对照试验不能用来研究疾病的危险因素，也就是说，研究者不能按照自己的意愿，给研究对象施加对健康可能有害的因素，如可疑的危险因素。因此，随机对照试验只能用来检验对健康有益的因素或措施（如可能有益的治疗、预防措施）对人体的作用。

这些可以人为施加的对健康有益的因素和措施，就是医学用来改善人们健康的干预措施。评估医学干预措施效果的重要性显而易见，因为医学资源有限，很多干预措施都有一定的不良作用，使用无效的措施不但浪费资源，还会给病人带来不必要的伤害。评估医学措施的效果是医学研究的重要任务之一。

二、发展简史

医生对受治病人的观察，也许是人们验证干预措施效果最原始、最朴素、最简便的方法。然而，现代生物医学实验研究的两个主要特征是采用对照和对实验条件的严格控制，后者的目的是保证试验组和对照组间在整个研究过程中的可比性。比如，在动物实验中，可以采用同窝的动物作为对照，可以严格控制用药途径、剂量和时间，以及限制和统一动物的生活环境和条件，保证比较组间的可比性。然而，由于伦理等因素的限制，这些措施在人群研究中是不可行的。因此，验证治疗效果的科学方法的发展，主要集中在对照组必要性的认识和如何获得可比的对照组两个方面。

最早记载的对照研究可以追溯到十八世纪中叶。1747年，英国的Lind医生将12名坏血病患者分为六组，每组两人，分别给予不同的膳食治疗，发现橙汁和柠檬汁有利于坏血病病人的康复。虽然Lind已经意识到组间病人可比性的问题，并采取了配对的方式来减少组间病人转归因素的差异，但是他的分组方式本质上是人为安排的，分组因素可能与疾病的转归因素相关，因而组间病人转归的区别不能肯定地归因于治疗方法的差别。

1662年，Van Helmont医生怀疑当时盛行的放血疗法的临床价值，向同行提出了一个大胆的挑战，建议找几百个发热或胸膜炎的病人作为研究对象，为了公平比较，并建议用抽签的方式将病人分为两组，一组病人用非放血的方法治疗，另一组接受放血治疗，然后看哪组病人的转归更好。虽然他的挑战并没有付诸实践，但他提出的抽签分组以达到公平比较的思想，对研究方法的进步有着重要的启示。

抽签也曾用来解决临床研究中对病人公正的问题。有时研究所比较的治疗的益处相差很大，如比较一个可能很有效的药物与无作用的安慰剂。若让病人自己选择接受哪种治疗，显然不合适，可能很少人会选择安慰剂。若由研究者来决定，分到安慰剂组的病人会觉得对他们不公平，而退出研究。为了解决这个问题，研究者曾采用抽签的方式决定病人的分组，多数病人可能不会接受人为不公平的分配，但往往会接受“命运”的裁决。当然，也可以用掷骰子和抛硬币分组的方法，以达到公平分组的目的。

在这些为了“公平公正”的分组方式的背后，蕴藏着一个重要的科学原理：抽签分组可以达到比较组之间各种影响疾病转归因素的完全可比，使得比较组间任何转归上的差别可以真正归结于组间治疗的不同。直到20世纪中叶，科学家才从理论上论证了抽签分组对实现组间可比性的作用，从而奠定了20世纪医学研究最重要的科学研究方法－随机对照试验－的核心理论基础。1948年《英国医学杂志》刊登的“链霉素治疗肺结核的随机对照试验”是随机对照试验最早的范例之一，它确立了对照、随机分组、分组隐匿、盲法等随机对照试验的基本原则。

通过几百年的努力，二十世纪中叶，医学确立了评估和比较不同干预措施效果最可靠的方法，这就是随机对照试验。

三、实例

早期随机对照试验的范例是1948年英国医学研究总局进行的链霉素治疗肺结核的试验。其主要目的是确定链霉素治疗肺结核的效果。该试验对107例急性进展性双侧肺结核新发病例进行了研究。符合入选标准的病人，55人被随机分入治疗组，52人分入对照组。治疗组病人接受链霉素治疗和卧床休息，对照组只卧床休息。随机分组的方法是基于随机数字表产生随机分组序列，并通过密闭信封的应用，使得医生和病人无法预先得知随机分组的方案。信封上只有医院名称和一个编号。当病人符合入选标准的时候，随机分组中心将通过医生随机拿给病人一个信封，打开信封，信封中的卡片将决定病人分配到链霉素组或卧床休息组，这一信息将同时反馈到随机分组中心登记备案。试验开始前，链霉素组病人不知道将接受的是特殊的治疗，卧床休息组病例也不知道他们在住院期间将会是一个特殊研究的对照组病人，通常他们和链霉素组病例不住同一个病房。链霉素组病例每天接受一日四次每隔6小时一次共计2g的链霉素注射治疗，研究期间未发现由于毒副作用需要中止治疗的病例。

6个月后，结果发现，7%的链霉素组病例和27%的卧床组病例死亡。影像学显示51%的链霉素组病例和8%的卧床组病例病情有明显改善，18%的链霉素组病例和25%的卧床组病例略有改善。链霉素组病例临床症状的改善也比卧床组病例明显。8例链霉素组病例和2例卧床组病例结核杆菌试验结果呈阴性。

四、基本框架

图1和图2描述了随机对照试验的基本框架和每个研究阶段的工作目的、内容和方法。

图1 随机对照试验的基本设计框架

图2 随机对照试验不同阶段

的工作内容和各阶段控制误差的措施

五、常见名词和概念

（一）干预措施

狭义的医学干预措施（intervention）多指临床上的治疗措施。广义的干预措施系指一切可以人为施加的用来改善人们健康的措施和活动，可以是针对个人的，如治疗，也可以是针对一个人群的，如卫生政策。常用的医学干预措施包括：药物和非药物治疗（如外科手术）、卫生政策、预防策略、医学筛检、诊断检查、医疗卫生管理、健康教育、医疗卫生服务融资方式等。由于随机对照试验主要用来评估临床治疗的效果，尤其是药物治疗，因此在没有特别指明时，本文中的干预一般指药物治疗。为了便于阐述和讨论，本文有时会把干预措施简单地叫做干预、措施或治疗。

（二）干预组和对照组

最简单最常见的对照试验是有两个平行比较组的试验。本章将统一把接受被评估的干预的一组叫干预组（intervention group），给予对照干预（如安慰治疗、无干预或另一种干预）的一组叫对照组（control group）。

（三）结局与干预的作用

干预的作用（effect）一般指干预对结局（outcome）影响的能力，它包括有益作用和不良作用两个方面。当对照组干预为安慰剂或无治疗时，干预组和对照组之间在某临床结局上的差别反映干预作用的大小。一项治疗可能会影响多种结局，如降血压药会影响血压、眩晕、冠心病、脑卒中、死亡等临床结局，且对不同结局产生不同的作用，因此结局的选择是评估干预作用的关键之一。

（四）效力和效果

干预的效力（efficacy）是干预措施在理想条件下所能达到的治疗作用的大小，是干预措施的最大期望效果。所谓理想的条件，主要由诊断的准确性、病人的依从性、以及医生的技能等因素决定。尤其对药物性治疗来说，效力是一个药物自身的生物学特征。

干预的效果（effectiveness）是在实际医疗卫生条件下干预措施所能达到的治疗作用的大小。干预效果有时又称临床效果或临床疗效，或简称为效果或疗效。因此，医疗条件越好，即诊断的准确性、病人的依从性以及医生的技能越高，就越能实现一个干预措施的最大潜力，疗效也就越大。反之，疗效就越小。

因此，效果是效力和医疗卫生服务条件和水平的综合结果，不是一项干预的普遍的生物学特征，它的大小往往随地区和人群的不同而不同。也就是说，一项干预措施在实际应用时的作用的大小，主要由效力和外在的医疗卫生条件两个因素决定。

（五）安全性和不良作用

安全与危险成反比。一项干预措施的不良作用（adverse reaction）越大，其安全性（safety）就越低。不良作用一般由副作用（side effect）引起，其大小表现在受治人群中不良反应事件发生频率的高低。一项干预措施产生不良反应的危险就是不良反应产生的概率。与疗效的估计一样，干预组和对照组之间不良反应事件频率的差别，才真正反映干预措施不良作用的大小。

（六）干预的益害比

任何医学干预措施，不管是否有效，都或多或少有一定的不良作用，如果没有明显的不良作用，至少实施时耗费（人力、物力和财力）资源。一项有价值的干预措施必须益处大于害处，医疗卫生服务才不至于做无用功。在评估干预措施效果时，不但要了解干预的有益作用，还要知道其不良作用，才能权衡其益害比例，作出全面正确的评价。

按照疗效和不良作用的对比（benefit-harm ratio），可把医学干预措施分为三类：益处大于害处，害处大于益处，益害比相当。值得注意的是，即使是益大于害的干预措施，其益害比会随着服务条件和水平的降低而降低，甚至会由益大于害变成害大于益。当然，益害比相当的治疗也不是没用，其用途取决于人们对益处和害处的偏好，决定会因人而异。

(本文是全文5个部分的第1部分，未完待续)

原文出处：唐金陵江宇. 主编推荐阅读章：随机对照试验. 见：李立明主编. 流行病学. 第6版. 北京：人民卫生出版社，2007：128-163. （文字略有改动）

作者：

唐金陵，广州市妇女儿童医疗中心临床研究总监、香港中文大学荣休教授

江宇，北京协和医学院公共卫生学院副院长、流行病与卫生统计学教授

编辑：

袁金秋，中山大学附属第七医院副研究员

照片：见水印

大型随机对照试验: 临床研究的典范与陷阱

观察与实验，效力与效果

再论观察与实验: 大数据现实世界研究不能取代随机对照试验

系统综述与meta分析（1/5）: 提出研究问题