查看原文
其他

什么是随机对照试验 | 集智百科

集智百科 集智俱乐部 2022-05-09

“集智百科精选”是一个长期专栏,持续为大家推送复杂性科学相关的基本概念和资源信息。作为集智俱乐部的开源科学项目,集智百科希望打造复杂性科学领域最全面的百科全书,欢迎对复杂性科学感兴趣、热爱知识整理和分享的朋友加入!

本文是对集智百科中“随机对照试验”词条的摘录,参考资料及相关词条请参阅百科词条原文。

本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!


目录


一、历史二、伦理
三、分类
四、随机化五、盲法六、分析数据
七、结果报告八、优势九、不足十、社会科学十一、批评
十二、编者推荐
十三、百科项目志愿者招募

据修改的2010年CONSORT (综合报告试验标准)要求,流程图包括:两组平行随机试验分为登记、分配、干预、随访和数据分析四个阶段,在对照试验中,需要其中一项干预作为对照处理措施。

随机对照试验 Randomized controlled trial(RCT)是一种科学实验(例如:临床试验)或干预研究(区别于观察性研究),其目的是在测试新治疗的有效性时减少某些偏倚来源。通过受试者随机分配到两个或两个以上的组,经过不同的处理,产生的效应再与一个有可控的处理效应相比较。即一组或多组(实验组)接受正在评估的干预措施,而另一组(通常称为对照组)接受替代治疗,如安慰剂或无干预措施。在试验设计的条件下对这些组进行监测,以确定实验干预的有效性,并与对照组进行疗效比较评估。当然这也包括一个以上的治疗组或一个以上的对照组。

试验可能采用了盲法 blinded experiment,这意味着影响参与者的信息在试验完成后才会公布。试验的任何参与者,包括受试者、研究人员、技术人员、数据分析人员和评估人员,都可能被强加盲。有效的盲法可以减少或消除某些试验偏差的来源。

在分配治疗方案时,受试者随机地被分配到不同组。这个随机化过程减少了选择偏差和分配偏差,平衡了已知和未知的预后因素。盲法减少了其他形式的实验者和主体偏见。

一个良好盲法的 RCT 通常被认为是临床试验的黄金标准。盲法随机对照试验通常用于检测医疗干预措施的效果,并且还可能提供关于药物反应等不良反应的信息。随机对照试验可以提供令人信服的证据,证明研究治疗对人类健康产生了影响。

“ RCT”和“随机试验”这两个术语有时被用作同义词,但后一个术语没有提到对照,因此可以描述在没有对照组的情况下相互比较多个治疗组的研究。科学文献中常有“随机临床试验”或“随机比较试验”这类引发歧义的术语。并非所有的随机临床试验都是随机对照试验(其中一些试验永远不可能成为随机对照试验,因为实施控制是不切实际或不道德的)。随机对照临床试验这个术语是临床研究中使用的另一个术语;然而,随机对照临床试验也被用于其他研究领域,包括许多社会科学。




历史




据报道,1747年James Lind进行了第一个临床试验,目的是确定治疗坏血病的方法。1784年,French Royal Commission on Animal Magnetism进行了第一次盲法实验,以调查催眠术的说法。19世纪下半叶,一篇提倡研究人员失明的早期文章来自Claude Bernard。Bernard建议实验的观察者不要知道正在被测试的假设。这一建议与启蒙时代流行的态度形成鲜明对比,即科学观察只有由受过良好教育、消息灵通的科学家进行才能客观有效。1907年,W. H. R. Rivers和H. N. Webber进行了第一项有记录的盲法研究,研究咖啡因的作用。

在19世纪80年代,Charles Sanders Peirce和Joseph Jastrow在心理学和教育学领域引入随机实验。

在20世纪早期,Jerzy Neyman和Ronald A. Fisher将随机实验引入农业研究。Fisher的实验研究和他的著作普及了随机实验。

医学上首次发表的随机对照试验出现在1948年题为《Streptomycin treatment of pulmonary tuberculosis》的论文中,这篇论文描述了医学研究理事会的一项调查。这篇论文的作者之一是Austin Bradford Hill,被认为是构想出了现代 RCT理论。

20世纪80年代进行的大规模 ISIS 心脏病治疗试验进一步影响了试验设计。

到20世纪后期,随机对照试验被公认为医学“合理疗法”的标准方法。截至2004年,美国 Cochrane图书馆有超过15万本随机对照试验的参考资料。为了改进医学文献中对随机对照试验的报道,一个由科学家和编辑组成的国际小组在1996年、2001年和2010年发布了Consolidated Standards of Reporting Trials (CONSORT)声明,这些声明已被广泛接受。随机化是将试验受试者分配到治疗组或对照组的过程,使用机会因素来确定分配,以减少偏差。




伦理




尽管临床平衡原则已经被广泛应用于RCT,但随机对照试验的伦理问题具有特殊性。首先,有人认为平衡本身不足以证明随机对照试验的合理性。另一方面,“集体均势”可能与缺乏个人均势相冲突(例如,个人认为干预是有效的)。最后,Zelen 的设计已经被用于一些随机试验,在受试者提供知情同意之前随机化,这对于筛选和选择性治疗的随机试验来说可能是合乎道德的,但是对于“大多数治疗试验”来说可能是不道德的。

一般来说,受试者要为参加随机对照试验提交了知情同意书,但1982年以来的研究记录表明,随机对照试验的受试者可能认为他们肯定会接受对他们个人最好的治疗; 也就是说,他们不理解研究和治疗之间的区别。需要进一步研究,以确定这种”治疗性误解”的流行程度和解决方法。

RCT方法的变种也可能产生尚未被很好理解的文化效应。例如,患有晚期疾病的病人可能会加入临床试验以希望治愈,即使治疗不太可能成功的情况下也是如此。

试验注册

2004年, 医学杂志编辑国际委员会(ICMJE)宣布,所有在2005年7月1日之后考虑在该委员会12种杂志上发表之前,必须对试验进行注册。尽管如此,试验登记可能仍然延迟或根本不会发生。医学期刊将强制性临床试验登记作为发表的先决条件进展缓慢。




分类



通过研究设计

通过研究设计对 RCT 进行分类。从最常见到最不常见,RCT 研究设计的主要类别是:
  • 平行试验:每个参与者被随机分配到一个组,组中的所有参与者都接受(或不接受)干预。

  • 交叉试验:随着时间的推移,每个参与者都会接受(或不接受)随机序列的干预。

  • 聚类试验:预先存在的参与者组(例如,村庄、学校)被随机选择以接受(或不接受)干预。

  • 因子试验:每个参与者被随机分配到一个接受干预或非干预特定组合的组(例如,第1组接受维生素X和维生素Y,第2组接受维生素X和安慰剂Y,第3组接受安慰剂X和维生素Y,第4组接受安慰剂X和安慰剂Y)。

对2006年12月在 PubMed 收录的616例随机对照试验的分析发现,78% 为平行组试验,16% 为交叉组试验,2% 为分体组试验,2% 为聚类组试验,2% 为因子组试验。

结果(效力 vs 效果)

随机对照试验可分为“解释性”或“实用性”。解释性随机对照试验在高度选定的参与者和高度受控的条件下测试有效性。相比之下,实用性随机对照测验 pragmatic RCTs(pRCT)在相对未经选择的参与者和灵活的条件下,在日常实践中检验有效性,这样,实用随机对照测验可以“为实践决策提供信息”。

假设(优越性 vs 非优越性 vs 等价性)

随机对照试验的另一种分类是“优越性试验”、“非劣性试验”和“等效性试验”,它们在方法和报告上有所不同。大多数随机对照试验都是优势试验,其中一种干预措施被假设在统计学意义上优于另一种干预措施。一些随机对照试验是非劣效性试验,“以确定一种新的治疗方法是否比一种参考治疗方法更差。”其他随机对照试验是等效试验,其中的假设是两种干预措施彼此不可区分。




随机化




随机对照试验中适当随机化的优点包括:
  • 它消除了治疗分配中的偏差,特别是选择偏差和混淆。
  • 它便于调查人员、参与者和评估人员对治疗人群的身份进行遮蔽。
  • 它允许使用概率理论来表达这样一种可能性,即治疗组之间结果的任何差异仅仅表明是偶然性的。

有两个过程涉及到随机化的病人接受到不同的干预。首先是选择一个随机化程序来生成一个不可预测的分配序列;这可能是以相等的概率将患者随机分配到任何一组,可能是“受限的”,也可能是“适应性的”。第二个也是更实际的问题是隐藏分配,这是指在将患者明确分配到各自的组之前,采取严格的预防措施,以确保患者的组分配不被披露。非随机的“系统”组分配方法,如在一个组和另一个组之间交替患者,可能会造成“无限的污染可能性”,并可能导致分配隐藏的破坏。

然而,相对于不充分随机化,充分随机化改变结果的经验证据很难被发现。

程序

治疗分配是每个治疗组中患者的期望比例。一个理想的随机化程序将实现以下目标:
  • 最大化统计能力,尤其是在亚组分析中。一般来说,相等的组规模将最大化统计能力,然而,不相等的组规模对于某些分析来说可能更强大(例如,使用Dunnett程序对安慰剂与几个剂量进行多次比较),并且有时由于非分析性原因而被采用(例如,如果有更高的机会获得试验治疗,患者可能更有动力登记,或者监管机构可能要求最少数量的患者接受治疗)。
  • 最小化选择偏差。如果调查人员可以有意识或无意识地在治疗之间优先招募患者,就可能发生这种情况。一个好的随机化过程是不可预测的,因此研究人员不能根据先前的治疗分配来猜测下一个受试者的分组。当已知以前的治疗方案时(如在非盲法研究中)或可以猜到(如果一种药物有明显的副作用),选择偏倚的风险最高。
  • 最小化分配偏差(或混淆)。当影响结果的协变量在治疗组之间分布不均,并且治疗效果与协变量的效果混淆时(即“偶然偏差”),可能会出现这种情况。如果随机化程序导致与各组结果相关的协变量失衡,如果不对协变量进行调整,效果估计可能会有偏差(这可能无法测量,因此无法调整)。

然而,没有一个单一的随机化程序在每种情况下都能满足这些目标,因此研究人员必须根据其优点和缺点来选择一个给定的研究程序。

1.简单

这是一个常用且直观的程序,类似于“反复公平抛硬币”,也被称为“完全”或“无限制”随机化,它对选择和意外偏差都是稳健的。然而,它的主要缺点是在小的随机对照试验中群体规模不平衡的可能性。因此,建议仅用于受试者超过200人时进行随机对照试验。

2.限制性

为了平衡较小随机对照试验中的组规模,建议采用某种形式的“限制性”随机化。随机对照试验中主要使用的限制随机化类型有:
  • 置换区组随机化或区组随机化:规定了“区组大小”和“分配比例”(一组受试者相对于另一组受试者的数量),受试者在每个区组内随机分配。例如,块大小为6,分配比例为2:1,将导致4个受试者随机分配到一个组,2个分配到另一个组。这种类型的随机化可以与“分层随机化”相结合,例如通过多中心试验中的中心,以“确保每个组中参与者特征的良好平衡。”置换块随机化的一个特殊情况是随机分配,其中整个样本被视为一个块。置换块随机化的主要缺点是,即使块大小很大且随机变化,该过程也会导致选择偏差。另一个缺点是,对置换区组随机对照试验数据的“适当”分析需要按区组分层。
  • 自适应有偏-硬币随机化方法(其中瓮随机化是最广为人知的类型):在这些相对不常见的方法中,如果一个组的代表人数过多,被分配到该组的概率会降低,如果该组的代表人数不足,被分配到该组的概率会增加。这些方法被认为比置换块随机化受选择偏差的影响更小。

3.适应性

在随机对照试验中,至少使用了两种类型的“适应性”随机化程序,但频率远低于简单或限制性随机化:
  • 协变量自适应随机化,其中一种类型是最小化:被分配到一个组的概率是变化的,以便最小化“协变量不平衡”。据报道,最小化有“支持者和诋毁者”,因为只有第一个受试者的群组分配是真正随机选择的,该方法不一定能消除对未知因素的偏见。
  • 应答自适应随机化,也称为结果自适应随机化:如果组中先前患者的应答是有利的,则被分配到一个组的概率增加。虽然有人认为,当治疗有效或无效的概率在RCT过程中增加时,这种方法比其他类型的随机化更符合伦理,但伦理学家尚未详细研究这种方法。

分配隐藏

“分配隐藏”(定义为“保护随机化过程的程序,以便在病人进入研究之前不知道要分配的治疗”)在随机对照试验中很重要。在实践中,临床研究人员在随机对照试验中常常发现难以保持公正性。关于调查人员将密封的信封举到灯光下或者搜查办公室来决定群组分配,以便指定下一个病人的分配的故事比比皆是。这种做法引入了选择偏差和混杂因素(这两者都应该通过随机化来减少) ,可能会扭曲研究结果。一旦研究开始并在研究结束后,充分的分配隐藏应该会阻止患者和研究者发现治疗分配。与治疗相关的副作用或不良事件可能足够具体,足以向研究者或患者揭示分配情况,从而引入偏差或影响研究者收集的或受试者要求的任何主观参数。

一些确保分配隐藏的标准方法包括顺序编号、不透明、密封信封(SNOSE);顺序编号的容器;药学控制的随机化;和中心随机化。分配隐藏方法被建议纳入RCT议定书,并在RCT结果的出版物中详细报告分配隐藏方法;然而,2005年的一项研究发现,大多数随机对照试验在其方案、出版物或两者中都有不清楚的分配隐藏。另一方面,2008年的一项对146项元分析的研究得出结论,分配隐瞒不充分或不明确的随机对照试验的结果往往只有在随机对照试验的结果是主观的而不是客观的情况下才会偏向于有益的结果。

样本量

分配给控制组和治疗组的治疗单位(受试者或受试者组)的样本量影响 RCT 的可靠性。如果治疗的效果很小,任何一组的治疗单位的样本量都可能不足以在各自的统计检验中拒绝零假设。拒绝无效假设的失败意味着在给定的试验中,治疗对被治疗者没有统计学上的显著影响。但是随着样本量的增加,同样的RCT可能能够证明治疗的显著效果,即使这种效果很小。




盲法




一项RCT的盲法是指阻止研究参与者、照顾者或结果评估者知道哪些干预措施,这一程序也称“蒙面”。与分配隐藏不同,在RCT,致盲有时是不合适的或不可能的;例如,如果RCT涉及需要患者积极参与的治疗(例如物理治疗),参与者不能对干预视而不见。

传统上,盲法随机对照试验分为“单盲”、“双盲”或“三盲”;然而,2001年和2006年的两项研究表明,这些术语对不同的人有不同的含义。2010年CONSORT 声明明确指出,作者和编辑不应使用”单盲”、”双盲”和”三盲”等术语;相反,关于盲法 RCT 的报告应讨论”如果完成,干预分配后谁被“蒙面”了(例如,参与者、护理提供者、评估结果的人员)以及其原因”。

没有盲法的随机对照试验被称为“未盲法”,也称“开放”,或者(如果干预是一种药物)“开放标签”。2008年的一项研究得出结论,只有当随机对照试验的结果是主观的而不是客观的时候,非盲法随机对照试验的结果往往偏向于有益的结果;例如,在RCT多发性硬化症的治疗中,未盲的神经学家认为治疗是有益的。在实用的随机对照试验中,尽管参与者和提供者往往是非盲的,但是”仍然需要并且往往可能使评估者“蒙面”,以获得评估结果的客观数据来源”。




分析数据



随机对照试验中使用的统计方法类型取决于数据的特征,包括:
  • 对于二元结果数据,可以使用逻辑回归(例如,预测接受聚乙二醇干扰素α-2a治疗丙型肝炎后的持续病毒学应答)和其他方法。
  • 对于连续的结果数据,协方差分析(例如,急性冠状动脉综合征后接受阿托伐他汀后血脂水平的变化)可以用于检测预测变量效果。
  • 对于可能删失的时间到事件结果数据,生存分析(如绝经后接受激素替代治疗后冠心病发生时间的卡普兰-迈耶估计值 Kaplan–Meier estimator和考克斯比例风险模型 Cox proportional hazards model)是合适的。

无论使用何种统计方法,RCT数据分析中的重要考虑因素包括:
  • 由于中期结果,是否应该提前停止RCT。例如,如果干预产生“大于预期的益处或危害”,或者如果“研究者发现实验干预和对照干预之间没有重要区别的证据”,则可能会提前停止随机对照试验。
  • 这些组在多大程度上可以完全按照随机化时的状态进行分析(即,是否使用了所谓的“意向治疗分析”)。一项“纯”意向治疗分析“只有在获得所有随机受试者的完整结果数据时才有可能”;当一些结果数据缺失时,选项包括仅分析具有已知结果的病例和使用估算数据。然而,分析越能包括他们被随机分组的所有参与者,RCT受到的偏见就越少。
  • 是否应进行亚组分析。这些“通常是不鼓励的”,因为多次比较可能会产生假阳性结果,而其他研究无法证实。




结果报告



CONSORT 2010声明是“一套基于证据的报告随机对照试验的最低建议。”CONSORT 2010核对表包含25个项目(许多带有子项目),重点关注“个体随机、两组、平行试验”,这是RCT最常见的类型。

对于其他RCT研究设计,“CONSORT扩展版”已经发布,一些例子是:
  • CONSORT 2010 声明: 扩展至聚类随机试验
  • CONSORT 2010 声明: 非药物治疗干预

相对重要性和观察性研究

2000年发表在《新英格兰医学杂志》上的两项研究发现,观察性研究和随机对照试验总体上产生了相似的结果。2000年研究结果的作者质疑“观察性研究不应用于定义循证医疗”以及随机对照试验的结果是“最高等级的证据”的观点。然而,2001年发表在《美国医学协会杂志》上的一项研究得出结论,观察性研究和随机对照试验之间“确实会出现超越偶然的差异,估计治疗效果的差异非常普遍”。

另外两条推理路线质疑随机对照试验对科学知识的贡献超过了其他类型的研究:
  • 如果按照新发现的潜力对研究设计进行排序,那么轶事证据将排在首位,其次是观察性研究,然后是随机对照试验。
  • 相对于所治疗疾病的预期稳定或逐渐恶化的自然病程而言,RCT对于具有显著和快速效果的治疗可能是不必要的。一个例子是联合化疗,包括顺铂治疗转移性睾丸癌,在1977年的一项非随机研究中将治愈率从5%提高到60%。

统计结果解读

与所有统计方法一样,随机对照试验同时存在ⅰ型(“假阳性”)和ⅱ型(“假阴性”)统计误差。关于第一类错误,典型的RCT将使用0.05(即20分之一)作为RCT错误地发现两种同等有效的治疗方法显著不同的概率。关于第二类错误,尽管1978年发表的一篇论文指出,许多“阴性”随机对照试验的样本量太小,无法对阴性结果做出明确的结论,但到2005-2006年,相当大比例的随机对照试验仍然有不准确或不完全报告的样本量计算。

同行评审

结果的同行评审是科学方法的重要组成部分。审查者检查研究结果是否存在可能导致不可靠结果的潜在设计问题(例如,通过产生系统偏差),在相关研究和其他证据的背景下评估研究,并评估是否可以合理地认为研究已经证明了其结论。为了强调同行评审的必要性和过度概括结论的危险,两位波士顿地区的医学研究人员进行了一项随机对照试验,他们随机给23名从双翼飞机或直升机上跳下的志愿者分配了一个降落伞或一个空背包。这项研究能够准确地报告,与空背包相比,降落伞不能减少伤害。限制这一结论普遍适用性的关键背景是,飞机停在地面上,参与者只跳了大约两英尺。




优势




RCT被认为是影响医疗保健政策和实践的证据层次中最可靠的科学证据形式,因为RCT减少了虚假的因果关系和偏见。随机对照试验的结果可以在系统综述中结合使用,越来越多地用于循证实践。一些科学组织认为随机对照试验或随机对照试验的系统审查是现有的最高质量证据的例子有:
  • 截至1998年,澳大利亚国家卫生和医学研究委员会将“一级”证据指定为“从所有相关随机对照试验的系统审查中获得的”,将“二级”证据指定为“从至少一项适当设计的随机对照试验中获得的”
  • 至少自2001年以来,美国预防服务工作组在提出临床实践指南建议时,将研究的设计及其内部有效性作为其质量的指标。它承认“从至少一个适当的随机对照试验中获得的证据”具有良好的内部有效性(即“良好”评级),是它所能获得的最高质量的证据。
  • GRADE工作组在2008年得出结论,“没有重要限制的随机试验构成了高质量的证据。”
  • 对于涉及“治疗/预防、病因学/危害”的问题,截至2011年,牛津循证医学中心将“1a级”证据定义为相互一致的随机对照试验的系统审查,“1b级”证据定义为“个体RCT(置信区间较窄)。”

导致临床实践改变的具有意想不到结果的显著随机对照试验包括:
  • 美国食品药品监督管理局批准后,抗心律失常药氟卡尼和恩卡尼分别于1986年和1987年上市。关于这些药物的非随机研究被描述为“glowing”,1989年初,它们的销售额增加到每月总计约165,000张处方。然而,在那一年,一份RCT的初步报告得出结论,这两种药物会增加死亡率。这些药物的销量随后下降。
  • 在2002年之前,基于观察性研究,医生为绝经后妇女开激素替代疗法以预防心肌梗死是常规。然而,在2002年和2004年,妇女健康倡议发表的随机对照试验声称,服用雌激素加孕激素的激素替代疗法的妇女比服用安慰剂的妇女心肌梗死的发生率更高,并且仅服用雌激素的激素替代疗法不会降低冠心病的发病率。观察性研究和随机对照试验之间差异的可能解释涉及方法学、所用激素方案和研究人群的差异。在随机对照试验发表后,激素替代疗法的使用减少了。




不足




许多论文讨论了随机对照试验的缺点。最常被提及的缺点包括:

时间和花销

RCT可能很贵;一项研究发现,在2000年之前,由国家神经障碍和中风研究所资助的28个三期随机对照试验总费用为3.35亿美元,平均每个RCT花费1200万美元。尽管如此,随机对照试验的投资回报可能很高,因为同一项研究预测,根据对质量调整生命年的评估,28个随机对照试验产生的“10年社会净收益”是试验项目成本的46倍,等于当时的人均国内生产总值平均值。

一部RCT的行为需要几年才能出版;因此,数据在很长一段时间内受到医学界的限制,在发表时可能不太相关。

维持几年或几十年的随机对照试验成本很高,而这些试验对于评估一些干预措施是理想的。

预防不常发生的事件(如婴儿猝死综合征)和不常见的不良后果(如药物的罕见副作用)的干预措施需要样本量极大的随机对照试验,因此最好通过观察性研究进行评估。

由于运行随机对照试验的成本,这些通常只检查一个变量或很少的变量,很少反映复杂医疗情况的全貌;而例如病例报告可以详细描述患者医疗状况的许多方面(例如,患者病史、体检、诊断、心理社会方面、随访)。

利益冲突

2011年的一项研究披露了用于医学荟萃分析的基础研究中可能存在的利益冲突,该研究回顾了29项荟萃分析,发现在荟萃分析的基础研究中很少披露利益冲突。29项荟萃分析包括11项来自普通医学期刊;15篇来自专业医学期刊,3篇来自Cochrane系统综述数据库。29项荟萃分析共审查了509项随机对照试验。其中,318个随机对照试验报告了资金来源,219个(69%)得到了行业资助。509个随机对照试验中有132个报告了作者利益冲突披露,91项研究(69%)披露了与一名或多名作者的行业财务联系。然而,这些信息很少反映在荟萃分析中。只有两个(7%)报告了RCT的资金来源,没有一个报告了RCT作者与行业的联系。作者总结道,“如果由于行业资助或作者行业财务联系而不承认荟萃分析中随机对照试验的COI,读者对荟萃分析证据的理解和评估可能会受到影响。"

一些随机对照试验完全或部分由医疗保健行业(如制药行业)资助,而不是由政府、非营利或其他来源资助。2003年发表的一项系统综述发现了四篇1986-2002年的文章,比较了行业赞助和非行业赞助的随机对照试验,在所有文章中,行业赞助和积极的研究结果之间存在相关性。2004年发表在主要医学和外科杂志上的一项关于1999-2001年随机对照试验的研究确定,行业资助的随机对照试验“更有可能与有统计学意义的亲行业发现相关。”这些结果在外科试验中得到了反映,尽管行业资助不影响试验中止率,但与完成试验的发表几率较低有关。行业资助的已发表随机对照试验中出现亲行业结果的一个可能原因是发表偏倚。其他作者认为学术和行业赞助研究的不同目标是造成这种差异的原因。商业赞助商可能会更专注于对已经在早期试验中显示出希望的药物进行试验,并复制以前的积极结果,以满足药物批准的监管要求。

伦理

如果医疗技术出现了颠覆性创新,如果“明显”对照受试者的结局较差,可能很难在RCT进行伦理测试——这可能是由于其他前述测试,也可能是在RCT的初始阶段。从伦理上讲,可能有必要过早地中止RCT,而获得伦理批准(和患者同意)以在未来的RCT试验中阻止对照组的创新可能是不可行的。

历史对照试验(HCT)利用以前随机对照试验的数据来减少样本量;然而,这些方法在科学界有争议,必须小心处理。




社会科学




由于最近在社会科学中出现了随机对照试验,随机对照试验在社会科学中的使用是一个有争议的问题。一些具有医学或健康背景的作者认为,一系列社会科学学科的现有研究缺乏严谨性,应该通过更多地使用随机对照试验来改进。

运输科学

交通科学的研究人员认为,除非随机对照试验证明其有效性,否则在学校旅行计划等项目上的公共支出是不合理的。Graham-Rowe和他的同事们回顾了文献中发现的77项交通干预评估,将它们分为5个“质量等级”。他们得出结论,大多数研究质量较低,并主张在未来的运输研究中尽可能使用随机对照试验。

Steve Melia博士不同意这些结论,他认为关于随机对照试验在建立因果关系和避免偏见方面优势的说法被夸大了。在干预措施必须改变人类行为才能有效的情况下,他提出了以下八项使用随机对照试验的标准:
干预措施:
  1. 没有适用于一个独特群体的所有成员(例如,整个国家的人口、一个独特组织的所有雇员等)
  2. 应用于类似于应用于控制组的上下文或设置中
  3. 可以从其他活动中分离出来,本研究的目的是评估这种分离的效果
  4. 从实施到效果成熟的时间很短
以及因果机制:
  1. 要么是研究人员已知的,要么是所有可能的替代品都可以测试
  2. 不要涉及干预组和外部环境之间的重要反馈机制
  3. 与外部因素有稳定且可预测的关系
  4. 如果对照组和干预组颠倒过来,会以同样的方式起作用

犯罪学

2005年的一项审查发现,1982-2004年发表了83项犯罪学随机实验,而1957-1981年只发表了35项。作者将他们发现的研究分为五类:“警务”、“预防”、“惩戒”、“法院”和“社区”。Hollin (2008)只关注犯罪行为项目,他认为随机对照试验可能很难实施(例如,如果RCT要求“判刑时随机将罪犯分配到项目中”),因此准实验设计的实验仍然是必要的。

教育

RCT已被用于评估一些教育干预措施。从1980年到2016年,已经发表了1000多份随机对照试验报告。例如,2009年的一项研究随机选择了260名小学教师的教室,让他们接受或不接受行为筛查、课堂干预和家长培训,然后测量他们学生的行为和学业表现。另一项2009年的研究对678名一年级儿童进行了随机课堂,让他们接受以课堂为中心的干预、以家长为中心的干预或不干预,然后跟踪他们19岁的学习成绩。




批评



2018年对10个引用最多的随机对照试验的回顾指出了背景特征分布不佳、致盲困难,并讨论了随机对照试验中固有的其他假设和偏见。其中包括“独特的时间段评估偏差”、“背景特征保持不变假设”、“平均治疗效果限制”、“个体水平的简单治疗限制”、“所有前提条件均完全满足假设”、“定量变量限制”和“仅安慰剂或仅常规治疗限制”。




编者推荐




随机对照试验

随机对照试验相关文章




百科项目志愿者招募




作为集智百科项目团队的成员,本文内容由Songgang77参与编译,李昊轩审校,薄荷编辑。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。


以上内容都是我们做这项目的起点,作为来自不同学科和领域的志愿者,我们建立起一个有效的百科团队,分配有审校、翻译、编辑、宣传等工作。我们秉持:知识从我而来,问题到我为止的信念,认真负责编撰每一个词条。




在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。


如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!



集智百科报名表


来源:集智百科

编辑:王建萍



推荐阅读


点击“阅读原文”,阅读词条随机对照试验原文与参考文献

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存