查看原文
其他

老姚专栏丨为何要对新冠肺炎特效药开展随机双盲对照实验

姚耀军 杨奇明 数据Seminar 2021-06-03


本文原刊发于澎湃新闻·澎湃商学院(2020年2月22日)2610个字,细读大约需要8分钟


面对新冠肺炎疫情,人们迫切希望特效药尽快出现。以致一旦有关于某些药物疗效的消息就会不胫而走,而这些消息本身却真假莫辨。其实,确认某种药物确实有效且副作用可控,可不是一件简单的事情。
随机双盲对照实验,被公认为是评估诸如药物疗效等处理效应的黄金标准。根据相关媒体报道,目前已有几例新冠肺炎备选药物正在开展这一类型的实验。最终这些药物是否靠谱,必须要等待实验的结果。
为帮助读者更好理解这类实验的关键点、优势和可能存在的问题,本文以案例形式,对其基本原理进行一个直觉性介绍。我们设想——

研究者为确认某种药物的疗效,安排一组患者(构成处理组)服用某种药物,并观察他们在服药后的病情变化。假设研究者欣喜地发现,处理组在服药后从整体上看病情有所好转。那么现在的问题是,这是否说明该药物有显著疗效呢?

答案是否定的,因为病情的好转可能归因于人体惊人的自愈效应而非药物的疗效。没错,评估药物疗效和评估一项政策的效应一样,必须建立在因果识别的基础上,而随机双盲对照实验就是这样一个因果识别框架。
本文首先通过介绍随机双盲对照实验中“对照”、“双盲”“随机这三大关键词的内涵,来厘清实验设计的关键点。随后,我们引入先占效应(Preemption effect)这个重要概念,以揭示此类实验可能会失效的情况。最后,我们提炼出两点启示,提醒研究者须客观谨慎地检视自己的研究成果,并始终牢记理论机制分析对实证研究的指导意义。



#01

对照与双盲

在因果识别框架中,为控制自愈效应的影响,研究者有必要在安排处理组服药的同时,再安排另一组患者(构成对照组)不服药。通过比较处理组与对照组的病情变化差异,就能控制自愈效应。但问题依然存在,因为与对照组相比,处理组或许受益于所谓的“安慰剂效应”(Placebo effect)——只要服药者认为自己得到了治疗,即使其服用的是毫无药效的糖丸,心理安慰作用也可能使其病情出现好转。

那么,如何进一步对安慰剂效应加以控制呢?


研究者会安排所有患者都服药,只不过处理组服用的是真药,而对照组服用的是安慰剂——某种无药效的糖丸。非常关键的是,所有患者对服用药物的类型应该一无所知,亦即是“盲目”的。然而,要保证患者的“盲目”并不容易。


实践中很可能存在如下情况:实验工作人员在给患者分发药物时,若他知道是在给处理组分发真药物,则可能无意中会表现得比较严肃;若他知道是在给对照组分发安慰剂,则可能无意中会表现得比较随意。此时,敏感的患者可能根据实验工作人员表情中透露出的蛛丝马迹,猜测其所服用药物的类型,进而使得实验结果掺杂了患者心理作用的影响。
上述例子表明,为了保证患者是“盲目”的,研究者还有必要让实验工作人员与患者一样“盲目”——实验工作人员既不知道某位患者究竟属于对照组谁还是属于实验组,也不知道其分发的药物是真药还是安慰剂。同时,这也有利于保证工作人员不会戴着“有色眼镜”观察患者病情变化,能客观准确地记录实验数据。
在科学文献中,确保被试与实验工作人员“双盲(Double-blind)”的实验设计分别称为被试偏差(Subject bias)控制与研究者偏差(Researcher bias)控制。那么,在被试偏差与研究者偏差均得到有效控制基础上,处理组与对照组的病情发展差异是否就可以归因于药物的疗效呢?
令人失望的是,答案依然是否定的,亦即控制上述两种偏差仍然不够。例如,万一选择进入处理组的患者都是一些身体状况较差(较好)的患者呢?假如情况确实如此,则会导致实验结果掺杂了所谓的样本选择偏差,以致药物疗效被低估(高估)。



#02
随机分配与抽样误差
为了控制样本选择偏差,研究者会将患者随机地分配到处理组与对照组。随机分配(Random assignment)旨在保证处理前的等同性(Pre-treatment equivalence)。不过需要指出的是,这种等同性并不意味着处理组与对照组在身体状况等方面从整体上看不存在任何差异,而是意味着,若存在差异,则这种差异是偶然而非系统性的,属于所谓的抽样误差(Sampling error)。
随机分配无法避免抽样误差,但我们希望抽样误差越小越好。为此,研究者可以做两件事情:
(1)进行大样本实验——基本的概率原理告诉我们,样本容量越大,偶然性对实验结果的影响越小。
(2)对处理组与对照组的病情发展差异进行统计学检验,以定量考察这种差异在多大程度上归因于药物疗效而非抽样误差。



#03
先占效应与实验的失效
现在我们要强调的是,虽然被公认为是评估药物疗效的黄金标准,但随机双盲对照实验并非无可挑剔,也存在失效的情况。一个经典的例子是——

古人曾经用砒霜来治疗性病,而若要对其疗效进行随机双盲对照实验,则实验多半会失效。原来,研究者按照上文提到的实验步骤最终很可能发现,处理组与对照组均出现了大量死亡现象。但这是否就意味着砒霜对性病缺乏疗效呢?并非如此,因为即使处理组与对照组均出现大量死亡现象,其死因也并不相同——对照组主要死于性病,而处理组应该主要死于砒霜中毒。

这表明,即使砒霜对性病存在疗效,但其会被砒霜的毒性所掩盖。在科学文献中,这被称为先占效应——一个原因在实验前就制约了实验中被操纵原因的影响,以致实验无法显示被操纵原因的实际效应。
当然,砒霜这个例子在今天不会发生,因为现代人已经了解砒霜对人体的毒性。现实中更常见的情况是,研究者对某种先占效应事先并不知情,结果使得单纯的随机双盲对照实验无法应对先占效应的挑战。显然,要应对先占效应对实验的挑战,研究者必须开展药物对人体影响的理论研究——不仅包括药物对疾病具有效果的因果机制研究,还包括其他副作用的理论研究。
在上述砒霜对性病疗效的实验中,存在两种因果机制假设:
其一是,砒霜会让患者中毒;
其二是,砒霜对性病产生疗效。
当我们试图对第二种因果机制进行实验检验时,第一种机制就会产生先占效应。在这个例子中,我们或许很容易从实验结果中察觉到这一先占效应,毕竟砒霜的毒性非常致命。然而在很多科学研究中,某种潜在的因果机制可能并不会像砒霜毒性这样主导实验的结果,但无疑仍会成为一种混杂因素,导致我们对某一特定因果机制的识别产生偏差。
先占效应及其相关讨论提醒我们两点:
第一,要以批判的眼光看待任何研究结果,即使它们满足科学的程序而看上去显得非常可靠;
第二,为了提高因果识别的效度,应将实验设计与理论机制分析紧密结合,充分发挥理论机制分析对构建因果识别框架的指导意义。







企研学术顾问 · 耀军


姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授、博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,浙江省“151人才工程”第三层次培养人员,杭州市“十三五”哲学社会科学应用经济学学科组评审专家,企研数据学术顾问。长期从事金融发展理论与实证研究,在《China & World Economy》《Frontiers of Economics in China》《金融研究》《数量经济技术经济研究》《财贸经济》《中国农村经济》等学术期刊上发表论文多篇,部分成果被《新华文摘》《中国法经济学研究》《中国经济的转型升级:新结构经济学方法与应用》《高等学校文科学术文摘》《人大复印资料》收录或者转载。主持教育部人文社科项目、浙江社会科学基金重点项目、浙江省自然科学基金项目等纵向课题多项。荣获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。



►一周热文

统计计量 | 数据科学家应该避免的5种统计陷阱

数据呈现丨Python数据可视化:5段代码搞定散点图绘制与使用,值得收藏

软件应用丨一文搞定SQL增删查改和函数使用

软件应用丨为什么Python是数据科学领域最受欢迎的语言之一?

欣闻丨2月12日,新增确诊病例数下降48.2%!还有哪些好消息?

欣闻|2月11日,从确诊到治愈,我们看到了越来越多好消息

欣闻丨2月10日,好消息如期而至,来看看今天有哪些?!









数据Seminar




这里是大数据、分析技术与学术研究的三叉路口




作者:姚耀军 杨奇明编辑:青酱






    欢迎扫描👇二维码添加关注    

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存