查看原文
其他

2022 ESMO特别篇 | 对单臂注册试验的灵魂拷问

阿拉蕾 医药魔方Med 2023-01-17


单臂试验(single arm trial,SAT)是指设计为开放,不设立平行对照组的一种临床试验。由于SAT的研发策略显著缩短了新药的上市时间,近年来有越来越多的企业希望采用SAT支持抗肿瘤药物的上市申请。同时,SAT的利与弊一直是领域内的关注热点。今年ESMO会议期间,来自加拿大女王大学肿瘤系的Bishal Gyawali教授,再次对单臂注册试验中存在的问题进行了探讨。



单臂注册试验,可能其本身就存在了矛盾(oxymoron),因为SAT的目的并不是用于注册/批准,而是用于评估抗肿瘤药物活性,从而决定药物是否可以进入III期随机对照试验(RCT)。然而,在一项针对III期阴性结果RCTs的研究中,我们发现有42%的RCT没有II期试验,28%的II期试验为阴性。也就是说,即使得到了一个阴性的单臂II期试验,仍旧进行了III期随机化试验,并取得阴性结果后才停止。SAT的目的并不是证明药物的有效性,有效性需通过随机化试验来证明。因此,能否采用SAT进行药品注册一直是领域内专家学者们的争论点。

一般来说在以下几种情况下,采用SAT进行注册可被接受:1、RCT的可行性难度较高,例如罕见病或RCT不符合伦理;2、安全性已经被证明,且利大于弊;3、在定义明确的人群中具有显著且持续的ORR;4、有强有力的基础研究来支持药物的作用机制;5、未满足的治疗需求。需要注意的是,上述这些条件都没有非常明确的定义或界限。

另外,SAT应使用什么样的终点才是合理的?是PFS或OS吗?它们可能会受到疾病自然病程的影响,而不是干预。是ORR吗?ORR很大程度上是药物的一个功能性指标。理论上来说肿瘤出现自发性退缩是非常少见的,故安慰剂组的ORR应该是0%。但事实上并不是这样,既往有多项研究显示安慰剂组的ORR在2%左右,这个问题也值得进一步去解答。

回到最初的问题,我们可以采用SAT进行注册吗?——这艘船已经启航,因为已有多个药物的获批基于SAT。你可能会说,那仅用于加速批准(AA),如果验证性试验失败将会被撤回。但你们错了,基于SAT的抗肿瘤药物获批,不仅在AA,也会在常规批准(regular approvals,RA)。


有一项研究,对2017~2021年FDA批准的成人实体瘤药物进行了分析,共有58项批准(58/161,36%)基于SAT。这58项批准中,39项为AA,19项为RA;39项AA中,最终有4项撤回,8项转为RA,其余继续保持AA。这些SAT的中位ORR为40%,用于AA和RA之间的ORR没有显著差异。因此,即使都基于SAT,不能解释为何部分可用于AA,而部分用于RA。

ESMO临床获益量表(ESMO-MCBS)的提出,有助于更好的使用个人和社会资源,选择具有成本效应的肿瘤治疗方案(注:结果会分为1,2,3,4,5,共5个等级,4级和5级代表了高水平的临床获益)。对上述这58项SAT进行评估,MCBS为1~2分的有20个,3分有38个,没有4分(注:SAT不可能达到5分),所有被撤回SAT的ORR<20%且均为1分。

推荐阅读:ESMO临床获益量表:不是所有阳性试验结果都能叫“突破”!

面对单臂注册试验我们需要考虑哪些因素?1、人群选择性(没有对照组,也有未知的混杂因素);2、样本量(多小是太少,多大是足够的?);3、ORR或缓解持续时间(DOR)(用什么标准来评判是低还是高?);4、用于AA还是RA?5、什么才是“真正的”未满足的临床需求?6、安全性。接下来我们会一一分析。

首先是选择偏倚,因为SAT没有同步的对照组,故只能依靠历史对照。如何确定现有药物的最佳治疗应答水平?该研究整理了FDA(2014年5月~2019年6月)基于SAT批准的药物治疗应答率(蓝色),并与相同适应症现有可及药物的应答率(橙色)进行比较,可以看到部分橙色的结果比蓝色要高(下图),也就是说现有治疗药物的应答率高于新获批的药物。


第二是样本量。一项发表于2020年的研究,对2010~2019年FDA的172项批准进行了分析,31项(18.0%)基于SAT,样本量中位数为104。进行以ORR、PFS和OS为终点的RCT,所需的样本量中位数分别为206,130和396。因此从理论上来说,与部分SAT所需时间相当的时间范围内进行随机对照试验是可能的。

第三,什么程度的ORR和DOR才足够显著?这是一项对比非随机化和随机化研究中ORR和DOR结果的分析,最后筛选出19个药物适应症可同时获得非RCT和RCT数据。分别有63%和87%的病例,非RCT的RR(response rate)和DOR高于RCT。汇总分析显示,非RCT中的RR较RCT高13%,DOR较RCT高17%。因此,什么程度的ORR和DOR才是理想的?目前没有一个明确的定义。

第四,什么样的疾病才是少见(rare)的?既往认为在美国每年<40,000人受影响,在欧洲发病率<6/100,000人。近些年,随着分子亚型的深入,我们对“少见”有了新的定义。举例来说,肺癌是少见的吗?但是如果根据分子亚型来分组,或可以说部分特殊分子亚型的肺癌是少见的。

第五,什么才是“真正的”未被满足的临床需求?在不同的癌种中,该定义可能也会有所不同。在部分的确少见的癌种中显然有未满足的治疗需求。但是即便在指南中可选治疗较多、五年生存率较高的癌种,也会有所谓的未满足的需求。因此,有时未满足的临床需求可能并不是“真正的”未满足的需求。

第六是安全性,这也是监管机构非常关注的问题。我们可以从免疫联合治疗在多发性骨髓瘤(MM)中的一篇观点性文章中体会,由于安全性信号(注:死亡风险增加)而提前终止了KEYNOTE-183和185研究。虽然有多个PD-1或PD-L1药物的单药方案获批是基于SAT中显示出持续性应答,但是在没有对照组的情况下,通过SAT很难充分评估联合用药的有效性和安全性,OS评估仅能通过随机化试验来评估。

最后来谈一谈基于SAT获批上市药物会产生的社会影响。针对AA获批后确证性试验失败的研究进行回顾性分析,结果显示它们取得AA基于的SAT的主要研究终点多为RR。同时也看到,在随机化试验失败并退出市场前,这些药物可在市场上销售多年。另有一项针对近千名肿瘤科医生的调查研究结果显示,医生最常选择的20个抗肿瘤药物(下图),无论是低收入、中等收入还是高收入国家,没有一个是基于SAT获批的药物。


什么时候SAT可用于注册?我认为需要有显著的ORR和DOR,并需完善后续的确证性研究;需要有持久的CR率;需要有里程碑式的持久应答率或少见疾病中的OS率(尤其是自然病程清晰且现有治疗方案不理想,例如JAVELIN-Merkel 200研究);此外,RA不应依据较短时间内评估的ORR或DOR来证明,但AA可能会在可及性和循证学依据之间有所妥协。同时,MCBS评估方法是否需要进行调整或改进,这也是一个值得讨论的点。

最后做一个总结。首先,SAT不代表可以提供足够的确证性依据用于支持获批,但这艘船已经启航了。第二,SAT可在满足一定标准的情况下适用于AA,但不应适用于RA。第三,长期随访的数据是需要的,用于提供明确的有效性结果。第四,部分SAT的样本量以及试验时间或已足够进行RCT。最后,部分偏倚在评估ORR时需要考虑,它们可能被错误的夸大。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存