国产新冠口服药登上顶刊,除了喜大普奔,我们还要注意哪些细节?
从目前可获取的公开数据如何看待本项研究的结果,我们做了一些案头研究,希望能够对正在进行的争论提供一些常规视角以外的补充和借鉴。
01
该药是否在头对头研究中击败P药?
不是。尽管一些媒体将研究结果相对风险(HR)1.17,95%可行区间:1.02-1.36放在了非常显眼的位置,但是本研究并不能证明VV116相对辉瑞新冠药效果更好,因为这是一项非劣效性而不是优效性临床研究。
当临床上已经存在具有可接受疗效的产品,出于伦理上的考量,后续的跟随者在进行临床试验的时候便不适宜选用安慰剂作为对照。如果预计两组间的差异性比较小,那么若是采用优效设计的话,样本量、随访时间和研究成本可能会无法承受,因此申办方会更加倾向于采用非劣效设计。在这种情况下,研究者需要考虑到研究药物理论上效果与阳性对照药物相近程度,首先要界定两个药物能够被接受的最小效果差异临界值Δ,只要VV116的治疗效果与P药效果差异小于等于-Δ,那么就能够证明VV116的效果不差于P药。在本项研究中,研究者最终确定了研究终点(至持续临床康复时间)6.875天的假设。这个假设是基于P药至持续临床康复时间是5.5天的基础上,设置双侧95%可行区间的下限大于0.8的前提下做出的。
对于这项研究我们可以看到相对P药,VV116的持续临床康复概率相比P药要高17%,95%置信区间1.02-1.36,显然能够证明VV116在持续临床康复方面不劣于P药。
郭敬明通过非劣效性检验证明自己的身高不低于姚明,通过定义临界值为2米,于是非劣效性被成功展示。
02
这项研究可否证明VV116的优效性?
不能。因为非劣效性检验的研究设计,只能够排除VV116康复时间大于6.875天的假设,但是并不足以证明VV116的效果优于P药,哪怕相对风险的可行区间不包括1。这是因为优效性检验需要在研究初始即确定下来,并采用完全不同于非劣效性的统计方法,因此即使中位时间在数值上缩短一天,也不能就此声称VV116的临床康复时间更快,更何况总体康复概率两者只相差0.7% (98.4% vs. 97.7%),25百分位时间都是齐齐整整的4.0 (95%CI 3.0-4.0)。
此外值得注意的是,这项研究并没有采用了经典意义上的意向性分析(ITT),而是将没有接受药物治疗的患者排除在全分析集(Full Analysis Set,FAS)以外。研究还纳入了进一步剔除存在研究方案违背/偏离或者依从性差患者的符合方案集(Per Protocol Set,PPS)。但是中位持续临床康复时间又延长到5天,同时VV116和P药间不存在任何差异。
VV116的中位时间从FAS中的4天延长到PPS中的5天,说明中断研究的患者大多数是在研究早期失访或者出现研究方案违背或偏离,同时这些患者的康复时间相对PPS中的患者更早。或许是患者已经出现了康复征象,因此拒绝使用试验药物?因为一般来说PPS的内部有效性更高而FAS的结果更保守,这项研究反而PPS的VV116治疗效果反而略差,非常值得继续深挖背后的原因。
我们知道,对于新冠感染这个一个高度自限性的疾病,任何治疗都可以达到非常高的表面“有效率”,无论是穴位苯酚注射,还是维生素C口服,或者是形形色色的补充和替代疗法,表面治疗成功率都可以在95%上下。因此,缺乏安慰剂对照的临床研究在严谨性上会大打折扣,更不用说研究效力和样本量一般更低的非劣效设计。
03
如何看待VV116的临床价值?
VV116可能在对抗当下新冠疫情中作用充满不确定性。事实上,人们愿意为P药支付溢价,是因为这个药被证实能够减少重症入院和死亡,而不是减轻症状。很遗憾在本研究中两组的重症率过低,无法评估这个临床上最重要的指标。
P药进行了三项大规模的安慰剂对比随机临床试验EPIC-HR、EPIC-SR和EPIC-PEP,分别研究了高危患者、中危患者和暴露后健康人群的治疗效果。
这三项研究除了EPIC-HR达到预期研究终点,EPIC-SR研究并不能证明P药在减轻症状方面的效果好于安慰剂。
本研究中,患者中位年龄只有53岁,疫苗接种比例非常高,加上今年4-5月上海疫情中当时”动态清零”的策略主动发现感染早期症状相对较轻的人群,因此VV116研究的入组患者事实上更加接近于EPIC-SR的标准风险人群,这点从EPIC-SR的最终重症比例中也可以看出,最终28天内入院比例用药组小于1%,这点也在不久前发表在《柳叶刀》上的香港地区真实世界研究所证实。
P药效果在中危人群的改善症状效果约等于安慰剂,VV116不劣于P药,是否可以四舍五入VV116不劣于安慰剂。既然如此,何必花上几百上千元治疗一个本来就可以自动康复的疾病呢?为了能够提前一天减轻症状,是否值得让数以万计的人承担包括血尿、肌酐升高和生殖毒性在内的各种药物不良反应的巨大风险?
之所以P药能在全球获得超过200亿美元的销售,原因在于在当时的德尔塔毒株疫情中,EPIC-HR研究证实这个药物能够有效降低高危患者转为重症和死亡的比例,尽管目前上没有证据表明包括VV116在内的新冠口服药能够在奥秘克隆毒株所引起的疫情中做到这一点,我们依然需要来自更大规模安慰剂对照随机临床试验的高质量证据。
因为没找到篮筐,郭敬明和姚明比赛打乒乓球,结果平分秋色。
除此以外,本研究的临床持续临床康复定义选定为0-1分而不是0分,同样值得考量。因为这些患者的平均基线症状并不高,只有3分,约等于发烧大于39.1°C。如果把主观症状改善作为研究终点,尤其在非劣效性研究设计下,必须非常谨慎,因为这类临床终点不如病毒载量和重症率这样的“硬性结局”那么客观。我们可以看到一方面持续2天症状在0-1并不代表没有症状,也不能说明当时病人转重症风险降低,更不能表明病毒载量相对P药有更加明显的下降。
当研究者使用更加严格的症状完全消失作为终点的时候,VV116和P药在统计上不存在任何区别。
既然首要研究终点的25百分位两组没有差别,中位时间基本没有差别,使用症状完全消失的次要终点两者没有差别,“摘樱桃式”地仅凭找到一个相差一天的中位时间显然不能说明显著性疗效。我们需要VV116提供关键结局指标的更多证据,包括且不限于病毒载量改善的定量分析、进展重症风险更高人群的用药优效性证据,以及远期死亡结局的结果。
04
本研究可否证明VV116更加安全?
不能。三期临床试验的目的主要是有效性方面的评价,但是典型临床试验数百到数千例的样本量往往不足以暴露相对罕见的药物相关不良反应事件。另外,这个临床试验第一时间排除了潜在妊娠的患者,因此对于核苷酸类药物致畸性风险无法通过本研究获得。当然,仅仅一个月的随访更加无法说明VV116远期的安全性。
药物安全性是一个系统性的评价,需要结合疾病严重程度、相对疗效和患者/社会接受程度进行研判。如果一个患者感染新冠后进展为重症的风险非常低,那么严重不良反映即使风险水平极低,也是不能让人接受的;反之,如果患者的重症风险高,比如未接种疫苗的高龄老人,那么完全可以耐受较低程度的不良反应,只要潜在获益大于风险,那么这个药物就值得在临床使用。从研究中可以看出,VV116相对P药在不良反应上大约有10%的差异。目前看来对于高水平接种疫苗的轻到中度新冠感染人群,无论是VV116的67.4%还是P药77.3%的不良反应率,恐怕都很难让人接受,更不用说两者都存在2.6-5.7%不等的3级以上药物不良反应。P药的不良反应很大程度上来自利托那韦,包括味觉改变和药物间相互作用。VV116如果能够上市,这个药会面临来自辉瑞和盐野义下一代不含有利托那韦的直接竞争,很难说依然具备治疗期间安全性的优势。VV116结构上与瑞德西韦高度相似,理论上不良反应恐怕也相似,尤其是肝功能损伤方面,不一定每一个轻型的患者都适宜接受新冠口服药的治疗,尤其是年轻的、没有基础疾病的患者。
从入组病人的基线信息看,研究者为了保证非劣效研究获得期望结果,使用包括呼吸窘迫症状和研究者自由裁量在内的手段,精准排除了潜在进展为重症风险较高的患者,VV116临床研究的入组人群恐怕更适宜接受布洛芬这样的对症治疗,因为事实上低风险的他们本并不需要暴露在试验药物和P药所带来的风险中。
05
本研究是否有助于VV116尽快上市?
不是。今年五月的时候本研究的结果已经通过公司新闻稿公开,但是随之而来的却是公司股价暴跌20%。当时已经存在大量的声音抨击该研究诸多不严谨,投资界已经用脚对这个药物的市场地位投票。但是为什么当下论文发表虽然没有提供进一步信息,何时能够让患者使用上这个药物的问题又被舆论推到风口浪尖。
背后的变量是此时与当下疫情防控形势的转变。彼时中国以举国之力贯彻动态清零政策时,防止转为重症的新冠口服药并没有很大的市场价值,同时由于主动筛查患者,大部分患者在疾病早期就被识别出来,并在住院的环境中接受治疗和隔离,患者能够得到基本医疗照护。但是随着本月以来政策根本性转变,每个人成为自己健康的第一责任人。在这种情况下,我国的医疗机构因为病毒快速蔓延承担了巨大的压力,大规模推广能够在上游阻断轻到中型患者进展到重症的口服药物成为从患者到社会的刚需。如果P药不能够充分的供应且价格显然过高,尽快获得能够充分供应、且疗效可靠的国产替代成为了具有高优先级的政治任务。
顶刊发表和药品监管遵循不同的逻辑。期刊论文看中的是VV116作为一种不同机制的新冠口服药在新冠患者当中的创新价值,尤其是克服P药药物不良反应方面的价值。而批准药物在现实世界大规模使用,需要满足更多的条件,比如对药品监管部门公信力的影响,相关药物批准标准的基本要求,以及临床试验提供证据的缺口等等。社会对新冠口服药需要的迫切程度不能成为药品监管部门放松监管,让疗效未经充分证明的药物上市的理由。任何时候都不需要一个售价数百元,伴随各种不良反应,获益仅限于一天左右部分症状改善的药物,这里当然也包括盐野义的Ensitrelvir。把药物政治化,甚至上升到中国与西方、传统医学与现代医学之争,是没有多少意义的事情。每一个药都会有特定的使用场景,一旦上市,在当下混乱的医疗系统中,滥用、囤积居奇和供应不足立马会出现,而且会因为药监部门的背书而放大。当人们最终意识到药物的疗效存在诸多夸张的成分时,社会和个人已经为之付出了代价,这个代价部分会通过政府的公信力损失的形式体现。因为阿尔兹海默症药物Aduhelm
美国FDA深陷争议,其中的教训不可谓不深刻。我们现在真正需要的是切实降低重症率和临床有意义结局的产品,而不是虚假的希望,如果没有确凿的改善临床有意义指标的证据出现,与其贸然上市一个未经充分审视的产品,不如审慎地观望,因为最终药品监管部门还是需要对其终身负责。
如果缺乏高风险人群的证据,那么就去寻找证据。如果轻到中型患者重症率过低,那么就去入组高龄高危的患者,而不是将其剔除出去。既然今年4-5月上海能够在一个月中开展这项临床试验,现在开展类似研究的条件只能说更加成熟,而且可以通过研究者发起的研究、观察性研究、实效性临床试验等形式开展。临床试验需要从临床实际需求出发,而不是紧盯着监管部门审批要求的下限。医学创新应该以患者的福祉为中心,而不是迎合资本市场的击鼓传花。中国创新药产业已经进入到大浪淘沙的下半场,资本催生出的企业开始争夺存量市场,新一轮兼并破产和重组也在路上。创新药产业本来就是一掷千金博概率的属性,更大的市场属于敢打敢拼的厂家。
总结
和各大媒体热议的喜报不同,本研究并未说明VV116有什么显著临床价值。
非劣效性研究设计存在根本缺陷,缺乏安慰剂对照会导致无法评估药物的真实疗效;越是不严谨的非劣效研究越可能出现有利于新产品的结果,对这类研究结果一定要非常审慎。
对于新冠感染这种高度自限性的疾病,任何疗法都可以声称获得90%以上的有效率;在临床上缺乏实际意义的主观症状结局不能外推到现实意义更大的重症和死亡结局。
学术文章发表与药物监管上市遵循不同的逻辑,本次研究的信息并未突破药监局已经掌握的信息范畴,今年五月“动态清零”到当下“快速过峰”的政策和社会形势转变,不应该成为鼓动不符合上市条件药品入场的理由。
撰写:周吉芳
编辑:陈彦妃