查看原文
其他

“阴性”临床试验如何解读?看看NEJM怎么说

VIP说 2022-08-20

The following article is from 肿瘤论坛 Author 上海胸科 张波

作为四大临床医学期刊之首,《新英格兰医学杂志》鲜有发表与统计相关的文章。2016年,杂志却破天荒的连续发表了两篇与统计相关的综述性文献——临床试验结束后,“阴性结果”和“阳性结果”该如何解读。虽然文章已经发表了5年,但是不得不说,顶级期刊所发表的文章极具启发性,文章中的很多观点,对后续临床研究结果的解读非常具有帮助。笔者虽然不是专业的统计人士,但还是尝试对全文进行翻译,以期望对读者有所帮助。在原文中,多数举例来自心脑血管系统疾病的研究。笔者也会在每一部分的“补充”内容中,额外增加肺癌领域的相关研究实例。以下为编译正文。


一个设计良好的临床试验,其可信度来自于对于预先设定研究假设的推断,这可以帮助研究者避免基于探索性数据得到假阳性结论。但是,目前广泛存在的一个不合理的现象是:所有临床研究都以P值是否<0.05被人为分为“阳性”或者“阴性”结果,这种做法过于简单粗暴。P值应当被视作一个连续变量,P值越小,说明研究证据越强。此外,置信区间在表征治疗效应的不确定性时,同样有用。对于任何一项临床试验的解读,都应该是基于完整的证据(如主要研究终点、次要研究终点及安全性数据),而不仅仅是基于单一的终点。
在此,我们提出了面对一项主要终点为阴性的临床试验时,需要考虑的一些问题。文中的例子多数来自于我们专长的心血管领域,但其背后的道理一体适用。
 
结果为阴性时候的几个关键为题
当研究大于0.05这一预设的显著性水准时,说明这一治疗策略充满不确定性,我们第一反应可能是:哪儿错了?真的没有效果吗?有弥补的希望吗?下一步怎么办?以下12个问题的充分考虑及解答,可能会为结果的解读提供有效路径,分别是:1、有潜在获益的趋势吗?2、把握度足够吗?3、主要研究终点的选择是否合适(或者被准确定义)?4、研究人群合理吗?5、治疗方案合理吗?6、研究执行有缺陷吗?7、非劣效结论有价值吗?8、亚组分析显示阳性信号吗?9、次要研究终点有阳性发现吗?10、改变分析策略有帮助吗?11、有更积极的外部证据吗?12、是否有充分的生物学依据支持这一治疗?
 
一、有潜在获益的趋势吗?
在P值大于0.05的前提下,推断是否存在获益信号(获益倾向)需要经过充分考虑。当主要研究终点呈现完全阴性的结果,对于这类临床试验的解释可以干脆利落。例如,PERFORM研究探索了特鲁曲班vs 阿司匹林在缺血性卒中的疗效及安全性,结果显示,两组在缺血性卒中、心肌梗死及其他心血管事件组成的复合终点上无差异(HR=1.02,95%,CI,0.94-1.12)。这项研究因其中期无效性分析被提前终止,且并无安全性优势。这些数据支持将这项试验定性为“阴性试验”。
与此相反,TORCH试验分析了沙美特罗联合氟替卡松vs安慰剂在慢性阻塞性肺疾病中的疗效及安全性,主要终点全因死亡的P值为0.052,但是在其他结局中,包括COPD的急性加重、健康状态等指标,沙美特罗联合氟替卡松相较于安慰剂均展示了更好的疗效。因此,审慎全面的解读这项研究比单纯定性为“阴性”结果更加合适。
补充:如前文所述,基于P值是否小于0.05将临床试验简单的分为“阳性“和”阴性“过于简单粗暴,因此,文章开篇作者就提到,动态看待P值。对于P=0.06和P=0.6的研究,虽然均大于0.05,但是其解读可能是不一样的。只是,当把P值当成一个连续变量的时候,”无获益的阴性结果“和”有获益趋势的阴性结果“,其P值的分界点又在哪里呢?这对结果的解读又引入了不利的人为因素。
 
二、把握度是否足够
纳入的病例数不够有可能导致本来存在的疗效并不显著,即出现假阴性结果(II类错误)。例如,在一项临床试验中,研究者分析了比索洛尔相较于安慰剂在心衰患者中的疗效及安全性,首要研究终点——全因死亡风险的HR值为0.80 (95%CI,0.56-1.15),但是,研究仅有621例患者,试验的把握度不够。幸运的是,申办方扩大样本含量,进行了CIBISII研究,该研究纳入2647例患者,结果发现,比索洛尔相较于安慰剂可以降低34%的死亡风险(HR=0.66,95% CI,0.54-0.81),而HR的点估计值同样落在首个研究中HR值的95%的置信区间内。
总之,在一项临床试验中,如果因为样本含量太小而导致无法发现原有的治疗效应,宜将其称为“非确认性的”而不是直接定性为“阴性的”研究。足够的把握度需要充分的终点事件数,这可以通过招募更多的患者、纳入高危患者、延长随访时间、纳入出现频率更高的终点以组成复合终点等,达到这一目的。
补充:把握度不足导致试验遗憾错失阳性结果的研究比比皆是,而造成把握度不够的主要一个原因,就是在研究过程中对疗效进行了过于乐观的估计,肺癌领域,Pembro-RT研究是其中的典型代表。该研究探索了在免疫治疗的基础上,给予低剂量放疗能否改善患者预后,作者假设,联合低剂量放疗可以将12周的ORR由20%提高至50%(这是一个非常激进的假设),即提高2.5倍,此时的样本含量为74例患者。最终结果发现,两组12周的ORR分别为18%和36%,实际提高了2倍。虽然数据很漂亮,但是,由于样本含量不足,把握度不够,最终,P=0.07;而中位PFS虽然分别为1.9个月和6.6个月,但是,差异同样无统计学意义(P=0.19)。在临床试验中,因为把握度不足而导致假阳性结果出现的例子不胜枚举。

Pembro-RT研究的PFS

 

三、主要研究终点是否合适(被准确定义)
复合终点的应用虽然可以提高终点事件数,但不一定提高研究的把握度。例如,在比较吡格列酮和安慰剂在II型糖尿病患者中的疗效及安全性的PROactive研究中。研究者将死亡、心肌梗死、卒中、急性冠脉综合征、血管内手术和小腿截肢组成了研究的复合终点。最终,吡格列酮组和安慰剂组分别有514例和572例患者出现终点事件,P=0.08。但如果采用由死亡、心肌梗死及卒中组成的更加传统的复合终点,则两组分别出现301例和358例终点事件,P=0.03。因此,将其他终点引入组成复合终点,只是纳入了额外的随机噪音,稀释了真正的获益。
临床试验的成功有时候取决于对主要终点的清晰定义及准确判定。例如,在CHAMPIONPLATFORM试验中,研究者分析了坎格雷洛与氯吡格雷在接受PCI患者中的疗效,但研究因中期无效性分析被终止,因为在由死亡、急性心肌梗死及48小时缺血性血管再生组成的复合终点上,坎格雷洛并未带来获益。但是,该研究中,对于围手术期心肌梗死的定义无法有效识别出那些PCI后,很快出现心梗且标志物阳性的患者。因此,对于心肌梗死更加准确的定义可能会带来阳性结果,因此,在后续的CHAMPIONPHOENIX试验中,对于标志物波动的解读更加严谨,谨慎的判断围手术期心肌梗死的发生。最终发现,坎格雷洛相较于氯吡格雷,48小时主要终点(死亡、心梗、支架血栓及缺血导致的血管再生)风险降低22%,并使得FDA及EMA批准了该药物的上市。
补充:临床试验中,如何选择一个合适的主要研究终点是非常重要的环节,这一点,笔者之前已经专题推送过。点击:ITT分析、PP分析、TTF:临床试验中的这些概念到底是啥意思?
 
四、研究对象是否合理?
当研究出现阴性结果时,一个恰当的问题是:纳入的研究人群是否合理?例如,伊伐布雷定在稳定性冠心病患者中的两项研究BEAUTIFUL和SIGNIFY并未展示任何获益,但是,SHIFT研究则探索了该药能否降低心血管死亡风险及心衰导致的住院,结果发现,这一符合风险降低26%。因此,基于药物机制及前期研究,为瞄准目标人群开展确认性试验提供了重要基础。
补充:在肿瘤精准治疗理念的影响下,合理选择治疗人群十分重要。因为纳入人群不合适而导致研究遭遇滑铁卢的例子同样很多。代表性研究就是KeyNote-024研究和CheckMate-026研究在2016年ESMO年会的那场“天王山之战”。两者均是探索针对PD-1的免疫检查点抑制剂——K药和O药对比一线化疗在晚期NSCLC患者中的疗效及安全性,不同的是,K药的KeyNote-024研究聚焦的是PD-L1≥50%的患者,而O药胃口更大,瞄准的是PD-L1≥5%的患者,但是,最终结果是冰火两重天。K药获得阳性结果,并顺利开启晚期肺癌的一线治疗适应症,而O药就此错失一线。

KeyNote-024研究和CheckMate-026研究
 
五、治疗剂量是否合理?
在临床试验中,确认一款新药的合理的给药剂量是非常具有挑战的事情。回过头来看,TARGET及MOXCON两项研究的失败可能与错误的剂量选择有关——前者药物剂量太低,后者太高。但即使有新的体外及II期剂量探索数据,该药在开展后续临床研究的可能性也不大。某些研究通过设立三个组,包括两个不同的剂量组来最大限度的减少这一风险。例如在PEGASUS-TIMI54研究中,在为心梗患者带来长期获益方面,60mg替格瑞洛的应用击败了90mg剂量组和安慰剂组。
补充:合理的治疗剂量将为后期III期临床研究的开展奠定坚实的基础。过低的剂量可能会影响疗效,这点显而易见,但是,过高的剂量也并不一定导致疗效的增加,因为,过高的剂量可能带来明显的不良反应,导致患者频繁出现给药中断、给药终止及给药延迟,从而影响疗效。这一点,代表性的研究为ASCEND-4研究。该研究探索了对于ALK融合阳性的患者,塞瑞替尼与标准化疗的比较,结果,塞瑞替尼在750mg空腹服用的情况下,3度级以上不良反应发生率达到78%,比化疗组的62%还要高,这也是为数不多的靶向治疗毒性高于化疗。塞瑞替尼组,80%的患者因不良反应需要剂量调整或者治疗中断,而这一比例在化疗组为45%,这种频繁的剂量调整也直接影响了塞瑞替尼的疗效,导致其中位PFS仅为16.6个月,远远低于其他二代治疗药物。虽然塞瑞替尼后续开展了不同剂量的探索,并发现450mg随餐服用可以降低不良反应并提高疗效,但这毕竟只是小样本探索性研究,而不是确认性结论。这也从侧面提示,塞瑞替尼在进行剂量探索时候存在一定的缺陷。

ASCEND-4研究的PFS
 
六、研究执行过程是否有缺陷?
不能高质量的执行研究方案有可能导致治疗效应被稀释,甚至完全消失。例如,在六个国家中进行的TOPCAT研究探索了安体舒通vs.安慰剂在保留左心室射血分数的患者中的疗效及安全性,其主要研究终点的HR值为0.89 (95%CI,0.77-1.04)。但是,在俄罗斯及格鲁吉亚患者中,很少出现终点事件,提示可能在这两个国家中,研究方案并未被高质量执行甚至纳入了不符合入组标准的患者。如果将分析人群局限在其他4个国家,则HR值为0.82 (95%CI, 0.69-0.98; P = 0.026)。基于这种事后分析能否提供足够信服力的证据,在这部分患者中是否应该推荐安体舒通,目前尚有争议。
补充:没啥好补充的。高质量的执行是临床研究的根本之一。没有高质量的执行及质控,一切免谈。
 
七、非劣效结论有意义吗?
当新的治疗手段相较于阳性对照没有达到优效性标准时,能否得出非劣效结论呢?需要注意的是,只有当新的治疗手段具有某些独特的优势(如更安全、更微创)的时候,这种非劣效结论才可取。但此时,非劣效界值需要提前确定。例如,VALIANT研究探索了并发心肌梗死的患者,接受缬沙坦、卡托普利或两者联合治疗的疗效及安全性,研究并未发现缬沙坦在降低死亡方面的获益(HR=1.00;,97.5%CI, 0.90-1.11;P=0.98),但是,由于其置信区间上限并未超过预设的界值1.13,因此,允许研究者得到缬沙坦非劣效于卡托普利的结论。因此,对于那些接受卡托普利治疗后出现咳嗽等难以耐受的不良反应的患者,缬沙坦提供了一个替代选择。
补充:这一部分笔者专门咨询了统计学方面的专业人士。这一部分的内容似乎欠妥。临床上,通常可以进行非劣效转优效设计,而基本不会在优效结论没有达到时,转为非劣效,这样有“先打靶,在确定靶子的位置”的嫌疑。
 
八、亚组分析是否有积极信号?
对主要研究终点为阴性的临床试验进行亚组分析是合理的,但是得到的结论往往并不可信(除非有强烈的生物学依据支持这一发现)。通常进行亚组分析时候,研究者并未进行多重性考虑。即使经过交互性检验发现有统计学意义,这样的结论充其量只能用来提出研究假设。实际上,我们在本领域很难找出哪个确认性临床研究,是基于阴性临床试验中的阳性亚组分析得到的。
但是基于亚组分析确实启动了一项多中心临床研究。SYNTAX研究探索了对于有三支或者左主干病变的患者,PCI vs.冠脉搭桥的疗效及安全性,最终发现,整体人群中,冠脉搭桥的效果更好,但是,在亚组分析中,左主干病患的患者,PCI的疗效及安全性是可接受的(甚至可能是更优的)。这项事后分析结果使得研究者开启了EXCEL研究,以比较在左主干病变的患者中,PCI与冠脉搭桥患者中的疗效,研究结果预期于2016年结果。
补充:关于亚组分析,笔者也曾经进行专题推送。点击:亚组分析到底靠谱吗?从FLAURA研究谈起
 
九、次要研究终点有阳性发现吗?
通常情况下,当主要研究终点为阴性的时候,次要研究终点的分析就是探索性的,相应的,监管部门也就当然不会基于此批准药物上市。但是,当次要研究终点的效力足够强的时候,也可能会影响临床实践。例如,ASCOT研究比较了氨氯地平和阿替洛尔在高血压患者的应用,研究的主要终点是非致死性心肌梗死和致死性冠脉疾病组成的复合终点,HR为0.90 (95%CI,0.79-1.02;P = 0.11)。但是,在卒中、心血管事件、全因死亡及新发糖尿病预防方面,氨氯地平展示了更好的疗效(P值分别为P <0.001,P<0.0001,P =0.02,P<0.0001)。回过头来看,在高血压相关的临床试验中,复合终点里面,将卒中排除在外有点奇怪。这一研究结果支持将阿替洛尔作为抗高血压药物的一线或二线治疗。
 
十、改变分析方式有帮助吗?
协变量分析
对那些可能影响主要研究终点的协变量进行分析相较于不分析,可轻微提高研究的把握度,但是,哪些变量需要被纳入需要事先明确说明,否则最终结果就只能是“有趣的”及“探索性”的。
例如,SPARCL研究探索了阿托伐他汀vs安慰剂在预防卒中及短暂性脑缺血发作中的疗效及安全性,未进行多因素校正的P值为0.05,通过预设的多因素校正,对地理区域、年龄及性别进行校正后,HR=0.84(95% CI, 0.71-0.99; P = 0.03),但哪一个是预设的主要分析目前并不清楚。在研究假设模棱两可的情况下,严守0.05的显著性水准是非常重要的,否则,同行会质疑,这是否是一个“阳性”结果?对于这种情况,一个合理的结论是:治疗有获益,但是证据级别较低。
实际治疗集与符合方案集
基于患者实际接受治疗方案进行分组的意向性分析(ITT分析)是疗效分析的主要方法(笔者注:经过与统计学专业人士确认,原文对ITT的定义有错误,ITT分析是基于患者随机化的结果进行分组,而不是基于实际治疗方案进行分组)。当ITT分析可能未达到统计学显著性,此时,实际治疗集与符合方案集可能与真相更加接近,但是,基于这两个集群进行分析有可能引入偏倚,因为对治疗方案依从性差或接受交叉治疗的患者可能和整体人群相比,存在不一样的预后,因此,这一分析很少会影响到基于ITT分析得到的结论。但是,基于实际治疗情况进行安全性分析是合理的。
STICH研究探索了对于存在左心功能不全的患者,心脏搭桥手术与内科治疗的疗效及安全性,在ITT人群中,经过中位4年的随访,患者全因死亡风险降低14%(HR=0.86,,95%CI, 0.72-1.04; P =0.12),但是,在实际治疗集与符合方案集分析中,心脏搭桥术可更加显著的降低患者死亡风险(P值分别为<0.001和P=0.005)。但是,最终的结论仍然是两组之间的主要研究终点无统计学差异。在ITT分析人群中,心血管相关的死亡及住院风险显著降低。此外,经过10年的随访后,心脏搭桥较内科治疗显示了可降低死亡风险(HR=0.84,95% CI,0.73-0.97; P = 0.02)。因此,完整的数据支持心脏搭桥手术是在左心功能不全的患者中具有重要地位。
与此相关的另外一个问题就是如何解释患者存在较高交叉率的现象。例如,BARI 2D研究分析了II型糖尿病患者中,冠脉血管重塑与内科强化治疗的疗效及安全性,由死亡和主要心血管事件组成的复合终点中,两组的5年结局无差异(P值分别为0.97和0.70),但是,研究中,42%的强化内科治疗的患者接受了冠脉血管重塑治疗,这就对单纯强化内科治疗的疗效提出了疑问,虽然这种交叉是保守治疗的一部分。当交叉比例过高的时候,对结论提出一定的质疑是合理的。
重复事件分析
在涉及慢性疾病的研究中,传统的研究终点聚焦在首次出现事件的时间而忽视了后续的重复的事件。这可能会导致统计效能的丢失并低估治疗效果。例如,CHARM研究分析了坎地沙坦或者安慰剂在保留左心室射血分数的心衰患者中的疗效及安全性,在由首次心衰恶化导致的非预期入院、心血管事件导致的死亡所组成的复合终点中,HR为0.89 (95%CI, 0.77-1.03; P = 0.12)。若纳入因心衰导致的重复住院后,HR值降低为0.75 (95% CI, 0.62-0.91,P=0.003)。最后,作者认为,在心衰相关的临床试验中,“重复事件”应当被常规纳入研究终点。
补充:关于ITT分析及PP分析等,笔者在之前的推送中有过涉及(ITT分析、PP分析、TTF:临床试验中的这些概念到底是啥意思?)。通常情况下,ITT分析更为保守,而PP分析可能会夸大药物疗,两者通常相互补充。但是,ITT分析由于严格遵循了随机化原则,因此是疗效分析的金标准。肺癌中,极少出现ITT分析与PP分析结果不一致的情况,典型例外是JUST研究。该研究于2018年7月发表于JTO杂志,探索的是新型化疗药物奈达铂与顺铂联合多西他赛在中国人群中的疗效及安全性。在ITT分析中,奈达铂和顺铂组的中位PFS分别为4.63个月和4.23个月,P=0.056,差异无统计学意义。但是,在PP集中,两组中位PFS分别为4.63个月和4.27个月,P=0.039。由于在研究方案中已经规定,疗效基于ITT人群进行分析,因此,作者在最终结论中也明确指出,两组的PFS无差异,即结果以ITT分析为准。

JUST研究中的ITT分析及PP分析数据
 
十一、有更充分的外部数据吗?
有前期充分的数据、统计效力足够的前提下,得到一个阴性结果总是令人惊讶的,此时,前期研究的证据强度及研究质量需要被仔细审查。首先,非随机对照研究中的比较、替代终点的应用都会降低证据的强度。纳入相似研究人群的类试验及Meta分析可能会更有价值。
例如,ASPEN研究比较了在II性糖尿病患者中,阿托伐他汀vs.安慰剂的疗效。在由心血管相关事件组成的复合终点中,HR=0.90(95% CI, 0.73-1.12; P=0.34)。考虑到其他相似研究得到阳性结果,该研究的结论是令人失望的。但是,在更大样本含量且设计相似的的III期CARDS研究中,HR=0.63(95%CI, 0.48-0.83; P=0.001),基于两项研究的Meta分析同样得到阳性结果。两者结论的不一致并非大问题,因为其95%的置信区间是重叠的,因此,ASPEN研究可能随机化出现问题,导致其不够走运而已。
需要注意的是,基于Meta分析得到的阳性结果需要被谨慎的解读,因为纳入人群的选择、治疗方案、研究终点的定义、试验的设计及执行均是不完全一样的。总体来说,来自设计良好的随机对照研究的数据比小样本的Meta分析得到的阳性结论更加可信,当两者结论明显相反时,则需要进一步的研究来解决这一问题。
补充:充分的外部证据是注册研究重要的证据,当然如果一项研究设计严谨、执行质量很高,同时得到的是明显的“阳性”结论,这种情况下,外部证据可能并不是那么重要。但是,当单臂设计、加速批准或者如JUST研究一样,ITT分析与PP分析得到相反的结论,此时,充足的外部证据就显得尤为重要。还是以JUST研究为例子,其实,从严格的统计学意义来讲,ITT分析中的疗效是阴性的,但是,奈达铂仍然获得了肺癌的适应症,很重要的一个原因是在日本人进行的III期临床研究——WJOG5208L研究,得到了OS的阳性结果,两组分别为13.6个月和11.4个月,P=0.037,因此,这一研究结果为JUST研究提供了充分的外部数据,考虑到JUST研究中,PP分析仍然是阳性结果,因此,ITT分析的阴性结果,有可能只是不走运而已。

WJOG5208L研究的主要终点——OS
 
十二、是否有充分的生物学依据支持这一治疗?
临床试验尽量远离那些生物学机制尚有争议的研究领域。几乎任何一项确认性III期临床研究开展之前都会积累大量的动物实验及临床前证据。很多大型临床试验的失败已经带来了足够多的教训。例如,通过调节高密度脂蛋白的水平,降低心血管事件发生率似乎是一个有前景的治疗策略,但目前没有任何一项临床试验为这一假设提供充分的循证依据。事实总是不遂人愿。如果临床试验的失败与方法学的缺陷无关,那么就该想一想:是不是有充分的生物学依据开展这项研究呢?
补充:一切没有生物机制作为基础的统计分析都是耍流氓。
 
     
这十二个问题是我们面对主要结果为阴性的临床试验时需要考虑的问题,当然研究者的解读需要非常谨慎,深思后向以下三个方向考量:
其一,宣布为阳性结果。只有在极端特殊的情况下,才会把一项未达到预设的主要研究终点的研究宣称为阳性结果。当主要研究终点为阴性,但有重要意义的阳性结果被发现时,下表列出的5项研究提供了如何描述研究发现的范本。但是,这种发现虽然可以改变指南,但几乎不会改变监管部门的决定。


当然,CAPRICORN研究是个例外。该研究评估了心梗后伴有左心功能不全的患者,卡维地洛vs.安慰剂的疗效及安全性。研究并未达到由死亡和住院组成的符合终点(HR=0.92;95% CI, 0.80-1.07; P = 0.30),但是,单纯看全因死亡风险,卡维地洛提供了相关获益(HR=0.77; 95% CI,0.60-0.98; P=0.03),在与监管部门沟通后,卡维地洛获得FDA的批准。可能全因死亡风险是其原始的主要终点(研究期间对研究终点进行了不走运的修订),且有外部证据支持β受体阻断剂在这部分患者中的获益。
其二,改善后续临床研究的设计。通常,申办方在启动一项临床研究前,往往会获得充分的依据来支持研究的开展。因此,当结果为阴性时,申办方可能会再开展一个临床研究,此时,需要考虑调整治疗方案、修订研究人群、改变研究终点及增加样本含量并提高研究的整体执行质量。但是,这一困难且耗资不菲的决定,前提是基于务实的判断而非盲目的乐观。
例如,在SYMPLICITYHTN-3研究中,肾脏神经阻断并不能控制难治性高血压。对这一结果的合理解释包括:混杂的研究人群(部分研究人群可能对该疗法本身就不太可能产生响应)、能量递送不足、治疗药物的改变、对向均数回归没有有效控制。在开展另外一个大型试验之前,在未口服抗高血压患者中进行的机制研究正在进行,以判断这一治疗手段是否凑效。
其三,宣称治疗无效,果断放弃。一项随机对照研究的最终目的是区分治疗是否有效,无效更为常见。因此,当一项研究并无获益信号,甚至有安全性问题,果断放弃是明智的选择。血栓吸引术在急性心肌梗死的患者中是一个很好的例子。基于几项研究得到的有争议的结果后,两项大型随机对照试验发现,该治疗手段并不能给患者带来获益。
 
 
本文中,我们提出了当一项研究未达到统计学显著性水准的时候,研究者需要考虑的几个问题,这有助于判断新的治疗策略是否仍然具有价值。最终的结果包括基于完整的证据,宣称获得“成功”、改善后续研究的研究设计、接受治疗无效的事实。当然,最好的做法还是事前对研究进行完整的规划。研究前有充分的病理生理学及其他理论依据,研究中选择适合的人群、恰当的终点、足够的样本含量、合理的终点定义、谨慎的剂量确定,失败后批判性的对研究进行解读,研究者最终会得到一个合理且明确的结论。
 
     
精读完全文,笔者最大的感触是《新英格兰医学杂志》的文章确实极具启发性。从事后的角度看,文章为我们解读阴性结果提供了重要的启发,而从事前的角度看,这何尝不是我们在设计临床试验的时候,需要注意的“雷区”和需要吸取的教训呢?

精彩推荐:


1.  全网必收藏PD-1精美幻灯


2.  全网必收藏PD-1精美幻灯 PART Ⅱ


3.  2021 PD-1治疗面面观合集


4.  PD-1治疗最全信息大汇总


5.  史上最全癌种免疫治疗合集


6.  史上最全PD-1肿瘤数据卡问世


7. 【VIP说】全系列-回复20210520



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存