学习一点临床试验小知识(第一版,2016-08-07)
医药研发社交平台翻译志愿者联盟2016-08-04
这是联盟翻译、编译的第三篇作品。【医药研发社交平台】对本文内容负全部责任。敬请老师朋友们批评指正。衷心感谢!
* 其它常见终点 5. 理解关键的数据统计概念 6. 展示临床试验结果的常见方法 7. 评估临床试验重要性的关键问题
* 新药产生于实验室,研究者在实验室里鉴定、分离和研究上千种可能用于治疗肿瘤的分子。* 一旦候选分子(化合物)在实验室中被鉴定,就需要对其进行严格的临床前测试(在实验室和或动物体内),评估候选分子的化学、生物和毒性特性(候选分子的风险)。* 临床前测试能够帮助研究者快速了解一种化合物是否有抗癌活性。* 如果临床前研究的结果是肯定的,该化合物就可以用于临床试验:临床试验包括多期研究,通常先在健康志愿者身上进行小规模研究,然后分步评估药物对患者的疗效。每一期研究中,只有严格符合安全和效果(疗效)标准的化合物才能用于下一期临床研究。* 当临床试验结果证明化合物的安全性和有效性,公司可以向监管部门申请上市许可(允许销售和在日常医疗实践中使用药物)。通常,上市许可需要在临床III期成功后申请,但如果适用疾病的治疗药物少,或者叫做“高医疗需求”,申请时间也可能提前。* 最终,上市许可被批准以后,医生可以在处方中使用该新药。监管部门对颁发给药物的许可证有严格的规定——制药公司销售的药物只能用于治疗患有许可证或标签中所描述的疾病(适应症)的患者。* 药物的使用仍然根据被批准的现行医疗规范进行监管。图 1:药物开发过程
临床试验可以分为四期:第一期: 安全性评估第二期: 药效评估第三期: 在一个大的患者人群中确认结果第四期: 临床实践中评估治疗效果
依据癌症的阶段,临床试验倾向于在以下几点中寻找变化:
* 总体生存率(OS)是指在诊断后或治疗研究中一段规定时间内患者的存活率;在治疗开始后一段规定时间内患者的存活率。OS通常被认为是一个五年生存概率,即患者在诊断或治疗完成的五年后的存活率。不同疾病诊断后的总体生存率将有很大差异,如某些癌症会比其他类型有更好的预期(存活率)。从OS来评价某种疗法效果,需要结合对于治疗的癌症背景和预估的总体生存率来评估。
* 无进展生存率(PFS)是指患者在病情未恶化的情况下继续存活的比例(例如:无进展疾病(PD))。举例来说,PFS-6是指患者在开始接受治疗后6个月内并且未恶化的存活比例。
疾病发展往往伴随着症状和不适,所以延长疾病的发展对患者而言是非常有意义的举措,并且是医生和护士的一个重要目标。
如果某种药物变得无效,患者可以切换到另一种疗法(交叉)或采取其他的治疗方法。不同于其他的试验终点(如OS),PFS不受交叉疗法或者后续治疗线的影响(一般后期疗法不同于前期疗法),因为它是直到病情恶化时才适用的测评指标
* 生存质量(QoL)临床试验可能需要评估治疗对患者生活条件和能力影响。这些评估是通过生活质量标准(调查问卷和量表)来衡量,这些标准被开发用于评测被癌症诊断影响的生活的特定方面。现在的一些临床试验包含了患者报告的结果指标(PROs),作为衡量QoL的一种方法。这些衡量方法展现了在日常生活中治疗方法的影响,因此对患者来说尤为重要。
* 疾病控制率(DCR)或者临床受益率(CBR)在一段时间内癌症缩减或者保持稳定的患者的百分比。DCR是完全,部分缓解以及病情稳定率的总和。* 缓解时间(DR)从确认部分缓解(PD),完全缓解(CD)或者病情稳定(SD)开始到出现治疗后的病情进展(PD)之间的时间。
体能状态(PS)分别考察癌症患者在治疗前,治疗期间以及完成治疗后的各个阶段中是否具有完成日常生活所需的基本的行为能力。PS评级的具体数字代表了因病致残的不同程度,以及/或者疾病症状的严重程度。两个主要的评分标准是:(1) 东部肿瘤合作组(ECOG)从0级到5级评估患者的体能状态,0级是具有完全生活行为能力,5级是死亡。一个评级为3的人,表明他的能力仅限于生活自理,或者说他的50%的醒着的时间是在床上或者轮椅上度过的。(2) 卡氏状态评价癌症相关的症状的严重程度以及致残程度,级别从100%(无症状)到0%(死亡)。一个50%的评级表明一个患者需要大量的援助或者频繁的医疗护理。癌症治疗预计会影响PS的评分,如果疾病负担减轻了则评分增加,如果治疗产生的副作用影响了患者的日常行为能力,则导致评分降低。进展时间(TTP)进展时间是指从随机直到肿瘤进展(不包括死亡)的时间。它不同于“无进展生存期”(PFS)—从随机到肿瘤进展或者死亡的时间。相对生存率在给定的时间间隔之内,跟相同年龄和性别的未患癌的普通人相比,癌症患者的存活几率。疾病/无复发生存期(DFS)经过治疗后,被治者在无疾病状态下的生存时间。无远处疾病/无复发生存期(DDFS)一个患者在经过治疗之后,在原发病灶以外没有出现新病灶的时间(没有出现新的转移病灶的时间,疾病转移是指肿瘤从患者的一个器官或者身体的一个部位转移到另一个非相邻的器官或者身体的其他部位)。无侵袭性疾病生存期(IDFS)在辅助治疗后患者没有出现侵袭性疾病的生存时间。辅助治疗是指添加在主要治疗形式以外的治疗,比如手术之后的化疗,通过摧毁可能残留的癌症细胞以推迟或者防止疾病复发。最小残留疾病(MRD)在治疗中或者治疗后残留在患者体内的恶性肿瘤细胞,它是导致像白血病这类的癌症复发的一个主要因素。无“事件”生存期(EFS)从开始治疗到出现预先设定的“事件”之间所持续的时间。其中,这些“事件”可以包括疾病或者治疗所带来的特定的并发症。病理学完全缓解(pCR)治疗后没有出现任何残留的侵袭性癌症。
图三中曲线显示两种不同配方的同种药物给药时间和血药浓度的关系。* Cmax 是指定给药干预的最大血药浓度。
* Ctrough是指定给药干预的最小血药浓度。当达到Ctrough时,表示需要再次给药。因此从给药到达到Ctrough的时间同给药频率相关。 桥接试验(Bridging Study)终点桥接试验用于测试药物在不同患者或给药方法亚组之间是否有区别。例如,桥接试验可用于比较具有不同体质指数(BMI)值患者的情况区别,从而判断浓度是否需用体重来矫正。
不良事件(Adverse events, AEs)当治疗被描述为安全时,不代表用药无潜在风险,只是表示其利大于弊。不良事件是指治疗相关的非预期的症状、表现(例如,非正常的实验发现等)、或疾病。不良事件能根据严重程度分级。 表 1:不良事件分级
统计学通过分析和评估临床试验中的数据,为临床治疗的有效性提供准确的措施;同时,统计学分析不同的治疗方案可能会因为发生某些事件(某一疾病的信号,症状或者致病因素)而产生的其他的可能性。根据以上,统计学能够为治疗方案的时效性和有效性提供数据上准确的方法。对临床试验结果的正确解读基于恰当而准确的统计学分析,以及正确理解这些试验结果在理论上以及实际对于患者到底意味着什么。 通过数据描述临床试验中的不同点从统计学上说来很重要不同组之间的数字上的差别;在一个治疗组中,某一数值(比如获得CR的人的数量)和另外一治疗组之间的这一数值的差别明显超过任何偶然情况下的预期,这就是有显著统计学意义。概率值概率值即假设在完全一样的治疗方案中,通过偶然的几率获得符合统计学理论结果的可能性。概率越低,这个结果偶然发生的可能性越小,即意味着更大的可能性是这个结果是试验中的药物引起的。根据不同的情形,概率值可能不同,但是通常是0.05。0.05的概率值指的是偶然事件发生的可能性只有百分之五。因此,这种试验结果是因为治疗方案的不同而导致的,而不是偶然随机的事件。图 4:p值和统计学重要性
图 5:中间值
* HR为1时,表明试验的2组发生某种不良事件风险无差异。HR 2时,则意味风险翻倍;HR 0.5时,风险降低50%。* 图6,A组相对于B组而言,其总体生存期(OS)的相对风险比(HR)为0.73。这表明接收A药治疗组患者发生疾病进展或死亡的风险较B药组患者降低了27%。计算公式:(1-0.73(HR))*100=27%。更重要的是,风险比与中位值不同,风险比对整个临床试验过程所发生不良事件的差异均纳入进行了考量,而不仅是局限在某个时间点或试验终点,因此,就患病整体人群而言,风险比是临床治疗效果最好的预测因子。基于风险比采用的方法学上,充分利用了临床试验中获得的所有数据,包括因任何原因未能完成整个临床试验过程患者的信息和数据。如果临床试验所采用终点事件发生率在不同事件点不恒定,采用风险比进行统计分析,意义重大。图 6:风险比
可信区间(CI)可信区间百分比(如95%可信区间)是指统计分析结果落在事先规定上限和下限区间的可能性。如一临床试验风险比的95%CI位0.65(下限)-0.80(上限),则说明,在相同研究条件下,对相同适应症人群而言,HR统计分析结果有95%可能性落在0.65-0.80范围内。就试验结果的精确度而言,可信区间大小的设定,如何能对临床试验提供更有价值的信息。一个试验结果能否投射到真实世界中的总体患者群,可信区间(CI)是一个重要的参考指标。图 8:可信区间
NNT是一项统计数值,是指一个患者为获得特定的终点效益而需要接受指定治疗(或治疗组合)的实际患者人数。NNT是从临床研究的数据中计算得到的,并被视为一种有效量度,可用于判定治疗是否有益于大量接受药物治疗的患者还是只有益于少量接受药物治疗的患者。NNT越小,治疗越有效。比值比(OR)治疗有效性的一种量度。OR是在治疗组中发生事件的几率,可表示为在对照组中发生事件的几率的比例。OR越接近1,在治疗干预和对照干预之间的效应差异越小。如果OR大于(或小于)1,则治疗效应优于(或劣于)对照治疗的效应。
统计学方法允许对所有来自一项研究的数据进行分析,并审核采用简单的中值测量(在试验过程中的特定点所取的测量结果)所无法说明的经时数据,以找出是否在治疗之间存在着统计学意义上的显著差异。采用正确的统计工具,我们可以对治疗效果进行精确测量,测量同时也考虑到患者接受治疗的不同起始时间和时间长度。
(1) Kaplan-Meier(KM)曲线KM曲线表示在连续的时间范围内仍然存活(或无病症或其他一些特定的治疗结果或终点)的研究人群的比例。这是用于表示总存活率或疗效的最常用方法。在显示治疗研究总存活率的KM曲线的情况下,该曲线提供了一定时间段的曲线图。他们比较了接受研究性药物的患者与对照组中的患者,表明在一定时间仍然存活的患者比例。可以根据患者一直接受了多久的治疗来计算这一比例,而不是根据患者何时进入该研究而进行计算。
图 9:Kaplan-Meier(KM)曲线
曲线分离越大,所分析的治疗组研究终点之间的差异就越大。如果KM曲线所代表的治疗组遵循类似的路径,则表明,在所测量的终点内的研究组之间,仅存在着少量差异。如果几组曲线是重合的,则意味着在那个特定的时间点上,所测量的终点的两个研究组之间无任何差异。
图 10:森林图
(3)瀑布图这种图表类型反映每例患者个体,如每例患者肿瘤的反应率状态是否为进展、稳定或改善。在肿瘤临床研究中,瀑布图常被用于阐释客观缓解率(ORR)的数据。
图 10:瀑布图
临床试验的研究周期是指一种药物或治疗处于研制路径的哪个阶段。例如,只有在早期临床获得令人鼓舞的结果之后,才会在大规模的患者组中开展III期临床研究,且III期临床研究常被用于支持新药的注册申报。主要终点是什么?主要终点是临床试验最重要的终点,常被用于评估治疗的疗效。理解终点和肿瘤类型的关系,以及主要终点对患者的意义对于理解临床研究的显著性极为重要。临床研究的对照药或对照组是什么?理解临床研究对照组的意义可以帮助理解临床研究的重要性。例如,一项用于对比研究性治疗与护理标准的研究就会比用于对比研究性治疗与疾病处置过程中未经批准的治疗或安慰剂而重要得多。多少患者参与了本研究?一般而言,参与一项临床研究的患者越多,其结果越有意义。由于结果来自于大规模的患者,因而某些罕见的患者反应对整体统计的影响就会有所下降,从而该结果就能够更精确地反映治疗是如何影响本研究以外的普通患者人群的。p值是否有统计学意义?p值有助于表明研究结果的可能性是由于概率还是所测试的治疗方法之间确有差异。p值小于0.05为显著性的,说明偶然发生的结果只有低于5%的可能性。
BMJ Clinical Evidence – glossary. Accessed November 2012. Available at: http://clinicalevidence.bmj.com/ceweb/resources/glossary.jsp
Harris M, Taylor G. Medical Statistics Made Easy Scion Publishing 2006 Ltd ISBN: 9781904842552
Greenhalgh T. How to read a paper: Getting your bearings (deciding what the paper is about). BMJ 1997;315:243–6
European Federation of Pharmaceutical Industries and Associations (EFPIA). A Highly Regulated Industry. Accessed November 2012. Available at: http://62.102.106.100/Content/ Default.asp?PageID=361
Response Evaluation Criteria In Solid Tumors (RECIST). RECIST. Accessed November 2012. Available at: http://www.recist.com/index.html
The Eastern Cooperative Oncology Group (ECOG). Introduction to ECOG. Accessed November 2012. Available at: http://www.ecog. org/general/intro.html
我们对罗氏表示最诚挚的敬意和谢意!感谢为中国医药研发事业做出的杰出奉献!
图片由好朋友图娅友情提供。我们衷心感谢!
参与本文编译工作的朋友有:项目总监:AmandaP2-3: HughP4-5:张忻P6-7:遥遥P8-9:孙晨P10-11:艾薇P12-13:EnjoyP14-15: 于文华P16-18:Amanda