查看原文
其他

诺华|用data42实现制药公司内部临床试验数据共享

智药邦 智药邦 2022-09-24

作为一家全球顶尖的、历史辉煌的制药公司,诺华内部拥有大量的临床试验数据,数据量级别在200万患者年左右。

然而,在生物制药公司内部实现临床试验数据的广泛访问和使用,历来受到技术、文化和政策的阻碍。诺华内部的数据共享请求数量远远超过了外部的数据共享请求数量。

2022年2月25日,来自诺华的Gabriel S.Eichler等人在Drug Discovery Today发表文章,介绍了诺华如何尝试通过一个名为"data42"的项目来全面解决临床试验数据共享问题。

以下是全文内容:

亮点

•诺华公司成立了一个项目,使(研发)数据的访问和重新利用常规化。

•许多问题经常阻碍临床试验数据的流程化和规模化使用。

•我们有责任保护患者的数据,同时最大限度地利用这些数据来推进医学发展。

•公司以患者至上的方式加速项目的推进。

•大多数公司内部对于临床数据的请求,都可以自动获得批准。

摘要

在生物制药公司内部实现临床试验数据的广泛访问和使用,历来受到技术、文化和政策的阻碍。诺华公司试图通过一个名为"data42"的项目来全面解决这一问题。在此,我们探讨了不同的企业利益相关者如何制定基于风险的数据访问方法,以实现对匿名临床试验数据访问的流程化,并极大地改善公司内部对研发人员使用数据的授权其结果是,诺华公司内部的大多数临床试验数据请求都能得到自动批准。本文探讨和讨论了这一框架的开发过程及其对诺华公司和更广泛的行业的影响。

引言

在其漫长的历史中,诺华公司已经产生了大量的临床试验数据来评估其药物的有效性和安全性,并将继续这样做。这些数据对于一个特定的新分子实体或药物的注册、报销和临床应用以及解决未满足的医疗和健康需求是非常宝贵的。然而,临床试验数据的效用不应该在试验团队的初级和二级分析完成后就停止。有了正确的技术技能和背景,再加上对数据收集背后的假设和设计的理解,并与新开发的方法和技术相结合,这些数据可以帮助在临床试验内和跨临床试验中获得更多的患者和药物资产洞察力。例如,这些临床试验数据可被用来识别:(i) 次反应或超级反应亚群(sub- or super-responder subgroups),从而发现更有针对性的病人群体,确保正确的病人获得更多的益处;(ii) 大型结果试验中(其中许多患者可能有合并症),可以就所应用的药物的替代适应症进行探索;(iii) 通过使用临床试验的纵向性质,更好地了解疾病的进展;(iv) 通过对多模态的数据(诸如 "omics"、临床和临床前数据等)进行更深入的调查,找到新的治疗途径/靶点。

由于存在各种挑战,寻找、获取和利用临床试验数据以进行更多的研究是非常困难的。从技术角度来看,数据很难找到、获取和使用,尤其是那些发生在多年前的试验。就程序上的挑战而言,临床试验数据通常被认为是敏感的,因此,受到基础设施的限制性保护。此外,在资产的整个生命周期中,试验数据有时可能被认为是特别敏感的(例如,在注册期间)。然而,在药物资产生命周期的大部分时间里,数据的敏感性较低。最后,从组织的角度来看,临床试验数据管理人员往往没有动力去分享和增强其他同事对数据的再利用。总的来说,许多因素阻碍了临床试验数据的流转和规模化再利用。

一个看似矛盾的情况是,与访问自己公司内部的数据相比,外部数据共享倡议似乎更容易找到和访问其他公司的临床试验数据。然而,到目前为止,我们内部数据共享工作和研究请求的数量远远超过了外部数据共享请求的数量,远远超出了使此类数据可从外部访问的任何法律义务。数据共享的努力如ClinicalStudyDataRequest.com, Vivli.org, TransCelerate’s DataCelerate,以及众多的创新药物计划项目(www.imi.europa.eu),都定期从行业参与者那里获取数据。这些倡议和平台经常产生高度编辑或匿名的数据集,旨在用于超越组织范围的共享,而data42主要用于内部数据共享。在前述的一些举措中,只有对照组和安慰剂组的信息可获取,因此,对一些用户的价值可能有限。

获取临床试验数据用于更多的研究仍然很敏感,因为业界有法律和道德责任保护患者数据的敏感性,同时也需要保护企业在商业方面的信息资产。如果使用不当,研究人员就有可能违反这些原则,那就与承诺的对病人隐私权保护不一致了。临床试验的受试者付出了他们的时间和精力来参与这些临床研究,研究人员有责任保护他们的数据,同时最大限度地有效利用这些数据来推动医学发展,改善对他们疾病的治疗和管理。在这种情况下,我们如何在诺华公司内部加强对多年临床研究和开发所取得的综合数据的利用?

可以假设,我们对数据的探索越多,我们就会发现越多,前提是这些发现是稳健的和有价值的。如果为不受控制的数据访问提供便利,产生不可靠的结论,那就会适得其反。因此,当我们致力于加强临床数据的再利用时,我们也必须准备好遵循良好的数据科学研究的原则以确保我们对数据进行的研究是可复制和有深远影响力的。

在此背景下,诺华公司成立了一个专门的项目,名为“data42”,目的是使研究与开发(R&D)数据的访问和再利用成为常规,即所谓的“企业中研发人员数据的民主化”。通过这个项目,诺华试图通过建立一个全面的临床数据访问框架来平衡上述挑战,实现整个研发与生产部门的定量科学家(如数据科学家和统计学家)和数据探索者(如临床医生和生物学家)的广泛的、企业范畴的数据访问。

正如以下章节所概述的,我们平衡了这种战略的风险责任和分段访问(这种分段访问在确保适当的治理水平和收集数据的临床试验团队的投入的同时,最大限度地提高了数据的可访问性)的责任。在此,我们分享了编写过程和由此产生的原则,即我们如何为额外的研究目的实现提供对临床数据的访问,以便其他努力开放敏感数据资源的生物制药组织能够将这些想法应用于他们自己的数据管理。

诺华的方法

诺华公司为解决获取临床试验数据的挑战而进行的尝试,即data42,旨在使研发数据资源的获取民主化,并实现再利用。期望通过利用这些数据揭示人类健康,临床试验设计和操作、疾病的自然史,甚至是诺华的药物和管线分子的新用途。

随着Data42项目对平台的技术和管理框架进行规划和绘制,临床试验数据访问的关键问题出现了。企业应该如何使整个组织的相关人员能够以符合我们的病人和社会的承诺的方式,访问一些最珍贵和信息丰富的数据,同时保持适当的风险与收益平衡?

一个核心障碍是管理和解释参加我们临床研究的病人签署的数千份知情同意书(ICF)。ICFs是用几十种语言写成的,被复制成几百个版本,并经常根据各个试验地点的需要进行修改,这些同意书对于确定在何种情况下可以使用病人的数据来回答试验相关的研究或其他研究问题至关重要。为了更好的履行我们在知情同意书中的承诺,保护患者隐私(包括遵守数据隐私法规,如美国的HIPAA和欧盟的GDPR),我们选择使用匿名化技术,使我们能够大大减少重新识别患者的风险。个人信息的匿名化支持负责任地使用数据,并允许为科学研究和其他合法商业目的创建有用的数据集,同时维护个人的数据隐私权。虽然这种匿名化方法不是本文的主题,但它是本文所含观点的核心,解决了临床试验数据被广泛重新应用的关键障碍之一。

为了建立和管理临床数据访问框架,本篇文章的作者与诺华公司的无数的其他顾问和审批人员一起,编写了公司的第一份企业范围内的临床数据访问指南。该指南是以公司的道德准则为基础,包含了公司对研究和开发中匿名数据使用的承诺。

临床数据访问工作组

为了制定临床数据访问指南,我们成立了一个跨部门的机构,名为临床数据访问工作组(Clinical Data Access Working Group, CDAWG)。为了确保所有诺华员工的观点和看法,来自整个组织的个人都被纳入CDAWG,以协调所需的关键属性、保障措施和操作元素,从而为提高效率和有效管理数据访问提供稳健的流程。多学科交流是找到强大的临床数据访问解决方案的关键,因为诺华的每个职能部门都有自己的观点、关心、目标和兴趣点(图1)。

图 1.CDAWG成员的不同兴趣和观点

通过一系列的定期会议和最大限度地重复利用数据的共同目标,该小组能够将一些共同的原则和评估风险的关键驱动因素结合起来。考虑的因素,如需要的临床研究数据的阶段 [prepivotal与pivotal(旨在从监管机构获得营销授权)] 以及这些数据所来自于项目的什么发展阶段,均被评估并认为有必要纳入任何风险评估中。

考虑到及时获取数据对研究人员来说往往至关重要,该团队就临床试验完成后如何快速获取数据这一问题互相挑战。找到流程化甚至自动化治理的方法是构建快速和有效的访问请求评估的关键。

该团队专注于数据访问风险的主要驱动因素。CDAWG最初估计,所有研究请求中的 80% 可以根据风险级别实现自动化,而剩余的 20% 需要额外的人工审查。总的来说,团队关注的是清晰的用例和组织的需求,同时期待指导方针将会通过第一个版本的实施所获得的实践经验而不断发展。 

我们的临床数据访问指南总体方法

与外部数据共享计划的保障措施和严格程度相同,要获得data42平台的访问权,需要完成相关的强制性培训,并确认使用条款,其中包括承诺不试图重新识别病人,并根据诺华其他政策适当和道德地使用这些数据。这一流程建立在诺华外部各方访问数据的现有控制之上。

Data42平台使被授权的研究人员能够探索哪些数据使可用的,主要是来自临床研究的基线数据,这些数据与有关试验设计特点的关键元数据一起提供。这个过程并不能直接获取单个病人的数据,而是帮助研究人员确定病人群组并选择他们想获得的项目的数据。这就解决了能够找到相关临床数据的难题,无论试验是什么时候进行的,哪个治疗领域,以及临床开发的哪个阶段。 在通过这个过程确定了所需的研究之后,就会提出对数据的请求,并由上述所述的数据访问指南管理和约束。

所提供的数据仅来自于已完成的和数据库锁定的研究。在一些特殊的研究中,在主要卫生当局提交研究报告时使用临时数据的特殊情况下(因为有必要进行长期的跟踪),这些临时锁定的数据被作为提交的完整数据,被纳入Data42平台。 

Data42平台旨在使申请数据的研究人员获得尽可能顺利的体验,因此,整个过程是透明的,研究人员在申请/调查表格中将得到指导。良好的数据科学原则被嵌入到data42的设计中,通过制定科学问题,提出详细的分析计划,并强制记录/公开传播结果,创建一个可识别、可访问、可互操作和可复制(findable, accessible, interoperable, and reproducible, FAIR)的知识圈和信息管理,促进了诺华公司的研究人员之间的合作,同时减少重复性。

匿名患者层面数据访问的整体方法采用了风险治理流程,该流程根据数据使用风险定义访问数据、管理结果和关键利益相关者参与的程序。我们确定了可能影响药品注册和市场准入的三个主要风险类别:低、中、高。低风险和中风险的数据使用可以通过自动化、可审查的流程进行管理,因此可以快速获取数据,同时只需让关键利益相关者了解数据的使用情况。相比之下,高风险的数据使用必须要有更精确的稳健记录,并在数据访问之前得到关键利益相关者的批准。风险调整后的管理是由表1所列的三个参数驱动的。

表 1.临床试验数据重用的风险驱动因素

以下是一个应用的例子。一个用户对探索疗效信号以产生药物的新适应症的假设感兴趣。该分析是根据一个正在进行III期临床试验注册的数据进行的。这种分析是一种高风险的数据使用,因为任何分析(即使是无效的)都有可能阻碍注册程序。在太早的阶段获取这些数据可能会导致完整性风险,因为在没有充分理解这些数据收集设计的情况下使用这些数据会产生误导性解释。这种误导性的结论可能会导致提交监管文件和向病人提供药物的延迟。相比之下,另一个用户分析一个尚未进入注册阶段的临床I期项目的基线数据是低风险的。这三个参数的每一个组合都被评估,并被赋予一个总体风险。

在确定了风险类别后,CDAWG列出了一个风险调整的管理途径,决定了整个研究活动中将要使用的数据如何记录、批准、访问和分析结果都将被管理。表2列出了针对访问策略以及结果审查和传播的三个风险类别中的每一个所实施的管理。在所有数据访问的情况下,一旦提出数据访问请求,相关项目的负责人和关键利益相关者将通过自动信息传递被告知。

表 2.基于风险的访问、文档和结果治理

当数据访问请求涉及不同风险类别的多个研究的数据时,就会出现挑战。在这种情况下,我们采取保守的方法,为整个使用情况指定最高的类别,或者允许研究人员重新考虑在他们的调查中是否包括高风险的试验,并将其删除,以获得较低风险类别。此外,有些请求可能包括来自不同项目的数据,在这种情况下,可能需要一个以上的高级利益相关者的批准。在这些情况下,对风险的意见需要统一,并可能导致不同的分类,这需要额外的跟进。而且,项目负责人可能不公正地拒绝数据访问的请求。在这些情况下,如果研究人员觉得他们的项目被不公平地评估,数据请求者可以向更高级的管理人员提出申诉。

讨论

Data42项目的基本目标是使研究和开发数据民主化,以促进科学发展,造福患者。与许多生物制药公司一样,诺华公司多年来一直在努力实现对研发数据的广泛访问。人们越来越清楚地认识到,数据是一种宝贵的资产,对数据隐私、道德和良好的科学研究原则的谨慎管理,都可以用来保护这些资产的使用。考虑到这一点,我们认为本文概述的数据访问框架在开放匿名数据访问的同时平衡了这些考虑。遵循这些原则也能使数据资源得到高效和有效的利用。此外,由于治理过程创造了许多文件的双产品(biproducts),每个研究项目都被有效地分类并可被找到。因此,工作有更大的可能性被重用,减少重复并获得资源的高效性。

通过关注三个关键因素(试验的关键性、项目阶段和数据使用目的),我们能够将访问分为上述三个风险类别。在实践中,我们观察到97%以上的数据访问请求属于低风险和中风险类别,因此,直接访问数据使可以实现的,只需进行最少的人工评估和审核。此外,还有一个额外的审查,因为对于所有的风险等级,项目负责人和主要专家都被告知所有的数据使用情况。这有两个目的:(i)研究可能确实对项目本身有用,只是以前没有考虑过;(ii)在任何特别敏感的情况下,对项目组有充分的透明度,这建立了信任,使研究人员能够探索和保持好奇。在写这篇文章的时候,已有超过250个数据请求已完成,97%的请求被认为不是高风险,数据在不到3小时内自动提供给最终用户。没有一例关于滥用数据或风险分类错误的报告。

鉴于风险框架透明地列出了其逻辑和由此产生的治理路径,我们相信这种方法也将有效地消除任何可能与敏感数据访问和使用的客观决定相互影响的决策偏见。我们的方法减少了任意或反复无常被拒绝的风险,也许是完全消除了。

从本质上讲,这个框架为诺华公司提供了一个在组织内部共享数据的明确方法。然而,它提出了一个问题:这项工作应如何发展,以支持更好的行业范围内的数据共享。我们如何在组织内和第三方之间以同等的方式组合和共享数据,其中包括高度的流水线式的访问,同时防止数据的不适当或无效使用?

结束语

这篇文章高水平的总结了超过20个人的10个月的工作,因此,内容必然是浓缩的。然而,这项工作的成果是一个全面的框架,指导诺华整个研发中对临床试验数据的使用。

诺华公司在创建变革性的数字技术方面投入了大量资金,如data42平台,然而,奇怪的是,一家公司往往会在文化和政策层面阻碍技术进步对这类创新技术的采用。此外,尽管生物制药公司可能会在化学、配方和商业运作方面展开竞争,但我们希望本文所包含的内容能够成为其他生物制药公司的参照,以病人至上的方式加快自己在这些技术障碍方面的进展。

正是通过这一视角,我们希望这项工作将支持其他组织寻求将其敏感数据资产民主化的讨论。我们希望更广泛的数据民主化将对发展中的科学和创新产生深远的影响。

参考资料

Gabriel S. Eichler* , Georges Imbert, Janice Branson, Rene Balibey, Jason M. Laramie. Democratizing data at Novartis through clinical trial data access


--------- End ---------


感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或  姓名-学校-职务/研究方向


- 历史文章推荐 -


数据共享

翼方健数|隐私安全计算助力数据共享 驱动AI药物研发

●Nature:优于联邦学习的医疗数据共享技术Swarm Learning及应用案例

●临床试验数据共享:挑战和前进之路

●AI药物发现的数据共享模式探索:以十大顶尖药企参加的MELLODDY项目为例

【诺华】

近两年诺华在AI药物研发领域发表的14篇论文

●诺华:技术时代的药物设计艺术

●Patterns|诺华举办内部挑战赛,用AI预测候选药物的临床试验成功率

●如何管理人工智能和数据科学:来自诺华的实践经验和教训 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存