AI算法平台!助力mRNA递送的可电离脂质开发
可电离脂质纳米颗粒(LNPs)递送mRNA已广泛用于临床,特别是在新冠mRNA疫苗中,但由于缺乏针对不同靶细胞类型的LNP,mRNA疗法在新冠肺炎之外的应用受到限制。LNP传统的开发过程仍然是一项艰巨、耗时和昂贵的工作,依赖于不断地试错和筛选。近日多伦多大学药学院研究团队,在biorxiv公开了一篇题为《AGILE Platform: A Deep Learning-Powered Approach to Accelerate LNP Development for mRNA Delivery》的研究文章,在这项研究中,提出了AI引导的可电离脂质工程(A I-Guided Ionizable Lipid Engineering,AGILE)平台,由深度学习和组合化学相结合。AGILE简化了可电离脂质的迭代开发,可电离脂质是LNP介导的mRNA递送的关键成分。这种方法带来了三个显著特点:组合脂质库的高效设计和合成,利用深度神经网络进行全面的计算机脂质筛选,以及对不同细胞系的适应性。使用AGILE能够快速设计、合成和评估新的可电离脂质,用于肌肉和免疫细胞中的mRNA递送,从超过10000个候选文库中进行选择。更重要的是,AGILE揭示了细胞对可电离脂质的特异性偏好,这表明需要不同的尾部长度和头部基团来优化向不同细胞类型的递送。这些结果强调了AGILE在加快定制LNP开发方面的潜力,有可能助于解决临床实践中mRNA递送的复杂需求,从而拓宽mRNA疗法的范围和疗效。
从本质上讲,AGILE采用了一个预先训练的深度学习神经网络,该网络吸收了数百万小分子的结构知识。该模型利用了来自组合脂质库的大量未标记数据,采用自监督方法来学习可微分的脂质。在对HTS后收集的湿实验数据进行微调后,AGILE可以从更大的组合文库中以准确鉴定出在特定细胞中高mRNA转染效力的脂质。利用这一工作流程,使用Hela细胞的转染数据对深度学习模型进行了微调,随后从12000个候选脂质库中预测了15个脂质结构,其中可电离脂质H9-LNP与含有D-Lin-MC3-DMA的LNPs相比,H9显示出更高的mRNA转染效力。值得注意的是,H9-LNP的转染作用局限于肌肉,R6是为向巨噬细胞递送mRNA而优化的。实验观察结果,如不可生物降解的尾部结构在巨噬细胞转染中的重要性以及碳链长度和转染效力之间的相关性,强调了AGILE为单个细胞类型提供有意义的生物学见解和定制LNP的潜力。AGILE针对不同细胞类型进行定制的能力表明,它具有指导新的mRNA-LNP的配方,并根据各种临床情况进行精细定制的潜力。
结果
AGILE平台概述
该平台的核心是一套深度学习算法,统称为AGILE模型。该模型包括图形编码器和分子描述符编码器,熟练地捕捉了可电离脂质分子结构的内在特征及其相应的化学属性。AGILE的实施分为三个关键阶段,如图1a所示:(1)虚拟库的构建和初始自监督模型训练,(2)从实验库中获取经验数据,通过监督微调提高预训练模型的精度,和(3)利用精细的深度学习算法对候选库中的可电离脂质进行计算机分析。作为一种多方面的工具,AGILE可以预测LNP制剂中可电离脂质的mRNA转染能力,并显著促进LNP针对特定靶细胞的设计。
▲图1 平台设计管线概述
阶段1旨在开发一种图形编码器,通过对大量未标记的脂质分子进行预训练,熟练区分和描绘不同的脂质。该过程始于利用图形神经网络(GNN)构建图形编码器,该编码器以MolCLR模型的参数为基础,其已经对超过1000万个小分子进行了预训练。利用这些并将小分子的一般结构的嵌入到算法中,增强了AGILE在后续阶段的准确性。图形编码器随后通过对比学习在60000种化学多样性脂质的虚拟库上进行了连续的预训练,从而能够区分每个分子中的原子和键,从而捕捉各种脂质结构之间的差异,基于3-CR化学原理设计由不同胺基头部和两个独特烷基尾链组成的脂质(图1b),适用于高通量组合合成。阶段2试图用来自可电离脂质库的mRNA转染效力数据进一步训练AGILE模型。为此,通过3-CR合成了1200种可电离脂质,并评估了它们在靶细胞系中的转染效力,利用这些数据以自查的方式微调AGILE模型。在第3阶段的计算机筛选之前,通过从第1阶段的虚拟文库中合理选择结构,组装了一个包含12000个脂质结构的候选文库(图1c),遵循三个规则:(1)去除因不可离子化而具有毒性的阳离子脂质;(2) 基于经验去除烷基链太短(<C10)或过长(>C18)的脂质;(3)去除不可用试剂合成的脂质。然后利用微调的AGILE模型来预测候选文库中脂质的mRNA转染效力,并进行排序(图1d)。基于AGILE提供的信息,在湿实验中选择性合成排名靠前的可电离脂质结构,并将其配制成LNP,以验证其将mRNA递送到特定靶细胞的能力。
组合脂质文库的合成及微调筛选
在第1阶段完成整个虚拟文库的预训练后,通过监督微调定制了用于转染效力预测的模型。这一阶段根据体外筛选结果训练模型,使模型能够捕捉分子的潜在转染能力。为了快速生成具有高化学多样性的可电离脂质库,开发了一种基于Ugi-3CR的自动化高通量合成(HTS)平台(图2a),该平台能够在24小时内合成大量(1200)可电离脂质。合成的脂质库包括20个不同的头部、12个具有可生物降解酯键的烷基链和5个含有异氰酸酯基团的烷基链(图2b)。
▲图2 高通量脂质合成和筛选平台
随后,通过可电离脂质、辅助脂质(DOPE)、胆固醇和聚乙二醇(PEG)-磷脂缀合物(DMG-PEG2000)的经典制剂合成LNP,用于测试潜在候选物(图2c)。为了评估Hela细胞中的mRNA转染效力,将Fluc-mRNA封装在LNP中来测量萤火虫萤光素酶(Fluc)蛋白的表达活性(图2d)。与未处理的细胞相比,这些1200种脂质中的大多数在Hela细胞中显示出mRNA转染效力(图2e)。Hela细胞是评估肌内递送方法有效性的有价值的模型,因为其表达低密度脂蛋白受体(LDLR),该受体在血液中与脂蛋白相关的脂质纳米颗粒(LNPs)的细胞摄取中起着至关重要的作用。但不同测试脂质的效力差异很大,在微调阶段,这些变化可以很容易地用于监督模型,以了解分子性质及其转染效力之间的关系。为了验证预测的质量,将预测的和实际的体外效率值划分为六个相等的百分位数,在图2g中可视化了所有1200种脂质的精密矩阵。尽管预测任务极具挑战性,但该模型在预测表现最好和最差的脂质方面尤其有效。例如,预测的前16%的脂质将有0.41的机会成为体外发现的实际前16%的脂质之一(图2g)。还使用UMAP嵌入检查了预测的结果(图2h)。UMAP算法将紧密的LNP呈现分配给二维空间中的相邻点,然后根据其预测的转染效力对其进行着色。在所得的UMAP图上,脂质聚集成具有相似效力值的区域结构,这验证了学习的表征捕获了脂质的潜在转染能力。
AGILE预测和鉴定用于肌肉注射的有效脂质
通过微调模型对候选库进行模型预测,筛选用于肌肉注射的潜在脂质。使用UMAP可视化预测(图3a),所得图显示了高预测值和低预测值之间的明显差异,表明该模型在更大的筛选库中区分有效和低效电离脂质方面的稳定性。仔细观察分层分布图,可以发现预测的潜力是按头部和尾部组合明确排序的(图3b)。即使在表现最好的5个头部群中,A8和A21的预测潜力也高于其他。虽然与头部组相比,尾部组合没有明显的预测转染能力分层(图3c),但与底部尾部组合相比,顶部尾部组合仍然是候选脂质的关键。用此排名,最终确定了一组15种候选脂质(图1d)。
▲图3 模型预测和最优的mRNA-LNP验证基因编辑潜力
在HTS系统中快速合成了15个候选脂质,并在Hela细胞中对其进行了评估,发现与未处理组相比,15个脂质都导致了荧光素酶蛋白的表达(图3d)。为了研究它们在体内的潜力,小鼠肌肉注射Fluc mRNA -LNP,在15个候选者中观察到H9-LNP显著的生物发光信号。通过实验设计(DoE)优化H9的LNPs配方后(图3e),与MC3-LNPs进行比较,发现H9-LNPs的mRNA转染效力是MC3的2.3倍(图3f)。基于这些结果,继续使用H9-LNPs通过肌肉注射评估小鼠体内的mRNA转染效力(图3g),结果显示,H9-LNPs在肌肉部位的转染效力是MC3的7.8倍,与ALC-0315相比没有显著差异(图3h和i)。而与ALC-0315 LNPs相比,H9-LNPs在肝脏中的表达较低(图3j和k),受这些结果的启发,接下来研究了H9-LNP用于疫苗接种的潜力。为了比较H9和ALC0315 LNPs的递送效果,用Cre重组酶mRNA-LNPs肌肉注射tdTomato报告小鼠模型(图3l),观察到H9和ALC-0315 LNP在肌内注射部位的GFP蛋白表达水平相当。然而,ALC-0315 LNPs在肝组织中显示出更高的蛋白质表达水平,共聚焦图像的定量显示,与ALC-0315 LNP相比,H9-LNP在肝脏中转染效率低28%(图3m)。有临床研究表明,在接种疫苗后,基于ALC-0315的BNT162b2 mRNA疫苗与自身免疫性肝炎(AIH)相关。因此,预计AGILE预测的H9 LNP将以较低的靶向效应缓解肝炎的严重潜在副作用。
AGILE鉴定巨噬细胞mRNA递送的可电离脂质
为了测试AGILE识别能够有效转染免疫细胞的可电离脂质的能力,在永生巨噬细胞RAW264.7中检测了1200种脂质,并创建一个专门针对巨噬细胞的数据集,对筛选过程进行微调。结果显示,在Hela和RAW264.7的转染效力存在显著差异。随着模型在巨噬细胞特异性数据集上的微调,再次进行了模型预测,并使用UMAP可视化了RAW 264.7细胞的预测转染能力(图4a)。与Hela细胞预测潜能的UMAP相比,顶层预测的LNP在整个空间中分布得更广,这可能表明预测RAW 264.7细胞潜能的复杂性增加。而与Hela细胞相比,按头部组和尾部组合分类时,RAW 264.7细胞的预测潜能表现出明显的分层(图4b、c)。
合成前15个候选,并在RAW 264.7细胞中进行初步筛选,其中15个候选中有11个显示出与MC3相比提高的转染效力(图4d)。R6为15个候选者中表现最好的脂质,通过优化配方并制备Fluc mRNA-LNP,评估荧光素酶蛋白在RAW264.7和Hela细胞中的表达,比较H9和R6-LNP在不同细胞系中的表现,在RAW 264.7细胞中的结果非常不同,其中R6显著高于H9和MC3的转染效力(图4f)。然而,在Hela细胞中,与R6相比,H9的转染效力增加了2倍以上(图4g)。这些结果表明,有必要开发专门针对单个细胞类型和组织的LNP,而不是针对所有靶点的一刀切方法。基于R6-LNPs在RAW 264.7中的优异性能,接下来使用R6-LNPs将GFP mRNA递送到RAW264.7中,通过流式分析,与H9和MC3-LNP相比, R6-LNP在RAW 264.7中的转染效力增加了5倍(图4h和4i)。这些结果验证了AGILE在鉴定一种用于高效巨噬细胞转染的新型可电离脂质方面的成功,突出了其用于开发免疫细胞非病毒mRNA递送载体的潜力。
▲图4 通过AGILE平台加速筛选巨噬细胞中EGFP mRNA递送的新脂质
AGILE深度学习模型解读
AGILE通过两种机制阐明其模型:(1)使用基于梯度的模型解释方法识别有影响的分子描述符,以及(2)识别选定脂质中的关键特征。基于梯度的解释方法应用于813个选定的分子描述符,评估它们对模型预测的贡献。如图5a和5b所示,已经可视化了Hela细胞系和RAW 264.7的前20个显著描述符。对于Hela细胞系,VSA_EState3和SssNH成为效力预测中最具影响力的分子特征。VSA_EState3是一种量化特定范围内分子表面积的电子和空间性质的描述符,以及代表叔胺的SssNH,这些符合具有叔胺的头部基团对脂质设计至关重要的说法。随后对按头部分类的基本特征的分析(图5k)确定PEOE和Estate是优选头部(A13,A21)的最关键描述符,而SsNH2(sNH2电子态的总和)和NsNH2(类型为sNH2的原子数)在表现最差的群(A5,A17)中占主导地位。值得注意的是,这些描述符与结构中的酰胺键有很强的关联,而该模型不利于酰胺键的产生,这可能是因为它会影响脂质的整体物理化学性质,如在RAW264.7的背景下,SpDiam_Zi和VR3_D被确定为最具影响力的描述符(图5b),这些结果强调了设计具有针对不同细胞靶点定制的特定脂质的LNP的必要性。
随后的分析,如图5e所示,解释了靶向Hela细胞的候选脂质之间的关系,如AGILE模型的脂质表示的相似性所确定的。为所选的15种脂质构建了一个相似性网络,将每种脂质与其结构相似的脂质联系起来。其中H9是最有效的LNP,它不仅与具有相同头部基团的LNP(H7,H8)相似,而且与其他高性能候选者也有相似,如通过相对荧光素酶单元(H12,H13)鉴定的那样。对H9进行分子解释,阐明了在AGILE模型中严重影响图编码器预测的分子结构中最显著的区域(图5c)。类似地,为RAW264.7选择的15个候选脂质开发了相似性网络(图5f),R6表现出与其他高性能候选者的相似,包括R3、R8和R11。这四种脂质具有相同的尾部结构:一种是C-12烷基链,另一种是C18烷基链。这一共同特征表明,这些尾部结构与R6、R3、R8和R11的高转染效力之间高度相关。有趣的是,两个尾部都是不可生物降解的,这说明了脂质稳定性对于成功转染巨噬细胞的潜在必要性。此外,这些高性能脂质通常具有不对称的烷基链,这是SM102的共同特征,有助于更容易形成倒锥几何形状。与H9的研究结果类似,在R6的显著性图上,头部结构被确定为一个影响因素。此外,尾端也被突出显示为一个突出区域(图5d)。此外,还发现了R2的尾部碳链长度作为预测转染效力的关键因素的重要性,特别是在RAW264.7中。它显示了来自表现最好的头部组A5脂质的预测势能相对于R2的不同碳链长度的分布(图5g)。这种分布产生了两个不同的方面:(1)随着R2碳链长度从10增加到12,预测效力的相应上升变得明显。有趣的是,R2长度的任何进一步延伸都会对预测的效力产生负面影响。(2) 此外,与较长尾部碳链相比,R2的较短碳链长度(C≤12)与效力预测的较小方差相关。检查候选脂质中所有脂质的分布图(图5h)揭示了关于R2碳链长度和预测效力的类似模式。值得注意的是,观察到较短的R2链之间的可变性较小(C≤12)。有趣的是,碳链长度的重要性在两个相应的尾部之间不对称地变化。如图5i所示,预测的效力与R3碳链长度之间的相关性明显低于R2碳链长度(−0.15 vs.−0.39)。这些尾部长度的发现与RAW 264.7中的转染特别相关。如图5j所示,Hela细胞系内的模式定义较少,导致皮尔逊相关性为-0.22。总之,这些见解对指导专门为RAW 264.7量身定制的LNP的设计具有重要意义。
讨论
在这里介绍了在综合虚拟和湿实验上训练的AGILE平台,即使在数据有限的情况下,也能预测不同细胞系的LNP效力。通过在训练过程中接触大量的分子描述符,AGILE中的深度学习组件以完全自我监督的方式结合了电子和空间性质以及碳链长度等特征,从而获得了对LNP设计的复杂动力学的基本见解。
总的来说,AGILE协同组合化学和深度学习的力量,阐明了LNP设计的复杂动力学,并使这一见解可用于多种下游应用。AGILE识别和解释有影响力的分子描述符的能力代表了纳米医学领域的重大飞跃,尤其是在脂质设计方面。它能够预测LNPs在不同细胞系中的转染效率,包括巨噬细胞等具有挑战性的细胞系,这不仅有助于改善mRNA递送,而且有助于指导CAR和TCR细胞治疗和其他免疫治疗策略。它可以潜在地加速强效LNP的发现,并促进为mRNA递送定制的可电离脂质的设计,从而为基于mRNA治疗方法的持续开发及其在临床应用中做出重大贡献。
END
▶注:推文仅供读者学习、借鉴与欣赏,不作为投资建议,不得用于商业用途,如涉及作品内容或版权问题,请在30日内联系删除。
▶如需转载请后台私信,个人转发群聊及朋友圈无需额外申请。
●盘点2023欧洲血液协会(EHA)年会中几种新颖的CAR-T研究
●2023年EHA年会—CD38靶向LNP递送siRNA治疗多发性骨髓瘤
●2023年ASCO|TCRCure靶向EBV的TCR-T I期临床数据
●Nature!一种新的癌症疫苗策略,规避MHC抗原呈递下调的影响
●间充质干细胞MSCs或可成为增强版DC疫苗大规模生产用于临床
●Biotech市场动荡,赛默飞、罗氏、武田等一批大厂纷纷裁员!
联系小编:Wzz202202
转发,点赞,在看,安排一下?