查看原文
其他

数学建模如何支持下一代生物工艺的开发?

开朗的豌豆射手 生物工艺与技术 2022-12-21



 

本文节选自《How Can Mathematical Modelling Support the Development of Next Generation Bioprocesses?》,由于水平有限,详细内容,请参考原文。

 

高通量实验系统的采用和多组学分析方法的进步正在产生大量的生物工艺数据,这些数据可以支持下一代细胞培养系统的设计。这些数据集的多尺度特性要求使用数学建模来解释它们。模型可以是机械的,例如,动力学或化学计量的,也可以是统计/机器学习,例如,多元分析,神经网络,或两者的混合。基于模型分析的应用旨在促进我们对细胞行为驱动因素的理解,设计工艺优化策略或提出细胞工程目标。

 

培养表型通常是不同细胞内过程的合成,可以有相同或相反的目标。建模可以用来解释和量化每个通路对观察到的群体行为的影响。例如,与在生理温度下培养相比,在轻度低温的中国仓鼠卵巢(CHO)细胞培养条件下,单克隆抗体(mAb)半乳糖基化整体降低,而行业已采用机械建模来分析影响这种现象的通路。该模型可正确地识别出代谢功能降低和mAb产量增加(这两者都是常见的测量值)不足以解释所观察到的半乳糖基化水平下降的幅度。这表明在高尔基体中糖基转移酶的可用性降低,其表达通常不会被监测,而这在实验中得到了证实。

 

工艺设计与优化一直是基于模型的研究课题。虽然早期的研究主要集中在基于Monod动力学的可计算、简单模型上,但计算策略现在涉及两个主要方向。第一个是纯粹的数据驱动方法,将工艺条件与蛋白质产量和质量属性联系起来。例如,偏最小二乘分析被用于描述培养基组成和mAb糖基化之间的关系,以及通过遗传算法开发的用于提高工艺性能的模型。连续多元细胞培养建模进一步被用于描述工艺条件对mAb糖基化特性、聚体水平、低分子量形式和电荷异构体在四种不同规模上的影响,从深孔板到中试规模的生物反应器。这种方法已经在大型数据集上得到验证,因此非常适合于平行生物反应器系统(如Ambr®或历史数据集)的数据分析。另外的好处是,统计建模可以被更广泛的生物制药专业人员使用,并适用于任何操作模式,包括连续细胞培养。

 

另一种方法是使用机械建模。动力学模型可用于工艺性能预测和工艺优化。例如,Kotidis等人采用了CHO细胞生长、代谢和mAb糖基化的动力学模型,以优化与增加的半乳糖基化相关的代谢前体的补液策略。相同的模型被用于探索操作参数空间,并确定满足产量和质量标准的补液条件范围。然而,这种模型需要大量的公式和参数化工作,并且必须针对每种细胞系和工艺量身定制。此外,它们不能描述无法测量的细胞内现象,如酶调节,这会影响模型的输出,导致在某些条件下准确性降低。这种信息在输入-输出数据中获取,但如果事先不知道此类事件的发生,就不会明确地包含在动力学模型中。克服这一限制的一个选择是使用混合动力学和机器学习/统计模型,以利用数据的全部信息内容。这种方法特别适用于描述没有被很好理解的现象,即缺乏对第一原理的理解,或细胞内检测很少或无法进行的系统。

 

行业利用转录组学、代谢组学和某些情况下的蛋白质组学数据深入表征候选细胞系特性的能力,需要一种全面的分析工具,从机理上描述细胞内广泛的功能:基因组规模建模。CHO细胞的基因组规模模型有几种,包括化学计量反应网络表征和基因-蛋白-反应关联。它们可用于分析不同工艺条件下的胞内通量分布,比较不同克隆以鉴定高产细胞的性状,指导设计细胞的合成。至关重要的是,基因组规模模型已配备了大量工具,可以利用代谢组学和转录组学数据进行管理。这对于创建能够正确描述现有细胞系的定制模型至关重要,但与原始基因组规模的反应网络相比,这些模型的规模也要缩小。除了典型的代谢通量平衡分析,特别值得注意的是Kol等人的研究,其中,CHO细胞的基因组规模模型被扩展到了包括蛋白质分泌通路,并用于鉴别宿主细胞蛋白,其随后可被剔除,以创造更“干净”的下游进料。

 

基因组规模模型有两个重要的数学特征:(i)它们是欠定的,因此需要作为一个优化问题来解决(称为通量平衡分析),(ii)它们在准稳态假设下应用。这反过来又造成了一定的限制。通过优化求解基因组规模模型涉及到目标函数的选择。虽然生物量的最大化是微生物细胞系统的一个目标函数,但它不能代表哺乳动物细胞在所有培养阶段的优先级。由于预测的验证非常困难,因此很难确定合适的目标函数。例如,虽然可以使用碳标记实验,但能够容易且可靠测量的代谢物的数量太少,无法达到细胞内通量的唯一解决方案。

 

基因组规模模型对细胞培养间隔而不是整个培养持续时间的分段适用性的第二个限制仍然是一个开放的研究问题。更小的代谢网络已被动态化。例如,在Nolan和Lee的一篇重要论文中,作者提出了一个混合化学计量动力学模型,该模型准确地生成了温度变化、种子密度、特异性产率和营养物浓度对关键培养性能指标影响的时间过程预测。类似地,Martínez等人开发了一个动态代谢通量分析框架,成功地分析了培养温度对细胞生长和mAb产量的影响。该方法定量地捕获了关键工艺参数的胞外浓度分布。

 

最近一个有趣的进展是混合化学计量/数据驱动模型的发展。Schinn等人使用基因组规模代谢模型分析了氨基酸消耗率,并使用结果训练了一个统计模型。该混合模型成功地预测了氨基酸浓度的时间进程变化,为工艺优化和控制铺平了道路。类似地,Antonakoudis等人选择了一种小规模代谢模型,来预测细胞内代谢通量,并使用该模型训练mAb糖基化的机器学习模型。他们的混合配方准确地预测了在细胞培养时间内糖基化变化的独立数据集。

 

上述研究说明了每种建模策略和混合配方如何促进我们对重组蛋白合成的胞内瓶颈的理解,为分析不同克隆和培养条件之间的差异提供了框架,并为细胞工程和工艺工程提供了开发线索。下一个前沿将是证实建模如何支持行业的工作,以解决两个热点挑战:向连续生产的转变,以及在新的药物模式中重现抗体生产平台的成功。在这两种情况中,建模都可以用来确定知识是否可以跨培养模式和不同的产品进行转移,以及决定新分子可制造性的关键过程和产品特征是什么。

 

原文:C.Kontoravdi, How Can Mathematical Modelling Support the Development of Next Generation Bioprocesses? American Pharmaceutical Review, 2021.

 



相关阅读:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存