查看原文
其他

智能化组学分析平台XploreSeq™,助力百亿级抗体序列空间“淘金”

晶泰科技 晶泰科技 2024-04-20



伴随着21世纪初“人类基因组计划”的完成,测序技术得到了蓬勃发展,海量基因组学数据爆发式增长,催生了生物信息学技术的二次变革。与此同时,同样以大数据为驱动力的人工智能技术重回历史舞台,生命科学领域日益增长的数据处理需求促使其被广泛应用。特别是在抗体药物发现领域,由于 B 细胞免疫组库存在极高的组合多样性,传统的生物信息技术已无法满足抗体药物的研发需求。人们期待人工智能技术的加持,以实现在百亿序列空间里的有效组学数据的提取与分析,弥补经典抗体发现手段的不足,助力发现更优的抗体序列。


自40多年前杂交瘤技术问世,抗体发现技术便得到了长足的发展,从噬菌体展示技术到近几年新兴的单B细胞测序技术,均在抗体药物发现领域占有一席之地。尽管如此,这些抗体发现手段仍然存在一些未被满足的需求


● 杂交瘤技术易于丢失大部分抗体序列,且耗时长

 噬菌体展示技术获得的非天然配对抗体序列存在可开发性风险

● 单B细胞测序技术单次实验的通量有限且成本高



为了弥补上述“未被满足需求”,充分发挥经典抗体发现技术的优势,晶泰科技搭建了AI赋能的免疫组库测序平台XploreSeq™,基于NGS测序技术,在传统生信方法基础之上融入机器学习算法,开发得到一系列可应用于抗体发现的AI训练模型,包括亲和力预测、重轻链配对、表位预测、可开发性评估等,以期在探索更广阔序列空间的同时保证抗体序列的下游可开发潜力。


晶泰科技XploreSeq™平台的基本框架


那么到底 XploreSeq™ 平台有哪些特色?该技术在具体的抗体发现环节中如何落地?落地效果怎样?12月8日,晶泰科技线上开展了一场主题为“数据淘金——智能化组学分析平台赋能抗体发现”的晶泰智播活动


XploreSeq™平台的搭建人叶兴达先生奉上了一场精彩的分享报告,并回答了直播间网友的提问。接下来,就让我们通过现场的Q&A互动,回顾本次直播活动的精彩瞬间。


● 晶泰科技XploreSeq™平台的特色

● 晶泰科技XploreSeq™平台的落地效果

● 欢迎观看直播课程回放


晶泰科技XploreSeq™平台的特色


1.  XploreSeq™平台处理哪些方法来源的数据表现更佳?为什么?

XploreSeq™平台的适用范围很广,像二代测序、多(单)细胞测序都有运用,三代测序技术也在关注中。对于XploreSeq™平台来说,测序技术提供的数据来源是该平台用于抗体发现的基础。像目前比较火热的单B细胞测序技术,其更加侧重于利用上游不同的抗体筛选手段来获取更好的抗体序列,而晶泰科技XploreSeq™平台则更加擅长于在下游实现生物数据的有效分析。


通过充分利用天然免疫组库所蕴含的大量抗原特异性抗体的优势,最大程度上保留抗体序列的多样性,在此基础之上,引入晶泰科技自有的特色机器学习(ML)和生信的模型进行深入分析,以提升抗体序列预测的效率和准确率。两个平台非常适合组合使用,效果更好。

●2. 请问XploreSeq™平台是不是通过机器学习可预测具有更好亲和力的抗体序列,避免了过多的筛选工作?

XploreSeq™目前有四大类机器学习模型正在重点推进,包括亲和力成熟、轻重链配对、表位预测和可开发性预测。亲和力成熟只是其中一类应用方向,能够通过多角度评估百万级序列空间内的每一条序列的特性,利用计算机模拟的方式即可完成筛选工作。


在亲和力预测方面,该平台最大的优势是能够减少过度的湿实验筛选工作,通过ML模型即可提前作抗体序列的筛选。当然,最终干实验筛选获得的具备更好亲和力的抗体序列,我们仍然会采用湿实验的方式进行验证和评估,以确保干实验结果的准确性。在验证和评估环节,我们所需要评估的抗体序列数量已经大大减少,因此该平台能够避免过多的湿实验筛选工作,降低资源的过多投入,提高筛选效率。


●3. XploreSeq™平台的机器学习模型是靶点特异的吗?

不一定。晶泰科技XploreSeq™平台,既包含基于靶点特异序列空间的数据进行训练的模型,也包含基于内部实验生成的数据进行训练的模型以及对公开数据集进行训练的模型。因此XploreSeq™平台的机器学习模型有靶点特异性的,也有泛靶点的,需要根据客户的实际应用需求选择适合的模型。有时候针对某一具体问题,甚至需要同时对多种ML模型进行组合使用,多维度的分析以确保训练结果的准确性。

●4. 您提到AIDD+CADD+生信3种计算方法,这3种在解决具体问题上是如何配合的?分别侧重点在什么方面?

AIDD、CADD和生信是晶泰科技抗体发现平台AI计算能力的三大基石。生信是从免疫组库数据出发,搭建基于序列的模型,以充分捕捉抗体序列的多样性;CADD是运用经典的计算化学方法,搭建基于结构的模型,从能量角度进行计算和分析;AIDD运用深度学习的方法,以数据驱动的计算方法。三类方法是平行且互补,以提升问题解决的成功率。


例如,在可开发性评估中,三个团队均会搭建各自的可开发性预测模型,通过三者多维度的评估和分析,获得能够相互佐证与补充的预测结果,以确保评估结果的准确性。


晶泰科技XupremAb™三大计算平台赋能抗体发现示意图

5. 除了PTM改造,晶泰科技的平台还能预测哪些可开发性指标?

晶泰科技抗体发现平台XupremAb™主要涵盖三大重点应用:抗体发现、抗体工程和抗体可开发性。对于一款治疗性药物来说,其可开发性的好坏很有可能直接影响它未来在临床阶段成功与否。所以晶泰科技非常重视药物的可开发性,并且目前已开发出了一套“干湿结合”的可开发性评估方案贯穿于抗体发现始终。晶泰科技希望在抗体发现初期即对抗体的可开发性进行全方面评估,把未来可能产生的风险降到最低,为客户提供极具临床开发潜力的候选抗体。


PTM热点改造只是XploreSeq™作为XupremAb™平台的一个组成部分,在可开发性方面的应用案例。实际上,XupremAb™平台通过有效结合AI训练模型和专家经验,可预测大部分可开发性指标,包括抗体的表达量、疏水性、电荷异质性、免疫原性、多特异性等。从近期的部分指标预测结果看,该评估算法比市面上公认最优的算法具备更优的性能。


晶泰科技XcelDev™可开发性平台示意图

晶泰科技XploreSeq™平台的落地效果

●1. XploreSeq™是怎么做到轻重链天然匹配的呢?

XploreSeq™平台首先利用单细胞测序技术将细胞一个个分隔在单独液滴里,获得天然配对的抗体序列信息。然后通过生信表征、机器学习等方法,将获得的天然轻重链配对信息用于AI模型的训练,即可获得可预测天然轻重链配对模式的AI模型。接着,在多细胞免疫组库测序基础之上,利用该模型对轻重链的配对概率进行预测,从而获得天然配对概率较高的抗体序列。

●2. XploreSeq™平台机器学习模型的落地效果怎么样?

晶泰科技“AI驱动的下一代抗体发现平台”的研发理念是将AI技术尽早应用于抗体药物研发,不求颠覆,而要实用,做“看得见、用得上”的AI,量变引起质变。基于此,XploreSeq™的ML模型并非是单独的训练模型,它集成了多种不同的ML训练模型、内部的专家经验以及对免疫系统知识的积累,通过综合运用多维度评估方式以保证ML模型落地的效果。


实际上,对于算法工程师而言,通过一批数据训练获得效果非常好的模型是一件非常容易的事情。然而,在ML模型实际应用和落地的过程中,晶泰科技为了保证模型的可迁移性和鲁棒性,会保持极为谨慎的态度对ML模型进行充分评估,包括大量数据集的验证、多种其他模型的平行验证、模型的应用边界测试等方式。因此,经过上述严谨的训练和评估流程的ML模型,其训练效果和落地效果都是非常好的。

3. 对于难成药靶点(如GPCR等离子通道),抗体发现效果怎么样?

GPCR广泛分布于人体各类组织、器官,介导着多种重要的生理功能,因此被视为极为重要的药物开发靶点。然而,不同于PD-1/PD-L1这类单次跨膜蛋白,GPCR是多次跨膜蛋白,在体外制备抗原蛋白的难度较大,且同时难以保证GPCR构象的稳定性,因而在抗体药物研发领域是大家关注的热点。


针对该类靶点,除了运用XploreSeq™平台的抗体多样性发现优势之外,晶泰科技还会组合使用XupremAb™平台下属的多种抗体发现手段XtraDoma™(杂交瘤技术),XpeedPlay™(噬菌体展示技术),XuperNovo™(从头设计)等,以充分发挥不同抗体发现手段的优势,拓展发现更多苗头抗体的可能性,同时借用AI计算弥补传统抗体发现技术的局限性,以此来提升针对该类难成药靶点的抗体发现效果。目前的评估数据显示,晶泰科技的抗体发现平台适合用于该类靶点的抗体发现,且效果符合预期。
欢迎观看直播课程回放

想要了解更多内容,欢迎您扫一扫下方二维码,观看12月8日主题为数据淘金——智能化组学分析平台赋能抗体发现的晶泰智播课程回放,了解生物信息学与AI如何交融互通,赋能抗体发现。

扫码观看直播课程回放


自成一 “π" , 智启未来

晶泰科技致力于成为全球药物研发智能化和自动化的领导者。
欢迎关注晶泰科技视频号
探索晶泰科技自动化实验室。





 
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存