RFdiffusion:蛋白从头设计的通用深度学习算法,用于互作蛋白筛选
The following article is from 科晶生物 Author 晶晶
点击蓝字 关注我们
产品概述
蛋白质-蛋白质互作(PPI)在动植物生物学中扮演了关键角色,它们驱动了许多细胞功能和生物过程。因此,识别蛋白质间的互作对于理解生物机制及开发药物和生物技术应用至关重要。传统的筛选方法(如Y2H、COIP等)验证蛋白互作往往耗时长、效率低,并且需要大量的实验资源。为了提高筛选效率,近年来高通量虚拟筛选技术和AI模型的进步使得基于结构和序列的互作预测成为了可能。
本产品旨在利用前沿的生成模型RFdiffusion从头设计人造高互作蛋白质,并结合Foldseek、HDOCK和AlphaFold 3等先进工具,对天然蛋白质进行筛选和验证。我们将这套新型计算工作流程命名为InterProDesign(IPD,Interaction Protein Design)。通过IPD能够更加高效且精准地筛选出与诱饵蛋白相互作用的天然蛋白,为进一步的实验验证提供重要参考。
产品流程
参考文献指示该计算工作流程实验验证成功率超过78%,为研究动植物生物机制提供重要的结构生物学信息。
1
RFdiffusion设计互作蛋白
基于已知诱饵蛋白结合热点的判断,从头设计10条不同长度的高互作蛋白质。
2
Foldseek搜索天然蛋白
在目标物种的蛋白质三维结构数据库,比对寻找结构相似的天然蛋白,(仅保留
bit score>50的匹配结果),并按分数高低排序(最多前100)。
3
结合能评价和整体结构评估
对于上一轮Foldseek筛选出的高分天然蛋白,使用HDOCK工具评估它们与诱饵蛋白之间的量化结合能,筛选出结合能较高的天然蛋白。接着,使用AlphaFold 3进一步评估这些互作蛋白与诱饵蛋白的整体复合结构的置信度。
拟交付结果示意
NEW TECNOLOGY
如图1,数据总表中包括所有步骤的汇总结果。红色方框内是RFdiffusion 基于诱饵蛋白所自主设计的10条互作蛋白序列,并将人造蛋白与诱饵蛋白对接评估。
绿色方框内是Foldseek 根据设计蛋白从待选物种库内筛选得到的结构相似天然蛋白。其中也存在人造蛋白没有bit score大于50的天然蛋白。
蓝色方框内是诱饵蛋白与候选天然蛋白从量化结合能和整体置信度评估的结果,稳定互作的高评分蛋白已标红强调,可以为后续实验验证提供指导。
如图2所示,是所有候选蛋白的详细信息,包括蛋白质的ID、基因名称、序列、物种、亚细胞定位、功能注释和所属家族。
图1: 数据总表示意图
图2: 候选蛋白注释信息
产品优势
NEW TECNOLOGY
1
创新型计算方法
本产品基于计算模型的预测与筛选流程,可以大幅缩短筛选时间并减少实验工作量。通过RFdiffusion、Foldseek、HDOCK和AlphaFold等工具的结合,能够在早期阶段快速预测出与诱饵蛋白可能发生互作的候选蛋白。多维度评估使得最终筛选出的互作蛋白更加可靠,提升了后续实验验证的成功率。
2
结构导向型的精确筛选
本产品更多依赖蛋白质的三维结构进行筛选。结构相似性在跨物种或功能多样性大的蛋白质互作中的至关重要。基于结构的筛选方法能够识别出那些序列相似度低但具有相似功能的蛋白质。
参考文献
1.Watson, J. L., et al. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620, 1089-1099.
2.Haley, O. C., Harding, S., Sen, T. Z., Woodhouse, M. R., Kim, H.-S., Andorf, C. (2024). Application of RFdiffusion to predict interspecies protein-protein interactions between fungal pathogens and cereal crops. bioRxiv, doi: 10.1101/2024.09.17.613523.
3.Watson, J. L., Juergens, D., Bennett, N. R., Trippe, B. L., Yim, J., Eisenach, H. E., ... & Baker, D. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620(7685), 1089-1098.
4.Baek, M., DiMaio, F., Anishchenko, I., Dauparas, J., Ovchinnikov, S., Lee, G. R., ... & Jumper, J. (2021). Accurate prediction of protein structures and interactions using a three-track neural network. Science, 373(6557), 871-876.
5.Lin, Z., Rigden, D. J., & McGuffin, L. J. (2023). Language models of protein sequences at the scale of evolution enable accurate structure prediction. Science, 379(6631), 1123-1130.
6.Dauparas, J., Anishchenko, I., Bennett, N. R., Bai, H., Ragotte, R. J., Milles, L. F., ... & Baker, D. (2022). Robust deep learning-based protein sequence design using ProteinMPNN. Science, 378(6615), 49-56.
关于科晶生物
合肥科晶生物致力于计算机虚拟筛选推动生物学发展,帮助筛选互作蛋白、转录因子、潜在药物以及纳米抗体。
福利来袭!
科晶生物论文出图
免费蛋白互作分析等您来领!
0551-64669001
扫码添加客服,即可领取!
▼
NEWS
AI DOCKING