浙工大张贵军教授课题组蛋白质折叠路径预测研究取得新进展
蛋白质折叠是分子生物学中心法则尚未解决的一个重大生物学问题,阐明蛋白质折叠机制问题将有助于全方位描绘细胞内蛋白质动态图景,对准确预测蛋白质结构,理性设计乃至生产具有特定功能的新型蛋白质等应用具有重要意义。当前发现主要是针对蛋白质天然结构(即蛋白质的静态属性)的预测,如要全面理解蛋白质功能,还需解析出折叠中间体和过渡态结构的动态特性。德国博物学家恩斯特·海克尔曾经指出:个体发育概括了系统发育,即个体在发育过程中会经历一系列形态上的变化,这些变化反映了该物种在进化历史上所经历的各个阶段。这一个观点间接地反映了进化施加于蛋白质折叠过程的作用,即蛋白质并不是从零开始设计的,而是在长期的进化过程中逐渐优化的。虽然理论上一个蛋白质可以尝试无数种折叠方式,然而只有那些有利于生存和繁殖的折叠方式会被保留下来。这就像是自然界在进行一场大规模的筛选实验,只有最适合的蛋白质设计才能流传下来。这意味着,通过对蛋白质家族的多结构比对来挖掘目标蛋白质的进化历史,获取蛋白质的折叠信息,进而预测目标蛋白质折叠路径将是一种可行的研究思路。
近日,浙江工业大学张贵军教授课题组在之前开展的基于模板检测的折叠路径预测方法PAthreader(Communications Biology, 2023)的工作基础上,提出了一种基于折叠力场模型指导的蛋白质折叠路径预测方法FoldPAthreader(图1)。该方法搜索蛋白质宇宙中海量结构模板,通过多结构比对算法提取结构片段折叠保守信息,设计了一种全新的折叠力场模型;进而构建了折叠片段库,设计了构象空间采样算法驱动蛋白质从氨基酸链逐步折叠到天然态结构,达到预测蛋白质折叠过渡态和中间体的目的。尤其需要关注的是,该力场模型是专门针对蛋白质折叠过程设计,能够有效地揭示蛋白质家族进化历史和个体目标蛋白质折叠机制之间的内在联系。在给定的30个测试蛋白上,FoldPAthreader预测的70%蛋白质的折叠中间体与生物实验数据一致(图2)。同时发现,该折叠力场可以有效地捕获氢键和疏水相互作用等关键的动力学特征。此外,研究工作提供了FoldPAthreader在线服务器(http://zhanglab-bioinf.com/PAthreader/)供社区用户免费使用(图3)。
图1. FoldPAthreader流程图
共包含6个步骤:三级结构建模、结构模板搜索、多结构比对、折叠信息提取和折叠片段库生成、力场模型构建、折叠路径预测
图2. 30个测试蛋白质的预测结果
蓝-灰结构是在天然态蛋白质上标注的折叠顺序。蓝色区域优先折叠,然后是灰色区域。红-白-蓝结构是FoldPAthreader预测的中间体集合。蓝色是预测的中间体重叠度较高的部分,表明在预测过程中优先折叠。红色表示重叠度较低,表明折叠发生得较晚
图3. FoldPAthreader在线服务器与输出示例
文章信息相关研究成果以“FoldPAthreader: predicting protein folding pathway using a novel folding force field model derived from known protein universe”为题于2024年6月11日发表在生物信息学领域国际期刊《Genome Biology》。浙江工业大学为唯一完成单位。浙江工业大学信息工程学院赵凯龙博士生为第一作者,浙江工业大学信息工程学院张贵军教授为通讯作者。该研究得到了科技部2030—“新一代人工智能”重大项目[2022ZD0115103]、国家自然科学基金项目[62173304]、浙江省自然科学基金重点项目[LZ20F030002]的资助。
https://doi.org/10.1186/s13059-024-03291-x
在线服务器链接http://zhanglab-bioinf.com/PAthreader
张贵军
浙江工业大学信息工程学院教授,博士生导师,入选浙江省高层次人才计划,兼任浙江省生物信息学学会人工智能专业委员会主任、中国生物分子预测与模拟专委会常务理事及副秘书长、浙江省生物信息学学会秘书长等。主要从事蛋白质结构AI建模、模型质量评估、蛋白质相互作用、折叠路径预测、抗体药物筛选方面的研究工作。主持科技部科技创新2030—“新一代人工智能”重大项目课题、国家自然科学基金面上项目以及省部级和企业合作项目20余项。在PNAS、Nature Computational Science、Nature Protocols、Genome Biology、Communications Biology、Nucleic Acids Research、Bioinformatics、PLOS CB、BIB以及TEVC、TCYB、TCBB等IEEE汇刊发表研究论文100多篇,授权国家发明专利100多项,获中国自动化学会自然科学二等奖1项。近五年来,课题组开发了PAthreader、DeepAssembly、DeepUMQA等蛋白质折叠、组装、模型质量评估等在线服务器、数据库及工具软件20多项(http://zhanglab-bioinf.com/services.html),开发的GuijunLab-RocketX服务器(算法名:DeepUMQA系列)在全球蛋白质结构预测竞赛(CASP15)蛋白质复合物界面接触残基精度评估赛道中排名第一;开发服务器多次在全球持续蛋白质结构预测竞赛(CAMEO)结构预测和模型质量两个类别中多次获得年、季、月冠军。往期回顾
浙工大鲍官军教授课题组在机器人柔性驱动研究领域取得新进展
优秀!浙工大9位青年学者入选浙江省科协青年人才托举培养项目
浙工大钱海丰教授团队新成果:用大数据评估海洋生态
—————————END—————————来源 | 信息工程学院