Nat Machine Intelligence | 孙红哲/王俊文合作开发深度学习方法预测联系疾病的金属蛋白结合位点突变
责编丨兮
在过去几年中,人工智能(AI)(以机器模仿人类行为的能力)已经成为药物开发等高科技领域的关键参与者。人工智能工具可帮助科学家使用优化的计算方法来发现生物大数据背后的秘密。深层神经网络这类的AI方法改善了生物和化学应用中的决策,如疾病相关蛋白的预测、新型生物标志物的发现,以及小分子药物前体的从头设计。这些最先进的方法可帮助科学家更有效、更经济地开发潜在的药物。
2019年12月9日,香港大学化学系的孙红哲教授领导的研究团队与美国亚利桑那州梅奥医院的王俊文教授(前香港大学教授)合作在Nature Machine Intelligence杂志上发表文章Predicting disease-associated mutation of metal-binding sites in proteins using a deep learning approach,成功开发出强大的深度学习方法来预测与疾病相关的金属结合位点突变。这是用于预测金属蛋白中与疾病相关的金属相关位点突变的第一种深度学习方法,该方法为应对人类疾病提供了新的平台。
金属离子在人类生命体系的(病理)生理学中起着结构或功能上的关键作用。锌、铁和铜等金属对于所有生命都是必不可少的,必须严格控制其在细胞中的浓度。这些生理金属离子的缺乏或过量均会导致人类严重疾病。科学家已经发现人类基因组中的突变与不同疾病密切相关。如果这些突变发生在DNA的编码区域,则可能破坏蛋白质的金属结合位点,从而引发严重的人类疾病。了解蛋白质金属结合位点上与疾病相关的突变将有助于新药的开发。
研究团队首先整合了来自不同数据库的组学数据,以建立一个全面的数据集作培训深度学习模型之用。他们使用一种新颖方法,基于能量的亲和力网格图从金属结合位点提取空间特征。这些空间特征已与物理化学序列特征结合以训练模型。最终结果表明,使用空间特征增强了预测性能,曲线下面积 (AUC) 为0.90,准确度为0.82,提升了预测联系疾病的金属结合位点突变的技术。鉴于金属学和金属蛋白领域有限的先进技术和平台,该研究的深度学习方法提供了一种强有力的方法来整合实验数据与生物信息学分析。
图.训练深度学习模型的资料收集和特征提取的工作流程
孙教授说:“机器学习和人工智能在当前的生物和化学科学中发挥着重要作用。在我们课题组,我们使用整合组学的方法,包括金属组学和金属蛋白组学,来研究生物学和医学领域中的金属离子并且已经从体内、体外实验中获得了大量有价值的数据。我们现在开发基于深度学习的人工智能方法将这些原始数据转化为有价值的知识,从而发现疾病背后的秘密并与之抗争。我相信这种新颖的深度学习方法可以用于我们实验室正在进行的其他项目上。”
孙红哲教授是香港大学化学系讲座教授和叶志成范港喜基金教授(生物无机化学)。他的研究重点是生物无机化学和无机化学生物学,尤其是金属组学/金属组学和多元组学的集成。孙教授发表了一系列有关理解金属蛋白功能和克服抗生素抗药性的论文和著作,并拥有数项专利。