查看原文
其他

DeepScreening:基于深度学习的药物虚拟筛选系统

BioArt BioArt 2022-04-16


前 言


药物研发具有投入大,风险高,周期长的特点,一般而言,一个药物研发周期在10年以上,研发投入在数十亿美金,并且呈现逐年上升趋势。近年来深度学习技术在无人驾驶,语音识别,图像识别等领域取得重大突破。同时,深度学习技术在生物医学领域也取得重要进展,利用深度学习在图像识别中的优势,已开发系列基于深度学习在皮肤癌、先天性白内障、儿童自闭症等疾病的诊断应用。制药工业界开始关注利用深度学习技术加速药物研发,降低研发成本。前期研究表明深度学习技术在优化合成路线,预测药物的药代性质,预测药物靶点,虚拟筛选,相比传统机器学习方法(如随机森林,支持向量机,贝叶斯模型等)方面具有优势。药物筛选是药物发现的关键环节,高通量药物虚拟筛选能大大降低筛选时间和成本,对于加速药物研发具有重要意义。

基于深度学习的药物虚拟筛选系统


广东省微生物研究所肠道健康与微生态研究组谢黎炜研究员开发了基于深度学习的药物虚拟筛选系统DeepScreening (deepscreening.xielab.net),结合分子指纹和深度神经网络方法,系统内置结构多样筛选库,实现在线自动建立深度学习模型和虚拟筛选,系统流畅,使用方便,帮助药物化学等从事药物发现人员针对自己的靶点进行快速筛选,获得潜在的活性化合物,加快药物发现。

图1. DeepScreening系统框架图

虚拟筛选效果


为验证筛选平台的筛选性能,采用5种分子指纹,从ChEMBL选择966个靶点数据测试深度神经网络分类模型性能,神经网络包括3层隐藏层,每层100个神经元,采用ReLU激活函数,Adam优化方法,学习率为0.001,每层采用batch normalization。采用计算AUC值作为性能指标,AUC平均值为0.86,中位数是0.89,表明基于分子指纹结合深度学习的筛选效果能力很好。

图2. DeepScreening分类模型测试结果


外部测试

为了进一步测试模型性能,从Journal of Medicinal Chemistry最新发表的PDE4D抑制剂和MetAP-2抑制剂作为测试,利用DeepScreening平台分别建立回归模型,PDE4D和MetAP-2回归模型的R2依次为0.76和0.6。表明模型具有较好的预测能力,然后利用建立的模型对新发现的抑制剂活性进行预测,模型预测的活性值pIC50与实验值的误差小于0.6,表明建立的神经网络模型具有很好的预测能力。


图3. PDE4D 抑制剂回归模型预测最新文献报道活性分子结果。

图4. MetAP-2抑制剂回归模型预测最新文献报道活性分子结果。

总 结


生物医药大数据的积累与人工智能技术正在快速改变药物研发的模式。然而由于受到方法与工具的限制,大部分药物化学家无法使用深度学习为代表的人工智能沿技术。因此,开发一款简单易用,界面友好的基于AI的筛选系统具有重要意义。DeepScreening采用深度神经网络作为建模引擎,利用ChEMBL作为化学生物数据来源,搭建了从筛选模型的构建,筛选,全新药物库的生成三大模块,用户可以快速在平台上针对具体靶点构建模型,全新库的生成,以及针对特定库进行快速的高通量筛选,DeepScreening有望加速活性化合物的发现,进而加速药物发现进程。

原文链接:
https://academic.oup.com/database/article/doi/10.1093/database/baz104/5585580

制版人:珂


参考文献



Liu, Z.; Du, J.; Fang, J.; Yin, Y.; Xu, G.; Xie, L. DeepScreening: A Deep Learning-Based Screening Web Server for Accelerating Drug Discovery. Database 2019, 1–11. https://doi.org/10.1093/database/baz104.

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存