【行业进展】AI:新药研发的新纪元
杨皓博
大学生,计算机视觉方向
作者 | 杨皓博(微信号Midlurker2017)
编辑 | 杨皓博
01
这个世界没有药神,但是有AI
口碑俱佳《我不是药神》前段时间火热上映,很多人怀着看喜剧的心情走进了电影院,结果却心情复杂地擦干眼泪出来。电影给我们带来了很多感动、深思,同时让更多人眼球投向了医疗、制药领域。
电影中吕受益想活着,听孩子叫声"爸爸"。
老奶奶想活着,三年把房子"吃"没了。
依然记得那几句话...
"这世界有一种病没药,就是穷病。"
"你能保证永远不得病吗?"
"他才二十岁"
"他只是想活着,犯了什么罪"
很多人观影后认为药厂定"天价药物",错在药厂可他们不知药厂每款成功的药品的研发成本,包括之前失败品,平均一款的上市需要十来年和几十上百亿,如此巨额的研发成本,只能专卖20年,销售峰期不过六七年,药厂不仅要收回成本,还要赚出下一款药品的费用,药价不高不行啊。斯坦福大学医学院院长米纳教授说过:“今天一款新药从关于它的第一批最重要的论文发表,到药品上市,大约需要20年的时间,在这过程中全部的科研投入至少为20亿美元。”所以药物价格昂贵怪不了药企,加上医疗资源不平衡,这是中国医药行业普遍的问题。
这个世界上本没有药神,但是有AI
AI可能是降低药品价格的合理途径之一,新药研发普遍存在着效率低下、时间密集、不断试错的创新过程,AI能为其带来显著改观。这正是许多人工智能专家所强调的价值。
02
AI药品研发技术
AI在靶点的发现
新药研发的目标是找到可调控机体生物学功能的实体物质,如小分子、大分子或生物活体等。而实体物质的发现首先要精准的找到疾病相关的靶点[1],接着通过靶点进行药物研发设计,然而传统的新药研发缺乏优质靶点,一旦出现一个获得临床验证的新靶点,叠罗汉式的前仆后继并不鲜见,研发成本也是疯狂增加。在制药界这般尴尬的境遇下,志在寻找新靶点的人工智能的出现, 综合计算化学、物理学以及结构生物学的相关知识,进行有效的小分子(或者大分子)的筛选与设计,从这个角度人工智能的相关技术将大量应用于疾病的靶点预测、高通量数据的分析以及系统生物学的建模过程中。
如Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[2]这篇论文中就提出使用了高通量组学数据的分析技术以及人工智能的相关建模方法,来挖掘和分析肿瘤相关的突变位点。
Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation[3]这篇论文中提出用机器学习的方法来评估致癌性去分化程度同时可以鉴定新靶点和相对可行的针对肿瘤分化的靶向疗法。
大家感兴趣可以看看上文中两篇论文,里面详细介绍了人工智能技术与复杂疾病靶点分析的方方面面研究。除了以上应用之外人工智能中自然语言处理技术(NLP)可以常见的即利用人工智能分析海量的文献、专利和临床结果,找出潜在的、被忽视的通路、蛋白和机制等与疾病的相关性,从而提出新的可供测试的假说,以期望发现新机制和新靶点。
小样本数据挖掘
由于近年来深度学习对药物研究领域也做出了巨大的贡献,是因为深度学习这种layer-wise的学习模式,天然适合对图像这种low-level feature的样本进行表征学习。通过逐层的网络学习,深度学习可自动学习图像的High-level feature,一定程度上避免了人工进行特征工程(Feature Engineering)的繁琐过程。如近年来发展的弱监督学习、小样本学习(one/few-shot learning)乃至零样本学习(zero-shot learning)也逐渐在药物研发领域应用。
例如最近斯坦福大学的Vijay Pande教授尝试用one-shot learning来进行low data drug discovery[4]
图中为小分子编码成一种适合于one-shot prediction的形式的神经网络。
文章中介绍了用于药物发现的低数据学习的任务,并给出了一种学习此类模型的体系结构。
上图为每个模型训练的分数,报告的数字是均值和标准差。随机度超过支持集的选择,20个支持集重复实验。附录包含所有未执行的Sider任务的结果。 s.每一行中平均值最高的结果将被高亮显示。表示法10/10−表示支持10个正面的例子和10个负面的例子。
Tox21.Tox21包括与人类毒性相关的12个核受体测定。文中训练了Tox21数据集收集的模型,并对SIDER集合的预测精度进行了评估。请注意,这些集合大致不同, Tox21检测结果进行核受体检测,Sider测定真实患者的不良反应。
上图为其余测定结果。在表6, 7和8中报告了每一个毒性检测的结果。
再如Molecular de-novo design through deep reinforcement learning[5]将强化学习用于小分子生成设计
如图是使用SVM分类器通过在Scikit-learn中建立在训练集上作为DRD2活动的预测模型,来预测对生物靶标具有活性的分子。
在最近6月份The rise of deep learning in drug discovery[6]这篇论文当中详细的介绍了当前深度学习在新药研发的主要应用以及新药研发未来发展,感兴趣大家可以自行了解~这些论文当中主要是药物研发领域面向小样本进行的有益尝试。
总的来说,人工智能在新药研发当中有很大的前景其原因如下:(1)人工智能在药物靶点的发现有巨大突破(2)小样本学习的发展是人工智能发展的重要方向。
03
制药公司对AI的应用
3.1罗氏基因泰克
罗氏基因泰克与医疗行业数据化分析公司GNS Healthcare达成协议,使用 GNS 的 AI 平台分析已知疗法在肿瘤学中的功效(主要利用贝叶斯概率推测肿瘤学中的疗法功效)。GNS Healthcare能把大数据、机器学习和仿真技术结合起来判断疾病预后效果,从而辅助医疗供应商进行市场决策。
3.2 强生
强生与英国AI技术开发和应用公司BenevolentAI达成新药研发合作。其核心技术是一个叫做JACS (Judgment Augmented Cognition System,判断加强认知系统)的人工智能系统。JACS在运算中从论文、临床试验中提取大量的数据,提取推动药物研发的知识,提出新的可被验证的假设,加速新药研发。强生把一些尚处于试验中的小分子化合物转交给了BenevolentAI,进行新药挖掘开发。
3.3 MSD
默沙东与美国的Atomwise合作共同构建AtomNet技术平台,它每天使用大量的深度学习算法和超级计算机工具分析数百万的潜在疗法,从而加快药物研发进程。主要针对的是新药的有效性和安全性预测。
3.4 辉瑞
辉瑞通过IBM的Watson机器人来对大量的文本数据进行快速分析,使用大量实验室数据、临床报告,用来寻找潜在药物,也就是上文中提到的使用NLP分析海量文本数据发现疾病靶点。此外,辉瑞也将VR技术带入新药研发领域,探索VR技术在药物研发的可能性。
3.5 GSK
GSK与指导药物研发的初创公司Exscientia在药物研发达成战略合作,Exscientia 通过AI药物研发平台为GSK的10个疾病靶点开发创新小分子药物,并且针对这些靶点药物发现临床候选药物。
04
总结
AI技术可应用于药物研发的各个层面(这里特指靶点筛选,小分子筛选、设计、合成,成药性评估等实验验证前阶段。大分子药物设计较为复杂,不在此次讨论范畴),各个大型制药公司也是积极使用AI应用于新药研发。
参考文献:
[1]https://en.wikipedia.org/wiki/Biological_target#Drug_targets
[2]Rodriguez H, Pennington S R. Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[J]. Cell, 2018, 173(3):535–539.
[3]Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation
[4]Altaetran H, Ramsundar B, Pappu A S, et al. Low Data Drug Discovery with One-Shot Learning.[J]. Acs Central Science, 2017, 3(4):283.
[5]Olivecrona M, Blaschke T, Engkvist O, et al. Molecular de-novo design through deep reinforcement learning[J]. Journal of Cheminformatics, 2017, 9(1):48.
[6]Chen H, Engkvist O, Wang Y, et al. The rise of deep learning in drug discovery[J]. Drug Discovery Today, 2018.
更多,欢迎到知乎专栏去投稿与交流。
打一个小广告,我的计算机视觉公开课《AI 图像识别项目从入门到上线》上线了,将讲述从零基础到完成一个实际的项目到微信小程序上线的整个流程,欢迎交流捧场。
如果想加入我们,后台留言吧
微信
Longlongtogo
公众号内容
1 图像基础|2 深度学习|3 行业信息
往期开源框架
往期综述
往期学员分享