JCIM | 建立药物研发中的图灵测试,让人工智能与药物化学家公平挑战
Alex Zhavoronkov
Alex Zhavoronkov博士,Insilico Medicine的创始人兼CEO。Zhavoronkov博士是借助GAN和强化学习从事药物发现和衰老研究的先驱之一。
背景介绍
自从计算机时代开始,科学家们就设想了全自动药物发现的可能性。然而,尽管在高性能计算、机器人技术、高通量化学合成和生物筛选、基因组学、蛋白质组学和许多其他领域取得了众多进步,但药物研究和开发的效率实际上却已经随着时间的推移而下降;例如,2016年批准的每一种新药的研发成本超过25亿美元,高于2013年的10亿美元。这些技术中有许多在历史上被吹捧为变革性技术,但未能在制药研发过程中提供切实的加速和降低成本,导致了人们对新技术的质疑。人工智能(AI)也不例外,比如2016年,当Insilicon Medicine和哈佛大学的Aspuru-Guzik实验室首次将最流行的现代人工智能技术生成对抗网络(GANs)推荐给药物发现时,但制药业并未接受这种方法。在会议上对产生分子结构的新系统的介绍导致了对证明分子活性的实验数据的要求,至少对于简单的目标。
随着技术的发展,研究者开始生成和合成具有特定特性的化合物,制药界开始要求使用更困难的目标物和动物验证进行演示。使用一个简单的开源系统对多种化合物进行额外的验证,导致了对在老鼠身上测试的单一分子的新奇性的批评。使用现代生成化学系统快速设计的不同和新分子的进一步演示常常导致对人类临床数据的要求。使用人工智能发现目标也产生了类似的反应。对特定疾病新靶点发现的演示,通常会导致要求在最相关的疾病模型中进行实验验证,甚至在2期临床研究中进行验证。这些要求在今天显得十分引人注目,因为目前有数十种以前的药物正在进行针对COVID-19疾病的人体临床试验,几乎没有直接理由排除这些药物的潜在可能性。
很明显, AI对制药行业影响的最佳展示,将是针对一种重大疾病推出一种完全使用人工智能系统设计的重磅药物: 从新靶标的识别和新分子的设计,到识别合适的患者的伴生AI生物标志物和完成临床试验的所有阶段。然而,对于像特定癌症或纤维化这样的重大疾病,这种验证过程将需要数年和数千万美元。事实上,分子植入医学计划在2021年进行临床试验,是在2019年使用旧算法设计的,2018年确定了目标。
这个例子描述了人工智能药物发现的主要挑战之一:使用今天的人工智能发现的药物将需要5-6年和数百万美元才能被制药行业接受,而用于发现这些药物的人工智能引擎每年都可能发生巨大变化。另一个挑战是,先进的人工智能系统的开发和验证需要花费数百万美元,而对于商业组织来说,挑战是在同行评审的期刊上发表最新的成果会导致关键知识产权的损失,以至于只有低优先级的概念证明系统才会被发表。
为了克服这一挑战并加速现代人工智能的采用,研究者需要探索信息技术行业用来打破“人工智能冬天”的最佳实践。在计算机科学领域,有一种图灵测试,要求人类区分机器和人类,还有ImageNet,在2015年,测试图像识别准确率的算法超过了人类。2017年,研究者建立了一个内部的图灵测试化学AI(http://www.chemistry.ai)系统评估早期生成化学管道的输出,以确保人类专家不仅喜欢用AI生成的分子,而且不能真正区分机器生成的分子和那些来自高价值数据库中的分子。为了加快人工智能在制药行业的应用,研究者必须在制药研发过程的每个阶段设计一个挑战,让人类专家和人工智能在速度和性能上竞争。
挑战
在这里,研究者提出了利用先进的人工智能技术来自动设计具有预定义属性的分子的生成化学的一系列挑战。这一挑战的工作流程将首先由一组专家提名独立的目标,然后使用AI进行小分子生成步骤(图1A)。然后,人类药物化学家会对生成的分子进行评论和注释,预测它们的性质,并根据预测的活性和其他参数对它们进行排序。随后,对最高和最低的分子进行合成和测试,并根据生成条件、人工智能的预测和专家药物化学家的预测对结果进行比较。研究者预测,发展这个提议成为一个全面的竞争系列与许多医药化学家和AI团队的参与将是昂贵的。然而,研究者提出了一个多相的方法,在其中一个AI平台上从一个简单的试点实验开始,例如,Insilo Medicine’s Chemistry42 (https://www.chemistry42.com),是为一个给定的目标生成分子的挑战。目标最好与具有高度优先级别和高度公共利益的疾病相关,如SARS-CoV-2引起的COVID-19。随后,人类药物化学家将被要求对生成的分子进行注释。最后,可能会有几个AI公司和学术机构举办一场比赛,以进一步促进这个拟议的工作流程的实施(图1B)。
图1 工作流程和挑战
展望和结论
研究者相信,通过公开竞赛或制药公司内部活动的形式,定期组织人工智能对人类的挑战,将有助于推动人工智能在药物研发方面的发展,让使用传统方法的科学家熟悉这些新兴方法,并避免在这个迅速崛起的行业可能出现的“人工智能冬季”。
注:作者邀请感兴趣的读者和研究小组直接与他联系,如果他们有兴趣参加这个挑战。
国内相关尝试
为了提高生成分子的质量,中国科学院上海药物研究所刘小红和郑明月近期也开展调查问卷,他们最近开发了一个挑选化合物结构的AI打分模型,综合考虑了可合成性和成药性两方面因素,希望能够与人类专家的经验判断进行对照比较。每份问卷中仅包含随机的10个化合物结构,邀请业界药物化学专家对化合物的合成难度和成药性进行打分,将在7月20日汇总收到的表格,统计人类专家对每个化合物的打分,同时给出AI预测模型的打分,相关的结果整理后反馈给参与者。
参与链接:http://survey.simm.cloud/m/84750648.aspx
参考文献
Alex Zhavoronkov Medicinal Chemists versus Machines Challenge: What Will It Take to Adopt and Advance Artificial Intelligence for Drug Discovery? Journal of Chemical Information and Modeling 2020 60(6),2657-2659. DOI: 10.1021/acs.jcim.0c00435
相关文章
喜欢我们的内容记得给个“三连”-关注、在看、转发