查看原文
其他

【热点】Nature: 人工智能会让化学家失业吗?

疾风劲草 化学加 2021-06-12

导读


2016年,“阿尔法围棋”在围棋人机大战中击败了韩国九段棋手、世界冠军李世石,引发巨大关注。在今年的政府工作报告中提到,加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进“互联网+”。发展智能产业,拓展智能生活,运用新技术、新业态、新模式,大力改造提升传统产业。那么人工智能是否可以应用在化学领域,实现部分化学工作的自动化呢?最近,Segler等人在Nature上发表研究工作,展示了他们设计的软件程序在有机合成中的神奇应用,文章DOI: 10.1038/nature25978。同时,Nature发文对此进行了点评,文章DOI: 10.1038/d41586-018-03774-5。随着人工智能的发展,人类不禁感慨,人工智能的发展是否会让部分化学工作者失业呢?

跳转阅读→同期两篇《Science》| 堪比“核弹”的超高能全氮阴离子盐再起风云, 引发科学争论

Scheme 1. 逆合成分析举例。图片来源:Nature

▼ 注册入驻化学加网,收获更多想要的 ▼

(长按识别二维码进入注册)

合成化学是从简单的分子构建目标化合物的过程,是化学学科的重要分支,长期以来,合成化学家的理论知识和经验被认为是成功构建分子的关键。在上个世纪60年代,有机合成大师E. J. Corey提出了“逆合成分析”的概念,并因此获得1990年的诺贝尔化学奖。合成化学家在考虑分子合成时,都会使用“逆合成分析”的方法,思考一系列问题(Scheme 1),比如:

1)该分子的前体结构是什么,该由什么样的最初原料构建?

2)每一步的产率怎么样?

3)每一步的操作可行性如何? 

然而,这一切真的只有人类才能完成吗?在查询每一步反应时,通常化学家会通过网络数据库如Scifinder或Reaxys等检索,那么是否可以设计一个程序,往其中植入足够多化学反应的数据库,让程序来设计合成路线呢?自上个世纪60年代起,人类一直都在设法寻找这样的程序,然而该研究很难取得成功。

有两个最基本的因素,阻碍了该研究的成功。首先,电脑硬件无法应对这样的挑战;其次,软件程序无法完全理解化学文献的复杂性。有机化学反应是极为复杂的,比如对某个特定反应,只有当Z基团不存在时,X基团可以顺利地转化为Y基团;但当Z基团存在时,也可以通过改变温度、酸碱度、溶剂等条件实现相应的转化。这样复杂的过程,是软件程序难于理解的。

针对第二个问题,人类已经开发了许多不同的解决方法。一种方法是往程序中植入足够多的化学反应,包括反应的局限性和条件限制。这样的程序往往会产生很多类似的合成路线,对这些路线进行评估便可以产生最合理的路线。目前这样的思路已经取得了一定的成功,并且产生了具有一定竞争力的软件产品。

Segler等人采用了另一种方法,他们考虑不把研究者的经验注入电脑,而让程序自己学习设计路线。事实上,程序存贮和记忆的容量比人脑要大得多,能提供的可能性也更多。目前,这样的研究已经产生了惊人的效果。

在该工作中,作者设计了一个电脑程序,可以自主地从一个大的数据库中学习化学反应,并进行细致地筛选。并且,它只会筛选已经被多次成功应用的反应。当程序被要求设计合成路线时,它可以像人类一样进行逆合成分析,根据自己掌握的知识制定出最有希望的合成前体,并对合成路线的可行性进行分析。作者将三个人工神经网络和一个随机Monte Carlo tree search结合起来(作者称之为3N-MCTS),用来产生最有希望的合成路线。

比如对如下药物候选分子的合成,在过去的报道中需要如下六步合成路线(Asian J. Chem. 201527, 2117-2124)。令人惊讶的是,作者利用他们开发的计算程序可以在5.4 s内发现该合成路线。

 

Scheme 2. 软件程序设计的逆合成分析。图片来源:Nature

值得一提的是,程序设计的合成路线不仅可以接受程序评分系统的考核,也可以接受训练有素的合成化学家的双盲实验审查。研究发现,对于test a, 化学家对于文献报道的路线和 3N-MCTS设计的路线没有明显的倾向性(Scheme 3a);对于test b, 相对没有知规矩制约的heuristic BFS程序,化学家高度倾向于3N-MCTS程序设计的合成路线(Scheme 3b)。对于test a 的task 1, MCTS 提供的路线是通过Ohira-Bestmann试剂发生Seyferth-Gilbert 增碳反应,而化学家倾向于选择经由Grignard反应的合成路线。尽管MCTS 路线在理论上是可能的,但在操作上不太方便。但接下来构建环系的方法则是一致的(Scheme 3c)。而对于test b,由于没有规矩的制约和范围的限制,heuristic BFS 产生了在逆合成分析中备受指责的错误(Scheme 3d)。因此,总体来说3N-MCTS产生的合成路线是较为合理的。

 

Scheme 3. MCTS产生的路线与文献报道的路线、BFS产生的路线进行双盲实验比较。图片来源:Nature

然而,这并不意味着程序给出的所有路线都是合理的,但化学家设计的合成路线也并不都是可行的。小编曾听不少学生抱怨,导师设计的合成路线是行不通的。因此,Segler等人报道的机器提出的路线不比人类提出的路线差,已经历史性地突破了。机器可以在短时间内分析众多的文献,在最短时间内提出可行的合成方案,这远远不是人类能比的。

那么人类不仅设想,如果人工智能继续发展下去,是否有一天会对合成化学家的工作岗位构成威胁呢?尽管软件无法处理特别复杂的、不常见的结构,但一些常规的合成问题会渐渐被AI取代。

总结:人工智能的发展,对很多化学家的工作岗位构成了威胁。然而,人工智能确实可以帮助化学家避免了许多重复的工作,让化学家把更多的精力放在思考高质量的问题上,比如该合成怎么样的分子、为什么要合成该分子,而不是把精力放在合成的具体细节上。目前来说,并不是所有化学家都能接受这一转变,然而历史的车轮滚滚向前,它不会随任何人的意志而改变,人工智能改变化学发展的日子终究要来。

原文链接:https://www.nature.com/articles/nature25978

评论:https://www.nature.com/articles/d41586-018-03774-5


欢迎广大读者分享赐稿或者有偿投稿

编辑手机/微信/QQ :18676881059 

邮箱:gongjian@huaxuejia.cn

拓展阅读


更多精彩,关注本号后,点击菜单栏或回复字母查看

回复 VNature/Science    回复 W有机化学

回复 T:科研动态    回复 i:美丽化学

回复 P:化工应用    回复 L科普知识

回复 C:漫画化学    回复 D:化学趣史

回复 F:化学视频    回复 Z科技名人



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存