IBM|基于云服务与AI驱动的自动化有机合成实验室(下)
Editor's Note
2020年8月底,IBM发布了建立在云端的RoboRXN化学实验室。RoboRXN融合了AI、机器人技术和云技术。化合物的设计由算法驱动,合成的操作由机器人执行。
The following article is from GoDesign Author PKUMDL
今天给大家介绍的是来自IBM Research Europe研究人员近三年发表的一系列关于人工智能应用于有机合成的相关工作。由于篇幅有限,本文将分为上下两篇,主要概述其代表工作并由笔者整理归纳其整体工作思路,仅供参考。
图1 IBM RXN for Chemistry主要工作及其整体思路(笔者自己整理归纳,仅供参考)
上一期已经介绍了前半部分的工作,讲解了“读文献”生成实验操作元与有机反应数据的预处理,本期将继续介绍学习有机反应数据后进行的三项预测任务以及预测新反应的实验操作。
预测正向反应的产物
逆合成反应预测
图3 从预测逆合成反应到寻找合成路线的流程示意图[9]
在超图探索过程中,研究人员采用了Coley等人在2018年发表的SCScore(一种分子合成复杂性的打分)[12],再结合类贝叶斯概率来决定图扩展的方向,最终找到由eMolecules数据库提供的可用的分子。在合成路线设计的评估方面,目前还没有benchmark,只能说体现了一定的潜力,可以为人工设计合成路线提供思路与启发,尚且无法处理复杂天然产物分子,对少数类别反应(氧化还原、酯化皂化等)的学习还不到位,容易得到不符合逻辑的逆合成切断策略。
预测反应产率
生成反应实验操作
图5 smiles2actions数据集生成与模型示意图[11]
表1 各模型预测合成操作的结果
总结与讨论
图6 IBM RoboRXN示意图(摘自官网介绍视频)
参考文献:
[1]Vaucher, A. C.; Zipoli, F.; Geluykens,J., et al., Automated extraction of chemical synthesis actions from experimental procedures. Nat. Commun. 2020,11 (1), 3601, DOI:10.1038/s41467-020-17266-6
[2]Schwaller, P.;Probst, D.; Vaucher, A. C., et al.,Mapping the space of chemical reactions using attention-based neural networks. Nat. Mach. Intell. 2021,3 (2), 144-152,DOI: 10.1038/s42256-020-00284-w
[3]Probst, D.;Schwaller, P.; Reymond, J.-L., Reaction Classification and Yield Prediction using the Differential Reaction Fingerprint DRFP. ChemRxiv 2021, DOI:10.33774/chemrxiv-2021-mc870
[4]Schwaller, P.;Vaucher, A. C.; Laino, T., et al.,Data augmentation strategies to improve reaction yield predictions and estimate uncertainty. ChemRxiv 2020, DOI:10.26434/chemrxiv.13286741.v1
[5]Toniato, A.;Schwaller, P.; Cardinale, A., et al.,Unassisted noise reduction of chemical reaction datasets. Nat. Mach. Intell. 2021,3 (6), 485-494, DOI:10.1038/s42256-021-00319-w
[6]Schwaller, P.;Hoover, B.; Reymond, J.-L., et al.,Extraction of organic chemistry grammar from unsupervised learning of chemical reactions. Sci. Adv. 2021,7 (15), eabe4166, DOI: 10.1126/sciadv.abe4166
[7]Schwaller, P.;Gaudin, T.; Lányi, D., et al., “Foundin Translation”: predicting outcomes of complex organic chemistry reactions using neural sequence-to-sequence models. Chem.Sci. 2018,9 (28), 6091-6098, DOI: 10.1039/C8SC02339E
[8]Schwaller, P.;Laino, T.; Gaudin, T., et al.,Molecular Transformer: A Model for Uncertainty-Calibrated Chemical Reaction Prediction. ACS Cent. Sci. 2019,5 (9), 1572-1583, DOI: 10.1021/acscentsci.9b00576
[9]Schwaller, P.;Petraglia, R.; Zullo, V., et al.,Predicting retrosynthetic pathways using transformer-based models and ahyper-graph exploration strategy. Chem.Sci. 2020,11 (12), 3316-3325, DOI: 10.1039/C9SC05704H
[10]Schwaller, P.;Vaucher, A. C.; Laino, T., et al.,Prediction of chemical reaction yields using deep learning. Mach. Learn.: Sci. Technol. 2021,2 (1), 015016, DOI: 10.1088/2632-2153/abc81d
[11]Vaucher, A. C.;Schwaller, P.; Geluykens, J., et al.,Inferring experimental procedures from text-based representations of chemical reactions. Nat. Commun. 2021,12 (1), 2573, DOI: 10.1038/s41467-021-22951-1
[12]Coley, C. W.; Rogers, L.; Green, W. H., et al., SCScore: Synthetic Complexity Learned from a Reaction Corpus. J. Chem. Inf. Model. 2018,58 (2), 252-261, DOI: 10.1021/acs.jcim.7b00622
作者:黄志贤
审稿:林康杰
编辑:由瀚天
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【自动化智能化药物发现】