就是这么牛!AI化学家对战10年合成经验老司机!
近年来,多个AI辅助逆合成产品被研发出来,并逐渐被应用于制药领域。但迄今为止,尚未有公开的测试报道将AI的路线设计能力与有经验的人类化学家进行对比分析。
不久前,智化科技研发的ChemAIRS逆合成系统与上海已铼生物科技的化学家进行了一场人机对比测评,从合成难度、合成思路、合成步骤数、路线合理性等角度对结果进行综合评定,对ChemAIRS合成路线设计与人工合成设计的案例进行全面分析。人机测评展示
这次测评选取22个有机分子(不含手性),分子合成难度接近药物化学家实际工作中遇到的分子复杂度,路线合成总步数从8步到14步不等。由16名平均具备10年合成经验的化学家来完成人工的路线设计,且设计过程可借助其他查询工具以及参考资料。
与此同时,ChemAIRS也对这22个分子进行批量路线设计,并从每个分子的路线结果中选出2条路线作测评打分。打分规则参考了合成思路合理性,合成步骤数,路线反应可行性等指标,打分时对化学家设计的路线和机器路线进行混淆,以保证评分的公平性。
合成路线设计速度对比
基于设计合成路线的速度评定结果,化学家设计合成路线所花费时间都在2小时以内,平均时间为1.5小时左右,AI计算路线平均总时间为8.7分钟,第一条路线找到的时间平均为2分钟,AI会给出多条路线,并能够按照合成路线难易和总步数排序。从路线设计速度上AI算法接近化学家的10倍。
合成路线的可行性打分对比
由6名资深化学家评委对22个分子的化学家/AI合成路线进行评分。可行的路线应该在6分以上,最高10分。化学家得分和AI得分的对比显示,在10个例子中,AI路线的分数与化学家的分数比较接近(差距在0.5分以内)。在7个例子中,化学家平均分数较高,在5个例子中AI设计的路线平均分数较高。整体在68%的例子中,AI与化学家相比做到了持平或更好。
合成路线的多样性对比
测试团队也统计了AI路线的不同合成策略数量,设计不同策略的合成路线对化学家来说难度较大。但在实际工作中,经常会出现由于某关键步骤的失败而需要改变合成策略的情况。在本次测评中,AI在数分钟内给到了5-20条不等的路线。可以从下图看到,在这些路线中,每个分子平均能有2-6种不同的合成策略,包含不同的关键步骤和关键中间体,帮助化学家快速找到成功率更高的方法和最经济易得的起始物料。
测试团队从22个测试分子选取了3个分子作为展示,验证AI算法合成路线可行性与化学家相近甚至更优。以TM1为例,在构建咪唑环的反应中,化学家在第六步用原甲酸三乙酯先构建咪唑环,进而对咪唑环先后碘化和偶联反应。在AI合成路线中,则是在第五步中使用芳香醛与二氨基底物直接一步实现芳基取代的咪唑环的构建,AI路线的合成步骤更加的简短高效。
在TM2的合成中,两条路线均有咪唑环构建的关键步骤。在化学家的路线中,第二步和第三步先后实现咪唑环构建和后续的溴代,相比之下, AI合成路线则在第二步就采用了更加简短高效的方法一步实现了碘取代的咪唑环的构建。除此之外,两条路线在整体上除了合成关键中间体的次序有差异外,可行性和策略都较为一致。
在TM3中,有一个七元氧环需要构建,化学家先通过傅克反应并在后续的官能团转化得到七元氧环,但是第二步的傅克反应可能会存在位点选择性问题,这样势必会对后续的分离和鉴定造成影响;而在AI合成路线中,则是在第四步完成双醇化合物的合成,并在第五步通过Mitsunobo反应完成七元氧环的构建,并且不存在选择性问题,且其他合成步骤也不存在可行性问题。AI路线评分优于人工合成路线。
人机测评结论
从对路线设计速度,可行性和多样性测评结果可以看出,当前ChemAIRS的路线设计能力非常接近于10年合成经验的化学家,而设计速度和策略多样性方面则超过了有经验的化学家,且将路线设计的速度提升10倍左右,在68%的情况下能够更快的设计出类似或者更好的路线,并使23%的路线质量得到提升。同时算法还能够给出化学家2-6种不同的合成策略做参考,为找到更好,更经济的路线提供设计思路,解决困难目标分子的合成问题。
以ChemAIRS为代表的逆合成系统并不能替代化学家,特别是针对某些比较新颖的结构,AI还不能代替化学家去进行创新性的思考。但它作为化学家设计路线的重要工具,可实现增强人类智能的目的,就像汽车让人更快一样。相信化学家将能够在这类工具的帮助下能够更高效,更轻松的设计出更好,更经济环保的合成路线。
注:由于本次内部测评的分子数量有限,结果并不具备统计意义,期待未来能够针对此领域进行更深入全面的测试研究。(来源:化学宝库,如有侵权请联系删除)余金权,再发Nature!“分子编辑”壮举,里程碑成就可合成大量化学品