MIT博士的催化材料征途:用AI4S造一枚化学工业“芯片”|甲子光年
追赶化学材料领域的ChatGPT时刻。
作者|苏霍伊
“量子离我们的生活一点都不远。”
“一米是多少距离,一秒是多长时间,而一千克又是多少质量?”刚一碰面,深度原理的创始人兼CEO贾皓钧便问了「甲子光年」三个问题。
两千多年前,庄子曾给出答案:一尺之捶,日取其半,万世不竭。与现代物理学中的基本定律不同,庄子和许多古代哲学家都认为物质是连续的,物质可以被无限分割,任何尺度的长度都只是相对和近似的,没有有绝对精确的度量标准,所以“一米”不能用基本物理定律精准定义它长度。
但物质并不是连续的。
“米、千克和秒这样耳熟能详的计量单位,都是用量子力学来标准化的。量子现象更加精准地定义了日常生活中的很多概念。” 深度原理创始人兼CTO段辰儒认为,“量子力学是人类近代最伟大的发现。”
数千年来,人们都以太阳定义时间。地球的自转和绕太阳公转的周期稳定性,也由此产生了天、小时、分钟等时间单位。实际上,“一秒”的定义既不是1/60分钟,也不是1/3600小时,现代科学给出了更精确的时间定义:“一秒”是铯-133原子基态的两个超精细能级之间发生9,192,631,770次跃迁的持续时间。
这种定义与地球的自转或公转周期无关,而是基于原子物理的恒定性。
“我们日常工作等精确到分钟就足够了。”贾皓钧说,“然而社会生产、科学研究和国防建设中,需要极其精确的时间测量,精度高达千分之一秒甚至百万分之一秒。对时间极致追求的科学家们在20世纪50年代发明了永久的时间测量标准——铯原子钟。”
铯原子钟以原子的运动为基准。当用激光照射铯原子时,铯原子最外层的单个电子会在两个状态之间来回循环,即超精细跃迁,这个速率是恒定的。其精确度在2000万年的时间跨度内,误差仅为一秒钟。
使用铯原子定义的一秒与原来的一秒时长无异,但这种新的定义涉及到铯原子内部电子的量子态变化,正是量子力学研究的核心内容。
“量子力学为我们描述和预测微观粒子的状态及其变化提供了理论框架。这些粒子状态的变化是物质相互转换的基础,深深影响着材料和化学领域。”段辰儒进而表示,“我们的研究就是通过AI for Science(简称AI4S)的方法,结合量子化学和实验解锁新的化学反应,以及发现更高效的催化剂。”
AI4S并不是一个新词。它是使用AI相关的技术和思想来指导科学发现,一个典型的例子是谷歌的DeepMind团队开发的蛋白质折叠模型AlphaFold。无论是科技行业的领头羊如微软、英伟达和字节跳动等,还是化学材料制造的巨头巴斯夫和陶氏、3M等,都在斥巨资布局AI4S领域。
随着AI4S技术朝着规模化和产业化发展,贾皓钧和段辰儒捕捉到了其中的应用潜力——如果在化学领域实现规模化和产业化,就能推动高效且成本低廉的催化材料的研发,还提高能源使用效率和温室气体的转化率。
瞄准时机,两人一拍即合,共同创办深度原理科技公司,专攻化学反应和催化材料。
六月回国后,他们完成了近千万美元的种子轮融资。本轮融资由线性资本领投,真知创投和Taihill Venture跟投,晶泰科技与深势科技作为科技产业方参与。在美国去工业化背景下,中国的材料化学企业正在从生产向研发转型,AI4S在这里前景更加广阔。
2022年,段辰儒获得麻省理工学院(以下称MIT)化学的博士学位,此前曾在微软担任研究科学家,主要研究生成式AI和大模型在化学方面的应用,和微软AI4S研究的产品化;贾皓钧也在今年获得了MIT物理化学博士学位,此前他曾任职陶氏化学的核心研发部门,利用人工智能技术开发催化剂配方和预测化学反应过程。
为什么是催化剂?
能源是人类社会运转的基础,而催化剂则是能源效率的关键之匙,毫不夸张地讲,催化剂就是现代化学材料工业生产中的“芯片”。
“化学反应无处不在。”贾皓钧介绍,“其中90%以上的化学品是通过催化工艺合成制备的,催化所创造的产值约占全球GDP的30%。工业生产中,催化剂贯穿整个化学反应。为了更好地控制这些反应,我们迫切需要关于催化材料的创新。”
以合成氨的生产为例,这一过程每年消耗全球1%至2%的能源,并造成全球约3%的碳排放。通过改进催化剂,若能将合成氨的转化提升1%,那么不仅能节省数十亿美元的成本,还能大幅减少碳排放。
“当AI4S技术将合成氨效率提高5%时,便是我心中化学材料的‘ChatGPT时刻’。”段辰儒说。
但发掘新型催化材料是一个极复杂的多任务问题。过程涉及大量的衡量标准和极大的材料空间。实验设计、数据分析和理论模拟,每一步都需要精确的控制和深刻的化学理解。不仅是科学上的难题,更是工程上的挑战。
基础科研不存在捷径。对于基础学科的前沿研究来说,理论知识是基础,未知问题的答案往往不会在课本上出现。而由此科研成果衍生的创业尝试,尽管困难重重,却能真正地重塑能源未来。贾皓钧略带激动地说:“化学改变了世界,现在,我们用人工智能改变化学。”
曾经在MIT化学工程系楼里,贾皓钧和段辰儒占据着实验室一角,埋头于屏幕前,键盘不断发出粗重的颤音,这是大脑与AI同频共振的声音,有时空气中还会弥漫一阵热力推动的电子元件的实验室气味。两个人经常在这里一待就是十几个小时,用字符编织算法,在与数据无声对话。
现在,一个绿色且高效的未来,正在深度原理中,静静孕育。未来的图景如星空璀璨,脚下的征途依然漫长,他们正在一步一步地迈进。
1.催化剂是工业生产的“芯片”
段辰儒和贾皓钧有时觉得自己的工作就像在沙场排兵布阵,对化学结构调兵遣将,而新材料就是队伍中的主力军。他们专攻催化领域,通过催化作用来影响化学反应,控制化学键的断裂和新化学键生成的速度和方向。
比如煤碳转化为石油的自然过程需要数百万到数亿年,但借助催化剂,这一过程显著加速。催化剂能在温和的条件下促使原本难以进行的反应顺利进行,从而改变物质和能源的转化方式。“我们的主要任务是寻找性能优异的新催化剂,并设计和实现新的催化反应过程。”贾皓钧解释道。
从面包烘焙到火箭升天,数千年来人类一直在不知不觉中感受着催化的力量。
在化学反应的历史中,每当发现新的催化剂或化学反应,人类合成新化合物的数量都会经历跳跃式增长,为科学发现和工业生产模式带来革命性变化。就像1950年代,齐格勒-纳塔催化剂(Ziegler-Natta Catalysts)的诞生时。它主要用于聚合反应,特别是聚合乙烯和丙烯这类塑料的生产。齐格勒-纳塔催化剂让塑料制品的大规模生产成为可能,极大地推动了现代塑料工业进程,影响了包装、建筑、汽车等多个行业。
能源是人类社会不可或缺的血液。
工业革命以来,人类大规模开采化石能源。在煤炭、石油与天然气燃烧的灰烬中诞生了高楼大厦与车水马龙。然而这种对化石能源的过度依赖以及二氧化碳的大量排放,也带来了资源枯竭、生态失衡和全球气候变化等一系列问题。
数据显示,自工业革命以来,全球地表平均温度已升高约1.1摄氏度,预计到21世纪中叶将超过2摄氏度。同时全球大气污染正威胁人类生存条件。按照当前消费水平推测,全球煤炭储备将维持不超过200年,石油则可能在50至100年内耗尽。
能源危机兵临城下,探索新型催化材料迫在眉睫。
2017年《Nature》刊登的文章《The Drug-maker’s Guide to the Galaxy》中提到,在整个化学空间中,人类可发现材料(物质)的可能性,是10的60次方。
但筛选10的60次方种材料如是现实中不可能完成的任务。
“用一个最优条件假设,我们就能充分认识到催化材料设计的困难。假设只需 1 微秒即可获得一份候选材料的所有所需信息,且我们拥有与Nvidia总销量相等的1300万台A100 GPU,同时并行、不间断地运行它们。我们每年消耗114大千瓦时的电力(占人类总用电量的 0.5%)。”段辰儒分析,“理想情况下,遍历这些材料需要10的36次方年,宇宙寿命大约为100亿年,这相当于宇宙寿命的10的26方倍。”
诚然科技发展早期,新材料的发现易如探囊取物,比如爱迪生通过试验找到灯丝材料钨的过程。
传统化学发现过程依赖于不断的试验和错误,此过程通常涉及实验室中的化学发现,但手工操作准确性不尽人意,整个过程的时间尺度从几个月延伸到几年,费用和时间成本都很高。但这种“大海捞针”式的方法论已无法满足当前新材料研发的需求。
想寻找催化材料的答案,要深入到肉眼不可见的微观世界。原子正等待着从杂乱无章逐渐走向有序,在最适合的微观结构中释放潜力。段辰儒介绍:“借助AI4S,我们能在信息大海中快速定位到最有价值的资源。”
贾皓钧和段辰儒在寻求一种“既有当前又有未来,我们要寻找一些全新的可能”。他们将实验、计算与机器学习三成形成一个循环(Experiment-Computation-ML in a Loop),通过AI决策链结合这些“武器”,从而优化整个化学发现的过程,让“AI炼金术”成为现实。
“现在国内高校和企业越发重视AI4S了,但深入的空间还很大。我们要做的是弥补材料化学和AI结合创新的空白。”贾皓钧说道。
2.“AI计算”炼金术
深度原理的核心算法有4块:
ReactControl:使⽤多种⼯具进⾏即时决策,以提⾼成本准确性权衡,超过⼀半的计算和实验努⼒都因失败的尝试⽽⽩费。 ReactControl 将节省⼀半以上评估催化剂性能的时间;
ReactBO:通过⻉叶斯算法的优化来发掘催化剂并优化反应条件,1000倍加速在拥有32.5M⼤⼩的材料空间中发掘可合成的发⾊团; Reactify:使⽤推荐引擎来进⾏⽅法选择和改进决策,让误差减少六倍,使⾼通量 DFT ⾸次达到实验精度。 ReactGen:⽣成式⼈⼯智能辅助对新型催化材料和反应的快速采样,采⽤反向设计,无需筛选10的60次方种材料。
关于OA-ReactDiff论文切片,来源:受访者
该论文的《Nature Computational Science》封面,来源:受访者
3.创业不是“做饭”
Kulik组的合影,其中Heather Kulik(左一)、段辰儒(左五)和贾皓钧(右一)。来源:受访者
段辰儒在微软总部的留影,来源:受访者
市场与技术的不确定性,来源:The Engine Ventures
贾皓钧在MIT博士毕业典礼上,来源:受访者
段辰儒分享了自己在计算机顶级会议ICML和NeurIPS上组织AI4S社群和会议的体验,“从参加人数的急剧增加可以看出社区的兴盛和AI在科学中应用的热度上升。”段辰儒说,“AI4S是一个兴起的领域。作为最顶尖的研究者时,我们最擅长的就是重塑问题并解决它们;那在创业时,我们为什么不挖掘工业界催化材料的研发生产问题并解决他们呢?作为CTO,我最重要的使命就是找到AI4S在化学材料领域最顶尖的研究者和工程师,把他们聚集在深度原理,和他们一起在工业界真实的应用场景上‘打怪’。”
“我希望深度原理不仅成为一个成功的公司,更是一个科技创新的象征,吸引全球顶尖的科学家和工程师来此大展身手。”贾皓钧憧憬着。
END.