【数字技术·观点视角】我们正处于新科学革命的起点 | 学界热议AI for Science
近日发布的《达摩院2022十大科技趋势》将AI for Science列为重要趋势,认为“人工智能成为科学家的新生产工具,催生科研新范式”,引起学界热议。AI究竟对传统科研意味着什么?我们做好迎接准备了吗?
我们正处于新科学革命的起点
数百年来,以数据驱动的开普勒范式和以第一性原理驱动的牛顿范式是科学研究的两大基本范式。当下正在蓬勃兴起的AI for Science有可能促使两种既有范式的深度融合,激发一场新的科学革命。
《达摩院2022十大科技趋势》将AI for Science列为重要趋势,无疑是看到了人工智能和传统科研结合带来的巨大潜能。我希望它能帮助推动更多科研工作者投身其中,加速这场科学革命的进程。
科学研究有两大基本目的:一是寻求基本规律,二是解决实际问题。
在量子力学建立之时,狄拉克就预言说寻求基本规律的任务已大体完成,但因为其数学问题太复杂,用基本原理来解决实际问题非常困难。
直到上世纪50年代电子计算机开始投入使用,以及微分方程数值方法的出现,人类才第一次大规模实现了从基本原理出发解决实际问题的能力,并由此构建起了现代工业和技术赖以生存的基础。
但很多问题依然非常难以求解,比方说各类多体问题,药物和材料设计、蛋白质折叠、湍流、塑性力学和非牛顿流体力学等。
这些难题的根本根源是“维数灾难”:随着自由度的增多,问题的复杂度呈指数级增长。
我从80年代开始研究算法,一直在尝试解决这些问题。尤其是在多尺度模型和算法方面,我持续了多年的努力,但总是觉得难以找到真正的突破口。
2011年我写了一本多尺度模型方面的书。本来是想在山穷水尽之际转行到更需要科研人力投入的大数据领域,但我没想到的是,机器学习恰恰是我们过去缺乏的工具。
从2014年起,我即投身于机器学习与科学计算的结合。去年我们一个以年轻人为主力的团队利用机器学习方法在量子力学精度的分子动力学模拟方面取得了重大突破,把可处理体系的规模从1000个原子提高到1亿个原子,并因此获得了2020年戈登贝尔奖。这是我们第一次看到机器学习、科学计算、高性能计算三大工具的结合所带来的广阔空间。
AlphaFold 2的成功,更是让我们看到了数据驱动的方法所能带来的革命性的改变。
这个空间和改变给我们带来的将是新的科学工具的发展和新的科研模式的构建。它也将推动科学研究从小农作坊模式转变到大平台模式,即由整个科学家群体共同努力构建基础模型、基础算法和工具。
这样的大平台将极大地提升整体科研的效率。在这一方面,DeepModeling 开源社区已经迈开了非常可喜的一步。
AI for Science 带来的不仅仅是几个点上的突破,而是科研方法的全面改变。要适应这样一个新的环境,科学家们需要更深入地了解AI,才有可能用好AI。企业积累了大量AI研发能力和资源。它们不仅可以提供学界所急缺的计算资源,还能够帮助打造基础科研工具。无疑,学界和业界需要更多协作,秉持开源开放的精神,消除门户之见,打造AI for Science的科研共同体。
达摩院十大科技趋势或许就是这种努力之一。我期待达摩院牵头的这种努力,能够加快信息科学和传统科学的深度融合。也期待AI for Science不只是一个新的浪潮,而是一个全新的科学时代。
(此文为《达摩院2022十大科技趋势》序言)
人工智能不只是科研工具 还是一种思维
我认为人工智能一定会成为科学家的工具,但我希望还不要局限于此。
我们正处于一个数据密集型计算范式的年代。我们有海量的数据,科学家们可以从海量的这个数据里面,应用自己的方法论,进行科学探索。而运用方法论来进行科学发现和科学探索,一定是基于人工智能,所以说人工智能一定会成为科学家的工具。
为什么我又说不希望仅只局限于此呢?工具背后是人工智能的一种可计算思维的一种渗透,所以我希望科学家在使用工具的过程里,能够形成以一个以设计构造、计算为核心的计算思维。
比如说像AlphaFold,这个伟大研究成果的产生,不仅仅只是利用了深度神经网络作为工具,而是不同学科的科学家汇聚在一起。它先去设计了一条明确的可计算的思路,来解决从氨基酸序列到蛋白质三维空间结构预测。
所以说,我们需要形成计算思维来进行科学探索,同时恰到好处的应用人工智能这个工具,就能开创科学更加崭新的未来。AI for Science是一个充满着光辉前途的人工智能的趋势。
从AI for Industry 看AI for Science的发展
目前AI for Science已经有可圈点的突破,但主要还是比较点状的一些结果,包括分子生物学、量子力学等,还没有形成大面积的成果,仍然有很大的突破空间。
用AI去助力科研是基于两点,一个是基于数据、一个是基于计算。
因为我们要在数据和算力的基础上形成AI能力。所以如果这个学科有比较好的数据、比较丰富的数据,以及它的问题是需要大规模计算相关的,可能是比较快地容易取得突破的地方。
比如像分子生物学,还有天文学、地理科学、大气科学,这些都有大量数据,问题又非常复杂,需要强大的计算。这里可能能够利用一些AI的能力,能够更快取得一些突破。
从本质上来讲,AI for Science和 AI for Industry差别不大,AI也是作为推动领域发展的一个工具。只是这个领域有点不一样,它的门槛比较高,因为是科学家要做的事情,不是一个普通人、一般的技术工作人可以做的事情。
但回到本质,也是这个领域因为有了数据,可以设计算法去挖掘数据中的“玄机”,去解决这个领域的问题。
今天人工智能技术又往前走了一大步,可以让计算助力科研走向智能助力科研,智能会使科学研究的方法带来一些变化。
其带来的效果应该和产业界的是可以类比的,就是能够让科研的效率提升,成果的产出能够更多,甚至能从手工作坊的方式变成批量生产——当然这个很不容易。
AI for Science的下一步发展会如何发展?
AI for Industry的发展经历有一定参考意义,那就是从单点技术逐渐地走向了平台化,AI for Science可能也会促使科研平台产生。这样科学家们可能有更大的自由度、更强大的工具,能够更批量地去做科学研究,实现更加丰富、更加重要的科学突破。
AI for Industry从单点技术到平台以后,再往下我判断是走向系统,或者叫进化系统或者叫协同进化系统,能够长久地、持续地、深入地解决行业的问题,产生核心价值。
对于科研来讲也是,如果说每一个领域能够建造出这样一个AI系统,那么科学的发现有可能实现自动或者半自动的模式,它可以持续、持久、深入、广泛地做出一些科学的发现,这个可能是更长远的一个未来。
当然,自动模式能解决的是相对简单一些的科学发现、科学论证,并不是最前沿、最尖端、最复杂的问题——这一部分是要科学家利用强大的AI系统和科学专业能力去发现、去解决。
数学家如何与AI合作?
DeepMind与合作者最近在Nature发表论文,AI帮助解决了数学难题,引起很多人的关注。大家关心得不是结果,而是AI在数学研究中如何发挥作用。
先介绍下背景,这篇文章是关于低维拓扑,里面有十几个数学量,其中关键量是通过神经网络拟合在做分析得到。
作者猜测低位拓扑中存在未知的非线性关系,作者产生了很多数据并用神经网络拟合了近似函数,发现其中三个量在拟合过程中起到了很重要的作用,并且只用这三个量也拟合得非常好。
通过反正做拟合实验,产生新的数据,得到新的观察模型,最终数学家利用智慧猜出了一个不等式结构,并进一步给了严格的证明。
大家关心的是人机互动的过程,大量神经网络实验和两个数学家之间多轮的互动,Nature描述了互动过程。
自古以来,比如开普勒和其他应用科学家反复地做实验观察,从中寻找规律,现在AI算法和AI专家扮演了这个角色。这次创新主要用了神经网络的技术,包括多元非线性函数进行递进的技术和黑盒解释的技术。
总结来说,这个成功案例会激发纯数学家和AI合作证明一些新的猜想或者发现新结构。
延伸到AI for Science,我的看法是,AI的确可以加速科学实验。除了做计算机模拟之外,AI还可以告诉大家实验的方向。
在最近的天体物理中,AI优化太空望远镜的指向,同时搜集更多更有趣的数据,有点像自动驾驶,用AI做自动驾驶望远镜,加快规律的发现速度。
其次,AI推动人机结合。当然说起来简单,具体操作要复杂得多,科学家和AI专家必须紧密互动,比如数据生成、作图、构建神经网络和训练、利用神经网络进行结果验证等解决问题高度相关。
最后非常重要的一点是发展可解释的AI工具。AI产生的结论需要易于理解、能够溯源,这样才能建立与科学之间的桥梁,获得科学家的信任。
【研院动态】我院青年领航学者主讲《杭州城市大脑的起源与发展》
【数字法治·最新资讯】浙江出台全国首部公共数据领域地方性法规
【研院动态】刘靖:六讲六做宣讲|抓好城市治理体系和治理能力的现代化
内容来源 / 科学网,2021年12月29日
今日编辑 / 陈恬乐
责任编辑 / 戴晟昱
城市大脑研究院提供开放研讨平台,所有文章仅代表作者个人观点,欢迎共同探讨。原创文章,转载请注明来源:城市大脑研究院。部分图片来源于网络,如涉及版权问题,敬请及时联系我们。