查看原文
其他

新的科研范式和工业业态应该如何实现|鄂维南院士再谈AI for Science

AISI 深度势能 2022-09-11

本周三下午,北京科学智能研究院(AI for Science Institute, Beijing, 下简称AISI)院长鄂维南院士做了一场名为《再谈AI for Science》的报告,反响热烈。

数年前,鄂维南院士在国际上率先提出“AI for Science”的概念,大力推动了 AI for Science 在应用数学、物理、化学、力学、材料学、生物学等多个领域的发展。随着AI for Science得到来自学界和业界越来越广泛的关注,一系列新的问题涌现了出来:AI for Science有怎样的方法论?有哪些新的方向值得我们关注,又有哪些需要注意的地方?AI for Science的未来会怎样?

当下,“AI for Science”的先驱在此背景下“再谈AI for Science”,自然得到了广泛的关注。在这场报告中,鄂老师从近年来科学研究所面对的实际挑战出发,解释了AI for Science兴起的背景。基于此鄂老师总结了实现AI for Science的三大主要途径处理数据的新方法(AI)处理物理模型(基本原理)的新方法模型驱动与数据驱动方法的深度融合进一步,鄂老师提出了AI for Science的新机会新的科学范式新的工业生态,并分享如何冷静的应对AI for Science的新局面包括如何建立新的基础设施,如何选择课题、组建团队、确立目标,等等。最后,鄂老师向大家介绍了新成立的AISI的愿景、使命,以及要做的事情。

讲座视频回放

你可以直接点击下面的视频观看👇

也可以去B站观看,视频链接:
https://www.bilibili.com/video/BV1vR4y1c7gQ?spm_id_from=333.337.search-card.all.click

讲座精彩回顾

科学研究面临的挑战&AI for Science兴起
科学研究总体上可以分成基于数据驱动的开普勒范式和基于原理驱动的牛顿范式,然而这两种范式在现代都遇到各自的挑战。对于牛顿范式,其核心瓶颈是处理基本原理的算法面临维数灾难问题。在现有算力条件下,经典的算法难以在有限时间内得到结果。深度学习本质是在解决高维的数学问题,深度神经网络对高维函数提供了有效的逼近方法。这就是AI for Science的基础。


AI for Science三大主要途径

处理数据的新方法(AI)

AI for Science第一条主要途径是处理数据的新方法(AI)。这里最成功的例子是AlphaFold2。蛋白折叠问题是一个典型的高维问题,AlphaFold2通过AI的方式彻底改变了蛋白折叠的技术路线,基本解决了这个问题。不过AlphaFold2是一个纯粹的数据驱动的模型,而科学追求的是基本原理方面的突破。基本原理方面的突破,它带来的不仅仅是更深的理解,而是更一般的方法论。


处理物理模型(基本原理)的新方法

AI for Science的第二条主要途径是发现处理物理模型(基本原理)的新方法。这里最成功的例子是DeePMD的相关工作。以分子动力学为例,传统分子动力学在计算势函数的时候靠经验力场,这个结果不可靠;第一性原理的方法通过量子力学模型计算,虽然可靠但是效率低,难以大规模使用。而基于机器学习的Deep Potential方法,依靠量子力学模型提供训练数据,用深度神经网络对高维势函数进行拟合,就可以同时保证算法的准确性和高效性。这种将物理模型、机器学习和高性能计算深度结合的方法,为我们展示了非常巨大的空间。


回到多尺度建模的问题,鄂老师指出我们现在已经比较好的构建了分子动力学领域的模型,然而其他尺度的物理模型构建依然存在大量挑战亟待解决。比如微观领域能否开发真正可靠,真正通用的密度泛函模型?等等。


模型驱动与数据驱动方法的深度融合

AI for Science的第三条主要途径是将模型驱动和数据驱动的方法深度融合。例如虽然AlphaFold2可以基本解决蛋白折叠的问题,但是面对药物设计,就需要考虑化合物、考虑结合自由能等。而这就无法纯粹靠数据驱动来解决,需要将模型(原理)驱动和数据驱动相结合。


这一块的的主要挑战很多,比如“数据同化”、“观测和模型的同步学习”、“强化学习”、“相关实验的设计”等等。同时鄂老师强调,相比于之前的挑战,这块的挑战更像是一个系统化的工程。每一个场景可能都需要一个庞大的团队来完成,当然这也意味着巨大的空间和机会。

AI for Science的新机会

新的科研范式

AI for Science会对每一位科研工作者产生深远影响,势必会在科研领域产生新的科研范式。

首先在未来,理论/计算 和 实验会有更密切的合作。因为随着AI for Science的发展,在很多计算领域,如计算物理、计算化学、计算生物学中,理论计算与实验结果的差距在未来10-20年的时间中会极大缩小,这势必会让理论计算和实验有更密切的合作。

再从计算的角度上,随着理论计算重要性逐渐增加,科学研究会从“小农作坊模式”到“安卓模式”转变,即产生平台化的科研模式。

进一步鄂老师以实验领域为例,讲了AI for Science对其产生的影响:比如在实验设计中新的算法(如同步学习)可以更好的帮助设计有效实验,避免浪费时间;新的实验能力,如智能机器人帮助自动化实验操作等等。


新的工业生态

什么是“工业新业态”?

在微观层面,我们基于AI for Science的基础模型、基础原理,基于新的算法和能力设想一个新的框架,即微尺度工业设计软件。这是一个系统化的工程,包括底层算法和模型的研究,数据平台的搭建等。这项工作将让我们具备真正的微尺度工业设计能力,让我们在药物、材料、催化等问题上,逐渐摆脱基于经验的“试错法”,而从底层原理出发进行基于理论计算的自动化设计。

除了设计以外,在制造领域相关条件也发展迅猛。以鄂老师90年代研究的材料增长问题为例,当时面对大量挑战:例如没有高效且精确的分子动力学方法、只能控制少数变量等。近年来随着AI for Science的发展,这些问题都有很大突破,使得原本难以解决的问题能够被高效的解决。因此微观领域工业制造在未来也将成为一个很大的产业。


宏观层面的工作制造,主要是指拥有新的CAx体系,包括CAA, CAD, CAM等。传统工业设计软件在网格生成方面耗费了70%以上的时间,同时其几何设计与工程目标脱节。下一代的工业设计软件的一个非常重要的目标,就是设计软件一体化和智能化,而机器学习就是实现这个目标的关键。


如何应对AI for Science的新局面
最后鄂老师谈了如何应对AI for Science的新局面。首先鄂老师告诫大家在热门的领域,保持头脑不发热是一件很困难但是非常重要的事情。对此鄂老师重点谈了3个问题:
  1. 我们应该如何建立新的基础设施?
  2. 如何选择课题、组建团队、确定目标?
  3. 有哪些新的方向值得关注?

新的基础设施

这里主要包括:数据、模型、算法和算力。

“数据”主要是指高质量的数据库建设(比如新的实验平台、新的数据合作平台等),和知识库的建设(如新的知识工程等)。“模型”主要是指不同时空尺度下各种物理模型,包括终极难题多体薛定谔方程和Navier-Stokes方程。“算法”包括数据同化算法、高维空间的探索和采样算法、处理稀有事件的算法(时间尺度问题)和其他时间尺度的算法问题。“算力”主要包括如何通过更好的软硬件设计、调度提升整体的运算效果。



如何选择课题、组建团队、确立目标?

首先要对自己重新定位,重新确定自己的目标:要以真正能够解决一些实际问题为目标,而不能满足于发一两篇不切实际的论文。鄂老师强调要从基础原理出发,最终能够将科研成果应用到实际中,这才是一个学者的立身之本。其次从团队方面,AI for Science需要垂直整合的团队。需要不同背景的科研人员(从原理到实验背景)进行高频率的日常交流。


哪些新方向值得关注?

鄂老师提了3个值得关注的问题。首先是元素周期表,即对分子的性质和材料的性质做更系统的描述;其次是湍流问题,鄂老师建议在可压缩问题上多花功夫;最后是计算物理方面,比如重整化群、量子多体问题等等。



更多关于"AI for Science"的前沿讨论,欢迎关注2022首届科学智能峰会大会由AISI主办、深势科技承办,将邀请多位院士、科研专家、前瞻投资人、企业领袖等学术界、产业界重量级人物汇聚一堂,跨界融合,通过报告分享、圆桌讨论及多场主题分论坛活动,共创"AI for Science"新未来!大会将于六月下旬到七月上旬在北京与您见面,同期还将发布AI4S全球发展报告。扫描下方二维码获取大会稀缺入场券!


敬请持续关注大会主办方官方微信公众平台【科学智能AISI】【深势科技 DP Technology】,第一时间获取大会最新举办时间、大会资讯及各项论坛精彩内容。




👇 点击“阅读原文”获取更多相关大会信息

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存