查看原文
其他

漫画丨AI for Science这事,到底“科学不科学”?

亲爱的数据 亲爱的数据 2023-03-26

图文原创:谭婧


无奖问答,这里有三道送分题。 

1.Science是什么?
参考答案:科学。
 
2.AI是什么?
参考答案:人工智能。
 
3.历史上哪三个物件影响人类科学发展?
A.伽利略的铁球,
B.牛顿的苹果,
C.冯·诺依曼的现代电子计算机。
参考答案:ABC。
 
伽利略和牛顿奠定了“实验”和“理论”这两大科学方法的支柱,
冯·诺依曼带来了“计算”。

有位诺贝尔奖获得者说:
当今,科学活动可分为三种:
理论、实验和计算。
 
科学方法论的“三驾马车”,既相互依赖,又相对独立。

 
这里有一道送命题。

AI for Science是啥?
 
参考答案:AI搞科学。

AI for Science,可以说是AI加上Scientific Computing(科学计算)。

AI不仅可以搞科学,而且搞得很科学。

从广泛的意义上来说,科学是研究大自然现象以及规律的学问。

物理的原理、机理,从最微观的尺度,到我们所能看到的最宏观的尺度,都是由方程来驱动。
 
为了描述一个自然现象,科学家大牛们为此做出简洁的数学描述,如微分方程。

微分方程能准确地描述人们想要知道的现象(情况),这一步也叫建模。
 
画家描述世界靠“绘画”。
科学家描述现象靠方程“刻画”。
 
不是所有的方程都适合用计算机来解,计算机有其适合的计算方法和技巧,因此有了科学计算。

所谓的科学计算,就是解这些方程,对方程做各种各样的数值模拟。
 
比如,冯·诺依曼和尤拉姆合作创造了著名的蒙特卡罗方法。

把要求解的数学问题化为概率模型,在计算机上实现随机模拟获得近似解。
 
上世纪60年代,冯康先生独自创立了有限元方法,属于世界最早之列。

有限元方法意义重大,贡献已为全人类所共享。 
假如我们能“算动”所有方程,就不需要做任何的化学实验、生物实验。

 
假如我们能“算动”所有方程,基本上,我们这个世界就是确定性的。

(of course,这是一个简化的说法,要展开讨论的话,肯定不是这篇文章能搞定的。)


困难就在于,像薛定谔这样的方程“算不动”。

所以,才出现了各种各样的“建模”。
 
那么问题来了:

怎么能保证算得动?

怎么能在各种尺度下做模拟?

怎么能跟实际观测到的数据相吻合?
 

AI for Science就是用人工智能(或者说机器学习,更多时候就是深度学习)来帮助我们在这里面做各种各样的建模和数值模拟。
 
AI for Science里的AI,它最大的“战斗力”就是参与到科学计算以前的各种瓶颈环节,这里面的挑战在很多时候都是由维数灾难所带来的。

(“维数灾难”是指依赖的变量太多了,随着变量的个数或者维数的增加,计算复杂度指数增加。) 

所以,不用怀疑,AI的“战斗力”,敲开了科学的大门。

并且,AI解方程和AI辅助科学探索,这两个是相辅相成的一回事。
 
有人怀疑,有人犹豫,但一些科学家早已认定AI for Science是时代课题,撸起袖子加油干了。

 

这里最著名公司就是谷歌收购来的DeepMind,科学家们尝试了三个和基础科学相关的场景:

核聚变,

蛋白质折叠,

帮数学家猜测函数关系以辅助证明定理。


自此,人们眼界大开,惊呼:

“这和此前AI所解决的问题,几乎不是一个层面的。”
 
虽然晴天响起霹雳,但是禁止过度宣传。

在科学的世界里,AI并不是打败天下无敌手,它没有攻占所有的科学领域,还在努力。
 
理解AI for Science,得理解AI是一种计算方法,AI是一种工具。
 
在AI领域中,算法指的是解决数学问题的计算机程序。于是,把算法处理数据的过程,称为,计算方法,做法,解法,或思维方式。
 
AI方法根据实验或者计算产生的数据对所求解的科学问题进行建模,从而使复杂问题得到有效解决。
 
AI方法:
第一步,找到科学问题;
第二步,找到数据;
第三步,找到规律(建模)。

 
以前,科学家先观察数据,琢磨背后有什么道理,有什么原理性的东西。之后,发现了规律,用公式表达出来。最后,通过实验去验证。
 
现在,AI是在给定的函数空间里面去找“答案”, 比如,神经网络的结构(比如层数、参数)中,有多少层基本上就确定了所在的函数空间,再在这个空间里面去优化。

最后,得出一个“最优解”(of course,这是一个简化的说法)。

科学家找规律,AI也找规律。

AI和科学家找规律使用的都是归纳法,但又各有所长。

AI for Science,重点就是用AI分析数据,也就是提炼出可能潜在的规律,但这里面有可能大量是错的,有可能存在大量“谬误(spurious)”规律。

人类介入,并从中筛选出真正有意义的规律,从而推动科学发展。
 

所以,你看大名鼎鼎的蛋白质折叠模型“Alphafold2”经常推断出一些令人困惑的结构,又或者推断出一些不准确的结果。

但它推断得快,相当快,可以给科学家很多选项,再由人类科学家拿主意。
 
AI的“战斗力”是在海量数据中迅速找到规律,而这点科学家不容易做到。
 
AI不擅长的就是甄别真正的规律,提炼简洁的表达式,而这些又是科学家所擅长的。

这就形成了AI辅助科学家进行科学探索新范式
 
因为AI可有效学习现实世界的内在规律,并快速推理获得结果,兼顾精度和性能。

所以,搞科学,以前不会想到用AI的方法。

现在,AI方法可能带来奇迹。
 
在AI for Science发展中,AI最合适的定位是什么?

现在看来,是辅助创新(AI assisted innovation)。

大半个世纪以来,科技进步(Technological Advancement)的核心目的都是在对人类的肢体器官做各种增广,

望远镜让我们看得更远,

显微镜让我们可以观察入微,

先进交通工具让我们能够高速移动。

信息技术的革命(包括AI)实际上做的是我们大脑的增广,让我们能够更快地汲取、交换、创造知识。
 
无论是AI解方程,还是AI辅助科学探索,AI for Science, 为科学带来了模型与数据双驱动的新的研究范式。或者说,已有的物理规律和数据的双驱动的新的研究范式。

 
(完)

全文审稿专家(按姓氏笔画排序)



更多阅读

AI框架系列:
1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)
2.搞AI框架那帮人丨贾扬清独家专访(二)

DPU系列:
1.造DPU芯片,如梦幻泡影?丨虚构短篇小说
2. 永远不要投资DPU?
3. DPU加持下的阿里云如何做加密计算?

其他:
1. 我怀疑京东神秘部门Y,悟出智能供应链真相了
2. 超级计算机与人工智能:大国超算,无人领航
3. 隐私计算:消失的人工智能 “法外之地”
4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?
5 AI芯片公司:拿下“超级石油”,助力地质模拟和人工智能
6两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500
7. “重型卡车自动驾驶,无量产,则无意义”赢彻科技CTO杨睿刚博士观点

漫画系列
1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单,一场大型凡尔赛
2. 梅长苏:推荐系统难道就是琅琊榜?
3. 大数据的社交牛逼症是怎么得的?
 

最后,再介绍一下主编自己吧,我是谭婧,科技和科普题材作者。为了在时代中发现故事,我围追科技大神,堵截科技公司。偶尔写小说,画漫画。生命短暂,不走捷径。个人微信:18611208992。还想看我的文章,就关注“亲爱的数据”。  

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存