AI浪潮下的暗礁与科学的未来——诺奖得主Roald Hoffmann谈“模拟”vs“理解”
作者 | 关雅妮,欧琪,蒲建锟,王一博(按姓氏首字母排序)
由北京科学智能研究院(AISI)主办的AI for Science系列学术讲座,于北京时间2022年7月26日(周三)09:00-11:00顺利举行。本次讲座主题为「SIMULATION VS UNDERSTANDING: A TENSION, AND NOT JUST IN OUR PROFESSION」(「模拟 VS 理解: 多领域中的拉锯战」),由诺贝尔化学奖得主Roald Hoffmann教授主讲。
数字技术的进步虽然带来便利的生活,但是也带来了许多复杂的问题。科学技术对人类社会的潜在影响,总能引起人们最广泛的担忧。基于此,Hoffmann从他与Jean-Paul Malrieu合作完成并发表在Angewandte Chemie的三篇文章出发,讲述了他对“模拟”(simulation)和“理解”(understanding)的见解。Hoffmann以自己为例,介绍了曾经的一项研究成果被计算机算法无情打败的经历,并由此探讨人类“理解”与计算“模拟”之间的差异,最终给出了人类在AI时代如何让“理解”与“计算”和谐共处的方案。
主讲嘉宾介绍
Roald Hoffmann was born in 1937 in Złoczów, Poland. Having survived World War II, he came to the U. S. in 1949, and studied chemistry at Columbia and Harvard Universities (Ph.D. 1962). Since 1965 he is at Cornell University, now as the Frank H. T. Rhodes Professor of Humane Letters, Emeritus. He has received many of the honors of his profession, including the 1981 Nobel Prize in Chemistry (shared with Kenichi Fukui).
At Cornell, Hoffmann taught introductory chemistry half of his time. Notable also is his reaching out to the general public; he was the presenter, for example, of a television course in chemistry titled "The World of Chemistry," shown widely since 1990.
As a writer, Hoffmann has carved out a land between science, poetry, and philosophy, through many essays, five non-fiction books, three plays and seven published collection of poetry, including bilingual Spanish-English and Russian-English editions published in Madrid and Moscow.
(www.roaldhoffmann.com)Hoffmann教授于1937年出生于波兰(今乌克兰)佐洛乔夫,幸免于二战,1949年移居美国,并在哥伦比亚大学和哈佛大学化学专业学习,1962年获博士学位。自1965年以来,Hoffmann教授一直在康奈尔大学任教,他现在是人文文学的Frank H. T. Rhodes教授。他曾获得专业领域内包括1981年的诺贝尔化学奖(与福井谦一共同获得)在内的许多荣誉。
在康奈尔大学,Hoffmann教授有一半的时间来教授化学导论课。同时,Hoffmann教授也是一位自1990年以来就广泛播出的电视课程“化学世界”的主持人。
作为一名作家,Hoffmann教授在科学、诗歌和哲学之间开辟了一片天地,写了许多散文、五本纪实文学著作和三部戏剧,并且出版了七本诗集,其中包括在马德里和莫斯科出版的西班牙语-英语双语版和俄语-英语双语版。
讲座视频回放
你可以直接点击下面的视频观看👇
讲座精彩回顾
AI浪潮下的暗礁
大数据时代的到来驱动着AI飞速向前发展,在为我们带来帮助的同时,AI的广泛应用也给我们带来了很大挑战。在“模拟”和“理解”之间出现了一种拉锯:AI技术所代表数值模拟虽然高效,但也导致知识的解释难度越来越高,难以为人类带来理解上的提升。这种拉锯不仅仅存在于化学、物理等科学领域,更广泛存在于社会生活的方方面面,并且带来了深刻的伦理道德的影响。
科学研究中的“思想铁三角”
为了更好的说明问题,Hoffmann提出了“思想铁三角”的概念,即在科学研究中,“理论”(theory)、“模拟”(simulation)和“理解”(understanding)三者之间存在着紧密的联系。在化学这样一个以实验为主导的科学领域,“理论”、“模拟”和“理解”所组成的“思想铁三角”被实验所包围着,并与实验密切联系。
Hoffmann自讲座中分别阐述了这三个概念:
理解(understanding)
“理解”是脑海中的一种意识,这种意识总体上是隐性的(tacit)、定性的,同时也有着一些定量的特点。
Hoffmann 用人类认识彩虹的过程为例来阐述“理解”所具有的定性和定量的特点。一开始,人们发现彩虹总是在雨后或水珠旁出现;渐渐地,人们认识到彩虹的形成与光线在水珠中的传播、反射和折射有关;到17世纪,笛卡尔和牛顿从定量的角度推导出为什么彩虹形成于视平线上42°而不是其他位置。人类首先通过某些具体现象进行观察,逐渐形成定性“理解” ,最后通过测量进一步提升对这个现象的“理解”。Hoffmann强调,定量的测量能够进一步支持定性的理解,但定性的解释依然是最重要的。然而在现今,模拟和AI将“理解”这个过程逐渐淡化,人们逐渐放弃了理性的思考,转而接受模拟的定量数值。
为了进一步阐述理解的重要性,Hoffmann在讲座中谈到“解释”的意义。解释的过程是向别人阐述一个事物或现象背后的原因,因此解释具有教育性。而教育不仅在帮助学生理解知识,更重要的是有助于提升自己对于问题的理解。此外,解释具有故事性。这是由于人类有一种自然而然地讲故事的本能,更倾向于通过故事的形式来阐述自己的某种“理解”。
基于此,Hoffmann进一步讲述自己对于“理解”的看法:
“理解”具有顺序性的因果关系:“理解”是从事物本身出发,通过因果推理的方式,一步步形成对某一事物的理解。“理解”中存在整体性(holistic)和逻辑性(logical)之间的矛盾:一方面,人类希望从整体上观察事物的全貌;另一方面,人类又希望认识事物每一部分之间的逻辑关系。在近代人类发展的道路上,偶然性事件扮演了重要角色,且有时还会对“理解”发挥积极作用。此外,也存在着对于同一种现象的多种互补的“解释”,例如波粒二象性。这意味着,对于自然界的任意一个现象,并非仅仅存在一种单一的解释,相反,多种解释都是具有价值和意义的。
由此看来,“理解”,这个能力极为重要。具体来说,在化学和物理领域中,“理解”意味着:
知道一个现象背后的一系列机理,并且能够对这些机理在这个现象中的重要性的做出判断
在做任何计算之前,能够定性的准确预测材料性质
这种“理解”的能力可以逐步提升。例如,我们可以对分子的性质进行计算,将计算结果和我们的预想的结果做比对。如果误差很大,那么我们就需要提高自己对于这个性质的机理的"理解";如果误差很小,那么我们可以对体系做一些微扰,来检查我们对于机理的"理解"还是否正确。通过这样的方式不断迭代,我们对于机理的"理解"便会不断提升。
理论(theory)
理论是写在字典里的解释,是针对一类现象用作解释原则的一组连贯的命题。理论能够解决“为什么”的问题。人们之所以接受某些理论是因为这些理论能以最高效的方式为人类带来更多的“理解”。我们不能期待有一个万能的理论能够解释所有的现象和事实。相反,我们需要的是能够与人类现有认知兼容,并且能够逐步扩大人类认知边界的理论。
Hoffmann提到人类对理论接受的过程还受到很多因素影响。一个有趣的观察是,当某个理论做了大胆的预测并取得成功以后,人们将会很快接受它——尽管理论中大胆的预测违背了大多数人最开始的想法。敢于做出这样激进的预测,往往意味着理论的提出者对于理论有充分的信心——这个问题对应的公式清晰且相信自己能够解决。同时能否讲好一个故事,并且将理论恰当的融合进当今社会也是理论传播的重要方式。这样,新提出的理论才可以在社会范围内进行传递,并能够为他人所用。
模拟(simulation)
在“模拟”这部分,Hoffmann列举了常见的“模拟”的方法:仿真模拟、现象模型、原理模型、机器学习和人工神经网络。
仿真模拟,是指用同样大小或等比例缩小的模型进行实验的模拟方法。虽然现在用得少了,但是例如用风洞实验这样的仿真模拟依然有用;现象模型,是指用经验归纳的简单模型,虽然缺乏理论基础,但是这类模型能够准确复现出分子的性质;原理模型,是指由理论推导出来的正确模型,这类原理模型是计算化学领域最重要的部分;机器学习和人工神经网络,是指训练数据构建起来的黑盒模型。这类模型是现今最流行的一种模拟方法。
其中机器学习和人工神经网络这种模拟方法就是正在发生在我们身上的浪潮。在计算化学领域,这助推了机器学习在电子结构方面的应用,能够降低计算成本,使得探索繁重的材料的工作变得轻松。算法成功的发现了一些具有优越性能但是繁重的组分,减轻了材料实验中的试错的代价以及所需要的人力成本。
奇妙的经历:Hoffmann被计算机击败的过程
讲到这里,Hoffmann分享了自己的亲身经历,讲述作为一个传统计算化学工作者被超级计算机所击败时候的感受。
Hoffmann曾与优秀的物理学家Ashcroft合作通过设计H配位数以及主族元素/过渡金属元素/镧系元素参杂来实现Si更好的导电性甚至超导性,他凭借自己作为化学家的经验和直觉设计出了一个结构,却在一年后被计算机所设计出来的结构击败了。无论是随机搜索算法、基因算法、模拟退火算法或者最小跳动算法,所有算法预测出的构型都优于Hoffmann根据化学直觉提出的——由计算机设计出来的结构有更低的焓,具有更低能量更稳定的结构。
面对被计算机打败的现实,Hoffmann做了如下解释:虽然是电脑发现了能量更低的稳定结构,但是人类在两个结构中都看到了八个带有电子空缺位的、双电子的、三中心的键。这个发现虽然对于计算机计算没有意义,但是对人类有重要意义:看到了结构和成键之间的联系。同时虽然计算机计算的更快,并且成功找到了更好的结构,但是计算机没有关于化学和物理任何知识的“理解”。
这里Hoffmann提到了一个已经存在很久的关于AI智力的讨论。Hoffmann举了“中文房间争论”(The Chinese Room Argument)、AlphaGo击败世界顶尖围棋选手、量子计算的将为科学界带来的改变这三个例子。
Hoffmann提出,从这些例子来看,程序工作的核心不是为了得到解释,而是得到答案。写代码并且调试代码反而会阻碍思考这里是否有一个科学解释。在不远的将来,机器学习和神经网络等发展将在计算精度、效率、成本的方面会媲美目前最好的量子化学工具。然而数据导向的量化科学家群体将会面临一个尴尬的难题:
“他们的方程能否继续为进一步提升的神经网络的表现而提供可信赖的训练数据,还是会让他们步入超市收银员、出租车司机的后尘?”
走向“理解”和“模拟”的和谐
如何使得AI具有可解释性
为了使得AI具有可解释性,未来的一个发展方向便是在训练数据中增加一个可解释的模型以及解释的接口,去展示AI是如何进行预测的。
在Hoffmann看来,使用大数据进行“模拟”有着势不可挡的发展前景。在一些领域深受欢迎的,例如音乐偏好预测、面部和指纹识别、自动驾驶等;但是在另一些领域使用大数据进行“模拟”不可避免地会引起一些伦理道德问题,比如保险公司是否有权利去利用你的DNA信息确定保险的条款等。伦理道德与科学和技术一样,是人类社会发明重要组成部分。并且伦理道德和法律的发展是落后于技术发展的。这意味着我们势必会被改变,而我们又应该如何生存在这个时代?
“理解”和“模拟”共存
在AI的浪潮下,我们该如何在这个时代保持人性?Hoffmann给了他认为让“理解”和“模拟”共存的方案:首先是让实验去引导我们,让实验作为团结一切的力量。其次要保持人性,去站到更高的维度思考事物之间的联系。再者,是多去“玩”可靠的工具,在不断使用过程中尝试建立对于工具工作方式的理解,进一步理解所研究的问题。同时,以“教”的心态去增进理解,不要以困难为借口就逃避解释。最后且最重要的是保持一颗好奇心,多问为什么。
在讲座的最后,Hoffmann回忆了曾经和Ed Wilson的一次访谈。Ed Wilson思考了与系外文明的会面:外星人对我们文明感兴趣的地方不是在于科技,因为人类科技文明对于他们来说是初级的,外星文明感兴趣的是我们的文化,这是我们几千年用一种有创造力的艺术方式来积累的想象力和创造力的产品。这是我们的遗产,是使我们成为人的根基。
2022科学智能峰会预告
8月8日至8月11日,2022中关村论坛系列活动——科学智能峰会将于线上召开。本届峰会的主题是“AI for Science:共创新未来”,分为主论坛和六场主题分论坛。多位院士、学者、研究员、企业家将带来50余场顶尖报告,从不同视角解读前沿话题。
快扫描下方二维码,一键报名吧!
敬请持续关注大会主办方官方微信公众平台【科学智能AISI】或【深势科技 DP Technology】,第一时间获取大会资讯及各项论坛精彩内容。
关于AISI
北京科学智能研究院(AISI)成立于2021年9月,由鄂维南院士领衔,致力于将人工智能技术与科学研究相结合,加速不同科学领域的发展和突破,推动科学研究范式的革新,建设引领世界的「AI for Science」基础设施体系。
AISI的研究人员来自国内外顶尖高校、科研机构和科技企业,共同聚焦物理建模、数值算法、人工智能、高性能计算等交叉领域的核心问题。
AISI致力于创造思想碰撞的学术环境,鼓励自由探索和跨界合作,共同探索人工智能与科学研究结合的新可能。
- End -
(如需转载图文请与公众号后台联系)
-------------------------------
推荐阅读