从诺奖风向标,到《Nature》雄文:人工智能再度封神,科学范式终将颠覆?
The following article is from 当时明月照清泉 Author 天涯流风
点击上方“图灵人工智能”,选择“星标”公众号
您想知道的人工智能干货,第一时间送达
1
2023年9月21日,备受瞩目的2023拉斯克奖(The Lasker Awards)揭晓,其中的基础医学研究奖授予谷歌DeepMind公司创始人和CEO戴米斯·哈萨比斯(Demis Hassabis)博士和资深成员约翰·贾伯(John Jumper)博士,表彰他们发明了能够预测蛋白质三维结构的革命性人工智能(AI)技术——AlphaFold。
AlphaFold 就是大名鼎鼎的AlphaGo的“兄弟”。AlphaGo是一个被广泛关注的人工智能系统,其在围棋领域的表现彻底颠覆了人们对于人工智能的想象。2016年AlphaGo横空出世,以4:1的总比分击败了当时世界第一围棋选手李世石,成为了人工智能领域的新标杆。
AlphaFold这种变革性方法,解决了从一维氨基酸序列预测三维蛋白质结构的长期难题,给出了50年来关于蛋白质结构最准确、最完整的图像,破解了长期困扰生物医学研究领域困境,增进了人类对基本生物过程的理解并促进了药物设计,为加速生物和医学研究打开了大门。
蛋白质是由氨基酸链组成的、具有自身独特 3D 结构的大型复杂分子,其对人们理解生命形成的机制至关重要。蛋白质从氨基酸序列折叠成何种形状与其功能密切相关,而预测蛋白质结构对于理解其功能和工作原理至关重要,这就是“蛋白质结构预测问题”,被称为生物医学领域的“圣杯”。在过去 50 年里,蛋白质折叠问题一直是生物学领域的重大挑战。
Demis Hassabis博士和John Jumper博士被誉为“AlphaFold之父”,他们与在DeepMind的团队一起开发了人工智能系统AlphaFold,可以在几分钟内预测由人类基因组编码和20个模式生物的几乎所有已知蛋白,并精确到原子级。这是第一种在已知没有相似结构的情况下构建高分辨率预测的方法。在两年一度的蛋白质预测大赛CASP(蛋白质结构预测关键评估)中AlphaFold以绝对优势夺冠。
AlphaFold2开源仅一周的时间里,98.5%的人类蛋白质结构被AlphaFold2 所预测,而在此之前,全球多少顶尖科学家耗时数十年的努力,也只解码了覆盖人类蛋白质序列中17%的氨基酸残基。
Demis Hassabis 和 John Jumper 两人凭借出色的想法、密集的努力和卓越的工程技术,带领AlphaFold团队将结构预测的准确性和速度提升到了前所未有的水平。
这种转变的方法正在迅速推进我们对基本生物过程的理解,并促进药物设计。
在过去的几年里,机器学习将蛋白质结构领域推向了一个新领域
2021年7月,Demis Hassabis和John Jumper发表了他们的模型以及对几乎所有人类蛋白质的准确结构预测。在短短两年左右时间,他们论文的影响力已经超过了自1900年以来在《自然》杂志上发表的近10万篇研究论文中的几乎所有文章,在所有高被引论文中这篇论文排名第50,被顶级期刊上发表的7000多篇论文引用(总引用次数超过了9000次)。
拉斯克奖官方评语中这样写道:通过放飞想象力和才华,Hassabis、Jumper和他们的团队完成了让科学家困惑了半个世纪的任务。这一胜利开启了研究和操纵蛋白质的新时代。它已经催化出了实质性的进步,随着众多领域的工作者想方设法挖掘其潜力,它的影响力和范围有望爆炸式增长。
拉斯克奖是美国最具声望的生物医学奖项,也是医学界仅次于诺贝尔奖的一项顶级大奖,该奖项创立于1946年,旨在表彰医学领域作出突出贡献的科学家、医生和公共服务人员。拉斯克奖素有“诺奖风向标”之称,其得奖者通常会在随后的一年到数年得到诺贝尔奖。例如2020年获得诺贝尔生理学或医学奖的哈维尔·阿尔特和查尔斯·M·赖斯,此前分别于2000年、2016年获得拉斯克临床医学研究奖;中国著名药学家屠呦呦,因“发现青蒿素——一种用于治疗疟疾的药物,挽救了全球特别是发展中国家的数百万人的生命”而于2011年获得拉斯克临床医学奖,4年后荣获2015年诺贝尔生理学或医学奖。从1946年创立至今,拉斯克奖的300多位得主中,已经有86人获得诺贝尔奖。最近十年,有8位诺贝尔生理学或医学奖获得者曾获得拉斯克奖。
统计数字表明,约有48%的拉斯克基础医学研究奖获得者随后获得诺贝尔奖,而28%的拉斯克基础医学研究奖和临床医学研究奖获得者本身就是诺贝尔奖得主。
AlphaFold颠覆了蛋白结构解析,开启了计算生物学的新时代。Nature杂志于2023年9月13日发表评论,AlphaFold使得医学科学家在蛋白质宇宙的黑暗角落中发现了令人惊讶的形状和意想不到的联系,就像发现了一个百宝箱、以至于科学家手足无措地不知道优先选哪一个珍宝!
Demis Hassabis和John Jumper最近拿奖拿到手软。
2022年9月,他们荣获科学突破奖(Breakthrough Prizes)。科学突破奖堪称科学界“第一巨奖”,有着科学界“奥斯卡奖”之美誉,单项奖金达到300万美元。
2023年3月,他们获得了盖尔德纳奖(The Canada Gairdner Awards)。盖尔德纳奖是加拿大盖尔德纳基金会设立的奖项,专门表彰在生物医学领域有重要原创成就的科学家。
2023年9月8日,《时代周刊》在官网发布了“2023年AI领域最有影响力100人”榜单,Demis Hassabis位列其中。
诺贝尔奖非常重视“0到1”的理论和技术突破,并引领新的领域。Demis Hassabis和John Jumper二人因其开创性的贡献,可谓是未来诺奖的热门人选,离诺奖仅一步之遥。
他们能否进一步荣获诺贝尔奖?让我们拭目以待。
2
第一范式:实验范式。
以观察和记录为依据的实验科学,也称经验范式,比如钻木取火、伽利略的比萨斜塔实验。
第二范式:理论范式。
利用模型归纳总结过去记录的现象,人类采用各种数学、物理等理论,构建问题模型和解决方案,比如牛顿定律、麦克斯韦方程和爱因斯坦的质能公式等为代表的理论科学,这些理论的广泛传播和运用对人们的生活和思想产生了极大的影响,在很大程度上推动了人类社会的发展。
第三范式:计算范式。
计算机的出现,诞生了模拟复杂现象的计算科学,人类进入了以“计算”为中心的全新时期,通过设计算法并编写程序输入计算机运行,解决复杂的科学和工程问题。例如核模拟实验、天气预报等。
第四范式:数据范式。
随着数据的爆炸性增长,计算机将不仅仅能做模拟仿真,还能进行分析总结,得到理论。数据驱动范式理应从第三范式中分离出来,成为一个独特的科学研究范式。也就是说,过去由牛顿、爱因斯坦等科学家从事的工作,未来完全可以由计算机来做。云计算、物联网和大数据这些产物推动了科技创新和社会进步。
第五范式:AI范式。
当前,许多科学家认为科学研究正在迎来新的范式,即第五范式。第五范式是以人工智能 AI 技术为核心的范式,开启以人机共融为特征的科学研究新时代。也可认为是从第四范式分离出来的一种新的范式。
人工智能驱动的科学研究(AI for Science,AI4S,科学智能),更是这一新范式在基础科研的深度体现。
AI for Science,就是利用AI的技术和方法,去学习、模拟、预测和优化自然界和人类社会的各种现象和规律,从而推动科学发现和创新。AI for Science泛指人工智能应用于科学领域的系列研究,旨在先解决科学问题,再解决产业问题。这一理念萌芽于科学界,正逐步在产业界兴起。
AI for Science不仅可以帮助科学家解决已有的问题,也可以帮助科学家发现新的问题和方向。这将为科学研究带来新的范式和机遇。
AlphaFold 就是 AI4S 领域最成功的代表,同时,也将 AI4S研究推向一个新的高潮。
3
简单来说,AI for Science就是让人工智能利用自身强大的数据归纳和分析能力去学习科学规律和原理,得出模型来解决实际的科研问题,特别是辅助科学家在不同的假设条件下进行大量重复的验证和试错,从而大大加速科研探索的进程,如今这一方法已在多个前沿科学领域中取得了显著的成果。
AI for Science的主要作用体现在:
(1)助力科学发现。比如近年的工作 AI Feynman2.0,让AI重新发现了《费曼物理学讲义》中的100个物理方程,甚至还发现了新的方程。这类工作可能在很大程度上可以做到帮助人类加快科学发现。
(2)提升数值模拟速度和准确性。如 DeepMind 提出的 GraphCast能通过输入60秒的历史天气,预报未来10天的天气,不仅在准确度上极大优于传统预测手段,在运算效率上也有极大的提升。AlphaFold的提出将人类蛋白质结构预测的准确度提升到了前所未有的水平。
(3)帮助科学家探索科学框架的设计。我们可以让AI去更大的设计空间搜索设计策略和控制优化策略。比如《Nature》2022年的论文,使用深度强化学习控制核聚变反应中的等离子体,第一次发现了全新的等离子体结构。
AI for Science(科学智能)将深度学习技术应用于传统的科学领域,如物理、化学、生物、医学,作为一个新的交叉学科,也逐渐兴起,孕育着巨大的潜力,受到广泛的关注。
近几年来,在深度学习等 AI 技术的推动下,AI4S 在数学、物理学、生物医学、材料科学等领域取得了许多令人瞩目的成绩。
AI for Science (AI4S)会是AI的下一个主战场,它将极大地拓展Science和AI的边界;他们发现,AI4S将赋能技术和工业的方方面面,帮助我们加快走完科学研究和技术创新之间的最后一公里,也将帮助科学家从纷乱的自然和社会特征之中抽丝剥茧,发现事物背后作用着的关键规律。
AI4S的未来正在走向流行。AI求解薛定谔方程、AI求解控制论方程、AI加速分子模拟、AI预测蛋白结构、AI赋能药物和材料设计……
深度学习教父之一Yoshua Bengio团队在《Nature》发表了长篇综述论文,从多个维度论述了AI for Science及其在科学发现中的应用,以及AI跨界的核心挑战。他们认为,从数据收集到模型构建,从实验设计到过程控制,AI跨界正在改变科学研究方式,成为科学发现引擎。
4
2016年,AlphaGo 首次战胜人类围棋世界冠军,使得科学家意识到AI在科学研究方面的潜力,开始逐步探索使用AI算法与工具求解科学问题;2021 年左右,AlphaFold2、DeePMD 取得显著突破,生命科学、材料研发、能源、天体物理等领域的AI4S科研成果遍地开花,多个开源算法和工具相继诞生,推动AI4S理念快速走进大众视野并引发行业热潮。2023年 3月,科技部会同自然科学基金委启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,再次引发AI for Science的行业热议。科技创新2030——“新一代人工智能”重大项目也将AI for Science作为人工智能的重要发展方向进行安排。在平台支撑方面,科技部正在加快推动公共算力开放创新平台建设,将为AI for Science发展打造智能算力基座。
Elon Musk 官宣 x.ai,其理念为“建立理解自然规律的人工智能系统 (understand the truenature of the universe)”。微软宣布成立专门的 AI4science 部门。英伟达联合 IIT 发布 AI for Science 公开课程。龙头药企赛诺菲宣布 “all-in” AI for (life) science。美国能源部联合5大国家实验室发布 AI for Science, Energy & Security 先进科研课题指引...... 从学界到业界,从产业到政府,从生命科学的 RFDiffusion、到化工领域的 Open Catalyst、到材料科学的 Uni-Mol,各行各业的优秀 AI for Science 应用正在加速涌现,AI for Science 已成燎原之势。
2023年9月28日,《Nature》杂志封面,刊登了“AI 如何改变科学”系列相关文章。
AI for Science日益表现出突破传统科学研究能力瓶颈的巨大潜力,正在成为全球科学研究新范式。
根据《Nature》杂志的分析,Scopus 数据库中在标题或摘要中提及人工智能或人工智能相关关键词的论文比例目前为 8%,而十年前为 2%。
与此同时,人工智能也在发生变化。21 世纪 10 年代见证了机器学习算法的繁荣发展,这些算法可以帮助识别庞大、复杂的科学数据集中的模式,而 21 世纪 20 年代则迎来了生成式人工智能工具的新时代,这些工具在庞大的数据集上进行了预先训练,这些数据集具有更大的变革潜力。
AI4S论文近年爆发式增长
5
AI for Science 是指以机器学习、深度学习等人工智能技术分析处理多维度、多模态、多场景下的模拟和真实数据,解决复杂推演计算问题,加快基础科学和应用科学的发现、验证、应用,打造下一代科学范式。
人工智能将成为科学家继计算机之后的全新生产工具,同时也正在催化一场新的“科学革命”。
AI for Science不只是一个新的科学浪潮,它更是开启了一个全新的科学时代。
如今,以ChatGPT为代表的大模型和生成式人工技术横空出世,正推动 AI 技术从特定应用和游戏等领域进入人们日常生活,成为切切实实的生产力工具,这将对AI for Science带来更广泛深入和空前深远的影响,人类社会的智能化革命已经拉开帷幕。
《经济学人》最近撰文:人工智将如何彻底改变科学。
关于人工智能的争论往往集中在其潜在的危险上,算法偏见和歧视、工作岗位的大规模破坏,甚至有人说,人类的灭绝。然而,当一些观察家为这些反乌托邦式的场景忧心忡忡时,另一些人却在关注其潜在的回报。他们声称,人工智能可以帮助人类解决一些最重要、最棘手的问题。他们说,人工智能将以一种非常特殊的方式实现这一目标:从根本上加快科学发现的步伐,尤其是在医学、气候科学和绿色技术等领域。
又踏层峰辟新天,更扬云帆立潮头。
现代 AI 教父之一 Yann LeCun 表示:“通过增强人类智慧,AI 可能会引发一场新的文艺复兴,或许是启蒙运动的一个新阶段。”
版权声明
转自当时明月照清泉,版权属于原作者,仅用于学术分享
文章精选: