Cell重磅评论 | AI在生物学和神经科学中的应用
翻译 by 王子轩、李元翔、张添翔、张亦欣、马米阳
继互联网和移动互联网引发第三次工业革命之后,以大数据驱动的人工智能(AI, Artificial Intelligence)技术正在推动第四次工业革命,并以惊人的速度持续影响人类社会各个领域。在生物领域,基于神经网络的AlphaFold 2能够根据一维氨基酸序列预测三维蛋白质结构,对大部分蛋白质结构的预测与真实结构只差一个原子的宽度,达到了人类利用冷冻电镜等复杂仪器观察预测的水平。2022年7月,加拿大麦吉尔大学Blake Richards、美国加州大学伯克利分校Doris Tsao和冷泉港实验室Anthony Zador合作在Cell上发表了题为“The application of artificial intelligence to biology and neuroscience”的评论文章,阐述了AI在生物学和神经科学领域中分析、解释数据方面的应用。
摘要
在过去的十年里,AI经历了一场后续可能改变经济、社会和科学等各个领域的变革,并且正在以惊人的速度发展,特别是神经科学和AI交叉领域的发展尤其引人注目。
正文
1
什么是人工智能?
AI这个术语尚无严格定义,但从广义而言,它指的是模仿人类思维、执行人类任务的计算机系统(图1)。人们通常认为AI是计算机科学的一个子领域,但也与数据科学、机器学习以及统计学等研究领域密切相关。它在科学领域的巨大潜力主要源于它能够在大数据集上发现或学习特定的数据结构,并利用这些数据结构进行预测乃至执行任务,而且它具有与人类互补的优势。例如,AI有能力从非常多维的数据中找到模式,作为强大的工具来帮助而非替代研究人员。此外,由于受到神经系统组织结构的启发,几乎所有现代AI系统都依赖于人工神经网络(ANNs,artificial neural networks)。
图1 现代AI成功的例子。此图由一个名为Dalle的“文本转图像”AI系统生成。在该系统中输入文字“三个盲人触摸一头大象,试图弄清楚它是什么,但是盲人是人形机器人”,即可得到本图。
AI中有三种从数据中提取结构的经典范式。第一,在监督式学习中,数据由成对的输入项目(例如,大象的图像)和标签(例如,词语“大象”)组成,监督式学习可视为一种特别强大的非线性回归形式,其目的是预测新项目的标签。第二,在无监督式学习中,数据没有标签,其目标是找到潜在的统计结构。例如,从一组野生动物图片中推断大象和长颈鹿的存在。无监督学习可以看作是对传统统计技术的推广,如聚类和主成分分析。(许多现代AI系统也依赖于自监督学习,它通过自动标记数据来达到与无监督学习相同的效果,例如,将相同的标签应用于一个对象的人工生成的不同变体)。第三,在强化式学习中,其目标是利用从先前行为中获得的反馈信息,从而发现实现某个目标的方法或策略。最近,强化式学习方法已应用于象棋和围棋等游戏以及新型药物设计中,并取得不错的效果。
在下文中,我们首先讨论AI工具在分析和解释数据方面对生命科学的影响,特别是神经科学领域。然后,我们将重点关注AI在神经科学方面的应用,使用人工神经网络作为模拟生物神经网络是如何计算的模型。本文补充了最近几篇关于人工智能在生物学和医学领域应用的评述。
2
用以分析和解释数据的AI工具
AI的第一个重要应用是开发用于分析和解释数据的工具。例如,依赖于AI工具的运动跟踪软件Deeplabcut,现在不仅可以通过分析视频来精确识别和标记动物的姿势,还能够在神经记录或扰动期间更精确地描述动物个体和群体行为。机器学习的另一个应用是使用来自机器学习的分割和跟踪算法,从连续的电子显微镜数据中重建突触连接图。到目前为止已重建了完整的果蝇大脑、小鼠视网膜和部分视皮层的突触连接图。这些AI系统正在改变科学家们收集和解释实验数据的方法。
本文主要关注的是AI在神经科学中的应用,AI技术也适用于生物学的许多其他领域。例如,AI在蛋白质建模、基因序列分析、医学诊断和药物发现等诸多领域都有重要作用。一个惊人的突破是Alphafold-2,这是一种基于AI的根据一维氨基酸序列预测三维蛋白质结构的方法,在最近的实践中超越了以前的所有算法。可以预测,今后几年AI技术将在各领域取得类似的突破。
3
模拟大脑的AI工具
AI的第二个重要应用是使用人工神经网络作为神经计算模型。人工神经网络最初是作为大脑模型开发的。这个领域的先驱者包括John von Neumann(发明了现代“von Neumann”计算机架构)和Frank Rosenblatt(发明了第一个从示例样本数据中学习的神经网络系统感知器“per-ceptron”)。他们的目标不仅是建造能够模仿人类思维的机器,而且还要了解大脑是如何计算和处理这些数据的。在20世纪80年代,认知科学家们为了理解和模拟人类认知,进一步将人工神经网络用作真实神经计算的模型,强化学习模型发展的相关研究也主要关注动物如何从“试错”中学习。事实上,当时认知科学的一个关键前提是,我们可以将智慧作为一种普遍现象来研究,通过使用AI模型来加深理解大脑,反之,凭借我们对大脑的理解以便构建更好的AI系统。机器学习领域的研究人员认为,神经科学、心理学和AI领域都关注相同或相似的问题,学科交叉更有利于这些问题的解决。虽然AI模型在认知科学和神经科学中的应用在20世纪90年代和21世纪初不被青睐,但最近“深度学习”的成功重新激起了人们对这些方法的兴趣。得益于更强悍的计算能力、更大的数据集和对模型的一些调整,AI领域的研究人员将会设计出最终能够发挥巨大潜力的人工神经网络。
在过去的十年里,AI解决了许多曾经被认为是人工系统难以解决的难题。在此期间,神经科学家也开始将人工神经网络用于其最初的目的——作为真实神经计算的模型。在某种程度上,这些最近的成功得益于新开发的用于监测大量神经元活动的实验技术,这使研究人员能够更直接地比较人工神经网络和真实大脑,进而发现在相关任务训练的人工神经网络中出现的表征与真实大脑中看到的表征有惊人的相似之处。这种对应关系出现在许多大脑区域的前馈和递归神经网络中,包括低级和高级视觉区域、语言区域、运动区域和前额叶区域(图2A)。例如,人们发现下颞叶皮层(灵长类动物中区分不同物体的关键区域)在空间上可表示成一个物体空间图,其两个轴与在物体分类训练的深层网络的后期层中的轴相同。与此同时,计算神经学家对大脑的学习功能和可塑性感兴趣,他们开始研究用于训练人工神经网络的技术,并在这些技术中发现了一些理论上在大脑中同样适用的方法(图2B),因而使用AI对动物行为和认知的建模研究大大增加。
人们重新开始寄希望于神经科学能够为开发新的人工神经网络方法提供更多的见解,从而进一步推动AI的发展。在许多领域大脑系统仍然明显优于人工神经网络,这些领域为人工神经网络模型提供了丰富的知识与资源。一个例子是机器学习的灾难性遗忘问题,即学习新样本会导致旧样本的遗忘。最近,美国国防部高级研究计划局(DARPA)为解决这一问题而提出了将“重播”确定为最有效的解决方案。“重播”是一种生物机制,在这种机制中,海马体会重新激活已经学习到的记忆。此外,人们认识到许多动物(包括人类)的行为是天生的,并以某种方式嵌入到基因组中,这启发了人们尝试创建与生物网络一样的结构必须通过“基因组瓶颈”的人工神经网络来实现。人们越来越认识到,神经科学在指导AI未来创新方面发挥着重要作用。
图2 人工神经网络帮助我们理解大脑功能及其可塑性。(A)人工神经网络为神经科学家提供了一套丰富的模型来解释大脑不同区域的神经活动,这是了解大脑如何完成人脸识别等复杂功能的重要一步。研究人员可以向动物实施一系列刺激,记录该区域神经元的反应,然后探究不同的人工神经网络如何捕捉这些反应。一种应用较多的策略是将神经元建模为神经网络单元的线性组合,然后探究神经反应中的多少差异可以用线性模型解释。(B)在大脑和神经网络中,从输入到输出都有许多可能的突触路径。例如,这里有三条可能的路径和六个可能的突触。这使得在学习过程中知道哪些突触应该改变而变得很有挑战性,这个问题被称为“贡献度分配问题”。人工神经网络通过使用损失函数的梯度来确定如何改变突触来解决这个问题。计算神经科学的最新研究表明,大脑有一种机制可以实现近似的梯度下降(一组求解非线性方程组的最优化算法)。
4
未来展望
AI提供了可分析高维数据的新工具,并以此来影响神经科学领域等科学学科。它可以提供强大的新模型来解释大脑是如何计算的,使用AI作为神经计算的模型可以说是实现了人工智能诞生的最初目的。然而,最近的进展迫使神经科学家重新思考他们的认识论,AI显示出自己是一个真正具有颠覆性的、改变范式的潜力股。理解大脑意味着什么?在神经科学的大部分历史中,答案一直是“能够用一个简单的模型解释尽可能多的神经活动”。例如,Hubel和Wiesel的初级视觉皮层神经元作为边缘探测器的模型是成功的,因为它可以用一个“边缘定向”参数模型解释,刺激诱发神经元对广泛的不同刺激的反应。然而,随着包含数百万个参数的模型的出现,“简单解释”的概念现在变得模糊了。用一个包含许多未被完全理解的单元组成的神经网络来解释一个大脑区域的价值和意义到底是什么?对于这个问题,有许多可能的答案。例如,可以实现新的预测,以天气模型来举例说明,即使一个天气模型包含数百万个参数,如果它能够准确地预测天气,那它仍然是有用的;可以确定大脑使用的最佳架构和学习规则,因为这些系统描述的维度要低得多,所以与权重模式和由此产生的单元刺激选择相比是可以理解的;还可以实现重要的实际应用,例如脑机接口和感觉系统等。
伟大的物理学家Richard Feynman有句名言“我无法创造,就代表我没有理解”。但AI最近的成功表明,“我甚至不能理解我能建造的东西”。即使在深度学习领域,人们也有一种强烈的感觉,即这些模型令人震惊地、不合理地有效。目前,该领域正处于一种进化模式中,最成功的模型之所以能够脱颖而出,与其说是因为基本原理的工程学,不如说是因为适者生存。因此,人们现在对理论机器学习的兴趣越来越浓厚,希望对有效模型有更深入的理解(例如,已经出现的一种见解是,深度网络不会陷入局部最小,因为在高维中,真正的局部最小几乎是不存在的)。对于神经科学家来说,这提出了一个问题:在这种完全透明的深层网络中,每一个单元对任何刺激/扰动的反应都可以立即被测量。当我们甚至不了解完全透明的深层网络的原理时,克服难以置信的技术挑战来记录包裹在坚硬、不透明的颅骨内的脆弱脑组织中的微小神经元的活动,这到底有什么价值?一个志向坚定的研究人员可能会回答:“机器没有意识,而我想了解的是能够获得意识的智能”。但是,如果有一天机器真的宣称它们是完全有意识的,甚至向我们倾诉它们的梦境呢?那些渴望了解大脑的神经科学家,会把显微镜收起来并扔掉他们的电极吗?