DeepMind用AI解密大脑:当你找路时,大脑里发生了什么
深度学习可以无需人类帮助击败世界上任何一位围棋选手,还能在几秒钟识别人脸,但是直到现在,深度学习算法都无法做到一项看似简单的事情:空间感知。
大多数动物,包括人类,都能在生活的环境中灵活地导航,比如探索新领域、快速返回之前的地方或者抄近路。绕过障碍物、记住某个商店、在哪个路口转弯……这些能力对人类来说都非常自然、简单,以至于我们根本不会意识到完成这一过程有多复杂。相反,空间导航是智能体面临的一重要挑战,在这方面它们与动物还相差甚远。
当大脑思考自己所在的位置时,会动用许多细胞。例如位置细胞(place cells),当生物体到达一个特定位置后会激发这一细胞。再例如动物头部的朝向会激发“head-directioin cells”。
除此之外,空间导航中另一个重要神经元就是网格细胞(grid cell,也称“网格单元”),这类神经元处于大脑中负责空间学习、空间记忆和通用常识的区域。2005年,研究人员发现,与其他神经元不同,网格神经元的形状是非常完美的六边形,当动物在环境中来回走动时,该神经元被激发,跟踪并记录物体移动的轨迹。六边形组成的网格中的点,被认为能够支持空间导航,类似于地图上的经纬线。另外,这些神经元在不断更新。当动物进入了一个全新环境,会重新激活一个相同的网格,适应新的环境。动物除了有内部的坐标系外,最近研究人员假设,它们的神经元(也称为网格单元)也可以支持基于向量的导航。也就是说,让大脑计算到目的地的方向和距离,就像“乌鸦飞行”一样,这可以让动物在陌生环境中找到自己合适的路线。
2014年,首次发现网格细胞的团队获得了诺贝了生理或医学奖,为了表彰他们对空间认知表示的贡献。但是虽然距离网格细胞的发现已经过去了十多年,网格细胞的计算功能,以及他们如何支持基于向量的导航,仍然不甚明朗。
而现在,打败世界最出色的围棋选手的AI背后的大脑正变得不再神秘,DeepMind的发现能帮助我们想答案迈进一步。
DeepMind的科研专家Andrea Banino说:“我们所想、所记、所感的一切都以某种方式编码在大脑中。为了理解这一点,我们必须学习如何研究神经元,如何测量它们的活动,以及将这些活动与我们的行为联系在一起。然而,这在真实的大脑上是很难实现的。”
而DeepMind做到了,不过不是在真的大脑上做实验,而是利用神经网络和受大脑神经元启发构建的算法,来解释了这一问题。在DeepMind最近发表在Nature的论文中,他们开发了一个智能体,用于测试网格细胞支持基于向量的导航的理论,“这与我们的重要理念相符合,即用于AI的算法与大脑中的元素十分相似,”研究人员表示。
第一步,DeepMind训练了一个循环网络(RNN),让其利用与动作相关的主要的速度信号,在一个虚拟环境中对自己定位。这种能力通常出现在哺乳动物走到一个陌生环境中或不容易发现明显地标的情况下才会出现(例如在黑暗中导航)。
他们发现,网格状的表示(下文称“网格单元”表示)会在网络中自发生成,这与正在觅食的哺乳动物中所观察到的神经活动模式十分相似,并且符合网格细胞为空间提供有效代码的观点。
在他们的实验中,智能体生成了网格状的表示:网格单元,它与哺乳动物觅食时的生物网格细胞非常像
接下来,研究人员测试了网格单元是否能够通过创造智能体来支持基于向量的导航的理论。他们把该智能体看作虚拟的小鼠。通过将初始的“网格网络”和更大的网络架构结合,形成了一个可以用深度强化学习训练的智能体,而它的目标是在虚拟现实的游戏环境中进行导航。研究人员发现,当它开始寻找自己的位置时,网格状的形状在网络中开始形成。某些节点比其他节点用的更频繁,这与真实动物在寻找方向是生成的网格单元形状非常相似。
该智能体的表现超越了人类,比职业游戏玩家还要出色,并且展示了动物身上才有的灵活导航行为,能够在必要时刻开辟新的路径,甚至“抄近道”。
通过一系列实验,我们证明了网格状的表示对基于向量的导航十分重要。例如,当网络中的网格单元消失,智能体导航的功能也就减弱了,同时关键指标(到目标的距离和方向)也变得不准确了。
用网格单元进行向量导航的演示。底部圆点代表三种不同尺寸的网格单元。当智能体移动时,网格单元就会被激活,代表这当前的网格代码,从而发生变化,反应智能体进入了不同的领域。网格单元用于计算到达目标的最短距离
DeepMind的CEO,Demis Hassabis表示:“人类大脑是唯一能证明我们是能够创造强人工智能的证据,所以将神经科学看成是算法新的灵感是完全可行的。但是我们认为这种灵感应该是双向的,既能对人工智能有所启发,也能对神经科学界未解决的问题提供帮助。这项工作就是很好的证明:通过创建一个能在复杂环境中导航的智能体,我们证明了网格单元在哺乳动物的导航中的重要性,并加深了对它的理解。”
研究团队认为,这项研究对于了解大脑中的网格单元的基本计算目的是很重要的,同时也表明它们对智能体的帮助也是很大的。实验的结果为网格单元能提供一个欧几里得空间框架的理论提供了支持,这一概念支持了基于向量的导航。
更广泛地讲,这项研究重新确认了大脑所用的算法能为机器学习架构提供参考。此前神经科学对网格单元的研究让智能体的可解释性变得更加容易,这本身就是人工智能研究中的主要话题,当他们试着想要理解它的内部表示,先前的研究可以给与参考。这项工作同样展示了利用智能体在虚拟复杂环境中的行为验证大脑如何工作的潜力。
长远来看,这样类似的方法还能用来检测大脑的某一区域,例如负责捕捉声音或控制肢体的地方。未来,这类网络也许能像科学家提供不一样的试验方法,或者提出新的理论,甚至完成目前只能在小动物身上做的实验。
原文地址:deepmind.com/blog/grid-cells/