会议报道|汪小京:将神经元变为数学模型和算法,在人脑和 AI 间架起桥梁
大脑是宇宙中最复杂的系统。人们一直试图揭秘大脑的内在机理,但囿于技术和方法的限制,进展始终有些缓慢。如今,人工智能技术的到来给脑科学研究带来了全新的机遇。
6月21日,天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)和neurochat神聊共同发起了第四届TCCI-neurochat神聊在线学术会议。会议首日,纽约大学汪小京教授作题为“Theoretical Neuroscience in the age of Artificial Intelligence”主旨报告,从理论神经科学的角度,分享了人工智能应如何与神经科学相结合来推动神经科学的研究。
所谓理论神经科学或者计算神经科学(Theoretical/Computational Neuroscience),是利用数学理论来理解大脑是如何工作的。如同理论物理之于物理学,理论神经科学在大脑研究中也扮演着重要的角色,与实验研究相辅相成。仅仅通过实验,我们可能无法真正了解大脑如何在多个不同层面上运转。理论神经科学可以将神经元和神经网络转化为数学模型和算法,在脑科学和AI之间架起桥梁。随着实验工具的进步和大数据的出现,进行理论研究和建模显得尤为必要。
AI难以企及的脑功能
当下AI领域的技术革命约始于2012年。当时,杰弗里·辛顿(Geoffrey Hinton)的研究小组证明了深度神经网络可以执行视觉对象识别任务。众所周知,不同部位的皮层对应不同的功能。深度神经网络的不同层级可以映射到大脑的V1、V2、V4等区域。但眼睛上方的前额叶皮层(prefrontal cortex,PFC)直到现在也没有被研究透彻。人们也没有找到它的功能在当下的机器系统中的对应关系。
这个仍待阐明的PFC区,对各种认知功能都非常重要,例如工作记忆和决策。何为工作记忆?它是大脑内部维持和处理信息的能力,使大脑可以专注于内在,不被环境所役使。而决策则是指,人们如何在不确定性中做出选择。
通常情况下,在实验室中可以使用延迟依赖性任务研究工作记忆。比如,先给猴子看食物的位置,然后设置一个5或10秒的延迟阶段。在这段时间里,猴子必须牢牢记住食物是在左边还是在右边。延迟结束后,猴子会根据记忆来检索食物,而不是基于直接的感官刺激(食物本身)。上世纪70年代早期,人们使用单细胞记录和电刺激发现,在延迟阶段PFC单个细胞持续活跃。这个神经元在刺激之前并不活跃,它甚至没有对刺激作出反应,但却在延迟阶段持续活跃,并且随着延迟时间加倍而加倍。这就是所谓的刺激选择持续活动(stimulus-selective persistent activity)。
▷图注:延迟依赖性任务。图源:汪小京教授提供
对于决策的研究,有一个简单且巧妙的实验——双选项强迫选择(two-alternative forced choice)。猴子被训练注视屏幕上的一个点,并在点消失后做出决策:判断点的运动是朝左还是朝右。猴子需要通过眼动来表达其决策。诀窍在于,在任何给定的试验中,点移动方向的比例是可控的,这个比例被称为一致性(coherence)或运动强度(motion strength)。如果所有的点都向一个方向移动,那么就很容易做出决定。如果只有50%的点向同一方向运动,另外50%的点则是随机移动的,这就有点难以抉择了。如果只有5%的一致性,甚至是0%呢?这时候做出主观判断是非常困难的。单细胞生理学研究发现,神经元活动的持续递增(ramping activity)发生在几毫秒间。这种瞬时的剧烈活动是神经元整合信息的一种机制,通过积累关于不同选择方案的证据,做出主观判断。
汪小京教授通过这两个实验例子,直击了最复杂问题的内核。正如著名心理学家唐纳德·赫布(Donald Hebb)所说的那样:“要用一种中枢神经机制来解释刺激和反应之间的延迟的话,它似乎与思维的特征不谋而合。”当我们思考时,不是由直接的外部刺激所驱动,而是大脑内部的一种行为。延迟活动,则是内部神经元群体活动的具体实例。
然而,人们尚不清楚决策或选择的生物基础,而AI系统也没有这种能力。诚如诺姆·乔姆斯基(Noam Chomsky)所言:“一旦涉及意志或决定或理由或行动选择的来源问题,人类科学就陷入了迷茫。”
基于生物学进行建模
即便真实的生物过程如此复杂,我们可以用相对简单的行为范式,尝试了解跨层次的机制。
在物理学单摆实验中,如果空气中存在摩擦力,摆锤的幅度会越来越小,摆幅随时间呈指数式衰减。神经元的放电,亦是如此,会随着时间的推移而衰减(时间常数为10毫秒)。要想在工作记忆中获得持续的活动,就需要解决这一问题。为此,汪教授提出了一个大胆的假设:回响(reverberation)。也就是说,如果一组神经元相互激发,那么即使输入消失,它们仍然可以持续活动。在灵长类动物PFC的第二三层,有强大的水平连接,也为这一假设提供了结构基础。
为了验证这一假设,汪教授化繁为简,构建了一个只有两个动态变量的系统,展示了如何将随机点、感知决策和工作记忆结合起来进行判断和选择。
这个模型有两个选择性发放神经元群体——a和b。神经元群体内部发生回响,而两个群体之间的兴奋选择性要弱得多。同时,它们通过抑制性神经元进行竞争,最终产生一个赢家。而这,就是系统的选择。系统的选择是由运动强度和对a组和b组的相对输入决定的。当输入消失时,选择信号在整个延迟期是自我维持的。这个模型可以解释工作记忆和决策的基本过程。
▷图注:(左)双选项强迫选择;(右)慢回响动力系统。图源:汪小京教授提供
并且,这个模型是跨层级的。以反应时间作为运动强度的函数,会发现,运动强度较低时,任务越困难,做出决定所需的时间就越长。就像在日常生活中,要做一个艰难的选择时,我们通常需要很长的时间来考虑不同的选择。而这一点在猴子的实验中也有体现。这也阐明了为什么循环神经回路的动力学可以解释行为。
同时,汪教授从细胞分子角度提供了一些洞见。比如,慢速时间积分主要由NMDA受体介导的兴奋性回响实现。NMDA受体对于决策和工作记忆非常重要,这在猴子实验中已经得到测试和确认。如果找到一种药物来减少或消除NMDA的信号,那么神经元活动就会结束。
如果以自我维持状态、内部状态为反复激活强度的函数,并将这些状态称为一个参数,则会发现:在这个模型中,当参数高于一个阈值时,会出现一系列刺激选择性的、持久性的状态。这些状态包括工作记忆中的不同记忆项目。这种状态的出现可以解释为动态系统中的分岔,即参数的分级变化导致了不同的功能和能力。这一观点对于循环神经回路非常重要,并且在多区域、大规模的大脑系统中也有应用。
▷图注:工作记忆和决策中足够强的循环连接。图源:汪小京教授提供
在此基础上,我们可以借助机器学习建立一个近似生物学上的神经回路,用于执行20个不同的任务,比如可以涉及工作记忆、决策、分类、多感官整合、延迟采样、延迟分类等等。一旦网络成功地执行了所有微小的任务,就可以打开“黑匣子”进行分析,提出自己的问题,分析新的回路、神经群体的动态。神经元的活动可通过任务差异来衡量;神经元之间的相互作用和组织方式可以利用聚类分析来厘清。
然而,即便我们设计出类似PFC的回路,可以基于规则灵活地指导行为,也不应止步于此。我们有必要超越目前为止所描述的局部回路建模。因为,事实上,任何一种功能都涉及多个脑区,不仅仅是PFC,还有后顶叶皮层,甚至还可能有一些超级皮层结构。
从局部网络到大脑系统
大脑不同区域的互动存在非常强的循环性,作为一位理论家,汪教授表示,仅将它们之间的反馈连接定性地勾勒出来远远不够,他需要数字这种清晰明确的描述。而近十年内,得益于科技的发展,利用收集数据绘制区域间有向加权连接矩阵(directed and weighted connection matrix)成为可能。
在猕猴的皮层中,如果用直方图表示两个区域有向连接的权重,会发现多个区域的直方图呈对数正态分布。而任意一对区域的权重与布线距离(wiring distance)呈指数分布。这意味着我们不能用传统的图形描述皮层网络,因为图形描述是顶层逻辑的,并没有实现这种特殊的嵌入,无法体现皮层间的特殊关系。汪教授的团队创造了一类新的数学模型,这些模型是专门为特殊嵌入而设计的,可以用来研究真实的皮层网络。
▷图注:(左)图形描述;(右)不同区域的有向连接权重直方图以及权重与布线距离直方图。图源:汪小京教授提供
构建大型皮层模型时,我们需要对每个区域进行数学建模。不同的区域可能需要使用不同的数学模型。因此,我们需要从制定科学问题开始,并根据问题建立相应的模型。
在神经科学中,有一个公认的原则是存在皮层柱(cortex column)。这是由一组垂直排列的神经元组成的柱状结构,这些神经元具有相似的功能和结构特征。因此,存在一个重复了很多次的局部回路单元,在啮齿类动物、猴子和人类中,这个局部回路都是差不多的。但是,即使在相同的局部回路中,也存在数量上的差异,这将导致质变,即功能和能力的不同。因此,在建立模型时,需要考虑数量上的差异。
汪教授展示了在大规模系统中,数量差异的影响。以树突棘数量作为层级位置的函数,可以观察到每个细胞树突棘的数量系统性地增加了。这种微观梯度显示了不同区域里神经元的兴奋强度之间的关系。而在前段时间发表于《自然·神经科学》的论文中,汪教授则研究了猕猴皮层神经递质受体的表达梯度,如多巴胺受体和5-羟色胺受体,发现了一个皮层层级,受体在高层级的皮层区域具有更高密度、更大树突和较少髓鞘。这是用数学模型量化生物特性变化的又一实例。
▷图注:一种沿锥体细胞基底树突棘层级测量神经元突触输入的方法。图源:汪小京教授提供
除了数量上有层级外,时间常数也具有层级。不同区域的活动发生的时间尺度存在差异,其中一些区域的时间常数较短,而其他区域的时间常数较长。比如,视觉网络运行得非常快,当看电影的时候,感官输入一直在变化,时间常数必须非常短,以快速反应。而在决策时,神经元活动持续增加,这意味着时间常数必须非常长。这对于工作记忆和决策等认知过程具有重要意义。
汪教授还表示,通过对孤立区域的分析,可以发现区域间的连接不仅仅是局部的,而是长距离的,这种连接形成了分叉空间。大脑皮层大规模模型的建立过程,既包括线性梯度的添加,也需要对时间常数的分析。层级结构和时间常数可以帮助我们理解大规模动力学和功能的影响。
最后,汪教授强调,不是所有的神经回路都是一样的。像PFC这样的认知神经回路,它能够同时进行工作记忆和决策。从AI角度来看,这是最值得思考的问题。
写在最后
神经科学是一个复杂而迷人的领域,本次主旨报告以大量计算神经科学的例子为引,由表及里,发现隐藏在数据中的规律和趋势,层层剥开神经网络的运作方式。汪教授基于优雅的物理、严谨的数学,讲述了如何进行精细的生物学研究,内容深入浅出,发人深思。
追问互动
○ 如果您对本期内容有进一步想要追问的问题或者讨论的内容,欢迎在评论区留言,或者加入我们的社群参与互动,添加小助手微信questionlab即可申请进群。