徐宁龙团队揭示大脑如何基于经验知识作出灵活决策 | Cell Press对话科学家
生命科学
Life science
2021年5月5日,中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)、神经科学国家重点实验室徐宁龙课题组在Cell Press细胞出版社期刊Neuron上在线发表了题为“A cortical circuit mechanism for structural knowledge-based flexible sensorimotor decision-making”的研究论文,首次揭示了一个明确定义的神经环路如何编码和计算基于结构知识的任务状态推测,从而产生灵活决策的智能行为。该研究主要由博士研究生刘彦和在徐宁龙研究员的指导下完成。
长按图片识别二维码阅读原文
在变化的环境中,生物体需要根据不同的感觉信息做出特定的行为反应。在哺乳动物中,得益于大脑新皮层的演化,动物体不仅可以做出简单的刺激-反应,而且可以抽提出多变环境中的共同结构,形成知识,对于环境状态变化形成预测,产生灵活可变的智能行为。
研究这种灵活抉择智能行为的神经机制是揭开大脑认知之谜的关键。虽然神经科学界对于包括眶额叶在内的前额叶脑区在动物行为中的神经活动作了大量研究,然而一个未被解答的关键问题是,不同脑区之间如何通过复杂的环路连结协同工作从而实现基于推断的灵活决策?
为此,研究团队在头部固定的小鼠上建立了灵活感知抉择行为范式,同时利用全新的神经环路光学记录和光学操控技术研究其背后的神经环路运算机制。在该行为范式中,研究人员巧妙利用简单的声音频率和奖励规则变化,引导小鼠执行基于任务规则的灵活抉择行为。小鼠需要根据不断变化的分类规则,对声音刺激进行灵活分类,以获得奖励。经过训练,小鼠不仅可以对声音刺激进行灵活选择,并且逐渐建立起了通过对潜在任务规则的推断迅速切换选择的策略。这一行为任务模拟了动物或人类利用已有的任务结构知识,根据不完整信息推断环境状态变化,从而做出灵活的适应性选择的智能行为。
研究人员进一步利用全光学神经成像和环路操控技术,发现听觉皮层神经元群体编码了关于听觉分类边界的主观估计这一认知变量,而来自眶额叶到听皮层的反馈信息对于这种听觉分类信息的计算和更新起关键作用。这种神经环路处理机制与该团队建立的一个新型强化学习计算模型相符。该模型包含了基于任务结构知识的状态推断,实现了基于任务规则的灵活信息分类,并且可以准确重现动物的灵活抉择行为表现。进一步,研究人员通过对这条反馈环路的精准干预,获得了因果性证据,支持该环路运算机制的确在灵活分类行为中起关键作用。
徐宁龙研究员表示,该研究系统而完整地揭示了一个明确定义的神经环路如何编码和计算基于结构知识的任务状态推测,从而产生灵活决策的智能行为。该成果对于从神经环路水平理解智能行为和认知功能的生物学机制是一个关键突破,并且有可能对于人工神经网络如何实现基于经验知识进行灵活决策的研究带来新的启发。
作者专访
Cell Press细胞出版社特别邀请论文通讯作者徐宁龙研究员代表研究团队进行了专访,请他为大家进一步详细解读。
CellPress:
大脑会根据先验经验来做出不同的决定,那么请问,基于经验知识的认知的关键神经机制是什么?
徐宁龙研究员:
基于先验经验做出灵活决策是大脑的重要认知功能,过去的研究认为前额叶等高级脑区编码了任务规则信息,但具体的神经机制还远不清楚。我们的这项研究为这个问题在神经环路运算机制方面带来了前所未有的突破。
CellPress:
请问本研究中采用的双光子成像以及特异性光遗传学等方法有何优势?
徐宁龙研究员:
双光子成像首先可以对大量脑内神经元活动同时记录,并且具有单细胞分辨率和细胞类型特异性;其次可以对一个脑区投射到另外一个脑区的轴突末梢活动进行记录,从而直接观测到神经环路连接部位的信息传递。光遗传学技术可以对特定脑区特定细胞类型进行操控,另还可以对从一个脑区投射到另外一个脑区的轴突末梢进行光学操控,实现环路特异性操控;光遗传技术另一个优势是可以快速开关光照,因此对神经活动的操控具有很高的时间分辨率,可以在行为过程中的特定时间段进行准确操控。
CellPress:
请问眶额皮层(OFC)及听觉皮层(ACx)在基于经验的决策过程中,分别起到怎样的作用?
徐宁龙研究员:
听觉皮层编码了听觉信息分类标准,当任务规则变化时,分类标准需要被更新,因此听觉皮层的编码也需要被随之更新。眶额叶皮层(OFC)则编码了任务规则变化时,行为结果的反馈信息,这种反馈信息被用于推断当前任务规则。
CellPress:
OFC提供的反馈信号有何重要意义?
徐宁龙研究员:
OFC的反馈信息包含了根据奖赏变化对当前任务状态的推断,该信息反馈到听觉皮层,用于对听觉分类边界线编码的更新,从而可以对于同样声音刺激做出不同的分类。
CellPress:
此前已经有很多研究确定了参与认知的重要大脑区域,但是仍有许多关键的机制问题没有解决,您认为本研究能够为此提供怎样的帮助?
徐宁龙研究员:
对于基于推断的灵活抉择这种智能行为的认知功能,之前灵长类研究在行为任务设计方面相当精巧,并且也有很好的量化,例如近期Salzman等人在Cell发表的研究,然而对于神经机制的研究仍然基于对单个脑区的群体编码的研究,缺乏神经细胞类型特异性、投射环路特异性,对于不同脑区之间形成的具体的神经环路如何协同工作这种环路机水平制仍然缺乏研究,并且由于技术限制,不能提供因果性证据来支持所观察到的神经编码是否的确参与认知行为。类似的局限性同样存在于近期利用小鼠对于分类行为的研究,例如最近Reinert等人在Nature发表的研究,训练小鼠执行2个维度的复杂视觉分类任务,虽然小鼠可以学会不同分类边界,然而该任务中小鼠并不能灵活的反复切换分类边界,因此无法研究基于经验知识的灵活决策;在神经机制方面,该研究主要关注一个单一脑区mPFC对于任务规则的编码,作者发现mPFC对任务规则的编码可以被泛化到不同的行动报告范式(Go/NoGO和二选一),然而与之前灵长类的研究类似,该研究仍然停留在对单一脑区任务变量编码的研究,而对于更关键的神经环路处理机制却缺乏研究,同时该研究也没有充分利用小鼠研究的优势,进行神经活动操控,未能提供因果性证据来支持mPFC编码是否的确对分类行为有贡献。我们的这项研究则全面超越了之前研究的局限,我们在头部固定的小鼠中建立了基于经验知识的灵活分类行为,并且利用计算模型重现了小鼠行为的同时,估算出了隐含认知变量;在神经机制方面,我们不仅找到了直接编码隐含认知变量的神经元群体,并且我们鉴别出了前额叶的OFC区域与感觉皮层之间的神经环路如何通过迭代反馈算法实现基于推断的灵活分类,更进一步我们获得了神经环路水平的因果性证据,支持这条具体的神经环路对灵活分类行为有直接贡献。因此,我们的研究是真正在神经环路水平发现了一种关键认知功能的神经运算机制,不夸张的说,该研究把目前认知功能神经机制研究的前沿推进到了一个全新的高度。
作者简介
刘彦和
博士在读
第一作者:刘彦和,中科院脑智卓越中心、中国科学院大学博士研究生
通讯作者:徐宁龙(右),中科院脑智卓越中心高级研究员。
推荐阅读
▲长按识别二维码关注细胞科学