查看原文
其他

Neuron | 内侧额叶和眶额叶皮层在决策和灵活行为中的功能

struggling Rong 鹿鸣Cogn 2023-05-13


按:内侧额叶及相邻的眶额叶参与了决策、灵活行为和社会行为的加工。本文介绍了一篇近期发表在Neuron上的综述,该文结合了人类、猕猴和啮齿类动物的研究,区分了额叶皮层的背侧前扣带回(dACC)、膝部前扣带回(pgACC)、前内侧额叶(amFC)、腹内侧前额叶(vmPFC)以及内侧眶额叶(mOFC)的不同功能。



众所周知,包括眶额叶(OFC)、前扣带回(ACC)和腹内侧前额叶(vmPFC)在内的额叶皮层引导着决策和灵活行为。然而,没有OFC和ACC的动物仍然能表现出不断变化的决策模式和灵活行为。那么,叶皮层对决策和灵活行为的贡献有何特异性?在这篇综述中,研究者主要总结了额叶皮层中的几个亚区在决策和灵活行为中的功能(图1)。


图1 啮齿类动物(左)、猕猴(中)和人类(右)的内侧和眶额叶皮层。关注的5个脑区:背侧前扣带回(dACC)、膝部前扣带回(pgACC)、背内侧前额叶(dmPFC)、前内侧额叶(amFC)和腹内侧前额叶/眶额叶(vmPFC/OFC)。


1. 前扣带回(ACC)与环境中的机会

如果动物能够表征当前环境的价值(是否有奖赏、有多少奖赏)以及所采取的行动是否会带来好的结果(正性或负性的预测误差),这将有助于更优的觅食。比如,陆地环境上具有距离感受器的哺乳动物,就能够从远处观察环境,同时dACC表征整个环境中的机会分布,以及预测追求机会会带来的行为变化(图2B)。接下来介绍dACC在三种环境中的作用。


图2 脊椎动物大脑中表征环境价值的多重系统。(A)皮层下环路根据动物的环境价值来判断环境中的奖赏,(B)dACC使得哺乳动物能够表征环境和不同时间上的机会分布,(C)前额叶使得啮齿类动物和灵长类动物能够表征环境特征之间的结构关系。


1.1 dACC与随着时间变化的机会分布

环境中资源的不均匀分布会随时间变化。比如,一棵果树只有在果实成熟后的几天内具有较高价值,而在成熟前的几个月里平均价值较低。人类脑影像和猕猴单细胞记录的研究都表明,dACC反映了不同时间尺度上的选择价值(图3A左)。即使是在静息状态,dACC神经元活动也跟长时间尺度呈现出自相关(图3A中)。研究表明,损毁猕猴的ACC后,猕猴只能根据最近的结果来调整行为反应,而更久之前的奖赏和选择所产生的影响则消失了。另外,被试会利用dACC表征的信息来引导决定是在某一环境中继续觅食,还是转向另一个环境中(图3A右)。

图3 通过dACC探索和导航环境中的机会分布。(A)dACC表征不同时间尺度上的机会分布,(B)dACC反映最优机会和其他环境特征,引导行为改变,(C)dACC反映信息不完整和不确定性情况下的信息寻求。

1.2 dACC与行为改变

虽然在实验室研究中,决策总是被设定为发生在两个既定选项之间,比如让猕猴在苹果和橘子之间进行选择。然而,现实情境中觅食动物在某一时刻往往只会遇到一个机会(如一棵苹果树),个体需要决策是否花费时间和努力以投入到当前机会中,还是继续探索其他机会。虽然额叶的多个脑区反映了这类决策,但是dACC的活动不仅能反映环境中其他机会的潜在价值,还能反映个体转换到追求其他机会的可能性。研究表明,猕猴的ACC能表征最优的备选机会(图3B左)。同时,除了最优的机会,ACC还会表征其他环境特征。比如,当一个科学家在决策是否离开当前教职寻求其他工作时,除了考虑梦寐以求工作的价值以外,还需要考虑其他工作机会的平均价值,以及自己获得这些工作的可能性(图3B中)。最后,ACC的活动还反映了人类和动物为实现目标所需要的行动序列(图3B右)。


1.3 dACC与信息寻求

上文让我们知道人类和动物可以根据环境中所包含的机会情况来改变他们的行为,但很多时候我们对环境的了解是不完整的。在这种情况下,dACC能够反映信息的寻求和更新。比如,当大鼠在关联了变化的奖赏率的两个声调之间决策时,它们会周期性的改变自己的偏好选项(图3C左)。同样地,当猕猴寻找有关奖赏增长的信息时,dACC神经元活动也会改变(图3C中)。另外,线索的不确定性比确定性能使得猕猴的dACC神经元产生最大的活动(图3C右)。


2. 前额叶对环境结构与奖赏分布的学习

除了根据环境中的机会分布来及时地调整行为,很多哺乳动物还了解这些机会与环境其他特征之间的结构和因果关系。比如,有一天早上猴子在一棵树上发现了一个成熟的果实,但是昨天这棵树上的果实都还未成熟;如果猴子具备对环境结构的知识,那么这一个果实足以让猴子推断这棵树上所有的果实正在成熟,目前不需要去新的地点觅食。然而,这种对环境结构的编码,并不依赖于dACC。

2.1 amFC与结构表征

前内侧额叶(amFC)对于表征环境结构尤为重要。比如,当人类被试需要决策哪种刺激序列能获得奖赏;在扫描初期,被试的注意只会在相邻刺激间移动,且amFC表征了两个连续刺激的空间距离;但学习了一会之后,被试的注意则由凸显刺激所引导,且amFC表征了凸显刺激的转换频率(图4A)。这说明,amFC能同时反映任务结构的空间和非空间信息。而且,amFC对环境结构的表征不依赖于奖赏是否出现;反之,外侧眶额叶后部(pOFC)只能表征特定的、由奖赏所强化的刺激序列(图4B)。更进一步,amFC能够整合环境特征、表征知识的抽象关系,从而模拟新的经验(图4C-D)。

图4 amFC与任务结构。(A)amFC对任务结构的灵活表征,(B)pOFC对奖赏强化结构的稳健表征,(C)amFC有助于模拟新的经验,(D)amFC以网格状表格任务的空间。

2.2 vmPFC与价值比较

有一个在结构和功能上与amFC都不同的脑区是人类的vmPFC,有时也对应于猕猴的内侧眶额叶(mOFC)。虽然dACC和vmPFC都能对决策选项进行价值比较,但是两者的差别在于:dACC反映的是从当前机会到探索其他机会的转换价值,而vmPFC/mOFC反映的是所呈现选项的当前价值


在人类中,已选择和未选择选项的价值差异越大,BOLD信号越大;而在猕猴中,则存在两种相反的情况。研究表明,如果处于高放电状态的神经元恢复到基线状态的时间较长,价值差异与BOLD信号呈正相关;如果恢复到基线的时间较短,则呈负相关(图5A-B)。另外,来自猕猴和人类的研究都发现,vmPFC/mOFC不仅能将价值转换为实际的决策,损毁或抑制vmPFC/mOFC(而非amFC)会因果性地降低对决策选项进行比较的正确率。


amFC与vmPFC/mOFC的功能差异还有待界定,很多奖赏导向决策的研究都发现这两个脑区会同时激活。不过,最近一项研究首次在同一个任务中发现,amFC以网格状编码所有个体的抽象社会空间,而vmPFC/mOFC则表征了团队之间的价值差异(图5C-D)。


5  vmPFC与决策。(A-B)神经元放电恢复到基线的时间影响价值比较信号的方向,(C-D)同一任务中amFC与vmPFC的功能差异。


3. pgACC与成本收益的权衡

另一个与amFC和vmPFC比较接近的脑区是pgACC。在涉及不同类型成本(cost)的决策中,pgACC都会整合cost和benefit。比如,猕猴需要决策是趋近还是回避同时包含奖赏和成本的线索,神经元的放电率表明pgACC会同时整合cost和benefit;对pgACC进行微刺激也会导致猕猴更多的回避行为(图6A,左)。另外,在选择即时的小奖赏或者延迟的大奖赏时,pgACC则表征了对延迟选择的整合价值(图6A,中)。同样地,抑制或者激活pgACC-纹状小体(striosome)环路会导致小鼠分别增加或者降低对高成本/高奖赏选项的选择(图6A,右)。


虽然PFC很多亚区都能加工cost,但是pgACC可能对动机相关的cost-benefit整合以及发起/回避趋近行为至关重要。比如,pgACC激活以及pgACC-striosome连接能够预测人们是否继续采取行动(图6B,左),pgACC还反映了人们最可能选择的默认选项的价值(图6B,中),甚至在短期和长期内监控自己的任务表现(图6B,右)。

图6(A)pgACC在cost 和benefit之间权衡,(B)pgACC发起行动。

4. dmPFC与社会环境

除了任务环境,人类和灵长类动物还会处于社会环境中,dmPFC可能在编码社会环境(如,竞争与合作)的结构上具有特异化的作用。研究表明,人类对自我的评估会受到自我表现和他人表现的影响;而且,dmPFC会追踪他人的表现、预测他人对自我表现的影响,也会追踪自我的表现、预测自我对他人表现的影响(图7A)。同样地,猕猴的dmPFC也能追踪其它动物的表现,反映其它动物的决策以及该决策为自我所带来的奖赏(图7B)。另外,对人类dmPFC神经元的记录发现,dmPFC不仅能追踪他人的行为,还能追踪他人的信念。

图7  dmPFC和人际关系的组织


总结一下,本综述主要探讨了哺乳动物的额叶皮层亚区在引导决策、适应性和灵活行为中的特异性功能。比如,多种哺乳动物的ACC都表征了环境中在时间和空间上的机会分布amFC和dmPFC则表征了环境特征之间的结构联结和因果关系。这些额叶脑区的功能不仅可以帮助灵长类动物根据过去相似情境中的经验进行决策,还能产生推断从而引导在新情境中做出决策。

图8  内侧前额叶各个亚区的特异性功能



论文原文:

    Klein-Flügge, M. C., Bongioanni, A., & Rushworth, M. F. (2022). Medial and orbital frontal cortex in decision-making and flexible behavior. Neuron. https://doi.org/10.1016/j.neuron.2022.05.022

相关论文:

    Bongioanni, A., Folloni, D., Verhagen, L., Sallet, J., Klein-Flügge, M.C., and Rushworth, M.F.S. (2021). Activation and disruption of a neural mechanism for novel choice in monkeys. Nature, 591, 270–274. https://doi.org/10.1038/s41586-020-03115-5.

    Klein-Flügge, M.C., Wittmann, M.K., Shpektor, A., Jensen, D.E.A., and Rushworth, M.F.S. (2019). Multiple associative structures created by reinforcement and incidental statistical learning mechanisms. Nature communications, 10, 4835. https://doi.org/10.1038/s41467-019-12557-z.

    Klein-Flügge, M. C., Kennerley, S. W., Friston, K., & Bestmann, S. (2016). Neural signatures of value comparison in human cingulate cortex during decisions requiring an effort-reward trade-off. Journal of Neuroscience, 36(39), 10002-10015. https://doi.org/10.1523/JNEUROSCI.0292-16.2016.


相关推送

综述 | 从认知控制的角度理解基于价值的决策

Science | 多巴胺通过增强认知活动的收益成本比来促进认知努力

Nature子刊 | 缰核-脑岛环路编码行动意愿

Nature子刊 | 基于努力的决策中疲劳和坚持的计算神经机制


投稿邀请

鹿鸣Cogn | 投稿邀请



感谢支持!欢迎留言、转发、分享!




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存