人类观察学习中对选择模仿与目标模拟的策略抉择的神经计算模型
本文详细介绍了近期发表在Neuron上的论文“A Neuro-computational Account of Arbitration between Choice Imitation and Goal Emulation during Human Observational Learning”。
作者在文中探讨了大脑如何在两种常见的观察学习方式(选择模仿和目标模拟)之间做出选择。作者设计了不同情景下的行为实验,拟合了多种模型,找到了合适的模型对选择模仿(Choice Imitation)和目标模拟(Goal Emulation)的抉择进行解释,并使用fMRI找到了对应的脑区。
太长不看版:
在实际中,两种学习策略并存。
模仿学习依赖于观察并重复动作,与镜像神经元(mirror neuron)系统的脑区高度重叠,包括前运动皮层和下顶叶皮层。
模拟学习通过表示学习对象的目标来实现心理化(mentalizing),包括dmPFC,双侧岛叶,右侧TPJ,IFG和背侧纹状体。模拟学习需要使用更多认知和注意力资源。
▲▲▲
不管是通过观察专家的表现来学习新技能,学会寻求奖赏和避免惩罚,还是做出复杂的战略决策,观察性学习(Observational learning, OL)在我们的日常生活中都是很重要的,它使得个人可以学习到行为的后果而不比承受直接行动的风险。有两种不同的观察性学习方法:模仿(imitation)和模拟(emulation)。在模仿中,人会选择学习对象过去最常选择的动作;而在模拟中,人会推断出学习对象的目标、信念、意图或隐藏的精神状态。如果这两种不同的OL策略彼此并存,但一些基本问题仍然不清楚:即大脑如何决定在给定情况下应采用哪种策略,以及一种或其他策略在什么条件下指导行为?
图1 实验任务设计
图2 OL策略的行为信号
作者使用了逻辑回归(Logistic Regression)来对两种策略进行分类。在每个游戏试验中,左,右两个游戏机的选择由动作学习回归器(模仿imitation的信号:学习对象过去执行的左右动作)和令牌学习回归器(模拟emulation的信号:选择左右游戏机的概率根据推断的令牌信息来预测)来预测。结果我们可以从图2A和图2B中可以看到,研究1和研究2的结果都很显著,表明模仿和模拟之间确实是相互融合的。一个点代表一个被试,红色线条代表beta均值。t检验:* p <0.0001。
同时作者对比了9种不同的模型(见文章方法细节部分)来对选择模仿和目标模拟两种策略的抉择的机制进行检验。图2C和图2D展示了抉择模型以及简单的模拟模型和模仿模型如何捕捉动作学习和和令牌学习的效果。红色数据点表示数据的真实效果(误差线表示标准误差);直方图显示了从模型生成的数据中恢复的效果的分布。好的效果以浅蓝色显示,不好效果的灰色显示。在研究1(C)和研究2(D)中,抉择模型(左)有效地捕获了两种学习效果。模拟模型(中)生成的数据仅捕获基于令牌的学习;模仿模型(右)生成的数据仅捕获基于动作的学习。
图3 波动性和不确定性对抉择的影响
当令牌颜色分布的不确定性较低时,被试倾向于模拟。当学习对象的动作稳定且令牌颜色分布的不确定性较高时,被试更青睐选择模仿。在波动性高不确定性试验中,策略之间没有差异。这些结果也在研究2中得到验证。
图4 抉择信号与预注册分析
图5 模拟和模仿信号与预注册分析
由于研究2中选择模仿的显著性无法被复现,作者将模型进行了改进。作者定义了一种更简单的选择模仿形式(“一步模仿”),以便在给定的两个可用选项中,选择学习对象最近选择的游戏机(见文章方法细节部分)。此外,假定抉择仅由模拟可靠性来驱动,因此,如果模拟可靠性高,则被试将更有可能依赖模拟,而如果模拟可靠性低,则被试将更有可能默认选择模仿。按照预注册模型计算出的模拟可靠性变化得到了相同的三个ROI中:右vlPFC;左TPJ; 和右TPJ(研究2中p=0.055)(图6AB)。探索性连接分析还显示了ACC,双侧岛和上颌上回的显著区域(图6C)。
图7 模拟和模仿在观察期间更新信号
作者发现新的模拟信号显著性类似于预注册的结果(图7AB),对dmPFC,前SMA,右侧TPJ(研究2中p=0.054),背侧纹状体有显着影响。探索性连接分析证实了这一点,并显示了双侧岛状,额下回和其他额顶区域的位置也具有显著性(图7C),与Neurosynth的“心理化(mentalizing)”脑区图重叠(图7D)。
但是,与模仿信号在预注册研究中未被复现相反,当前信号对学习对象当前行为与之前行为不同的情况做出了有力反应,这与“一步模仿”策略一致。该信号在preSMA ROI中发现,并在模仿过程中持续。连接分析显示了参与动作观察和动作准备的区域[preSMA],双侧下壁小叶[IPL],左运动皮层和左dlPFC;图7G),与Neurosynth“镜像”脑区图基本重叠(图7H)。
//
这些不同的信号表明,大脑会并行跟踪与每种策略相关的决策值,从而使个人可以在需要时部署其中一种策略。
//
观察性学习(Observational learning):通过观察其他对象的表现来学习
模拟学习(Imitation learning):在本文是指,通过模仿其他对象过去最常选择的动来学习。注意:这里的概念与机器学习领域的imitation learning有所不同。
模仿学习(Emulation learning):通过推断出学习对象的目标、信念、意图或隐藏的精神来学习。
写作:NCC lab 魏晨
校对:刘泉影
转载请先发邮件咨询:刘泉影,liuqy@sustech.edu.cn
文献来源
Charpentier et al., A Neuro-computational Account of Arbitration between Choice Imitation and Goal Emulation during Human Observational Learning, Neuron (2020), https://doi.org/10.1016/j.neuron.2020.02.028