Chap.5 The Demystification of Thought
我们之前提到,动物行为的发生是依靠一种叫做先天释放机制(IRM)的东西,那么人的心理和行为是如何产生的呢?本章从信息加工的角度,借鉴计算机的加工方式来探讨人类行为发生的基本准则。
随着计算机科学的发展,在20世纪50年代,认知心理学家开始用计算机的加工方式来类比人脑的运行方式,一个重要的例子就是Allen Newell, Cliff Shaw和Herbert Simon的“通用问题解决者”(General Problem Solver, GPS)模型。这一模型具体而详细地展示了人类问题解决过程是如何由基本的信息加工过程组合而成的。在早期心理学中,行为被认为是一系列的“刺激-反应”(stimulus-response)联结,就像巴普洛夫的狗的条件反射实验一样。之后,心理学家开始对这一简单的行为主义思想进行修正,Miller等人在1960年发表了Plans and the Structure of Behavior一书,认为人类行为的核心不是刺激-反应联结,而是一种叫“test-operate-test-exit”(TOTE,测试-操作-测试-退出)的结构。TOTE将孤立的刺激和反应转化为有组织的结构,具体来说,就是实现目标的结构。TOTE单元的原则可以适用于各种行为和思想,从追求职业的长期目标到进入房间或开灯的短期目标。这里举一个将钉子钉入木板的例子:TEST: Is the nail down?IF NO, OPERATE: Hit the nail and return to TESTIF YES, EXIT (goal achieved)可见,TOTE确实可以解释这一行为。而且自然而然,这种TOTE是具有层级结构的。可以向上或向下扩展(变化TEST),例如把TEST定为有没有抬起锤子或者锤子有没有敲到钉子:TEST: Is the hammer raised?
IF NO, OPERATE: Lift the hammer upward and return to TESTIF YES, EXITTEST: Has the hammer struck the nail?
IF NO, OPERATE: StrikeIF YES, EXIT这时候我们就有三层结构,一个是位于更高的层级(nail down)另两个是位于较低的层级。在TOTE的概念中,行为不受到“刺激-反应”的控制,而是受控于“当前状态”、“目标状态”、“行动”这三者的结合。一系列的行动是以一种非常具体的方式选择的,选择是为了减少当前状态和目标状态之间的差异,直到目标本身实现。
在TOTE语境下,无论我们放眼于更大的目标(如十年工作目标)还是放眼于小的目标都可以用这一套“目标导向”的模式来解释。当然TOTE也存在未解的问题,比如从一个TOTE单位到另一个TOTE单位这种控制流是如何实现的?它是如何建立来习得复杂和新异的行为的?为了解决这个问题,Newell, Shaw和Simon用符号逻辑的方法来做了解释,这一部分可参考原文。要解决任何问题,无论计算机还是人类,首先需要有一定的“知识”(knowledge,尽管计算机和人的物理存储方式不一样),其次需要有能够实时加工的场所,从而才能知道在每个时刻正在处理什么子目标,正在接近什么最终目标等。在计算机和人脑中都存在长时记忆(内存)和工作记忆(缓存)系统,后者可以让我们实时存储和加工当前的信息。现在已经知道,计算机可以和人类一样完成一些目标导向行为(比如计划旅行路线)。一些研究的结果表明,计算机做的规划和人类做的规划差不多,这说明当计算机程序配备了世界的详细知识,便可以产生复杂的,有用的,目标导向的思想和行为。同样这也说明,计算机的思维方式和人类是存在相似之处的,这里蕴含了哪些一般性原则?我们知道,计算机通常是系列加工(串行)而不是平行加工,这种加工方式非常适合思考和解决问题,但同时却不太适合许多其他类型的大脑操作(人脑既有系列加工也有平行加工)。正如Newell等人提及,复杂的问题必须分为一系列小的子问题来解决。整个问题的解决是通过找到可以单独解决的子问题,并按顺序解决这些部分。最终目标会导致子目标的选择,而子目标控制着行动的细节,子目标依次遍历会到最终目标。在一个问题的解决方案的每一部分中,都有少量的知识用于解决一个受限的子问题。我们可以把这个集合称为一个cognitive enclosure,在这个enclosure里,只要有一个子问题被解决,与这个子问题有关的那些事实就被允许考虑进去。有效的思考和行动需要把问题分解成有用的cognitive enclosure,然后依次发现和执行。当每一个enclosure完成,它必须交付重要的结果到下一个阶段,然后结束对它的控制。用这种想法可以解释很多问题(比如文中举到了顿悟的实验例子)。原则上讲,让机器来进行人类类似的行为并不困难,机器只需要充满正确的知识,然后用这些知识以正确的、循序渐进的、类似人类的方式进行推理。随着心理学和神经科学的发展,特别是当我们使用计算机模型时,机器被用来模仿任何一种人类的思想和行为都是可能的。
与动物的先天释放机制不同,人类的行为序列是人类思想中任意构建的cognitive enclosure,每一个enclosure都只包含一个小而集中的子问题有关的信息。与动物不同,人类的行为序列可以任意地长和复杂,在我们的头脑中,先天的释放机制已经被一个几乎完全灵活的结构所取代,这个结构能够专注于几乎任何类型的问题。只要我们可以获得知识,以任何形式表达,我们就可以用这些知识提出问题并设定目标。作者认为,正是这些完全灵活的cognitive enclosure的组合,提供了人类智力中本质元素。本章讨论了人类心理和行为的基本准则,那么这些准则如何在实际的大脑中运行呢?这是下一章要讨论的内容。在第四章中提到过,脑损伤法、fMRI成像实验是了解大脑功能很有用的技术。在fMRI中,大脑被分割成一个个3毫米见方的小正方体(称为voxel, 体素),尽管这已经很小了,但每个体素里面还是包含了数以万计具有不同功能和属性的神经元,所以fMRI信号尽管可以对这一区域整体的信号强度做一个估计,但是没有办法看得更细。因此作者认为,利用单细胞记录的方法记录各个神经元接受和传输的确切信息是了解大脑工作方式最好的方法。
在脑中,所有信息都是通过触发短暂的电脉冲(electrical impulse)或尖峰(spike)的速率来编码的。在刺激(stimulus)出现前,细胞以一个自发或基线的频率放电,这个速率中微小的、每时每刻的波动反映了所有神经元的噪声或可变性;当刺激出现,这个放电频率会发生突然的改变;不同的刺激速率会告诉大脑其他部分细胞出现了什么刺激,然后做出相应的反应。
单细胞记录示意图 (Biasiucciet al., 2019, Curr.Biol.)
在大脑中植入一个微电极就可以记录每个神经元的放电情况,这种实验通常在动物身上做(因为是有创的),但有时也会在脑外科病人身上做(而且通常会在被试清醒的时候做,因为大脑本身没有感受器,是感觉不到什么的)。对于一个系统性的实验,我们需要在正确定位的脑结构中广泛取样一些神经元,然后在严格控制实验条件的情况下在不同的session里记录数据。从十九世纪开始,神经生理学普遍认为每一个细胞的放电都有其特定的含义,这被缪勒(Johannes Müller)称为“特殊神经能量假说”(the law of specific nerve energies)。相比之下,对前额叶的单细胞记录研究出现较晚。非常有意思的是,研究发现额叶细胞的活动显示出极大的灵活性和对环境的适应性,而不是对每个细胞的激活都有固定的意义。早期的动物实验发现,在切除猴的前额叶后,猴子的短时记忆能力明显受损。之后,单细胞记录实验发现,前额叶的细胞能够编码短时记忆的内容(content),研究者经常能发现在延迟期存在有两种不同的放电模式,这取决于奖赏出现在左边还是右边。这说明,前额叶神经元能够在储存短时记忆上起作用。
更进一步,已有研究发现视觉通路有腹侧通路(编码物体信息/物体识别;“what”通路)和背侧通路(编码空间、位置信息;“where”通路),因此研究者推测额叶区域可能也存在腹侧和背侧的差异,即背侧前额叶负责短时记忆的空间位置信息,而腹侧前额叶负责短时记忆的物体特征信息。实验结果支持了这一个想法。
这一切似乎很顺利,那么我们会问:额叶受损患者出现的行为损伤真的都是归结于短时记忆的受损吗?Earl Miller对上述研究的结论表示怀疑,因此他设计了一个实验(Rao, Rainer, & Miller, 1997; Science),让单细胞记录既可以记录在记忆“what”,又可以记录在记忆“where”,并同时记录腹侧和背侧额叶的神经元信号。结果发现,背侧和腹侧前额叶的神经元没有区别,都是既可以编码what,也可以编码where,根据需要,前额叶神经元可以编码相当多不同的东西(位置、物体、规则等等)!因此,额叶神经元并没有“特殊能量”,每个神经元活动没有固定的含义,它的含义只存在于当前任务的上下文中。当环境改变时,细胞的活动也随之改变。这也是为什么早期研究总是成功的原因。在上一章我们提到过思维是一系列cognitive enclosure组成的,现在我们发现额叶神经元的特点非常类似cognitive enclosure的特点,对于每一种新的任务,大量前额叶神经元会编码与任务相关的信息(除了前额叶,前文提到过的Multiple-demand system的其他脑区都具有这样的编码特点)。Cognitive enclosure是需要注意(attention)参与的,单细胞记录的实验也关注了猴子的视觉注意,如猴子如何区分需要注意的物体和需要忽略的物体。Moran和Desimone在1985年在Science上发表了一篇有影响力的论文,其发现猴子视觉系统的单个细胞也出现了和人类注意一样的过滤无关信息的效果。当然,前额叶细胞也有类似且更为强大的功能,显然,细胞所做的就是适应任务相关的信息——就是那些属于当前注意聚焦的东西。这里作者提到,很有可能视觉系统编码任务相关的视觉信息、听觉系统编码任务相关的听觉信息,而前额叶(或者说Multiple-demand网络)扮演了一个整合任务相关信息的角色。(基于视觉注意的电生理研究,他们提出了注意的有偏竞争模型biased competition model;Desimone & Duncan, 1995, Annu Rev. Neurosci.)
总之,前额叶细胞有着高度灵活的特性,可以根据任务的需要编码各种各样不同的信息。【但是这不代表额叶各个神经元都同等强度地适应各种功能,adaptive ≠ equal)。John2001年在Nature Reviews Neuroscience提出了一个额叶的适应性编码假说(adaptive coding hypothesis),那篇文章中更详细地讨论了这个观点。】
神经元适应性编码的示意图(Duncan, 2001, Nat. Rev. Neurosci.)
第七、八两章相对更加松散和开放,可以说是对之前内容的补充、总结、展望,因此这里就不作为重点介绍。第七章回到了实验心理学,补充了人类认知局限性的例子以及介绍了“竞争”(competing)和“偏向性”(bias)的思想在实验心理学中的角色。在一开始的章节就提到,人的“理性”或者“智力”是很有局限性的,也很容易受到外界因素的干扰,这一章通过一系列的例子(如卡尼曼的框架效应、费斯汀格的认知失调等)来说明,cognitive enclosure也是有局限性的,当一个问题被评估时,各种想法就会相互竞争,这时竞争胜利的想法就会占据主导,其他想法就会被抑制。这时,有些知识虽然可能是可用的,但可能处于被忽视的状态。在极端情况下,理性会堕落为合理化。这一章内容强调了“竞争”和“有偏”,虽然说的是知识的竞争,但竞争、有偏也是他关于注意系统“有偏竞争模型”的核心概念。
Chap.8 The one sure thing
总结全书的内容,作者对于智力的观点是:人类智力的核心是额叶和顶叶一些区域组成的多重需要系统(multiple-demand system; MD system),尽管这可能不是全部的解释(例如共享的基因也可能产生影响)。它的功能是将有结构的思维程序组装起来,每个程序是一系列的cognitive enclosure,每一个enclosure都致力于解决一个聚焦(focus)的子问题。这种cognitive enclosure有点像动物的先天释放机制,但是相比之下,人类的系统更加灵活和具有适应性。之后,作者对智力研究做了一些展望,内容非常丰富。从基因对一般智力的作用到认知年老化的探讨,从单细胞记录的实验视角到fMRI新技术的运用。这里就不赘述了。实际上,这本书于2010年发表后,在这十年里John课题组在围绕MD system、adaptive coding、cognitive enclosure等方面又做了一系列研究。比如,利用一系列fMRI研究,借助MVPA的方法验证了在MD系统的适应性编码;利用行为学手段验证完成智力测验的核心在于认知的分解;利用人脑连接组项目(HCP)的核磁数据精确标定了MD的解剖及其功能连接等等。
对我们来说,智力相关的研究仍然在发展的路上。更需要提及的是,我们研究智力已经不只是为了发现谁更聪明而谁不聪明,而是能够通过这个问题来探索人类大脑运行最一般性和本质的问题。
这本书的导读就到这里,深刻发现科普类书籍和文献还是存在不少的区别,读完之后发现自己居然还是更爱看文献一些 =͟͟͞͞(꒪ᗜ꒪ ‧̣̥̇)