TiCS | 在视觉探索和阅读过程中支持预览的流水线机制
按:本文介绍了Ole Jensen等人去年在Trends in Cognitive Sciences上发表的观点性论文,该论文提出了一个基于alpha振荡的支持视觉探索和阅读的“流水线机制”。这篇文献笔记的作者是来自北师大的Dongwei同学。
人们具有通过眼动有效地探索视觉场景和进行阅读的能力。人类通常大约每250 毫秒进行一次扫视。由于扫视启动和执行需要 100 毫秒,因此只剩下约 150 毫秒来识别客体(或词语),同时预览下一个扫视目标的候选对象。
当你看到一个视觉场景的图片时(图1A),眼睛总是精准的落在有意义的位置上,这就引发了一个问题:在眼睛到达某个位置之前,当这些信息还没有被充分加工的时候,我们的大脑是怎么知道哪些部分是这个场景中重要的部分?
因此,作者在本文提出了一种流水线(pipeline)机制,大脑在串行加工中央凹处的视觉信息的同时,有部分认知资源在对中央凹旁(Parafoveal)的视觉信息进行并行处理,这种对中央凹旁的视觉信息进行处理的能力叫做预览(preview),其中串行处理发生在特定的脑区,而并行处理发生在不同的脑区。作者还指出,该机制由协调眼睛扫视、视觉识别和预览的alpha振荡来计时。因此,必须同时研究支持自然视觉和扫视的神经机制,以揭示支持视觉探索和自然阅读的脑机制。
生理结构决定了信息从视网膜传输到视觉皮层大约需要 60 毫秒,而大脑皮层处理固定物体大约需要 90 毫秒(图1B,E)。大量人类脑磁图(MEG)和猴子的颅内电生理研究发现,在 150 毫秒内识别语义级别的视觉对象是可能的。但由于还必须在同一时间段内探索和选择未来的扫视目标,这就对视觉系统提出了严峻的挑战。
然而,在扫视开始前就开始处理中央凹旁的信息,这会为预览即将到来的扫视目标留出约 40 毫秒的时间(图1C; 例如,如果扫视目标被认为是无信息的,则它会花时间来改变扫视计划)。因此,通过预览来加速视觉处理可能对于有效的视觉探索至关重要。同样的时间限制也适用于阅读,这也就解释了为什么在阅读领域的眼动研究中,经常发现一些无意义的词会被跳读。这正是因为预览可以将词汇语义识别减少到大约 110 毫秒(图1F),为评估下一个扫视目标留出时间。如果接下来这个字已经被处理到不再需要一个注视点的程度,这将允许有足够的时间来改变扫视计划,出现跳读现象。
图1 一个(A)视觉探索和(D)自然阅读的例子;(B)没有预览帮助的视觉探索的时间进程;(C)通过对中心凹旁的信息进行预览可以加快视觉探索的处理速度;(E)没有预览帮助的自然阅读的时间进程;(F)通过对中心凹旁的单词进行预览可以加快对单词的语义的识别。
那么,这种预览的加工深度究竟有多深呢?阅读的串行加工模型认为不存在预览的现象,而并行加工模型则认为大脑对于中央凹处和中央凹旁的单词都具有语义层面的加工(图2)。
有强有力的证据表明在正字法和语音处理层面存在预览。一些眼动追踪研究发现,目标前注视持续时间不受目标词的词汇频率的调节,这似乎表明没有在词频层面发现预览现象。然而,作者最近通过将眼动追踪与不可见的快速频率标记(invisible rapid frequency tagging)范例相结合挑战这一结论。在这个范例中,作者在自然阅读期间以 60 Hz 的频率闪烁目标词。使用 MEG,可以测量 60 Hz 的神经夹带(neural entrainment)反应。作者发现,相对于高频的目标词,当读者注视低频目标词之前的那个词时,MEG的tagging响应会更强。这说明中央凹旁的词频信息可以调控神经活动。此外,阅读速度更快的读者在神经活动上表现出更强的中央凹旁的信息处理,这表明中心凹旁预览的强度会影响阅读效率。这一发现为在词频水平上进行预览提供了新的神经支持。
图2 (A)阅读的串行加工模型;(B)阅读的并行加工模型;(C)阅读的流水线加工模型。
这一理论的雏形起始于2014年获得诺奖的工作,在小鼠的海马体中发现了与空间导航有关的位置细胞(place cell)。简单来说就是当小鼠在运动过程中,海马体中编码当前位置的位置细胞总是发放最强,对其他位置编码的位置细胞发放较弱,且对不同位置的发放总是出现在theta活动的特定相位上。
对于小鼠来说,感知外部世界最主要的方式是依靠运动,而对于我们人类来说,最主要的方式则是依靠眼动获得视觉信息。大脑的视觉皮层与海马体的距离也相对较近,而小鼠的theta节律频段较宽(6-12Hz),在人类的研究中这些频段主要被划分为alpha节律(8-12Hz)。因此,是否在人类的视觉皮层中,也存在类似位置细胞的神经活动,可以对视觉空间的信息进行编码,具体来说就是,视皮层对当前眼睛到达的位置(中央凹处的视觉信息)的编码最强,对眼睛即将到达的下一个注视点(中央凹旁的视觉信息)编码较弱,且对不同眼跳位置的发放对应对不同物体的编码,总是出现在alpha振荡的不同相位上(图3C)。
图3 (A,B)视觉探索过程中,研究首先看在男孩的位置然后眼跳到女人,最后看到狗的位置。(C)支持流水线机制的时间组织由 alpha 频段中的振荡协调,不同的物体表征在不同的alpha相位上被编码。
在文章的最后,作者提出了几个可能的证据来支持视觉探索和自然阅读中的流水线加工机制,包括alpha振荡的相位编码和扫视之间的关系。作者认为视觉系统必须以高效的方式运行,以支持视觉探索和自然阅读。核心问题是,必须在与计划下一个扫视目标时相同的时间间隔内处理场景信息或单词。
鉴于视觉皮层具有严格的层级结构中,作者认为大脑是通过协调当前和即将到来的视觉对象的处理的流水线机制来实现的。重要的是,作者提出alpha频段中的神经振荡用于协调流水线机制,该机制由相位编码实现,其中不同的表征沿着alpha振荡的相位顺序激活。最后,为了协调视觉输入与神经处理,该机制还要求将眼跳锁定到alpha振荡的相位。当然,这些仍需要在未来的实验研究中去论证。
论文原文:
Jensen, O., Pan, Y., Frisson, S., & Wang, L. (2021). Anoscillatory pipelining mechanism supporting previewing during visualexploration and reading. Trends in cognitive sciences, 25(12), 1033-1044.
相关论文:
Pan, Y., Frisson, S., & Jensen, O. (2021). Neural evidencefor lexical parafoveal processing. Nature Communications, 12(1), 1-9.
相关阅读
投稿邀请
感谢支持!欢迎留言、转发、分享!