Nature Neuroscience:利用深度神经网络进行基于磁共振的眼动追踪
有态度 有深度 有温度
你的科研小伙伴注:需要原文资料的小伙伴,可以添加茗创科技周翊工程师的微信号MCKJ-zhouyi或致电17373158786。另外,茗创科技创建了文献互助群,为大家提供免费帮忙下载文献服务、技术咨询、前沿研究和电子书等海量学术资源分享。(详见文末)
前 言
眼动是我们思想、目标和记忆的直接表达,我们的视线从根本上决定了我们对视觉世界的了解。因此,眼动追踪和神经成像的结合可以为人类认知的许多方面提供一扇窗户,同时还可以深入地了解神经退行性疾病和大脑神经紊乱等症状。功能磁共振成像(fMRI)是研究人脑功能的一种广泛使用的工具,fMRI可以在参与者从事各种任务时检查大脑活动。在许多功能磁共振成像研究中,观察行为要么是一个兴趣变量,要么是一个潜在的混淆变量。然而,绝大多数研究都不进行眼动追踪。
研究者认为,眼动追踪可以而且应该成为功能磁共振成像研究的核心组成部分。因为它不仅能深入了解大脑功能,还能在扫描过程中提供强大的行为读取能力。重要的是,眼球运动还与知觉扭曲、视觉和运动活动以及成像伪影有关,这些都会严重影响对神经成像结果的解释。这并不局限于视觉系统上的研究,而是在很大程度上影响了基于任务态和静息态的神经成像。磁共振(MR)兼容的摄像机眼球追踪器提供了一个解决方案。在扫描过程中,它们以高时间和空间分辨率追踪注视位置,因此,可以分析或解释与注视相关的大脑活动。然而,在实践过程中,摄像机系统只用于功能磁共振成像研究的一小部分。造成这种情况的原因有很多,但通常它们只是在各自的研究或临床环境中不可用或不适用。MR兼容的摄像机价格昂贵,需要训练有素的工作人员和宝贵的安装和校准时间,并具有一定的实验限制条件(例如,需要睁开眼睛)。此外,获得的这些fMRI数据不能用于盲人参与者群体或进行事后比较分析。
另一种可替代和补充的框架是基于磁共振的眼动追踪,直接从眼球的磁共振信号重建注视位置。虽然以前的工作表明这确实是可行的,但仍然存在一些关键性的限制,比如其可用性只能局限于特定的场景中。这些早期的方法并不像许多研究所强调的那样精确,最重要的是,需要为每个单独的参与者进行专门的校准扫描。因此,研究者在这里提出了DeepMReye,一个基于CNN的开源无摄像头眼球追踪框架,它可以直接从眼球的MR信号来重建观看行为。此外,它还可以在闭着眼睛(在静息态或快速眼动(REM)睡眠)或在眼动仪校准仍具有挑战性的群体中进行眼动追踪。
方 法
数据集。用DeepMReye对来自268名参与者的数据进行训练和测试,这些数据来自5台3T MRI扫描仪,有14种不同的扫描协议和各种预处理设置。关于数据集的相关信息可见结果部分中提到的数据集1-5及其发表的文章。
结 果
首先,研究者详细介绍了其数据集、任务、数据处理通道和CNN。其次,研究者证明了解码后的注视位置是高度准确的,并深入探讨了DeepMReye的适用性和要求。第三,通过将已解码的注视标记与同时记录的大脑活动进行对比,结果表明,观看行为能够解释一个较大区域网络中的活动,DeepMReye可以取代基于摄像头的眼球追踪来研究或解释这些影响。研究者在下面介绍的方法和结果中强调了眼球追踪对MRI研究的重要性,并且介绍了一种软件解决方案,使无摄像头且基于MRI的眼球追踪能够广泛免费可用。
图2.跨参与者凝视解码结果。
扩展数据图1.预测误差(PE)与真实位置和预测位置之间的欧氏距离误差相关。
扩展数据图2.在高预测误差和样本外数据中量化注视解码。
无监督异常检测。该模型除了对注视位置进行解码外,还为每个样本和参与者计算出一个PE分数。重要的是,这个PE分数与参与者间的真实EE相关,它允许对那些解码效果不如其他参与者的数据进行检测(图2b和扩展数据图1a,b)。
扩展数据图6
扩展数据图7
跨数据集泛化。当训练集和测试集之间的观看行为和成像协议相似时,DeepMReye的注视解码具有很高的准确性。为了测试该模型是否也具有跨数据集的普遍性,研究者接下来执行了一个留一数据集的交叉验证方法。尽管这种跨数据集方法的总体表现得分低于之前提出的跨参与者(数据集内)方法,但它在所有情况下都能准确地复原出观看行为。
图3.当眼睛闭上时,扫描参数和眼球追踪的影响。
睁眼和闭眼分类。当眼睛闭上时,眼皮向下压住眼球,眼球的形状略有改变。这时应该会影响从眼睛获得的MRI信号,因此研究者测试了该模型是否也能解码眼睛睁开或闭上的这种情况。结果发现,确实可以从每个体素中恢复高可靠性的闭眼时间比例,DeepMReye能够准确地预测眼睛是睁开还是闭上的不同比例的TR,表明睁眼和闭眼分类确实是可行的。
图4.解码的观看行为解释了整个大脑网络的活动。
讨 论
DeepMReye是一个基于CNN的无摄像头眼球追踪框架,它可以从眼球的MR信号中解码注视位置。它允许在不需要MR兼容摄像机的情况下,以较好的分辨率精确和连续地监测观看行为。研究者证明了该方法对体素大小和重复时间以及各种观看行为都有效,包括注视、平滑追踪、自由浏览,即使是在闭眼情况下。小的训练集也可以产生良好的训练模型和具有高解码性能,即使训练时没有基于摄像头的追踪。
这种易于实现的分析方法,解码的注视位置和眼球运动可以用于随后的功能磁共振成像分析中,这对于揭示大脑区域网络中与注视相关的活动尤为重要。通过在每个数据集中的独立参与者中测试该模型,以及通过不同的MR扫描仪和协议获得的数据集证明了DeepMReye具有在现有fMRI数据中成功解码观看行为的潜力。DeepMReye在广泛的注视行为和成像协议中具有良好的稳健性,即使在现有的数据集中也可以实现高精度的观看行为重建。这项研究强调了眼球追踪、神经成像和人工智能在研究人类大脑功能方面的重要性和巨大潜力。
原文:Magnetic resonance-based eye tracking using deep neural networks.
https://doi.org/10.1038/s41593-021-00947-w