基于机器学习的自适应超体素分割揭示了人脑中的躯体定位组织
图解摘要
前 言
躯体特定区是将身体的一个区域点对点映射到中枢神经系统的一个特定点。Penfield的开创性研究是用电刺激大脑皮层来绘制人脑的躯体特定区组织的。在初级运动皮层(M1)和初级躯体感觉皮层(S1)中,下肢位于背侧,靠近中线,手臂和手更偏向外侧,面部最偏向外侧和腹侧。躯体特定区组织并不局限于中央前回和中央后回(M1/S1),fMRI和EEG研究都揭示了辅助运动区(SMA)、扣带运动区、前运动皮层、顶上和顶下小叶、岛叶、基底神经节和小脑的躯体特定区组织。目前对这些方面的认识是从实验范式中得来的,这些实验范式往往不能测量或控制通过效应器的运动表现。
之前的研究使用大脑信号来分类不同的效应器,并取得了不同程度的成功。尽管这些研究在评估效应器、做什么动作以及如何测量动作方面各不相同,但很明显的是个体水平的分类性能高于群体水平。在脑机接口情境下,当机器和大脑之间存在适应阶段时,在个体水平上对效应器进行分类是有利的,但这种方法并不总是能够很好地推广到其他个体。其他fMRI研究已经实现了多体素模式分析(MVPA),根据预定义的感兴趣区域对运动进行分类。虽然BOLD信号可以有效地区分特定大脑区域内的效应器,但在整个大脑中实现数据驱动的聚类方法是具有挑战性的。
神经影像文献中使用的聚类方法包括K-means、mean-shift和spectral clustering。这些方法可以有效地进行聚类,但是随着数据集大小的增加,这些方法的灵活性和效率会降低。例如,K-means是一种优秀且通用聚类算法,但它更倾向于球型聚类,无法捕获几何形状的复杂聚类。Mean-shift算法能够很好地处理球型数据,并能自动选择最优的聚类簇数,但是它并不是高度可扩展的。Spectral clustering是一种基于图形的聚类方法,聚类不考虑形状和分布,但在聚类数量较少的情况下效果最好,且计算成本较高。因此,本研究使用了一种改进的简单线性迭代聚类(SLIC)算法,通过提供紧密型簇的灵活性(即分割)、提高计算效率和基于网格的初始化来解决这些限制性因素。
方 法
参与者:共20名右利手成年被试(年龄为20.50±0.92岁;10名女性)。所有参与者视力正常或矫正至正常视力,无残疾或神经系统疾病等。
Force任务:每个参与者在核磁共振扫描仪内执行三个Force输出任务。在所有条件下,参与者均仰卧,并使用右脚(见图1A)、右手(图1B)和双侧口(图1C)对分辨率为0.025 N的定制光纤力传感器进行力的输出。在进入扫描仪之前,记录每位参与者在练习过程中每个效应器(脚、手、嘴)的最大自发性收缩(MVC)。在一系列连续三次的MVC试次中,参与者保持最大力量收缩(MFC) 5s。试次之间有60s的休息时间。计算在每个持续MFC期间的平均力,并将三次试次的平均值作为参与者的MVC值。任务范式如图1D所示。每项任务都包含rest和force条件。在force条件下,两根水平杆分别代表产生力(绿杆)和目标力(白杆)。当杆变绿时,说明参与者产生4s的力。产生的力使得绿色的杆垂直移动,为参与者提供视觉反馈。白色的目标条保持静止,表示参与者的10% MVC目标。当横杆变红时,参与者休息2s。
Force数据分析:在LabVIEW中使用自定义算法对力数据进行分析。计算每个次试次产生的平均力(占MVC的百分比)、产生力的变化和目标力误差,然后分别对每个效应器(手、脚、嘴)进行平均。这些测量是根据从每个4s力的脉冲中间2s中提取的数据计算出来的。采用均方根误差(RMSE)对目标力误差进行量化。通过力上升到峰值力的10%以上的时间点来确定试次的开始,通过力下降到峰值力的10%以下的时间点来确定试次的偏移。采用Shapiro-Wilk正态性检验来确定数据是否为正态分布。使用Bonferroni进行事后统计分析。
超体素分割:使用三维简单线性迭代聚类(3D-SLIC)算法生成超体素。该算法分割数据点均匀一致,计算效率高。本研究实现了3D-SLIC15算法来分割三维空间(x,y,z)中的体素簇。该算法采用单个输入K,即期望的大小相同的超体素数量。每个超体素的大小近似为N/K,其中N为从fMRI体素计算出的β系数的三维图中的体素数量。对于每个超体素,计算所有效应器中每个参与者的平均β系数(图2e)。每个超体素代表一个单一的特征,反映了大脑某个区域的活动。因此,超体素的数量表明有多少特征被输入到分类分析中,特征数量的增加反映了空间分辨率的增加。分类分析的目的是确定哪些超体素(即特征或大脑区域)对预测使用的效应器贡献最大,同时也有助于确定超体素组合的总体性能准确性。超体素特征被输入到Python 3.7的机器学习算法中,以对效应器进行分类(图2f)。使用改进的梯度提升决策树(GBDT),称为极端梯度提升(XGBoost),它利用了弱学习者或浅决策树的集合。该算法输出超体素的权重(图2g),提供在对效应器进行分类时,哪些超体素(以及大脑区域)被识别为是最重要的信息(图2h)。
遮挡测试:遮挡测试用于通过遮挡特定的大脑区域(例如将值设为0)来显示模型性能的变化。脑区对分类的贡献越大,遮挡模型的性能下降越大。为了评估某一大脑区域的贡献,将所有数据(包括训练数据和测试数据)的大脑区域值设为0。然后,使用相同的机器学习建立一个模型,使用区域受损的数据,并计算测试数据的分类性能。本研究使用AAL atlas挡住特定大脑区域和设置超体素数量到5000创建自适应的超体素分割,具有良好的空间分辨率和计算时间之间的平衡,在实际分割模型中具有1038个超体素。
结 果
Force数据:在各效应器之间,产生的平均力占MVC的百分比、目标力误差都无显著差异。效应器对输出力的变化有显著影响,Bonferroni事后检验揭示了由手和脚产生的力的可变性大于嘴。手和脚产生的力的可变性之间没有显著差异。
混淆矩阵显示了真实效应器标签和预测效应器标签之间的预测关系(图7)。只有一个超体素的超体素模型在混淆矩阵中看起来是随机分布的,其精度较差。当超体素从1增加到10000时,主对角线得分变得更高,而跨标签的错误分类更少。矩阵表明,所有模型在所有三个标签上的表现都是一样的,在主对角线上的得分几乎是相等的。
讨 论
本研究使用fMRI来评估全脑和小脑的特定躯体的大脑活动。研究采用了单变量分析和多变量机器学习分析来表征、区分和分类与每个效应器相关的大脑激活。体素分析和分类分析在中央后回、中央前回和旁中央小叶区域确定了效应器依赖激活。单变量体素分析确定了枕中回和壳核是效应器独立激活的区域。最后,SMA、顶下和顶上小叶,以及小脑各包含效应依赖和效应独立表征。机器学习分析表明,提高数据驱动模型的空间分辨率可以提高分类精度,分类精度可达84-95%,超体素数在1000左右。本研究中基于3D-SLIC的超体素粒度分割优于使用已建立的大脑模板和随机模拟的分类分析。遮挡实验进一步证明了在对效应器进行分类时,感觉运动网络的冗余性。
原文:Unraveling Somatotopic Organization in the Human Brain using Machine Learning and Adaptive Supervoxel-based Parcellations.
第四届脑电数据分析启航班(线上:2021.12.19~2022.1.9)
第二届茗创科技脑电数据分析入门班(线上:2021.12.4~12.16)
非常欢迎大家留言、转载、收藏或分享~ 本文来自微信公众号“茗创科技”。如需转载,请在“茗创科技”后台回复“转载”,并附上所需转载的文章标题以及您的ID。
需要原文资料的小伙伴,可以添加茗创科技周翊工程师的微信号MCKJ-zhouyi或致电17373158786。另外,茗创科技创建了文献互助群,为大家提供免费帮忙下载文献服务、技术咨询、前沿研究和电子书等海量学术资源分享。请联系周翊工程师,邀请您入群。