请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论及转发推荐,也欢迎了解思影科技的课程及数据处理服务,添加微信号siyingyxf或18983979082咨询(咨询电话18580429226,杨晓飞)。(文末点击浏览)
深度学习已成为对正常脑老化以及与脑疾病相关的各种神经病理学过程进行影像学特征挖掘的有力方法。其中,由核磁共振成像(MRI)衍生的脑龄已被用作评估大脑健康的综合生物标志物,可以通过与典型的脑老化过程产生的残差来识别异常老化个体。各种脑疾病的影像学特征——包括精神分裂症和阿尔茨海默氏症,也已经通过机器学习算法被识别出来。由于需要复杂且不易重复的处理步骤以及脑老化轨迹中存在的多样化样本,和在不同人群和核磁共振扫描仪的数据中结果的可重复性较低等原因,严重影响了研究人员提取相关的影像学特征标记物。因此,本文作者开发和测试了一个复杂的深度学习模型——DeepBrainNet,作者团队使用了一组来自全世界不同研究、扫描仪、年龄和地理位置的高度多样化人群的核磁共振扫描数据进行模型的训练(n=11729)。他们使用在原始数据上进行交叉验证和在一个独立的数据集合样本(包含2739名被试)进行测试表明,DeepBrainNet不需要专门的图像数据准备和处理,就可以可靠地估计不同的数据集中被试的脑龄。此外,作者还证明了适度拟合(moderately fit)大脑衰老过程的模型可能会提供对具有病理学特征的个体的最大判别力——因为强拟合(tightly-fitting,也就是能够有效预测脑龄的模型)的脑龄预测模型自然会产生脑龄的估计值,但是几乎不提供脑龄之外的信息;而松散拟合(loosely fitting,也就是上面提到的moderately fit)的模型可能包含大量噪声(所以适度拟合是最好的)。本文的结果提供了一些实验证据来反对通常追求的强拟合(tightly-fitting)模型——结果表明,在四个疾病组中,与强拟合(tightly-fitting)模型相比,适度拟合(moderately fit)的脑龄预测模型能够显著有效地对脑疾病进行分类。更重要的是,本文证明利用DeepBrainNet和迁移学习,可以构建更精确的脑疾病分类器,而不是直接在患者和健康对照数据集上或者使用常见的图像数据库(如ImageNet)训练分类器。基于这些工作,本文作者推出了一个领域特异(domain-specific)的深度学习网络,并且免费开源了 DeepBrainNet模型,用于对普通人群在其整个生命周期进行基于MRI的脑健康状况的评估。本文发表在BRAIN杂志。(可添加微信号siyingyxf或18983979082获取原文及补充材料)正常的脑发育和老化伴随着神经解剖学方面的变化,这些变化可以通过应用于成像数据的机器学习方法捕捉到。构建由MRI衍生的脑龄已被神经科学界广泛采用,并将其作为个体水平上脑健康的生物学标记。可以通过与典型脑龄变化轨迹的正的残差或负的残差来识别表现出病理或非典型大脑发育和衰老模式的个体。例如,精神分裂症、轻度认知障碍(MCI)、阿尔茨海默氏病和2型糖尿病均与各个年龄段的大脑加速老化有关。研究人员使用机器学习技术发现了与神经病理学变化相关的基于MRI的生物标记物,包括阿尔茨海默氏病、轻度认知障碍、精神分裂症、重度抑郁症和自闭症。由于它们的高敏感性,这些指标可以在临床早期捕获大脑的变异。因此,这些基于机器学习的生物标记物可以通过提供个体化的脑健康指数来提高早期诊断的精确率。之前的研究人员已经成功在实验中对神经影像数据应用机器学习方法进行分析;然而,它们并不普遍适用,也不容易在实践中采用。一般来说,这些分析方法需要几个专门且复杂的预处理步骤,例如细致的偏差校正、分割、形变配准和数据标准化(及去除多中心效应)等。这些预处理步骤需要专业知识、时间和精力,而且难以在不同的扫描仪、人群和MRI采集协议的多种数据上重复结果。这种复杂性使得这些方法在临床应用中不实用,因此还没有被临床医生广泛采用。深度学习作为一种强大的机器学习方法为超越这些局限性提供了巨大的希望。卷积神经网络在大多数图像识别任务中取得了最优秀的结果,并在神经影像学中得到了广泛的应用。这些方法允许对复杂的非线性关系进行建模,而不需要传统上所需的手动特征工程。这些模型往往受到需要谨慎地适应和微调网络架构以适应特定问题的限制,例如基于MRI的对特定疾病的分类。深度学习应用程序的一个重要要求是能够提供大量的、多样的样本来训练复杂的深度网络。尽管由于越来越多的公开数据和元分析研究使得可用的MRI数据资源迅速增加,但是特定疾病的MRI数据库的样本数量依旧比较小,这限制了直接使用深度学习方法对病理性的神经解剖模式进行表征。为了应对这一挑战,本文使用了一种迁移学习方法,并利用大量的具有差异性的核磁共振扫描样本,并证明这个方法可以在不同扫描仪和人群的数据集下获得鲁棒的脑龄估计。基于深度学习方法的脑龄预测模型基于先前的一项工作——这项工作在2001名健康成年人数据上训练了一个具有较高预测精度的卷积神经网络模型。这里,作者从18项研究中构建了一套样本数量更多、样本多样性更大的数据集来训练脑龄预测模型。在最近的一篇论文中,Jonsson等人(2019)使用了一个样本容量与本文相当的数据集来训练一个基于深度学习的脑龄预测模型。但是,他们的训练集是从一个研究项目(UK BIOBANK)中的数据构建出来的,他们的模型在应用到其他的较小的数据集上时需要对模型进行再训练。这两项研究都关注于脑龄预测,但是本文采用一个更大样本量的数据集,并使用脑龄预测作为工具来构建一个brain-specific的深度网络。本文使用了从3岁到95岁的正常对照被试(n = 11729)中收集的大量T1加权的脑MRI扫描数据,用于DeepBrainNet模型的训练和交叉验证。作者将这个数据集称为LifespanCN——这是一套包含大量不同地理位置、扫描仪、采集协议和研究的数据集。此外,作者还在一套未加入到训练数据集的独立数据集(SHIP, n=2739)上对模型的性能进行了测试。他们还使用了三套不同疾病的数据来研究不同脑疾病数据在DeepBrainNet模型中所预测的脑龄差异。这三套数据集包括来自ADNI 1和2的正常对照,AD和MCI患者(n = 1699,正常对照= 513,MCI = 833,AD= 353),来自多中心精神分裂症数据的正常对照和精神分裂症患者(n = 835,正常对照= 448,精神分裂症= 387),并来自UK Biobank的正常对照和重度抑郁患者(n = 408,正常对照= 204,重度抑郁= 204)。通过迁移学习,疾病特异性组群也被用来建立和验证疾病分类模型。表1给出了在不同模型中使用的所有数据集的概述。原始T1加权扫描像输入到DeepBrainNet模型后,采用基于多图谱标签融合的自动化方法对每次扫描像进行头骨剥离。系统的质量控制程序是通过使用自动异常值检测,然后手动验证标记实现的。使用FMRIB的线性配准工具FLIRT将颅骨剥离的图像仿射配准到一个共同的图谱空间。
DeepBrainNet 网络结构
本文采用了一个inception-resnet-v2的网络框架构建DeepBrainNet模型,这个网络框架使用了跳跃连接(注:skip connection,由何凯明于2015年提出,在某种程度上可以缓解深度网络在反向传播过程中出现的梯度消失问题,有助于深度网络的训练和收敛)和inception模块(注:为了在网络的深度和计算效率上取得平衡,inception模块被提出用于增加网络宽度,并带来多尺度的特征检测)。该框架通常用于计算机视觉中,并且已被证明在许多复杂的图像任务中表现出色。作者在验证实验中证明该模型相对于其他通用体系结构可以获得最高的预测准确率。与其他基于深度学习的神经成像模型一样,本文使用了2D卷积架构。选择2D而不是3D架构的原因主要有两个:首先,作者使用了一个在ImageNet(这是一个由1400万张经过标注的自然图像组成的自然场景数据库)上预训练的网络进行了网络参数的初始化,使用2D网络架构可以方便的使用ImageNet进行初始化,这样可以训练出一个更加精确的网络模型;其次,使用3D卷积会显著增加模型的参数量,即使有超过10000例扫描数据组成的数据库,其样本数量与模型参数量相比仍然较小。作者首先在轴向平面上将每张3D扫描影像切成80张slice输入到网络中训练(注意:每张slice是当作一个独立样本用于网络的训练),这样就拥有了一个超过100万张图像的训练集。为了进一步扩增数据,作者对输入slice进行随机的垂直和水平翻转,以及随机变换输入slice的图像强度和对比度(对图像初始值进行随机缩放,缩放范围在95%~105%),使得网络对于图像变异和多中心效应保持一定的鲁棒性。Inception-resnet-v2最后的组成包括:1)连接到一个全局最大池化层(global max pooling layer,将输入特征图统一降采样到相同的维度大小);2)然后与一个大小为1024的全连接层(fully connected layer)连接;3)然后使用丢失率(Dropout rate)为80%的Dropout层进行正则化防止模型过拟合;4)并接上一个RELU层作为激活函数。作者之所以使用比较大的丢失率是因为全连接层占用的参数较大。Dropout能够随机删除网络输入的一部分,以减少网络对某些神经元结点的依赖。而在测试阶段,Dropout层不会被使用。图1为DeepBrainNet的网络架构。DeepBrainNet使用随机参数初始化,并使用Adam优化器进行模型优化训练,以均方误差作为损失函数。初始学习率设为0.0001,如果模型在5轮训练中依旧不收敛则将学习率减少为原来的0.1倍。如果模型在10轮训练中训练损失(training loss)不收敛,或者在5轮训练中验证损失(validation loss)一直增加,那么就停止训练。由于每张3D扫描数据是切成80张slice输入到网络的,所以每个3D图像的脑龄预测值为这80张slice所预测的脑龄的中位数。本文作者使用了Tensorflow和Keras实现DeepBrainNet模型。使用NVIDIA P6000显卡和具有24GB内存的服务器训练网络。使用5折交叉验证进行交叉验证实验,每一折的训练时间大概为10个小时。
图1:DeepBrainNet网络架构。10x表示当前模块单元重复10次;20x表示当前模块单元重复20次
深度学习模型通常利用大型预训练网络进行初始化。例如,在计算机视觉中,标准做法是使用ImageNet权重初始化网络。一个网络在一个巨大而多样的数据集上训练,可以学习一种特征表征,这种特征表征已经被证明是高度可推广到许多其他任务的(注:在这样大型的数据库上训练,模型学习到的特征具有较高的泛化性,能够学到一些通用的图像表征)。基于ImageNet训练得到的模型权重,可以使用针对某一个任务的数据,对预训练网络的权重进行微调使得网络模型适应于某一任务。迁移学习的过程对于成功训练那些没有那么大训练集的问题至关重要——医学影像任务属于此类问题,因为绝大多数疾病分类研究很少有超过1000例患者扫描数据的数据库可以使用。作者使用了基于inception-resnet-v2网络模型作为疾病诊断任务的迁移学习模型。为了实现基于迁移学习的模型初始化,他们使用了在LifespanCN数据集上训练的脑龄预测任务的模型权重进行初始化。注意,这里的初始化仅使用了卷积层部分的参数。脑龄预测模型最后面的全连接层被去除,使用了一个具有1024个节点、丢失率为85%、RELU激活函数的全连接层。对于疾病分类任务,作者使用了较大一点的丢失率(85% compare to 80%),是因为疾病分类任务的数据量要小一点,可能会造成过拟合。全连接层之后再接一个结点,这个结点使用sigmoid函数作为激活函数。训练过程中将卷积层参数冻结,只训练全连接层的参数(注:之所以这么做是为了防止卷积层中的权重参数被全连接层中因随机初始化参数而导致的较大梯度过度干扰)。在训练后期,放开网络中的所有参数一起训练直到网络收敛。初始学习率设为0.00005,使用Adam优化器优化,并使用binary cross-entropy作为损失函数。测试阶段,类似于脑龄预测模型,单个扫描的分类结果是通过所有slice的预测概率的中位值计算得到的。为了验证不同程度的模型正则化对于预测脑龄的残差的效应,作者构建了几个实验用于测试预测脑龄与真实年龄之间的偏差能否用于区分疾病(如AD、MCI、精神分裂症和抑郁症)和正常对照以及这种区分能力是否随着不同正则化程度的模型而变化(统计结果看表5)。因此作者测试了脑龄偏差中不同疾病造成的模型差异。对于这样一个混合效应模型:
R_i,m表示在模型m中,被试i的脑龄预测差距;D_i是一个二值化指标:1表示患病被试,0表示健康对照。对于一个特定的模型m,c_m表示与健康对照的平均脑龄差距,b_m表示某个模型对于脑龄预测差距的影响程度;a_i是随机截距,它量化了特定人群年龄与总体平均水平之间的偏差。a_i在每个受试者i的所有三个模型拟合中共享,并且照顾了大脑年龄差距值中可能存在的受试者内部相关性。 这里将在一种特定情况下进一步说明上述模型。就是说,根据AD与对照的差异比较松散拟合(m = 1)和适度拟合(m = 2)模型。对于松散拟合的模型(m=1),如果一个被试是健康对照(D_i=0),则:
如果一个被试是AD患者(D_i=1),则:
那么,在松散拟合模型下,AD与健康对照之间的平均辨别力就是上述𝑏1之间的差。 类似的,对于一个适度拟合的模型(m=2),如果一个被试是健康对照(D_i=0),则:
因此,在适度拟合模型下,AD与健康对照之间的平均辨别力就是上述𝑏2之间的差。因此,为了比较适度拟合和松散拟合模型,在零假设𝐻0:b_2-b_1=0的情况下测试其判别力的对比。基于固定效应的似然比(LRT)测试,确定了混合效应模型中不同辨别力的显著性。之所以使用混合效应模型,是因为特定模型的大脑年龄差距R_i,m是根据同一被试的数据生成的。因此,对于任何成对的比较(例如适度拟合与强拟合),数据可能在被试者内部相关。已知具有特定于受试者的随机截距a_i的混合效应模型可为相关结果数据提供有效推论。如果您对机器学习感兴趣,欢迎浏览思影科技课程及服务,添加微信号siyingyxf或18983979082咨询(咨询电话18580429226,杨晓飞):第十二届脑影像机器学习班(重庆,11.11-16)
第十三届脑影像机器学习班(南京,12.13-18)
使用inception-resnet-v2框架的DeepBrainNet模型是在LifespanCN数据集(n=11729)上训练的。该模型使用5折交叉验证方法预测脑龄,即对80%的数据进行训练和优化,对剩余的20%进行测试,并对该过程重复五次。该模型预测的脑龄在LifespanCN数据集上的平均绝对误差(MAE,它表示预测值和观测值之间绝对误差的平均值,越小越好)=3.702。而其他的网络架构——如DenseNet169、VGG16和ResNet50,虽然架构之间的差异在统计学上并不显著,但是他们的准确率与DeepBrainNet相比都较低,如表2所示。DeepBrainNet所预测的被试脑龄与被试真实脑龄之间的相关系数为0.978(图2),每一折上模型的精度都保持一致(表3)。其中,男性和女性的脑龄均方误差比较接近,分别为3.68和3.72。作者使用五折交叉验证在LifespanCN数据集上分别训练男性和女性的脑龄预测模型来研究其中的性别差异。结果表明,混合性别模型预测的脑龄与性别特异模型预测脑龄之间高度相关(男性为98%,女性为97%),这表明性别上的差异不会显著影响脑龄模型的预测结果。作者进一步评估了模型在未知数据集上的泛化性能,作者使用LifescpanCN数据集对模型训练,并在SHIP数据集上进行评估。结果表明,在SHIP数据集上预测结果的MAE为4.12。这项结果与在中心内数据集上的预测结果比较相似,这表明该模型在多站点之间具有较强的泛化性能(图2)。他们进一步使用经过额外预处理步骤(如bias correction和histogram equalization)的数据集在LifespanCN和SHIP数据集上重复了所有实验,实验结果表明,无论是否进行额外的预处理步骤,该模型的性能都是差不多的。作者还评估了数据样本年龄范围对模型预测的影响,特别是考虑到这里的样本包括儿童和成人被试。他们分别为儿科数据集(PING和PNC,年龄范围3-22)和所有其他数据集(老化数据集,年龄范围18-95)分别训练和测试模型(使用五折交叉验证)。混合年龄模型(注:就是使用了全部数据)和年龄特异性模型之间的预测的脑龄高度相关(儿科数据集为0.973,老化数据集为0.954)。这些结果表明,DeepBrainNet模型能够在一个单一的网络中捕捉到与大脑发育和老化这两个显著不同过程相关的复杂图像特征。深度学习算法的一个主要挑战是解释由网络学习到的图像特征模式。由于网络的复杂性,不可能直接可视化这些特征模式。作者使用了Kotikalapudi and contributors (2017)中提到的一项技术创建saliency maps用于表征在不同年龄范围下、不同轴向图像切片中激活程度最高的体素(图3)。
表2 不同网络架构之间的在脑龄预测精度和模型参数上的比较
表3 使用LifespanCN数据集在不同的交叉验证中预测脑龄的精度
表4 经过最小预处理和经过额外处理步骤的输入数据的脑龄预测精度
表5 混合效应模型的结果被用于确定哪种拟合程度的模型可以有效的捕获疾病被试与健康对照之间脑龄残差的最大差异,可以看出适度拟合(Middle fit or moderate fit)最具有区分度。
左:对完整的LifespanCN数据集的预测。DeepBrainNet在LifespanCN数据集上进行了5折交叉验证的训练和测试。右:在以前未见过的数据集上的表现。利用不包括SHIP数据集的LifespanCN数据对DeepBrainNet进行训练,并在SHIP数据集上测试。
图3 模型特征可视化。较高的激活率表示某个区域在预测中的重要性。
脑龄的临床意义显然不在于确定某人的年龄,而在于确定那些偏离典型大脑发育和衰老的个体,即具有正或负脑年龄残差的个体。在这方面,准确的脑龄预测不一定会产生最具临床信息的脑龄残差,因为深度学习模型可能会专注于不受病理影响的图像特征和模式,以努力拟合具有此类疾病的个体的脑龄。为了解决这个问题,作者开发了三种不同的模型,它们对数据的拟合程度各不相同。具体地说,模型在训练的每个epoch之后被保存(提前几个epoch停止训练,相对于对模型进行正则化),为了进行比较评估,他们选择了三个epoch数量从小到大的模型,分别对应于松散(loose)、适中(moderate)和强(tight)拟合的模型,训练集上的平均MAE分别为7.651、5.922和3.701。然后他们评估了每个模型在病理组数据上所产生的预测残差。为了消除与年龄相关的残差,他们使用了线性模型对这些残差进行了矫正。根据假设,病理组的预测结果将会表现出正的预测残差,也就是说,病理组预测出的脑龄将比实际的脑龄更大。然而,具有最高脑龄预测精度的模型并不是最好的模型,这是因为这样的模型不能够产生足够区分患者和健康对照之间的脑龄残差(图4)。事实上,适度拟合(moderately-fit)模型,即mid-range MAE,在患病组和健康对照组之间具有更显著的组间差异和更大的效应量。
图4 脑龄预测模型在不同正则化情况下,患病被试与健康对照之间预测脑龄残差之间的分布。每个子图中的每一行分别展示了松散、适度和强拟合模型的结果。左边的列显示了预测年龄和实际年龄。每个子图的右列为正常对照组和患病组的脑年龄残差直方图及组间差异的显著性。(这里所示的p值是由不同程度拟合的模型对各个对照组与疾病组的t检验得出的)
作者检验了这样一个假设:与其他初始化方法相比,在LifespanCN数据集上进行训练用以预测脑龄的DeepBrainNet网络,可以用作为一个更好的迁移学习平台用于对特定疾病(如AD、MCI、精神分裂症和抑郁症)的分类任务。他们的假设是,虽然ImageNet权重捕获的许多较低层次特征对神经影像任务有用,但较高层次的特征可能没有那么有效。迁移学习的方法可能能够寻找到更能够捕获与神经影像相关的高阶图像特征的模型权重。具体来说,作者使用迁移学习为四个患病组的数据集分别构建了四个独立的分类器。这些模型分别使用DeepBrainNet模型的权重进行参数初始化,并针对具体的分类任务进行五折交叉验证。为了进行比较评估,他们还通过从零开始训练(随机初始化)和使用预先训练好的ImageNet权重初始化模型来构建模型。在交叉验证分析中,这两个模型都用来自疾病组的扫描数据进行了再训练。需要注意的是,抑郁症分类器在任何初始化方法下都不能收敛。基于DeepBrainNet的分类模型在阿尔茨海默病、MCI、精神分裂症和严重抑郁症分类任务中的表现均优于使用ImageNet初始化的模型,所有任务的准确率和曲线下面积(AUC)值都有显著提高(表5)。此外,使用DeepBrainNet权重进行初始化可以使模型在所有任务中更快地收敛(这为之后的相关深度学习模型的开发提供了一个良好的迁移学习方法的范例,可以使用DeepBrainNet权重进行深度学习模型的初始化)。在所有测试疾病中,使用随机初始化的网络至少有一折训练无法收敛。作者进行了一系列额外的实验,以评估使用DeepBrainNet和ImageNet初始化的网络模型在可用于训练的较小样本规模问题上的分类性能。为此,他们使用分层抽样方法(注:不同于对数据集进行随机划分——因为这样可能每次划分不同类别的比例不能和原数据集中保持一致,分层抽样方法使得采样出来的子数据集中不同类别之间的比例和原数据集中的一样)对每个特定疾病的子集进行下采样,并创建样本量递减的新数据集。使用DeepBrainNet或ImageNet权重初始化的两个深度学习模型,在每个新的下采样数据集中进行交叉验证,这个过程类似于对完整样本进行的实验。他们用不同的分层抽样方法对每个小样本实验重复两次,以获得随着样本容量逐渐减少的性能的鲁棒估计。这些实验的结果与图4相似。值得注意的是,在n = 50时,精神分裂症分类器未能在一个样本中收敛。这可能表明在这个样本容量下的收敛是不可靠的(表6)。两种模型在样本规模较小的数据集上的分类精度和AUC值如图4所示。DeepBrainNet在所有分类任务中都取得了优异的性能。重要的是,与基于Imagenet的模型相比,基于DeepBrainNet的模型在样本规模较小的情况下保持了相对较好的性能,而基于Imagenet的模型始终表现出较低的准确性。在AD与正常对照和精神分裂症与正常对照分类任务中,DeepBrainNet在小样本上的表现特别稳定,而基于ImageNet的模型在小样本规模下显示出准确率的显著下降。两种网络都能很好地完成大样本的分类任务。对于MCI与正常对照的分类任务,随着样本的减少,DeepBrainNet的性能下降更大,而ImageNet的性能保持稳定但准确率较低。
表6 重复样本容量等于或小于100的迁移学习实验,以检验试验估计的鲁棒性。
图5 基于迁移学习的疾病分类性能。使用两种不同的初始化方法(DeepBrainNet和ImageNet)在三种疾病分类任务以及在不同样本大小的数据集上对模型进行训练和测试。每个模型使用了五折交叉验证。
作者在14468个多样化的结构脑核磁共振影像上开发了一个脑龄预测模型——DeepBrainNet,他们证明,这个模型可以从经过最小预处理的数据中可靠的估计被试脑龄。更重要的是,他们发现,与那些不使用脑MRI进行预训练的方法相比,使用DeepBrainNet的训练模型参数作为网络的初始化参数,并在特定疾病分类任务上使用迁移学习可以更好的收敛并获得更高的分类精度,特别是对于样本数量较小的数据来说。这个结果强调了特定领域的深度学习网络的重要性,它不需要针对特定问题进行专门的适应和微调。最后,作者发现,与强拟合或松散拟合的脑龄预测模型相比,适度拟合(moderately-fit)的脑龄预测模型在识别与四种不同临床类别相关的脑龄残差方面是最优的。这四种临床类别分别是:轻度认知障碍、阿尔茨海默病、精神分裂症和重度抑郁症。基于深度学习的脑龄预测算法可直接从经过最小预处理的脑影像中准确预测脑龄众所周知,在整个生命周期中,大脑结构表现出与发育和衰老相关的变化的一致模式。然而,在不同的大脑结构和不同的生命阶段,其变化的程度是高度不均匀的,导致了大脑复杂的、非线性的、区域性的纵向变化轨迹。通过MRI扫描来估计脑龄的概念之前已经被探索过,这表明使用机器学习或多变量回归技术通过volume或体素图像特征来准确预测被试的实际年龄是可能的。然而,以往的研究大多局限于相对同质的数据集和小样本。也许最重要的是,之前脑龄预测方法依赖对数据集进行细致的预处理,这些数据集使用了复杂的预处理工具(包括精细的分割和可变性配准)。这些工具对于那些想要随时获得脑健康指数(如脑龄)的临床医生来说并不容易获得。关键的是,这些预处理步骤通常需要仔细调整以适应不同研究、扫描仪或中心图像的特定特征,并且通常需要人为监督质量检查,严重限制了它们的广泛适用性。深度学习方法为克服这些局限性提供了宝贵的机会。Cole等人(2017a)证明,使用卷积神经网络的深度学习模型在对n = 2001名健康成年人的MRI扫描进行训练时获得了很高的预测精度,并且使用经过预处理的数据或者原始数据的性能表现都差不多。在这些结果的激励下,作者利用最小的预处理和完全自动化的程序,从大量不同的大脑MRI扫描中得出了一个独特的大脑年龄指数。本文介绍的数据集样本数量大、多样性也比较大,因此DeepBrainNet能够提供鲁棒的脑龄估计,这样估计的脑龄可以初步提供与正常大脑发育和老化发生残差的患病被试的病理学特征。此外,由于本文的训练集是高度多样化的,该网络对于多站点效应具有很强的鲁棒性,这可以从样本外验证的良好性能得到证明,这可能使它在不同的采集和临床场景中获得成功。深度学习对整个生命周期中大脑变化模式进行了精准的建模,这使DeepBrainNet可以非常准确地估算出大脑年龄。DeepBrainNet能够对平均4岁左右的大脑核磁共振扫描来估计脑龄,这意味着大脑以一种微妙但协调良好的方式在人的一生中不断发展变化,使模型能够以较高精度预测脑龄。值得注意的是,这种大脑变化也出现在25-55岁的人群中,这一年龄段之前被认为在大脑结构形态方面是最稳定的。与之前提出的用于预测大脑年龄的其他机器学习或多变量回归技术相比,本文所提出的深度学习方法具有显著更高的计算复杂度。虽然这些更简单的方法在许多情况下工作得很好,但是它们受益于特定领域的预处理,并且可能不能推广到其他任务。此外,我们应该注意到这种复杂性只涉及到训练阶段。一旦一个模型被训练好,这个模型可以直接处理新的被试数据,这个预测过程在计算上是非常高效的,特别是考虑到DeepBrainNet模型可以直接应用在经过最小预处理的扫描数据上,而不需要复杂的处理步骤。基于DeepBrainNet的迁移学习模型在小样本数据集上的表现优于基于imagenet权重的模型虽然脑龄残差是一种简单且具有临床吸引力的评估整体脑健康的指标,但它并不针对或优化任何特定疾病分类任务。AD和精神分裂症等疾病表现出高度独特的神经解剖学模式,这些模式可以通过专门的指标更好地捕捉。本文的工作为深度学习如何优化疾病特异性指数提供了深刻见解。特别是,他们证明了使用来自DeepBrainNet的网络权值和迁移学习,深度学习模型可以在不同的训练数据样本大小上表现出更加鲁棒的性能,因此可以用比其他情况下可能需要的更少的训练样本进行训练。高效地使用小样本量数据在医学成像中尤为重要,在医学成像中,收集与疾病相关的数据昂贵且费时。此外,作者还证明了大脑MRI专用的DeepBrainNet网络的性能要优于在较大数量级但不是大脑特定的数据库(如ImageNet)上训练的深度学习网络。这一发现表明,特定领域技术下的深度学习模型可能比使用常规训练网络表现更好,特别是当可用于训练的样本相对有限时。考虑到大脑的医学扫描数据可以捕捉到一百多种病理特征,几乎可以肯定的是,对于每种病理的足够大的数据库在许多年内都不会可用,尤其是对于罕见疾病。汇集和使用这里使用的大量和高度多样化的脑MRI数据库,对我们实现鲁棒的疾病特异性指数的能力发挥了关键作用。与ImageNet的权重相比,DeepBrainNet的权重很可能更接近分类任务的全局最小值。因此,经过针对特定疾病的训练后,更有可能收敛到更接近最优局部最小值。ImageNet的权值不能与DeepBrainNet的权值收敛到相同的精度,即使训练时间更长,原因是在优化过程中它们陷入了局部极小值。这种差异进一步强调了特定领域的权重对于迁移学习的重要性,特别是在复杂的非凸优化问题中。最终版本的疾病分类器可能会通过仔细的超参数调整和架构的改进而得到改进。然而,这将需要高水平的专家知识和广泛的实验验证。本文的深度学习网络能够精准地估计大脑年龄,MAE为3.702。这就提出了这样一个问题,即这样的精度是否有利于检测大脑年龄和实际年龄之间的信息差异,从而可以用来识别相关病理特征的可能性。作者评估了模型与数据的三个紧密程度:松散拟合、适度拟合和强拟合。适度拟合的脑龄模型在所有临床类别中得出了最显著的脑龄残差,因此提供了证据,证明这种“适度拟合”的方法可能是构建脑年龄指数的最佳方法。这一发现其实是合乎情理的,但它在以往的工作中被忽视了,因为以往的这些工作更关注如何精准地预测脑龄。强拟合的脑龄预测模型很可能关注除了年龄之外不受任何因素影响的大脑特征和模式(注:为了尽可能准确的预测被试脑龄,深度学习网络往往会自动去寻找与一些病理学特征无关的影像特征,因此强拟合的模型很可能对于疾病分类任务效果并不好)。然而,许多典型的老年人即使在认知正常的情况下也有各种各样的隐蔽的病理,如小血管缺血性疾病、淀粉样斑块和tau神经纤维缠结等。因此,一个强拟合的脑龄预测模型自然会避免这种病理过程的影响,以达到最低的MAE。至少在某种程度上,由此产生的脑龄残差很可能无法捕获这些病理过程对大脑衰老的影响。另一方面,松散拟合的脑龄模型往往会忽略病理模式上的细微差别,因此也无法捕捉到大脑衰老的重要特征。换句话说,可以从脑室的大小或其他无法捕获由神经病理学过程引起的神经解剖学变化的细微特征的简单特征中获得对某人年龄的粗略估计。作者对四个不同疾病组进行的实验表明,适度拟合的模型比其他组更具鉴别力,而这些差异在AD和MCI中具有统计学意义,而在精神分裂症和抑郁症组中则不具有统计学意义。本文的结果表明,适度拟合的脑龄模型可能提供最有意义的脑龄残差值,未来的工作应该进一步研究这一点。本文训练的网络可以作为在线资源公开,也可以在本文团队的在线平台上使用此外,作者公开了本文中描述的所有模型的权重,因为它们在各种迁移学习任务中都很有价值。他们收集了多个流行网络架构的DeepBrainAgeNet权重,以便选择最适合研究问题的网络架构。这些架构包括VGG-16、ResNet-50、DenseNet-169和Inception-ResNet-v2。相关文件数据可以在github上找到(https:// github. com/ vishnu bashyam/ DeepBrainNet)。也可以在CBICA上(https:// ipp. cbica. upenn. edu/)直接使用DeepBrainNet对被试进行脑龄预测(注:这里提供的多种模型的预训练权重可以用于其他医学影像任务的基础权重进行调优,由于医学影像的数据集通常较小,使用这样的预训练权重有利于一系列任务的收敛泛化——如肿瘤分割、高分辨率重建、模态转换等任务)。总而言之,本文提出了一个复杂的深度学习网络,该网络对脑MRI特征进行优化以估计脑龄。除了对脑龄进行预测估计,以及与脑的衰老相关的指标之外,作者还发现这个网络能够为构建特定的疾病分类模型提供良好的初始化参数。因此,有可能可以利用DeepBrainNet作为基础,为特定的疾病进行参数调优,从而开发一大类疾病相关的深度学习模型。如需原文及补充材料请加思影科技微信:siyingyxf 或者18983979082(杨晓飞)获取,如对思影课程及服务感兴趣也可加此微信号咨询。觉得对您的研究有帮助,请给个转发,以及右下角点击一下在看,是对思影科技莫大的支持。
微信扫码或者长按选择识别关注思影
非常感谢转发支持与推荐
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf或18983979082(杨晓飞)进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):
第三十一届磁共振脑影像基础班(重庆,9.14-19)
第三十三届磁共振脑影像基础班(重庆,10.11-16)
第十七届磁共振脑网络数据处理班(重庆,10.20-25)
第十四届DTI数据处理班(重庆,11.19-24)
第十届磁共振脑影像结构班(重庆,11.2-7)
第十二届脑影像机器学习班(重庆,11.11-16)
第十三届磁共振弥散张量成像数据处理班(南京,9.15-20)
第六届小动物磁共振脑影像数据处理班(南京,9.1-6)
第三十二届磁共振脑影像基础班(南京,9.21-26)
第六届任务态fMRI专题班(南京,10.16-21)
第二届DWI提高班(南京,10.24-29)
第七届磁共振ASL数据处理班(南京,10.12-15)
第十八届磁共振脑网络数据处理班(南京,11.6-11)
第三十四届磁共振脑影像基础班(南京,10.30-11.4)
第七届小动物磁共振脑影像数据处理班(南京,12.20-25)
第十三届脑影像机器学习班(南京,12.13-18)
第九届脑电数据处理入门班(重庆,9.22-27)
第二十三届脑电数据处理中级班(重庆,12.16-21)
第二十二届脑电数据处理中级班(南京,11.12-17)
第十届脑电数据处理入门班(南京,12.1-6)
第八届眼动数据处理班(重庆,10.26-30)
第九届近红外脑功能数据处理班(上海,11.24-29)
此处点击在看,让更多朋友关注思影