脑影像特征预测散发性阿尔茨海默病症状发作时间
请点击上面“思影科技”四个蓝色小字,轻松关注这个优秀的脑影像专业公众号。
来自加拿大麦吉尔大学的Jacob W. Vogel等人在Brain杂志上发表了关于大脑特性预测散发性阿尔茨海默病(sporadic Alzheimer’s disease)症状发作年限的研究。本研究收集了255名健康受试者(其父母患有散发性阿尔茨海默病)的结构和功能磁共振成像数据,并分别提取了灰质体积和静息功能连接度两类特征,采用机器学习方法训练预测症状发作年限的模型,并进行了测试和验证。研究结果表明,散发性阿尔茨海默病(sporadic Alzheimer’s disease)症状发作的年限可以通过大脑特征进行预测,该模型有助于评估高危人群病症发作前的疾病进展。
关键字:功能和结构MRI,生物标记,机器学习,散发性阿尔茨海默病(sporadic Alzheimer’s disease)。
阿尔茨海默病发病前需要跨越多年的漫长的“临床前”阶段,在此期间,在没有明显的认知症状的情况下,阿尔茨海默病患者的大脑发生微妙的变化。预测何时出现病症发作是研究散发性阿尔茨海默病中未解决的挑战。在患有常染色体显性遗传性阿尔茨海默病的个体中,症状发作的年龄在世代之间具有一定的相似性,可以在一定程度上准确预测个体发病时间。
研究者将这一概念扩展到父母具有散发性阿尔茨海默病病史的个体中,以便测试个体的症状发作年龄是否可以通过父母的发病年龄估计获得,以及是否可以仅使用MRI进行预测。基于此目的,研究者首先提出了假设:接近父母发病年龄的个体在阿尔茨海默病特异的脑区有更严重的结构和功能改变;其次,分别从结构和功能磁共振影像中提取灰质体积和功能连接度的特征;再者,基于结构和功能特征,采用机器学习的方法训练个体发病年龄的预测模型,并进行了测试与验证。
研究数据
本研究采用了来自PREVENT-AD(P Resymptomatic EValuation of Experimental of NovelTreatment of Alzheimer’s disease)的255名年龄不低于55周岁认知正常的受试者。所有受试者临床痴呆评分(Clinical Dementia Rating)均为0,并且至少父母一方临床上诊断为散发性阿尔茨海默病。具体的信息请查看表1。
表1 PREVENT-AD的详细信息
另外,研究者从公开数据集ANDI(The Alzheimer’s Disease Neuroimaging Initiative)获取了同时具有结构和功能MRI数据的受试者188名。通过控制数据质量,受试者人数减少到149名,并确定了26名转换受试者(converters)。该26名受试者基线时认知正常,但后期发展为轻度认知障碍,或者是基线时轻度认知障碍,后期发展为痴呆。另外,该部分被试在采集了磁共振图像的基础上,同时收集了人口统计信息(如表2所示)、蒙特利尔认知评分(Montreal Cognitive Assessment scores)、APOE4载体信息和海马体积等相关资料。
表2 ADNI“Converters”受试详细信息
最后,所有被试均采集了T1-weighted图像和BOLD(blood oxygenation level-dependent)图像。另外,通过DNA自动提取技术检查受试者是否携带APOE基因。
数据处理与分析
1. 功能数据的处理与分析
首先,PREVENT-AD 和ADNI的功能数据均通过NeuroImaging Analysis Kit,Octave和minc-toolkit工具进行预处理。预处理步骤主要包括时间层校正(slice-timing correction),刚体配准、空间标准化,回归时间漂移、白质和脑脊液信号以及6个头动参数。通过数据预处理,PREVENT-AD数据集保留206名受试者和ADNI数据集保留了149名受试者(包含26名转变者(converters))。
其次,本研究采用了包含了443个感兴趣区(Regions of Interest, ROI)的中尺度模板进行了脑区的划分。其中,该模板包含了444个感兴趣区,由于空间不一致,去掉其中一个,本研究保留了443个感兴趣区。
再者,基于划分好的脑区,本研究提取了感兴趣的平均BOLD信号,并计算两两脑区之间的平均BOLD信号的功能连接,并进行了Fisher’s z变换。
最后,本研究通过不同的稀疏度阈值(90%,92%,94%,95%,96%,98%)对功能连接矩阵进行了二值化,并在此基础上基于图论的思想计算了度(degree count)。PREVENT-AD 和ADNI中的每个被试经过一系列的处理在每个稀疏度阈值下得到了443维的静息态功能连接特征。
2. 结构数据的处理与分析
首先,PREVENT-AD 和ADNI的结构数据通过SPM12(Statistical Parametric Mapping 12)进行了预处理。预处理步骤主要包括,灰质、白质和脑脊液的分割,DARTEL的处理,非线性配准和平滑(8mm3)。
其次,基于功能数据分析中采用的大脑分区模板,本研究提取了对应443个感兴趣的灰质体积和颅内总体积作为结构特征。.
综上所述,每个被试得到887个特征,包括443个功能连接特征和444个结构特征。
3. 统计分析
本研究在数据分析时进行了特征选择、训练、验证、测试,采用了嵌套交叉验证来获得高泛化能力的线性模型(a linear model with improved generalizability)。然后,研究者基于功能连接和灰质体积特征采用LASSO(Least Absolute Shrinkage and Selection Operator)回归来估计PREVENT-AD被试的病症发作的年限。
首先,研究者将PREVENT-AD数据中划分为训练集(138名被试)和测试集(68名被试),并在训练集上通过嵌套交叉验证选择和验证模型。其中,训练集和测试集在估计病症发作的年数或其他统计学变量上没有显著差异。
其次,出于探究的目的,仅在训练数据集上,研究者计算了灰质体积和功能连接特征与估计病症发作年龄之间的相关性,同时也计算人口统计信息、所有MRI图像指标与估计的病症发作年限之间的相关性,并采用t-test进行了检验。
再者,通过3折嵌套交叉验证构建了预测模型,模型通过以下步骤进行选择:
(1)基于年龄和估计病症发作的相关性进行特征降维;
(2)特征标准化和输入Lasso回归,其中Lassso回归通过10折交叉训练惩罚因子。如图1所示。
最后,为了测试模型的泛化能力,本研究采用了ADNI受试者进行了模型的测试。
(所有的统计分析均采用python及其numpy,scipy, scikitlearn工具包。)
图1. 用于Lasso回归模型优化的交叉验证流程
4. 年龄控制
考虑到估计的病症发作年限和图论特征的强相关,研究者进行了两个独立的分析,首先,在PREVENT-AD预测病症发作年限和在ADNI中的conversion的时间分析中控制年龄因素。其次,本研究将年龄、颅内灰质体积等因素在确定Lasso Regression最优模型权重之前回归掉。
5. 图像的预测特征与其他临床标志物的比较
本研究使用人口统计学和临床标记训练新的模型,主要包括年龄、性别、教育程度、APOE4携带、左右海马体积、总颅内体积、蒙特利尔认知评分和五个认知综合评分。然后,研究者将该模型的特征与原模型特征进行融合,训练第三个模型,最后采用bootstrap测试对三种模型进行比较。
结果分析
首先,通过估计病症发作年限和模型特征相关分析表明,年龄较大的受试者更加倾向于接近或超过他们被估计的病症发作年限,同时APOE4携带者趋向于被估计的病症发作年限。在ADNI中,蒙特利尔认知评分较差的患者转换更快。如表3所示。
同时,控制年龄、性别和总颅内体积因素后,在PREVENT-AD训练集中,灰质体积和估计病症发作年限的关联在特定皮层出现。如图2所示。更接近或超出父母发病年龄的个体表现为在内侧顶叶、内侧额叶皮层、内侧颞叶、丘脑、小脑和部分颞侧、额叶和顶叶的灰质体积减少。在ADNI数据中,与正常对照相比,阿尔茨海默病患者的与估计病症发作年限关联的灰质体积显著减少的脑区也与上述类似。最后,估计病症发作年限与全脑静息功能连接的相关性,在默认网络和额顶网络出现负相关,而在皮层下结构、内侧颞叶和额叶出现正相关。如图2所示。
表3. 疾病进展度量和传统人口统计、认知和影像测量之间的关系
图2. 大脑图像特征与估计病症发作年限之间的关系
其次,影像特征预测估计病症发作年限的分析表明,Lasso回归定义的权重影像特征可以预测估计病症发作年限。灰质体积特征主要包括后扣带、侧向顶颞皮层和前额叶。功能连接特征包括双侧的默认网络、突显网络和边缘系统。如图3所示。总之,64个特征(17个灰质和47个功能连接特征)被选择,并在PREVENT-AD测试和训练集上均具有较高的预测能力(PREVENT-AD:r2(138) = 0.256 (95% CI: 0.18, 0.36), P<0.0001;r2(68) = 0.221 (95% CI: 0.077,0.392), P<0.0001)。
图3. 神经影像特征预测估计病症发作年限和临床转化时间
再者,通过图像特征预测临床转变年限的分析表明,本研究训练的模型在ADNI上的数据上也具有显著的预测能力(ADNI:r2(26) = 0.153 (95% CI: 0.024, 0.360), P<0.049;:r2(21) = 0.201 (95% CI: 0.028,0.516), P<0.040)。如图3所示。该结果表明,预测估计病症发作年限的模型提供了有效信息,并且能够预测ADNI中患者临床转换时间。因此,该模型可作为预测个体痴呆进展状况的一般模型。
最后,多模态影像特征改进了使用传统度量特征的预测模型,分析结果表明,相比于仅采用传统标记物,增加多模态高分辨率神经影像信息显著提高了对临床疾病进展的预测能力。如图4所示。
图4 三种预测模型的比较。
本研究基于多模态影像,采用了基于机器学习的回归方法(Lasso回归)在训练数据中进行了模型的构建,该模型成功预测了病症发作年限,最后将模型应用到预测ADNI数据集的临床转换时间(轻度认知障碍转变成认知障碍或痴呆)进行了交叉验证。相关结果表明,本研究训练的模型具有很好的预测精度和泛化能力,多模态神经影像特征能够为预测病症发作提供更多的信息。但是本研究也存在局限与不足,最主要的局限是依赖于对病症发作年限的估计,同时,许多因素(如性别、IQ等)的影响未被引入,在未来的研究将进一步采用额外的数据来证实和扩展本研究的发现。
一句话总结:结合结构像的灰质体积、功能像的功能连接度等特征,采用Lasso回归模型,可以更好地预测阿尔茨海默病的发病年限。
参考文献:Vogel J W, Vachon-Presseau E, Pichet Binette A, etal. Brain properties predict proximity to symptom onset in sporadic Alzheimer’s disease[J]. Brain, 2018.
微信扫码关注思影科技
获取原文:关注“思影科技”公众号,回复“原文”或“培训”,获取原文pdf及补充材料下载链接,同时欢迎浏览我们的培训通知及数据处理业务介绍。(直接点击以下文字即可浏览):
数据处理:
如对加入我们team感兴趣,请点击下文招聘,我们非常期盼志同道合的你的加入: