查看原文
其他

神经影像数据相关统计学习方法的综述(4)

张疏影 孟祥宇 狗熊会 2023-04-22

作者介绍

张疏影:中国人民大学统计学院本科生

孟祥宇:中南大学数学与统计学院本科生

本系列推文是基于综述文章Zhu, H., Li, T., & Zhao, B. (2022). Statistical learning methods for neuroimaging data analysis with applications, https://arxiv.org/abs/2210.09217. 该文章将在2023年发表在Annual Review of Biomedical Data Science,它详细地介绍了复杂神经影像数据分析的一些问题、挑战、及统计学习方法,其中大部分内容源于对该综述文章的翻译。在此特别感谢原文的第一作者朱宏图教授对本译稿提出的宝贵修改意见。



往期回顾

神经影像数据相关统计学习方法的综述(1)



神经影像数据相关统计学习方法的综述(2)



神经影像数据相关统计学习方法的综述(3)



5.2.5 数据集成(DI)

如前文所述,来自不同研究和医院的多源异构数据的收集正在呈指数级增长,这些数据包括电子健康记录、成像、遗传、传感器数据和文本。数据集成(DI)是将不同来源的多视角数据集成到统一的信息视图中,以便更好地管理数据和执行下游任务。一个好的DI系统包括(i)用于生成更完整的、高质量的数据及其相关特征的特征工程流程,(ii)与不同NDA任务相关的数据集成SL方法,以及(iii)改进主要NDA任务数据收集和特征提取的反馈循环。特征工程流程由数据提取、数据处理、数据注释、转换和存储组成。在所有这些任务中普遍存在数据缺失,但本文在5.2.4小节已论述过相关方法。然而,尽管在过去十年中已经取得了很大的进展,但由于NDA复杂、异构、具有时间依赖性、不规则、注释不足和非结构化的特点,开发一个良好的NDA DI系统仍具有很多挑战性。

我们回顾了与四个主要NDA任务相关的个体研究与跨中心研究中的数据整合的SL方法,这些方法包括(T1)多模型神经影像融合,(T2)神经影像测量的遗传学结构,(T3)基因-环境相互作用对神经影像测量的影响,以及(T4)基因-影像-临床链路。处理(T2)和(T3)的大多数统计学习方法将在第5.2.7小节介绍,而处理(T4)的大多数方法将在第5.2.8小节介绍。用于数据集成的统计学习方法中流行的构建模块包括特征拼接、贝叶斯模型、基于树的集成方法、多核学习、矩阵/张量分解和深度学习 (Li et al., 2018; Zhao et al., 2017)。例如,贝叶斯方法可以轻松地将来自不同视角的先验信息进行整合,然而基于树的方法可以使用集成方法来整合从每个视角中学习到的树。

例如,我们在针对个体研究的数据集成中考虑矩阵分解和深度学习。首先,我们考虑一个对个体研究中使用矩阵分解进行多视角集成的通用模型,假设我们观察到一个以行均值为中心的数据矩阵,记为,表示在n个主题上的K个视图中的第k个视图,其中为变量的个数,n为受试者的数量。矩阵/张量分解的一般模型为

其中为低秩共源矩阵,表示所有视图共有的潜在因子;为低秩异源矩阵,表示对应视图的独特潜在因子;而为噪声矩阵。基于模型(3)的一些最先进的矩阵分解方法包括公共正交基提取(Zhou et al., 2015)、联合和个体变异解释(Lock et al., 2013)和基于分解的广义典型相关分析(Shu et al., 2022)。这些方法在如何重构共源矩阵和异源矩阵方面各不相同。其次,我们将多视角集成的深度学习的分层结构视为一种更强大的方法,其分层结构包括(i)子网络的构建,如用于神经影像数据的变分自编码器(VAE)和生成对抗网络(GAN),和(ii)将所有个体子网络集成到模型中,其中是链接函数,是参数向量,是误差项。我们可以使用类似于方程(2)的目标函数来优化和子网路。比如,Miotto等人(2018)讨论了单个视图的子网络的不同架构,而这些子网络可以首先采用来自其他领域(如计算机视觉)的一些预训练模型,然后在集成阶段对整个模型进行调优。

我们考虑了跨多个研究或中心进行数据集成的两种主要方法,包括合并学习器和集成学习器。合并学习器通过合并和处理来自所有研究的数据,然后基于合并后的数据训练单个学习器,通常使用固定或随机效应模型来训练学习器(Zugman et al., 2022)。集成学习器则通过基于每个研究中获得的数据来训练一个学习器,然后采用所有学习器的加权平均值。它包括集成机器学习(Patil and Parmigiani, 2018)、元分析(DerSimonian and Laird, 2015)、融合学习(Cai et al., 2020)和联邦学习(Li et al., 2020)等方法。ENIGMA在大多数影像遗传研究中一直使用集成学习器,但它现在也开始使用合并学习器 或大型分析(Zugman et al., 2022)。由于数据汇集不仅可以显著增加样本量,而且确保数据处理和质量控制的一致性,所以合并学习器将被越来越多的国际神经影像学工作所采用。

我们讨论了大型分析中的两个主要问题,包括异质性和抽样偏差。首先,需要开发数据协调方法以明确纠正加性位点和扫描仪效应、协方差批处理效应、隐藏因素以及神经影像数据中的一些结构先验(Yu et al., 2018; Chen et al., 2021; Huang and Zhu, 2022)。这些方法部分消除了混杂变量的影响,但它们需要使用移动模型、合成数据集和注释数据集进行广泛的验证。其次,虽然将具有不同研究设计的多视角数据进行汇总看起来很有吸引力,但基于固定和随机效应模型的简单统计方法(Burke et al., 2017; Simmonds et al., 2015)不能很好地处理这一问题。我们讨论了几个关键问题。首先,在许多与成像相关的研究中(如ADNI和UKB),神经影像数据不是首要表型变量,因此即使在一项研究中不调整采样偏差也会有很大的问题(Kim et al., 2015; Zhu et al., 2017)。其次,许多与神经影像相关的研究具有不同的研究设计,并且可能在一些关键的感兴趣的混淆变量(如年龄)上重合较少。例如,除了年龄差异,HCP中有许多双胞胎,ADNI有很多纵向观察。它引发了许多关于合并样本的目标人群、要回答的科学问题类型以及不同统计模型的选择(例如前瞻性和回顾性研究)的严重问题。总之,在没有恰当解决抽样偏差的情况下,不能简单地对许多NDA任务执行合并学习器。

5.2.6 降维(DR)方法

降维的目标是将数据从高维空间降到相对低维的空间,同时保留原始数据的一些重要信息。由于高维是神经影像研究的常见特征,因此有大量关于各种降维(DR)统计方法的文献。我们可以将降维方法概括为特征选择和特征提取。特征选择旨在为特定的任务找到原始特征的子集,而特征提取旨在从原始特征中构造新特征。起初,前面提到的降维方法主要是为了解决小n大p问题而开发的,即受试者的数量远远小于影像变量的数量。然而,随着许多大规模神经影像学研究的有效性问题的讨论,我们必须处理大n大p问题,即受试者和变量的数量都非常大。这种大n大p问题需要开发新的降维方法。

根据选择算法和模型构建的结合方式,可以将特征选择进一步分为过滤策略、封装策略和嵌入式策略(Li et al., 2017)。过滤方法使用选择度量进行特征子集的选择,如相关性和距离相关性。封装方法,如逐步回归,使用基于预测模型的搜索算法来对特征子集进行评分。嵌入式方法,如决策树和LASSO,将特征选择作为模型构建过程的一部分。在实践中,在进行下游数据分析之前消除大量噪声变量至关重要。

特征提取方法可以分为基于知识的方法和数据驱动的方法。在NDA中,基于知识的特征提取是利用特定的脑图谱进行个体区域内和跨区域对的特征提取。在脑图谱中使用几十到几百个相关的同质区域(ROIs)极大地降低了神经影像数据的复杂性。它提高了研究人脑结构和功能组织的神经解剖学精度。数据驱动的特征提取方法可以分为传统方法和现代深度学习的无监督、有监督和半监督方法(Anowar et al., 2021; Liu et al., 2021)。一些著名的无监督特征提取方法包括主成分分析(PCA)、核主成分分析(KPCA)、函数主成分分析(FPCA)、奇异值分解(SVD)、张量分解、多维标度(MDS)和独立成分分析(ICA)。参见Anowar等人(2021)及其参考文献,读者可以了解各种无监督降维方法。有监督降维方法包括线性判别分析(LDA)、偏最小二乘回归(PLSR)和典型相关分析(CCA)。将特征提取和特征选择方法集成在一起,解决了小n大p问题,同时也考虑了复杂的时空结构(Lin et al., 2014; Zhu et al., 2017)。然而,由于有限的计算速度和计算机内存,大多数现有的特征提取方法对于大n大p问题还是不可用的,一些分层特征提取方法已经被开发出来以解决相关的挑战(Crainiceanu et al., 2011; Gong et al., 2021)。

大多数用于提取图像的无监督深度学习方法(或自监督学习(SSL))包括三类:生成式、对比式和对抗式方法(Liu et al., 2021)。这些自监督学习方法通过将输入图像编码为低维表征来训练编码-解码网络,对比语义上相似和不相似的嵌入值,并生成假样本,鉴别器几乎无法将其与真实样本区分开。最近,通过将下游任务(如分类或预测)合并到原始的子任务(构建和对比)中,开发出了半监督学习 (SS-SSL) (Jaiswal et al., 2020)。与传统的深度学习方法相比,基于深度学习的降维方法通常是利用强大的计算能力和更灵活的框架来提取更多信息。

5.2.7 影像遗传学

人类大脑结构和功能的遗传结构是非常有趣的。利用影像特征作为表型,在以前的家庭研究或基于群体的研究中,基因对人脑结构和功能(或遗传力)的影响程度已被量化(Blokland et al., 2012; Zhao et al., 2019)。为了发现与人类大脑结构相关的遗传位点,研究人员建立了几个大型计划,如ENIGMA (Thompson et al., 2020)、CHARGE (Fornage et al., 2011)和IMAGEN (Mascarell Maricic et al., 2020)。近年来,UKB和ABCD等大规模MRI数据集为人类大脑的遗传决定因素提供了进一步的见解。例如,Elliott等人(2018)和Smith等人(2021)从UKB研究中筛选了3000多种脑功能和结构成像表型,并且发现了常用影像特征的遗传结构,如来自sMRI的区域灰质体积(Zhao et al., 2019)、来自DWI的WM微结构(Zhao et al., 2021)和来自fMRI的功能连通性(Zhao et al., 2022)。从这些研究中,研究者们已经确定了数百个与大脑相关的遗传位点,并观察到与主要脑疾病(如AD和精神分裂症)的大量遗传重叠。在影像遗传学方面,一些开放资源知识门户,包括牛津BIG40 (https://open.win.ox.ac.uk/ukbiobank/big40/)和BIG-KP (https://bigkp.org/)已经被开发出来。虽然它们使用不同的策略提取影像特征,但它们在人类大脑的遗传控制方面提供了类似的发现。图3B给出了基于UKB的各种影像学表型的遗传价度。

典型的影像全基因组关联研究(GWAS)包含以下步骤。首先,我们开发和应用影像数据分析流程,从原始神经影像数据中提取影像特征。例如,在白质 GWAS (Zhao et al., 2021)中,我们应用ENIGMA-DTI流程从4万多名受试者中提取白质微观结构测量值(Jahanshad et al., 2013)。虽然体素级或顶点级特征可用,但通常在后续的基因发现中使用脑区域水平的影像特征(如脑区和白质束)的聚合测量值。除了提高信噪比外,这些区域级特征还可以减少多重测试的负担,同时增加遗传分析的统计能力。其次,进行变异水平和基因水平的关联分析,以检测大规模发现队列中的重要遗传变异或基因。通常使用比发现队列小的独立的队列来检查是否可以复制重要的性状-变异/基因关联,可以利用种族多样性队列进一步进行复制和普适性研究。此外,多基因风险得分也可以通过评估可由遗传变异可以预测的影像特征的方差比例来提供验证证据。

目前已经开发了一些工具来使用个体水平(例如,GCTAGREML(Yang et al.,2011))或摘要水平数据(例如,单变量LDSC)(buliki - sullivan et al.,2015))来估计遗传性。此外,分区LDSC可用于估计与特定脑组织或细胞类型(如胶质细胞和神经元)相关的遗传性富集程度。FUMA(Watanabe et al.,2017)是基于摘要数据的有用平台,用于功能基因映射。Coloc、双变量LDSC和孟德尔随机化方法(Sanderson et al.,2022)可以从不同角度量化影像特征与其他复杂特征或疾病之间的遗传关系。关于GWAS方法的最新综述可参见Sun和Zhao(2020)。

尽管近年来影像遗传学取得了重大进展,但将遗传学、脑部异常与神经精神障碍联系起来的因果生物学路径仍然具有挑战性(Le and Stein, 2019; Shen and Thompson, 2019)。图1给出了一个假设的因果路径。为了了解遗传变异影响脑部疾病风险的因果途径,神经影像可以作为重要的内表型。大规模成像基因队列中识别的基因位点需要与多个生物医学数据层相结合,如RNA、蛋白质、脑细胞和脑组织(Zhao and Castellanos, 2016)。因此有必要做出更大的努力来收集和整合多种类型的生物医学数据,并开发更好的统计模型用于因果分析(Yu et al.,2022)。此外,临床应用也可以从最近的成像遗传学发现中受益。例如,遗传多基因风险评分和MRI的组合可以更好地预测大脑疾病的风险(Kauppi et al., 2018)。

图1 左图:几个代表性大规模生物医学研究中不同领域的主要数据类型;右图:描述与环境因素和未观察到的易混淆因素的因果基因-影像-临床(CGIC)路径的动态因果模型。

5.2.8因果关系研究

因果关系研究在神经科学研究中得到了很多关注(Friston, 2009; Ramsey et al., 2010; Lindquist, 2012; Yu et al., 2022; Sobel and Lindquist, 2020; Yu et al., 2022; Taschler et al., 2022; Knutson et al., 2020; Zhao et al., 2021; Le and Stein, 2019; Zhao and Castellanos,2016; Li et al., 2021)。神经科学中一些重要的科学问题包括:实验刺激如何影响大脑功能,不同的大脑区域如何在完成一项特定任务时产生因果关系,大脑结构和功能之间如何产生因果关系,大脑结构如何调节遗传学和临床变量之间的关系,大脑如何调节与脑相关疾病的治疗方法/药物和临床变量之间的关系,基因、大脑、健康因素和大脑疾病之间的因果关系是什么。解决这些问题对实验设计、数据收集和整合、未观察到的混杂因素、因果研究的SL方法和因果关系验证等方面提出了严峻的挑战。例如,随机对照试验(RCTs)被广泛认为是因果发现的金标准,但由于伦理或其它实际原因,在许多神经科学场景中进行RCTs可能是不合适的。因此在一系列“严格的”假设下,人们可能不得不从现有的观察数据中以得出因果结论。

因果关系研究大致可分为因果发现, 它用于确定一组变量之间的因果关系,和因果推断,它用于估计大型系统中某个变量对感兴趣的结果的变化所产生的因果影响 (Imbens and Rubin, 2015; Pearl, 2009; Greenland et al., 1999; Upadhyaya et al., 2021; Imbens, 2020)。因果关系研究是随着一组变量的因果模型的发展而进行的,如图1中的因果基因-影像-临床路径,然而它中可能存在未观察到的因素。三种主要的因果模型包括基于有向无环图(DAG)的贝叶斯网络(BN)模型、给定有向无环图的结构因果模型(SCM)和鲁宾因果模型(RCM)。这些因果模型相互补充,各有优缺点。在某些条件下,结构因果模型是一个因果贝叶斯网络模型,而鲁宾因果模型在逻辑上等价于结构因果模型 (Pearl, 2009)。结构因果模型和贝叶斯网络在计算机科学和流行病学中更受欢迎,因为它们提供了具有可解释性和可说明性的图形表示。相比之下,鲁宾因果模型在统计学、经济学和社会科学中更受欢迎,因为它与实验设计和估计因果效应有很好的联系。

    因果贝叶斯网络(CBN)的因果发现方法可分为离散空间算法和连续空间算法(Upadhyaya et al., 2021)。传统的离散空间算法,包括基于约束和基于分数的方法,通过使用统计检验或得分(例如贝叶斯信息准则)从候选图的离散空间中搜索最优图来估计有向无环图的因果结构。相比之下,连续空间算法使用机器学习从加权有向无环图的连续空间中寻找最优图。在计算上,传统的离散空间算法的复杂度随着有向无环图中节点数的增加而增加,而连续空间算法具有更好的可扩展性。此外,因果发现方法旨在分析三种类型的数据,包括横断面、时间序列和纵向数据。横断面数据和时间序列数据的区别在于,时间序列数据中存在时间成分,因此当前的事件不会导致过去的事件。格兰杰因果关系方法是一种用于时间序列数据因果发现的著名方法之一。

作为示例,文章考虑了不同的因果发现方法,用于使用功能神经成像数据(例如,fMRI)来推断有效连通性,这是不同脑区之间相互作用的因果模型。不同的离散空间算法及其扩展算法已被用于有效连通性的推断(Smith et al.,2011)。有效连通性的其它统计方法包括格兰杰因果关系、动态因果模型、结构方程模型、状态空间模型、鲁宾因果模型、有向图模型和动态贝叶斯网络模型等(Friston, 2009; Ramsey et al., 2010; Lindquist, 2012; Sobel and Lindquist, 2020)。然而,大多数现有的网络方法都存在连接方向估计误差较大的问题(Li et al.,2021)。

我们通过两步法来估计特定治疗(X)对特定结果(Y)的因果效应,包括(i):研究X→Y的识别问题,(ii):对因果效应X→Y的估计和推断方法。步骤(i)的具体识别策略包括实验设计、调整/无混淆性、工具变量、双重差分模型、断点回归方法、合成控制方法和因果中介分析等。例如,通常使用前门准则和后门准则来识别有效的调整集(Pearl, 2009; Upadhyaya et al., 2021; Imbens, 2020)。因果推断算法只有在观测数据中包含了X和Y的所有共同原因时才有效,它称为因果充分性,因此控制未观察到的混杂因素需要一系列强大的假设(Burgess et al. (2017); Zhu (2020))。在步骤(ii)中,结构因果模型明确指定了所有中介变量,而鲁宾因果模型无法处理在结果生成的模型中未指定的中介变量。

作为说明,文章考虑在ADNI中集成多视野数据,以推断Jack Jr et al. (2010)提出的AD发病过程中生物标志物动态的假设因果模型。它始于AD风险基因,到-淀粉样蛋白(A)纤维的异常沉积,到脑脊液tau蛋白水平的升高,到海马萎缩,到认知症状和损伤的下降,最终到AD。现有的统计学习方法关注不同视图之间的关联,但越来越多的人对Jack的因果模型中描述的时间因果关系产生了感兴趣,例如海马萎缩(X)对行为缺陷(Y)的因果效应(Yu et al. ,2022)。我们的因果基因-影像-临床路径是Jack因果模型的一个近似。我们需要检查X和Y的因果充分性,这在实践中很可能是无效的。虽然有几种常见的识别策略,包括工具变量和前门准则,可以处理未观察到的混淆问题,但每种方法都需要做出一些严格的假设。例如,孟德尔随机化是一种工具变量方法,它选择一组基因变异体(G)作为工具来估计X→Y的因果效应(Sanderson et al.,2022)。它需要三个关键假设,包括相关性、独立性和无水平多效性。它可以使用单个样本中的个体级数据或来自两个样本的摘要数据来实现。几种常见的工具变量估计方法包括比率法、两阶段方法、最大似然法和半参数方法(Burgess et al., 2017; Zhu, 2020)。此外,构建SCMs以将ADNI中的所有变量联系在一起,并通过扩展因果中介方法推断其时变因果关系是非常有意义的(VanderWeele, 2015)。这主要受两个因素的驱动,一是我们需要描述大多数与脑相关疾病的进展,二是需要对各种由健康因素造成的时间混杂进行调整(Zhao and Castellanos, 2016)。

5.2.9预测模型(PM)

在神经科学研究和临床转化方面,有大量文献是关于构建各种预测模型的统计学习方法发展的(Kohoutová et al., 2020; Davatzikos, 2019; Hastieet al., 2001; Zhou et al., 2021)。预测模型的目标是使用X中的一组当前和历史特征来预测Y中的未来事件。这主要受那些有助于检测、诊断、预后、预测和监测疾病状态等的生物标志物(例如,神经成像)的推动。如图1所示,NDA中的特征向量X可能包括神经影像、遗传、环境和人口统计学变量,Y是由认知评分、诊断和生存时间等组成的低维向量。尽管最近预测模型在学术环境中已经取得了很大的进展,但大多数预测模型还没有转移到NDA的临床实践中。

NDA中用于临床转化的良好预测系统包括(i)生成成本效益高且可靠的生物标志物(例如,血液)并进行高质量的数据注释,(ii)统计学习方法用于训练具有高预测能力、稳健性和清晰度的预测模型,以完成主要的NDA任务,以及(iii)一个用于改进(i)和(ii)的反馈回路。开发一个良好的预测系统需要恰当考虑重要的特征(CT1)-(CT8),其中(CT4)需要密切关注。模型(1)强调神经图像数据包含由外生因素(如设备、采集参数)引起的外部异质性和与Y的下游任务相关的内部异质性(Liu and Zhu, 2021)。具体而言,“内部异质性”是指病变区域在数量、大小、程度和位置方面在不同受试者和/或时间之间的显著差异。一个好的预测系统必须通过(i)和(ii)的进一步发展来恰当地处理神经影像数据的外部异质性和内部异质性,其中(i)是目前最大的瓶颈。

下面文章将讨论现有的用于NDA预测模型的统计学习方法的优缺点。首先,由于神经影像数据中图像生物标志物对Y和(CT4)的非稀疏效应,大多数现有的监督学习和变量选择方法(hasttie et al.,2001)对于NDA的预测模型都不是最优的。其次,深度学习方法(Goodfellow et al., 2016)在处理模式识别问题方面取得了非常有前景的结果,其中包括上面讨论的神经影像数据的内部异质性问题。训练良好的预测模型需要具有高质量数据标注的大规模代表性数据集。第三,在NDA中,为因果预测模型开发统计学习方法很有趣,它通过因果思维来改进预测模型 (Imbens and Rubin, 2015; Pearl, 2009).)。具体来说,我们可以基于观察数据测试来验证图1中的动态因果关系,然后将这些因果关系纳入假设干预措施下的风险评估。



5.3 挑战

文章简要回顾了上述9种重要的PSA技术,但其中大多数是新兴领域,并提出了许多统计挑战。首先,对于学术界和工业界的大多数研究团队来说,这些大规模神经成像相关数据集的复杂性太高。它需要在统计学、生物统计学、流行病学、遗传学/基因组学、工程学、应用数学、机器学习、神经科学、脑疾病、成像物理学和成像分析方面具有强大技能的专家之间进行密切的多学科合作。其次,在控制预处理阶段引入潜在偏差的同时,很难对跨不同域的数据进行恰当的高质量处理。它要求整个科学界密切合作,通过使用精心设计的合成和真实数据集,在可重复性、可泛化性和可靠性方面测试所有主要的预处理工具。第三,如何将不同研究和队列中获得的不同领域的数据与不同研究设计进行适当整合,以实现无偏数据整合,目前仍不确定。尽管人们可能会尝试在一个项目中整合尽可能多的变量和研究,但这可能会导致下游数据分析和结论的严重偏差。第四,目前尚不清楚如何在确保算法公平性的同时,利用多个Vs(例如,体积(Volume)、速度(Velocity)、多样性和真实性(Variety and Veracity))恰当且有效地分析神经影像相关的数据集。

许多现有的统计和机器学习模型是在大数据时代之前开发的,因此它们可能会做出一些不适合第一节(神经影像技术回顾)和第三节(大规模神经影像相关研究)所讨论的神经成像相关数据集的强大假设。预计在未来十年,将会研发更多新颖的统计学习方法。



参考文献

[1] Anowar, F., S. Sadaoui, and B. Selim (2021). Conceptual and empirical comparison of dimensionality reduction algorithms (pca, kpca, lda, mds, svd, lle, isomap, le, ica, t-sne). Computer Science Review 40, 100378.

[2] Blokland, G. A., G. I. de Zubicaray, K. L. McMahon, and M. J. Wright (2012). Genetic and environmental influences on neuroimaging phenotypes: a meta-analytical perspective on twin imaging studies. Twin Research and Human Genetics 15(3), 351–371.

[3] Bulik-Sullivan, B. K., P .-R. Loh, H. K. Finucane, S. Ripke, J. Yang, N. Patterson, M. J. Daly, A. L.Price, B. M. Neale, S. W. G. of the Psychiatric Genomics Consortium, et al. (2015). Ld score regression distinguishes confounding from polygenicity in genome-wide association studies. Nature Genetics 47(3), 291–295.

[4] Burgess, S., D. S. Small, and S. G. Thompson (2017). A review of instrumental variable estimators for mendelian randomization. Statistical methods in medical research 26(5), 2333–2355.

[5] Burke, D. L., J. Ensor, and R. D. Riley (2017). Meta-analysis using individual participant data: one-stage and two-stage approaches, and why they may differ. Statistics in medicine 36(5), 855–875.

[6] Cai, C., R. Chen, and M.-g. Xie (2020). Individualized inference through fusion learning. WIREs Computational Statistics 12(5), e1498.

[7] Chen, A. A., C. Luo, Y . Chen, R. T. Shinohara, and H. Shou (2021). Privacy-preserving harmonization via distributed combat. NeuroImage, 118822.

[8] Crainiceanu, C. M., B. S. Caffo, S. Luo, V . M. Zipunnikov, and N. M. Punjabi (2011). Population value decomposition, a framework for the analysis of image populations. Journal of the American Statistical Association 106(495), 775–790.

[9] Davatzikos, C. (2019). Machine learning in neuroimaging: Progress and challenges. NeuroImage 197, 652.

[10] DerSimonian, R. and N. Laird (2015). Meta-analysis in clinical trials revisited. Contemporary Clinical Trials 45(Pt A), 139–145.

[11] Elliott, L. T., K. Sharp, F. Alfaro-Almagro, S. Shi, K. L. Miller, G. Douaud, J. Marchini, and S. M. Smith (2018). Genome-wide association studies of brain imaging phenotypes in uk biobank. Nature 562(7726), 210–216.

[12] Fornage, M., S. Debette, J. C. Bis, H. Schmidt, M. A. Ikram, C. Dufouil, S. Sigurdsson, T. Lumley, A. L. DeStefano, F. Fazekas, et al. (2011). Genome-wide association studies of cerebral white matter lesion burden: the charge consortium. Annals of neurology 69(6), 928–939.

[13] Friston, K. (2009). Causal modelling and brain connectivity in functional magnetic resonance imaging. PLoS biology 7(2), e1000033.

[14] Gong, W., C. F. Beckmann, and S. M. Smith (2021). Phenotype discovery from population brain imaging. Medical image analysis 71, 102050.

[15] Goodfellow, I., Y . Bengio, and A. Courville (2016). Deep learning. MIT press.

[16] Greenland, S., J. M. Robins, and J. Pearl (1999). Confounding and collapsibility in causal inference. Statistical Science 14(1), 29–46.

[17] Hastie, T., R. Tibshirani, and J. Friedman (2001). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer-V erlag: New York.

[18] Huang, C. and H. Zhu (2022). Functional hybrid factor regression models for handling heterogeneity in imaging studies. Biometrika 107.

[19] Imbens, G. W. (2020). Potential outcome and directed acyclic graph approaches to causality: Relevance for empirical practice in economics. Journal of Economic Literature 58(4), 1129–79.

[20] Imbens, G. W. and D. B. Rubin (2015). Causal inference in statistics, social, and biomedical sciences. Cambridge University Press.

[21] Jack Jr, C. R., D. S. Knopman, W. J. Jagust, L. M. Shaw, P . S. Aisen, M. W. Weiner, R. C. Petersen, and J. Q. Trojanowski (2010). Hypothetical model of dynamic biomarkers of the Alzheimer’s pathological cascade. The Lancet Neurology 9(1), 119–128.

[22] Jahanshad, N., P . V . Kochunov, E. Sprooten, R. C. Mandl, T. E. Nichols, L. Almasy, J. Blangero, R. M. Brouwer, J. E. Curran, G. I. de Zubicaray, et al. (2013). Multi-site genetic analysis of diffusion images and voxelwise heritability analysis: A pilot project of the enigma–dti working group. NeuroImage 81, 455–469.

[23] Jaiswal, A., A. R. Babu, M. Z. Zadeh, D. Banerjee, and F. Makedon (2020). A survey on contrastive self-supervised learning. Technologies 9(1), 2.

[24] Kauppi, K., C. C. Fan, L. K. McEvoy, D. Holland, C. H. Tan, C.-H. Chen, O. A. Andreassen, R. S. Desikan, A. M. Dale, and A. D. N. Initiative (2018). Combining polygenic hazard score with volumetric mri and cognitive measures improves prediction of progression from mild cognitive impairment to alzheimer’s disease. Frontiers in neuroscience 12, 260.

[25] Kim, J., W. Pan, A. D. N. Initiative, et al. (2015). A cautionary note on using secondary phenotypes in neuroimaging genetic studies. NeuroImage 121, 136–145.

[26] Knutson, K. A., Y . Deng, and W. Pan (2020). Implicating causal brain imaging endophenotypes in alzheimer’s disease using multivariable iwas and gwas summary data. NeuroImage 223, 117347.

[27] Kohoutová, L., J. Heo, S. Cha, S. Lee, T. Moon, T. D. Wager, and C.-W. Woo (2020). Toward a unified framework for interpreting machine-learning models in neuroimaging. Nature proto-cols 15(4), 1399–1435.

[28] Le, B. D. and J. L. Stein (2019). Mapping causal pathways from genetics to neuropsychiatric disorders using genome-wide imaging genetics: Current status and future directions. Psychiatry and clinical neurosciences 73(7), 357–369.

[29] Li, H., Y . Wang, G. Yan, Y . Sun, S. Tanabe, C.-C. Liu, M. S. Quigg, and T. Zhang (2021). A bayesian state-space approach to mapping directional brain networks. Journal of the American Statistical Association 116(536), 1637–1647.

[30] Li, J., K. Cheng, S. Wang, F. Morstatter, R. P . Trevino, J. Tang, and H. Liu (2017). Feature selection: A data perspective. ACM computing surveys (CSUR) 50(6), 1–45.

[31] Li, T., A. K. Sahu, A. Talwalkar, and V . Smith (2020). Federated learning: Challenges, methods, and future directions. IEEE Signal Processing Magazine 37(3), 50–60.

[32] Li, Y ., F.-X. Wu, and A. Ngom (2018). A review on machine learning principles for multi-view biological data integration. Briefings in bioinformatics 19(2), 325–340.

[33] Lin, D., V . D. Calhoun, and Y .-P . Wang (2014). Correspondence between fmri and snp data by group sparse canonical correlation analysis. Medical image analysis 18(6), 891–902.

[34] Lindquist, M. A. (2012). Functional causal mediation analysis with an application to brain connectivity. Journal of the American Statistical Association 107(500), 1297–1309.

[35] Liu, R. and H. Zhu (2021). Statistical disease mapping for heterogeneous neuroimaging studies (with discussions). Canadian Journal of Statistics 49(1), 10–34.

[36] Liu, X., F. Zhang, Z. Hou, L. Mian, Z. Wang, J. Zhang, and J. Tang (2021). Self-supervised learning: Generative or contrastive. IEEE Transactions on Knowledge and Data Engineering.

[37] Lock, E. F., K. A. Hoadley, J. S. Marron, and A. B. Nobel (2013). Joint and individual variation explained (jive) for integrated analysis of multiple data types. The annals of applied statistics 7(1), 523.

[38] Mascarell Mariˇci´c, L., H. Walter, A. Rosenthal, S. Ripke, E. B. Quinlan, T. Banaschewski, G. J. Barker, A. L. Bokde, U. Bromberg, C. Büchel, et al. (2020). The imagen study: a decade of imaging genetics in adolescents. Molecular Psychiatry 25(11), 2648–2671.

[39] Miotto, R., F. Wang, S. Wang, X. Jiang, and J. T. Dudley (2018). Deep learning for healthcare: review, opportunities and challenges. Briefings in bioinformatics 19(6), 1236–1246.

[40]Patil, P . and G. Parmigiani (2018). Training replicable predictors in multiple studies. Proceedings of the National Academy of Sciences 115, 2578–2583.

[41] Pearl, J. (2009). Causality. Cambridge, England: Cambridge University Press.

[42] Ramsey, J. D., S. J. Hanson, C. Hanson, Y . O. Halchenko, R. A. Poldrack, and C. Glymour (2010). Six problems for causal inference from fmri. NeuroImage 49(2), 1545–1558.

[43] Sanderson, E., M. M. Glymour, M. V . Holmes, H. Kang, J. Morrison, M. R. Munafò, T. Palmer, C. M. Schooling, C. Wallace, Q. Zhao, et al. (2022). Mendelian randomization. Nature Reviews Methods Primers 2(1), 1–21.

[44] Shen, L. and P . M. Thompson (2019). Brain imaging genomics: integrated analysis and machine learning. Proceedings of the IEEE 108(1), 125–162.

[45] Shu, H., Z. Qu, and H. Zhu (2022). D-gcca: Decomposition-based generalized canonical correlation analysis for multi-view high-dimensional data. Journal of Machine Learning Research 23(169), 1–64.

[46] Simmonds, M., G. Stewart, and L. Stewart (2015). A decade of individual participant data meta-analyses: A review of current practice. Contemporary clinical trials 45, 76–83.

[47] Smith, S. M., G. Douaud, W. Chen, T. Hanayik, F. Alfaro-Almagro, K. Sharp, and L. T. Elliott (2021). An expanded set of genome-wide association studies of brain imaging phenotypes in uk biobank. Nature neuroscience 24(5), 737–745.

[48] Smith, S. M., K. L. Miller, G. Salimi-Khorshidi, M. Webster, C. F. Beckmann, T. E. Nichols, J. D. Ramsey, and M. W. Woolrich (2011). Network modelling methods for fmri. NeuroImage 54(2), 875–891.

[49] Sobel, M. E. and M. A. Lindquist (2020). Estimating causal effects in studies of human brain function: New models, methods and estimands. The annals of applied statistics 14(1), 452.

[50] Sun, N. and H. Zhao (2020). Statistical methods in genome-wide association studies. Annual Review of Biomedical Data Science 3(1).

[51] Taschler, B., S. M. Smith, and T. E. Nichols (2022). Causal inference on neuroimaging data with mendelian randomisation. NeuroImage, 119385.

[52] Thompson, P . M., N. Jahanshad, C. R. Ching, L. E. Salminen, S. I. Thomopoulos, J. Bright, B. T. Baune, S. Bertol´ın, J. Bralten, W. B. Bruin, et al. (2020). Enigma and global neuroscience: A decade of large-scale studies of the brain in health and disease across more than 40 countries. Translational psychiatry 10(1), 1–28.

[53] Upadhyaya, P ., K. Zhang, C. Li, X. Jiang, and Y . Kim (2021). Scalable causal structure learning: New opportunities in biomedicine. arXiv preprint arXiv:2110.07785.

[54] V anderWeele, T. (2015). Explanation in causal inference: methods for mediation and interaction.Oxford University Press.

[55] Watanabe, K., E. Taskesen, A. V an Bochoven, and D. Posthuma (2017). Functional mapping and annotation of genetic associations with fuma. Nature communications 8(1), 1–11.

[56] Yang, J., S. H. Lee, M. E. Goddard, and P . M. Visscher (2011). Gcta: a tool for genome-wide complex trait analysis. The American Journal of Human Genetics 88(1), 76–82.

[57] Y u, D., L. Wang, D. Kong, and H. Zhu (2022). Mapping the genetic-imaging-clinical pathway with applications to alzheimer’s disease. Journal of the American Statistical Association (just-accepted), 1–30.

[58] Y u, M., K. A. Linn, P . A. Cook, M. L. Phillips, M. McInnis, M. Fava, M. H. Trivedi, M. M. Weiss-man, R. T. Shinohara, and Y . I. Sheline (2018). Statistical harmonization corrects site effects infunctional connectivity measurements from multi-site fmri data. Human brain mapping 39(11), 4213–4227.

[59] Zhao, B., J. G. Ibrahim, Y . Li, T. Li, Y . Wang, Y . Shan, Z. Zhu, F. Zhou, J. Zhang, C. Huang, et al. (2019). Heritability of regional brain volumes in large-scale neuroimaging and genetic studies.Cerebral Cortex 29(7), 2904–2914.

[60] Zhao, B., T. Li, S. M. Smith, D. Xiong, X. Wang, Y . Yang, T. Luo, Z. Zhu, Y . Shan, N. Matoba,et al. (2022). Common variants contribute to intrinsic human brain functional networks. Nature Genetics, in press.

[61] Zhao, B., T. Li, Y . Yang, X. Wang, T. Luo, Y . Shan, Z. Zhu, D. Xiong, M. Hauberg, J. Bendl,J. Fullard, P . Roussos, Y . Li, J. Stein, and H. Zhu (2021). Common genetic variation influencing human white matter microstructure. Science 372(6548), eabf3736.

[62] Zhao, B., T. Luo, T. Li, Y . Li, J. Zhang, Y . Shan, X. Wang, L. Yang, F. Zhou, Z. Zhu, et al. (2019). Genome-wide association analysis of 19,629 individuals identifies variants influencing regional brain volumes and refines their genetic co-architecture with cognitive and mental health traits. Nature Genetics 51, 1637–1644.

[63] Zhao, J., X. Xie, X. Xu, and S. Sun (2017). Multi-view learning overview: Recent progress and new challenges. Information Fusion 38, 43–54.

[64] Zhao, Y . and F. X. Castellanos (2016). Annual research review: discovery science strategies in studies of the pathophysiology of child and adolescent psychiatric disorders-promises and limitations. Journal of Child Psychology and Psychiatry 57(3), 421–439.

[65] Zhao, Y ., L. Li, and B. S. Caffo (2021). Multimodal neuroimaging data integration and pathway analysis. Biometrics 77(3), 879–889.

[66] Zhou, G., A. Cichocki, Y . Zhang, and D. P . Mandic (2015). Group component analysis for multi-block data: Common and individual feature extraction. IEEE transactions on neural networks and learning systems 27(11), 2426–2439.

[67] Zhou, S. K., H. Greenspan, C. Davatzikos, J. S. Duncan, B. V an Ginneken, A. Madabhushi, J. L.

Prince, D. Rueckert, and R. M. Summers (2021). A review of deep learning in medical imaging:Imaging traits, technology trends, case studies with progress highlights, and future promises.Proceedings of the IEEE.

[68] Zhu, H., D. Shen, X. Peng, L. Y . Liu, and Alzheimer’s Disease Neuroimaging Initiative (2017(PMC5693262)). Mwpcr: Multiscale weighted principal component regression for high-dimensional prediction. Journal of the American Statistical Association 112, 1009–1021.

[69] Zhu, W., Y . Y uan, J. Zhang, F. Zhou, R. C. Knickmeyer, H. Zhu, A. D. N. Initiative, et al. (2017). Genome-wide association analysis of secondary imaging phenotypes from the alzheimer’s disease neuroimaging initiative study. NeuroImage 146, 983–1002.

[70] Zhu, X. (2020). Mendelian randomization and pleiotropy analysis. Quantitative Biology, 1–11.

[71] Zugman, A., A. Harrewijn, E. M. Cardinale, H. Zwiebel, G. F. Freitag, K. E. Werwath, J. M. Bas-Hoogendam, N. A. Groenewold, M. Aghajani, K. Hilbert, et al. (2022). Mega-analysis methods in enigma: The experience of the generalized anxiety disorder working group. Human Brain Mapping 43(1), 255–277.

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存