基于FreeSurfer的海马亚区分割
温故而知新,建议结合以下亚区分割相关解读阅读,另思影可承接相关数据处理业务(直接点击,即可浏览,加微信siyingyxf或18983979082获取原文及补充材料或咨询相关业务):
关键词:ENIGMA,FreeSurfer,海马亚区域,海马亚区,海马,MRI,质量控制,分割
海马在临床前和临床神经科学中是一个研究非常密集的脑区(Andersen, Morris, Amaral, Bliss, & O'Keefe, 2007)。它参与了认知的多个方面,包括空间导航(O'Keefe, 1990)、学习(Morris, 2006)、情景记忆(Burgess, Maguire, & O'Keefe, 2002)、情感处理(Koelsch et al., 2015)以及人类的应激反应调节(Herman et al., 2016;McEwen & Akil, 2020)。考虑到其多种功能以及在内侧颞叶上的狭小暴露位置,海马一直是神经学和精神病学体积研究的目标。早期计算机断层扫描的海马研究使用了间接指标,如扩大的海马裂、增加的海马透明度或颞角直径(de Leon, George, Stylopoulos, Smith, & Miller, 1989;George et al., 1990;Sandor, Albert, Stafford, & Harpley, 1988;Scheltens, Weinstein, & Leys, 1992)。与其他不太明确的脑结构相比,其在磁共振成像(MRI)上与脑室空间形成的对比度丰富的边界甚至可能导致了对这一结构的“调查偏见”。与此同时,基于MRI的海马形态测量已经通过改进对比度、空间分辨率和计算进步得到提高。现在,具有0.5-0.9mm等向空间分辨率的图像可以在3特斯拉平台上的标准解剖序列上定期收集(例如,人类连接组计划,http://protocols.humanconnectome.org)。高场MRI的推广进一步加速了这一发展。最近将活体7-Tesla人类MRI与组织学相结合的工作已经将MRI推向了“活体神经病理学”(DeKraker, Ferko, Lau, Köhler, & Khan, 2018),并允许亚区分割技术利用7特斯拉提供的分辨率和对比度(Giuliano等人,2017年)。
多年来,人们一直在尝试从MRI中将海马结构划分为子结构。基于子层和与邻近结构的边界,将海马划分为若干部分一直是几种手动分割协议的目标(Jeukens等人,2009;La Joie等人,2010;Mueller等人,2007;Mueller等人,2018;Mueller & Weiner, 2009;Shing等人,2011;Wisse等人,2012)。在复杂的“瑞士卷”样结构中检测和跟踪边界以及在内部对比度不足时识别地标,是一项需要专家解剖学知识和实践的复杂视觉任务。这个过程可能需要每例高达40小时(Winterburn等人,2013),在现实可用资源上消耗巨大,特别是在更大的影像遗传学研究中,其中一些现在超过50,000个个体(Satizabal等人,2019,Grasby, Jahanshad等人,2020)。手动分割仍然是金标准,并已经小心地融入到全自动算法中(Iglesias等人,2015;Van Leemput等人,2008, 2009;Yushkevich等人,2009;Yushkevich等人,2015)。
通过元分析增强神经影像遗传学(ENIGMA)联盟在国际多站点框架下对人群队列和临床样本进行影像和影像遗传学分析,将影像和遗传学团队聚集在一起进行大规模合作。分布式分析的原则——即本地站点在自己的权限下进行图像后处理和关联统计——使得协调成为提高可靠性的重要元素。合作研究允许检测小效应大小,但结果的汇总统计数据在很大程度上依赖于传入的本地关联结果和提取数据的质量。由于疾病工作组越来越多地参与跨诊断比较或真正的跨诊断(“去病理化”)研究(Thompson等人,2020),这些努力可能会受益于流程协调(图1)。
本报告的目的是概述在FreeSurfer(FS)中实现的海马亚区分割算法,并提出一种标准化质量控制(QC)的新方案。为了将流程放入上下文并引导研究者最佳地使用该算法,我们回顾了使用该工具的报告,指出了典型的方法论挑战和陷阱。在本文中,我们遵循最近确立的做法,将结果的子结构称为“亚区域”或“亚区”,尽管曾经的解剖学命名规则为海马的角(CA)保留了“亚区”。第1节提供了本研究的背景和基本原理。在第2节中,我们描述了基于FS的海马分割的核心算法,总结了可靠性研究的发现,并用亚区体积之间的相关性为例,讨论了尺寸和可靠性之间的关系。接下来,第3节描述了在ENIGMA联盟背景下开发的QC程序,以提高流程协调。在第4节中,我们概述了2013年1月至2019年12月之间发布的基于FS的海马亚区研究,重点关注(a)正在研究的临床或神经科学领域,(b)统计方法,以及(c)QC程序。最后,第5节以总结、讨论和展望作为结论。
2 | FS海马亚区分割算法
2.1 | 原理和输出
(a) 依据其平均大小绘制典型的原始亚区体积排名,取自马克斯普朗克精神病学研究所(MPIP)基于 N = 614 名受试者的样本(T1WI,FS6.0,均值和1 SD)。该体积排名顺序在其他样本中具有极高的稳定性,包括 3 特斯拉样本(未显示数据)。彩色框架指向违反排名规则的子区域(详情请参阅第 2.3 节)。
(b) 一个 3T示例在 FS 中查看对应的三个平面(请参阅白色十字线),采用 FS 内置的颜色方案。ENIGMA 质量控制(QC)算法采用了与 12 个子区相同的方案。
(c) 调整双侧 CA1 区域的年龄影响倾向,考虑颅内体积(ICV)、性别、诊断(重度抑郁症 [MDD] /健康)和站点(这里编码与线圈升级相关的原始图像差异)。二次或三次多项式拟合优于线性相关。
(d) 以相同原则绘制总灰质体积与 ICV 之间的比率;可以从拟合值中读取较弱的非线性影响。
(e) 最近的 FS 开发版本中提供的三种聚合方案之一,称为“FS60”,解释了 12 个输出标签(即本研究中使用的 FS6.0 图谱中的标签)与底层区域之间的映射关系。
本文所研究的海马分割工具是广泛使用且开源的神经影像分析软件包FS(Fischl,2012)的一部分。该工具的当前版本是FreeSurfer 7.1,与版本6.0 [FS6.0]相比,此版本在海马亚区工具方面没有显著变化。FreeSurfer 7.1包括杏仁核的分割(Saygin等人,2017),这并不影响FS6.0引入的海马亚区分割。海马亚区的自动分割由一个概率图谱驱动,该图谱是根据两个手动划分的数据集构建的:一个包括15名死亡后受试者(其中4名患有阿尔茨海默病),通过7特斯拉(FLASH序列)的核磁共振成像(MRI)以非常高的分辨率(0.10-0.20毫米各向同性)获得;另一个包括29名对照组和10名轻度痴呆者的39个T1加权体内图像(1毫米各向同性体素)。从FS5.3到FS6.0的关键发展飞跃是包括手动标记的高分辨率体外MRI数据(Iglesias等人,2015)。贝叶斯算法将这两个标记数据集合并成一个概率图谱,该图谱以四面体网格编码,其中每个节点携带有关其分配到亚区域的概率信息(van Leemput,2009)。
将新的、未见过的海马体分割的挑战,然后被提出为一个贝叶斯推理问题,即在给定图谱和输入图像的情况下最大化分割的概率。通过将体素强度建模为条件于隐藏分割的高斯混合模型样本,实现了对MRI对比度变化的鲁棒性。该模型的参数是由个体输入扫描更具体地从五个强度区间获得的:灰质、白质、脑脊液、海马体、和分子层)。尽管海马体和分子层类似于白质,但它们是单独建模的,因为部分容积效应影响了它们的体素强度。海马分割的输出是左、右半球图像,标签分配给海马区域中的体素(各向同性分辨率为1毫米和0.333毫米),分为背景或12个亚区域之一。这些亚区域是(按平均大小排序):CA1、分子层(ML)、海马尾、海马前区、海马前区、齿状回颗粒细胞层(GC-ML-DG)、CA4、CA3、海马裂、海马-杏仁核过渡区(HATA)和纤毛(图2a,b)。手动划线协议及其亚区域分组为12个输出标签的详细信息见Iglesias等人(2015)。备用聚合,例如考虑头部、身体和尾部细分的聚合,可在线获取(https://surfer.nmr.mgh.harvard.edu/fswiki/HippocampalSubfieldsAndNucleiOfAmygdala)。在本报告中,我们使用重新聚合来指代与三个标准聚合偏离的聚合。
2.2 | 测量可靠性和有效性
自动FS子区分割的输出包括子区的空间映射和其绝对体积,可靠性测量已经在第2.2.1和2.2.2节中详细报告。对于体积,测量之间的差异(例如,试验-再试验测量)可以表示为百分比误差或者作为类内相关系数(ICC)。后者量化了相同数量重复测量的一致性。存在不同类型的ICC,其中一些也对一次测量的系统偏差敏感,这是Pearson相关可能未检测到的特征。子区分割的空间可靠性通常表示为Sørensen-Dice指数,通常缩写为Dice指数;范围为0-1;1表示两个测量的完美重叠)。对于重复测量的子区域的单对,可以计算Dice指数,并且对于将子区分割用作其他(例如,功能成像)实验的感兴趣区域(ROI)是相关的。
2.2.1 | 试验-再试验可靠性(相同的扫描仪)
有几项研究检查了FS6.0子区体积的试验-再试验可靠性,所有研究都报告了大于0.5的ICC值,大部分在0.9左右(Brown等,2020;Elvsåshagen等,2016;Quattrini等,2020;Whelan等,2016;Worker等,2018)。更具体地说,Whelan等人(2016)包括了四个独立队列的数据(总数N > 1740),报告了3特斯拉样本的高ICC值(0.70-0.97),以及4特斯拉样本的中等至高ICC值(0.50-0.89)。另一项3特斯拉研究将FS6.0应用于22名健康受试者三次扫描的数据以及40名阿尔茨海默病患者两次扫描的数据,同样报告了24个被研究的海马子区中20个的高ICC值(>0.9),并且对于海马裂和髓状部分的ICC值明显较低(Worker等,2018)。此外,通过重复扫描的内部优化的共注册检测到高敏感性,既包括2年的随访时间,也包括6周的随访时间(Worker等,2018)。在关于双相障碍的报告中,Elvsåshagen等人(2016)报告了3特斯拉T1加权图像的齿状回/CA4的试验-再试验ICC大于0.94,分别针对会话内重复(N = 53)和两个单独扫描会话(N = 21)。Quattrini等人(2020)还报告了不同的3特斯拉扫描仪平台的良好体积可靠性(平均误差<5%,ICC > 0.92)和优异的空间一致性(平均Dice指数>0.92)。另一项关于FS6.0的最近报告(Brown等,2020)确认了高试验-再试验可靠性(通过体积差异、ICC和Dice重叠测量),具有类似的区域排名,即除了旁海马回、海马裂和HATA,所有子区域的可靠性都很高。
FS5.3海马子区分割的可靠性也已在13个地点扫描的65名受试者中进行了研究。Marizzoni等人(2015)报告了除海马裂和髓状部分之外的所有子区的良好或非常良好的体积(再现性误差2-5%)和空间再现性(Dice指数$0.9或>0.9)。
值得注意的是,自FS7.1(2020年4月发布)以来,海马子区分割可以与纵向输入数据相结合,以最佳地评估受试者内的变化。与两个独立分割相比,这种方法减少了测量噪声,提高了试验-重测可靠性,从而提高了对纵向变化的敏感性(Iglesias等人,2016)。两个较新的报告都强烈证实了这一发现,适用于扫描仪内和扫描仪之间的比较,尤其是对于年龄较大的受试者(Brown等人,2020;Quattrini等人,2020)。因此,对于重复测量,这种方法显然是值得推荐的。
2.2.2 | 跨供应商平台和磁场强度的可靠性
Whelan等人(2016)报告了一个FS6.0研究,将1.5特斯拉的T1WI与3特斯拉进行比较,发现11个子区域的ICC较高(0.721-0.915),而海马裂的值较低(0.575)。另一项跨平台分析(1.5和3特斯拉,FS5.3,对7个儿童进行测试)包含在Tamnes等人(2014)的报告中,显示除fimbria外,所有子区域的线性相关性较高(r值为.80- .97)。最近,已经详细报告了跨供应商(或在进行典型硬件升级之前和之后)的可靠性(Brown等人,2020;Quattrini等人,2020)。作为一种通用模式,这些研究表明,与子区域体积相比,空间重现性对MR扫描仪效果的敏感性更高。在会话内对T1进行平均是改善试验-重测可靠性的一种可能性。
2.2.3 | 平均子区域大小与测量可靠性之间的关系
对于FS5.3,Marizzoni等人(2015)报告称,特定的试验-重测测量(可重现性误差和Dice指数)与区域体积呈正相关。在这份报告的兴趣之处,基于已发布的结果(Whelan等人,2016),表2),我们将平均子区域大小的排名与两个FS6.0样本(两个样本和两个半球的未加权平均值)的相应ICC值进行了相关,并发现高度正向的排名相关(Spearman's rho 0.85)。这种模式进一步被Quattrini等人(2020)证实并扩展到了FS6.0的Dice重叠指数,他们还得出结论,对于>300 mm³的海马亚区,实现了最佳的试验-重测可重现性(请参见图2a中的典型尺寸排名)。这可能意味着检测组差异或其他临床相关性的能力可能偏向较大的子区域,因此在解释结果时应考虑这一点。
2.2.4 | 其他可靠性方面 T2WI(T2加权图像)作为输入
众所周知,T2加权图像(主要在冠状面,垂直于海马主轴)有助于识别分子层及其与CA1的边界,这些在标准T1加权数据上通常不清晰可见(Iglesias等人,2015;Wisse等人,2014)。在这方面,Mueller等人(2018)比较了四种自动分割协议,包括基于T1WI和T2WI的协议以及手动分割,特别关注提高对疾病效应的敏感性。事实上,对于包含高分辨率T2WI的方法,效应大小高于仅基于T1WI的方法。然而,没有关于单个T1WI和版本6.0的组合T1-/T2WI输入之间的直接比较的报告。这样的直接比较可以在Iglesias等人(2015)的报告中找到,他们证明了与MCI/对照组差异的组合输入的敏感性增加。
2.2.5 | 测量有效性
测试-再测试可靠性研究无法解释偏离基本事实标签的情况,因此,无论研究设计如何,这些研究都不能说明子领域测量的实际有效性。FS基于海马体亚区体积测量的一般外部有效性植根于离体样本标记的细胞结构原理。其他有效性方面仍在进行研究,潜在的假设是子领域测量包含关于功能或电路差异的间接信息,具有(病理)生理学相关性。这里,关于亚区域功能连接性(FC),包括海马内连接性,或形态协方差分析的研究提供了相关贡献(Dalton, McCormick, de Luca, Clark, & Maguire, 2019; Dalton, McCormick, & Maguire, 2019; Ge等人,2019)。一种引人入胜的方法是寻找子区域特异性连接模式,而不是硬的组织学基本事实:纯粹基于数据驱动的,基于FC的海马分割令人印象深刻地与手动和——在较小程度上——自动分割的子区域相匹配(Wu等人,2018)。此外,3特斯拉的联合解剖和功能特征提供了与7特斯拉数据相似的准确性。到目前为止,还没有FC研究直接结合了基于FS6.0的子领域体积,或将子领域体积与连接性测量相关联。
如果您对脑结构数据分析感兴趣,可浏览思影科技课程及服务,另思影可承接海马亚区分析相关数据处理分析业务,感谢转发支持(可添加微信号siyingyxf或18983979082咨询,另思影提供免费文献下载服务,如需要也可添加此微信号入群):
北京:
3 |3.1 质量控制方面
报告的质量控制程序
在162份审查报告中,约44%提及了质量控制程序(附表1,有关审查程序的详细信息,请参阅第4节),其中包含不同程度的详细程度,有时涉及多达三名独立评审员。这并不一定意味着在其余的研究中没有进行质量控制,因为对于大多数影像实验室来说,可预期的合理性检查可能会被低估。亚区分割的整体技术成功率受到安装前提条件的影响,很少明确说明(例如,Schmidt等人(2018)中FS6.0的96.5%),因此由于报告的异质性无法可靠地量化,只能估计在95%以上。大多数质量控制描述指向视觉和主要定性的整体评估。十项研究(占6%)仅根据异常值特征(例如,> 5个标准差)排除了案例,其中最大的研究是van der Meer等人(2018)(请参阅附表1,质量控制详细信息列)。反过来,大多数研究使用异常值特征来指导视觉检查,但在未识别出技术分割失败的情况下不排除异常值。五项研究(占3%)报告了手动编辑,但没有进一步详细说明(请参阅附表1,质量控制详细信息列)。仅在极个别情况下,由于分割完全失败,有些与严重脑病变有关的案例被排除。一些研究提到了用于检查分割的FS查看工具,或提到ENIGMA协议,或者没有详细说明。似乎存在共识,即在出现特殊情况或分割失败的情况下,整个案例(至少是受影响的半球)将被排除,而不是单个亚区。
3.2 | 质量控制的理论考虑
基于FS6.0的海马分割算法是完全自动化的,技术上可以进行手动更正,但没有明确指定。然而,不应该完全“无监督”的使用该算法,因为在复杂的多步过程中,由于多种原因可能出现分割失败。FS算法本身非常稳健,取决于在开始分割之前进行基本检查,通常会获得具有海马亚区体积的地图。FS工具包允许在背景图像上覆盖海马分割输出,通常是在原生空间中进行视觉质量控制(图2b),这在较小的研究中非常有用。
图 4 作为示例的全分割结果覆盖,联合海马起始掩模和裂缝,以及全面的视觉质量控制(QC)输出。
(a) 3 特斯拉的(偏场校正的)T1加权输入图像示例以及轴向和矢状彩色亚区分割。
(b) 结合背景图像,海马起始掩模(来自一般亚皮质分割[recon-all]),以及海马裂缝的原理,可以一目了然地检查基本的方向/旋转,成功的基本海马分割(紫色透明覆盖)以及海马裂缝(黄色)在海马起始掩模内的正确位置。
(c) 一个案例的HTML输出的布局结构。一个8 × 3的图像集通常可以放在一个大屏幕上,所以最多只需要翻一页就可以完成一个案例。深蓝色的水平条分隔了各个案例。虚线紫色框标出了在(d)中展示的实例的区域。
(d) 一个案例的示例HTML输出(仅限于轴向和部分冠状输出图像)。
Sl.,切片编号。
类别(2)代表了可以称之为“小伪影”的现象,对最终体积没有严重影响。然而,识别这一类别中的示例似乎是有用的,特别是对于评估可能只包含很少这类现象的较小研究的评估者(请参阅图3b-e及图例以获取具体示例)。
(a1) 成年人中25%的人在海马状回和阿蒙角之间发现的海马回残余囊肿的例子;被认为是无病理意义的偶然发现;被分类为海马裂缝(中行图像上的黄色)代表脑脊液强度。类似的周围或海马内囊肿存在,例如脉络裂囊肿(病因学上的蛛网膜或神经胶质或神经上皮囊肿)可能被类似地分类为海马裂缝,或者由算法将其视为海马外的(“背景”),取决于位置的详细信息。某些类型的囊肿可能与扩大的脑血管周围空间(Virchow Robin空间)共存,例如在下基底节或中脑(见a1中的开放箭头)。
(a2) 一个囊肿区域没有被分类为裂缝,而是被分类为海马外的背景,CA1的一部分似乎被忽视了。根据这种被切断的海马组织的数量,这种类型的极端情况应该被排除。
(a3–a5) 被明确分类为裂缝或背景(即,没有海马亚区)的囊肿的例子。a5可能正确地分类了裂缝,但由于部分体积效应,在原始图像上看起来比脑脊液亮。更极端的情况(海马裂缝在T1WI上的强度过亮或在T2WI上没有表示)应该被排除,海马裂缝的体积可能包含囊肿。
(b) 非常频繁(90%)但实际上可以忽略的CA1的不连续出现和/或CA1内的较小保留区域(“洞”)。
(c) 亚区延伸到另一个亚区或形成小的扩展/岛;虽然视觉上显著,但这种扩展的体积效应是可以忽略的。
(d) 可定位到髂状突(淡粉色,d1)或CA3(绿色)或CA1(红色)如在d2或d3的“洞”是由于在最后的二值分类步骤中去除了海马上缘的白质层(髂状突)区域,这可能会造成分割突然结束的印象。
(e) CA1的“粗壮”外观,即这个亚区在一切片上强烈地占主导地位。这可能是由于在原生空间中严格的正交切片所导致的。
(f1) 标准海马分割(recon-all)缺少海马后部的部分,而亚区分割v6.0正确地检测到了这些部分。因此,标准二值海马起始掩模的不完整性本身不应该是排除的标准。
(f2) 前部看起来被切断,但位于杏仁体复合体内;这种外观是正常的,不表示分割失败。
类别(3)可能是复杂的,包括各种底层原因,包括技术故障(例如,算法故障或输入图像的错误方向)、输入图像质量低,或者极端病理学导致的严重萎缩或海马内信号强度变化。特别是后一类别——极端病理学——可能导致决定将受试者保留在样本中,或者在特殊情况下仅排除选定的子区域。这种情况可能是例如标记术后或颞叶损伤后变化,导致某些子区域难以正确检测,海马硬化、缺血或脑炎引起的强烈的海马内强度变化,或者是阿尔茨海默病或其他形式的神经退行性疾病的严重进展。出于这个原因,底层的T1WI将并行显示。
图3涵盖了类别(1)和(2)的示例。关于偏差的其他示例,请参见原始报告中关于离体图谱基础方法的图12和补充图22(Iglesias等人,2015)。
还有两点值得关注:首先,循环性是有问题的——在这个意义上,(视觉上)对那些将作为分析的因变量的特征进行评分。此外,由于海马分割是基于(尽管不完全依赖于)对海马进行正确的一般分割(作为FS recon-all命令的一部分),这样的控制步骤应该纳入QC(见下文)。因此,对于我们的QC管道,我们开发了一个三重覆盖:(a)生成的海马裂缝(子区域分割的输出)覆盖在(b)一般分割的起始海马掩模上,两者都覆盖在(c)作为视觉QC基础的T1加权背景图像上。除此之外,还有不是孤立的,展示海马子区域的完整集合(图2)。第二,一般的皮层和皮质下分割也应该接受QC,例如,自2017年4月起支持在线的程序包(http://enigma.ini.usc.edu/protocols/imaging-protocols),有两个主要原因:(a)生成的强度分布基于定义的白质区域和成功的皮层/皮质下分割;(b)全局测量,如颅内容积(ICV)、总脑容积或总灰质(TGM)通常需要用于统计模型,且依赖于适当的一般配准或分割。
当通用QC和子区域QC同时显示原始输入图像的示例切片时,这有助于检测到非常低质量的输入图像(例如,由于运动伪影导致的模糊边缘)。这种图像增加了通用分割失败的风险(例如,脑叶部分缺失,或者皮层厚度的显著低估)和/或海马分割未能完全延伸至海马边界。后者可能出现在极度退化的海马中,其中内部CSF信号可能模拟真实边界。根据我们的经验,这种全局低质量案例通常导致TGM值或TGM/ICV比例被严重低估,尤其是当它们与年龄进行对比绘图时,这些值看起来像异常值。
提出的质量控制(QC)流程
在ENIGMA联盟中,我们开发了一套用于FS6.0算法导出的海马亚区的质量控制的标准化的MATLAB、Linux shell和R脚本集合,这些脚本提供了几个功能,包括:(a)对已经进行了一般recon-all分割的一组受试者启动子区域分割,(b)从一般分割中获得子区域体积和全局体积的标准化读出表,(c)应逐个检查的案例列表,以及(d)一个可浏览的超文本标记语言(HTML)文件,允许在较大样本中执行此视觉质量控制(图4)。
步骤(a)和(b)基于Linux shell脚本。步骤(c)是基于两个原则的R脚本:首先,一个针对所有子区域体积,以及总脑体积、总灰质体积、ICV和GM/ICV比例的异常值计算方案(+/- 2.98 SDs,每个代表正态分布尾部大约1%的样本)。其次,由于子区域体积的秩次顺序在MR平台和样本间非常稳定(图2a),因此从N = 626个受试者的分析中定义了一组三种违反该排名顺序的情况,其中计算了实际排名与组平均排名的偏差模式:(a)CA1不是最大子区域(即不是排名#1;频率≥11%),(b)海马尾部排名低于3(频率≥2%),和(c)海马回不是排名#4(频率≥2%)。第一个规则是可选的(默认关闭),因为它可能在较大的样本中过于敏感和不够特异。
对于步骤(d),可以由用户定义每个HTML文件中汇总的案例数量。这样,将生成若干个单独的文件,例如,分发给几个评估员。此外,可以请求随机顺序模式(以避免质量控制顺序偏差),或HTML输出的稀疏版本,其中包含较少的示例切片,允许加速非常大的样本(例如,N>1000)的吞吐量。
总体而言,在使用我们的ENIGMA海马亚区质量控制协议时,我们建议在对子区域体积进行统计分析之前执行以下步骤,如图5所示:
1.执行一般FS分割并追加海马分割模块,最好使用相同的版本(目前为6.0或7.0)(注意:将FS.5.3一般分割与FS6.0子区域版本结合是可行的,并产生与FS6.0仅相当相似的结果;还请参阅van der Meer等人(2018)的补充材料)。
2.使用相应的ENIGMA脚本和说明执行一般皮层和皮层下分割的质量控制(http://enigma.ini.usc.edu/protocols/imaging-protocols)。
3.使用SUBFIELDS软件包中的脚本读取海马子区域体积和一般分割结果;在此输出上运行R脚本outliers_hippo_and_QC_support.R,生成可能存在问题的案例列表(请参阅图5以获得示例)。
4.运行三个质量控制(QC)准备脚本,最终生成QC-HTML文件;根据需要在脚本中调整图形和随机排序或稀疏输出设置。5.使用标准浏览器查看QC-HTML文件中的所有数据集,特别注意被标记的数据集。其他建议包括:
a.为了熟悉特定研究的分割方差,并避免顺序偏见,最有效的方法可能是以更快的速度查看随机选择的案例,首先收集“全球印象”。
b.在浏览静态HTML文件之前,如果对FS海马切割输出不熟悉,可能有益于使用FS查看器Freeview探索几个案例,该查看器允许在所有三个维度中滚动。由于FS输出在本机空间中,这个步骤有助于熟悉由于主体之间解剖切片位置不完全对应所引起的方差。
4.分析:临床神经科学出版物的状态 | 基于FS的海马亚区
从这些研究中,我们试图确定领域、主题和一些选定的方法学信息:场强、MRI序列(T1WI、T2WI或两者)、FS版本、全局体积校正(如果使用,以及使用的具体体积)、全球校正的统计方法(回归方法、比例方法、协变量方法)、年龄和性别是否作为协变量、非线性年龄效应的建模以及其他协变量。我们提取了是否报告了亚区分割的质量控制,是否排除了异常值,以及是否进行了手动校正。最后,我们记录了海马亚区是否被(重新)聚合以创建复合标记。三项研究仅将海马亚区分割用作定义感兴趣区域(ROI)的工具,剩下159项研究用于分析统计方面。
作为ENIGMA的一个目标是推进遗传关联研究的内表型概念(Gottesman & Gould, 2003),返回的海马亚区研究被组织成(a)遗传力研究;(b)临床诊断、行为和认知表型或其他生物标志物研究;以及(c)候选基因研究或探索性成像遗传学分析。关于(a)的结果以文本形式在第4.1节中总结。所有类别(a)和(c)的结果以三种不同的粒度呈现:首先,在基于完整论文的迭代过程中,研究被聚合成19个领域(15个临床/行为领域,4个(表观)遗传领域),如饼图(图1,详见图例关于类别融合的详细信息)所示。其次,在表2中,对单个研究或研究组进行了子分类和主题描述,以便快速概述和参考。第三,补充表1详细列出了所有162项研究,重点关注技术特征,以便进行方法学和质量控制审查。
表格2:2013年1月至2019年12月报告的基于FS的海马亚区研究概述。
第一类别的研究(遗传性研究)总结在4.2节中。临床/行为/生物标志物领域被划分为15个领域,遗传领域被划分为4个领域。为单一研究或研究组提供最少的关键词以描述子领域。
4.1 | 遗传力分析
FS6.0的海马亚区体积已经在遗传力方面进行了分析——主要是基于单卵/双卵双胞胎研究(Elman等人,2019;Greenspan等人,2016;Whelan等人,2016)或基因型信息(van der Meer等人,2018)来证实它们作为内表型的有效性。
Whelan等人(2016)报道了在控制年龄、性别和年龄-性别效应后,海马亚体积和总HV之间的遗传力在56%和88%之间。通过双胞胎研究测量的遗传力估计h2(体积中可归因于遗传的方差比例)对于相对较大的区域(整个海马体、分子层、CA1、CA3、CA4、海马尾、颗粒细胞层、海马嵴和前海马嵴)大于70%,对于较小的亚区(HATA、脑翼、副海马嵴、海马裂)中等到高(55% < h2 < 70%)。投影到海马表面模型表明,后部亚区(包括海马尾)的遗传力较大,而前内侧亚区(副海马嵴、前海马嵴、脑翼)的遗传力较小,这表明了遗传影响的梯度。尽管如此,亚区体积与测量可靠性之间的关系也可能影响遗传力的估计。Elman等人(2019)报道了在控制年龄和性别后,遗传力值在37%(HATA)和89%(分子层)之间。遗传相关作为衡量子区和总HV之间共享遗传影响的指标很高,这表明对于标准分辨率的T1WI,通过子区体积没有获得关于遗传基础的实质性附加信息(Elman等人,2019)。尽管发现了子区之间的显著遗传协方差,但在因子分析中没有发现稳定的潜在遗传特质(由子区组合组成)(Elman等人,2019)。
Greenspan等人(2016)报道了FS6.0亚区体积的遗传力估计在20%和87%之间,同时总HV的共享遗传方差较高(平均值0.79,范围0.50-0.98)。在剔除总HV之后——或者考虑基于子区体积/总HV比率的百分比时——遗传力在4%和86%之间波动(分别为7%和84%)。在这里,海马翼、海马裂和HATA的遗传力值并不显著。
根据一个最近关于海马亚区体积的GWAS研究,研究中的体积数据已经校正了ICV、年龄、性别和地点(van der Meer等人,2018),在非常大的样本中(N>20,000),报道了显著的SNP基遗传力,范围在14%(副海马嵴)到27%(海马尾)之间。
4.2 在临床诊断、行为和认知表型、(表观)遗传标记或其他生物标志物的应用。
我们发现迄今为止使用FS工具进行的海马亚区分析已经涉及到广泛的领域,这些领域在图1中进行了量化,并在表2中分为子领域/主题。除了海马依赖性认知功能、健康和病理性衰老、情感/精神病谱系的主要精神疾病以及不同的神经系统疾病等预期的主要领域之外,我们还注意到心理创伤学和神经毒性影响(包括系统性炎症)的研究越来越受到关注。在分析候选基因、表观遗传甲基化模式、多基因风险评分的研究中,现在也开始探讨亚区体积作为内表型,这些研究还包括探索与单个亚区相关的整个基因组(Nakahara等人,2019)或所有亚区相关的基因组(van der Meer等人,2018),以及进行方法学比较(Couvy-Duchesne等人,2019)。
4.3 | 统计方面 4.3.1 | 建模全局体积效应
大脑区域体积的个体差异的一个重要来源是整体头部大小的变化(Mathalon, Sullivan, Rawles, & Pfefferbaum, 1993)。为了提高区域结果的特异性,ICV通常会纳入统计模型 - 在亚区体积作为结果变量的159份报告中,78%的报告纠正了ICV。技术上,在FS中,ICV是根据将个体MRI扫描线性注册到Talairach空间时创建的矩阵进行估算的,因此也称为“估计的总颅内容积”(Buckner等人,2004年)。因此,基于FS的研究倾向于将此测量值作为ICV替代物。另外,在分割之后(例如,使用统计参数映射[SPM]软件),可以将TGM、白质和CSF体积相加。两种方法都与手动划线的金标准相关性良好,但对于SPM8和FS(版本5.1.0)都报告了过高估计(Nordenskjöld等人,2013年)。最近,通过手动编辑的颅内掩模(在MNI空间中)增强的基于SPM12的分割实现了与金标准的优秀一致性,优于FS5.3(Malone等人,2015年)。较小比例的研究认为总脑体积(4.4%)、颅上灰质体积(2.5%)或总HV(5.7%)是修正变量。选择这些变量会逐渐增加区域特异性,这在预期额外海马脑区域的影响时尤为相关(例如,神经退行性疾病)。纠正总HV允许研究超出总HV效应的亚区效应,最大化区域特异性。
ICV(或其他全局体积)可以通过多种方式进行建模(O'Brien 等人,2011):首先,它可以作为一个干扰协变量包含在协方差分析、线性混合模型或回归分析中,与其他混淆变量一起(协方差分析方法)。在包含全局体积的136项研究中,绝大多数(79%)使用了这种方法。第二,可以通过回归分析调整体积(残差方法),因此 volcorr = vol - b*(ICV-ICVmean),其中 b 是体积对 ICV 的回归的斜率(Hayes 等人,2017;Mathalon 等人,1993)。大约13%的136项研究采用了这种方法。第三,ICV 可用于对区域体积进行直接的个体标准化。这种方法在25%的报告中应用,被称为比例(或比率)方法。在最简单的形式中,volcorr = vol/ICV。在此基础上,可以将样本平均 ICV 与此项相乘。每种方法的优缺点是一个长期讨论的话题(Arndt, Cohen, Alliger, Swayze 2nd, & Andreasen, 1991; Buckner et al., 2004; Jack Jr et al., 1989; O'Brien et al., 2011; Sanfilipo, Benedict, Zivadinov, & Bakshi, 2004; Voevodskaya et al., 2014)。不能给出适用于所有研究类型和问题的普遍有效的建议,每种方法都需要一定的假设(O'Brien等人,2011)。例如,协变量允许明确归因于不同的方差来源;回归方法在小样本中可能不可靠,但与比例方法相比,产生更高斯分布。
越来越多地认识到的一个问题是,在总体和局部脑测量之间可能存在非线性(异速)而非等速关系(Jäncke, Liem, & Merillat, 2019;O'Brien 等人,2011;Reardon 等人,2016)。Toro 等人(2009)证明了在海马体积遗传研究中,关于脑异速的假设产生了关键性差异。最近,van Eijk 等人(2020)报道了海马亚区体积也可能存在异速缩放。
4.3.2 | 年龄效应建模
对于海马形态学研究,年龄效应建模是另一个关键点。对于校正后的 TGM 体积,通过非线性项获得的解释方差增益相当弱(见图 2d),而海马亚区体积(及其他皮质下结构)显示非线性效应,成人中期呈平台期,大约 65 岁开始减少(de Flores 等人,2015)(也见图 2c)。类似地,已经报道了8到30岁之间的亚皮质脑结构(包括整个海马)的非线性发育轨迹(Ostby等人,2009),以及4到22岁之间的海马亚区域(Krogsrud等人,2014)。这意味着,在涵盖较大年龄范围的海马亚区研究中,应使用包含非线性项的模型,这可以是基于理论考虑或数据探索。在我们收集的报告中,大多数研究(89%)对年龄效应进行了建模;其中四项(2.5%)研究对非线性年龄效应进行了建模。此外,衰老过程在临床状况下可能是异常的,疾病特异性的衰老过程可能错误地转化为组主效应。相应的年龄-性别和年龄-诊断交互项及其更高阶版本有助于完善模型,减少解释上的模糊。在这里,多站点数据的汇集(例如,巨量分析)是有用的,已经提出了在保留协变量效应的情况下消除批次效应的方法,用于年龄协调(Fortin等人,2018;Pomponio等人,2020)。
4.3.3 | 跳过或重新组合海马亚区
在一些研究中(约4%),跳过或反过来重新组合海马亚区,以创建与原始FS6.0或FS5.3方案不同的综合测量。由于其相对较低的可靠性而被排除的亚区主要是海马小翼和海马裂缝(因为后者并不代表海马组织,而是一个脑脊液裂缝)。一些研究将亚海马嵴、旁海马嵴和前海马嵴组合,定义为亚海马复合体(参见补充表1,最后一列,以及表图例的详细信息)。在FS6.0和FS7.1中,提供了三种将算法隐藏的精细海马亚区划分聚合到最终标签的方法:(a)头-身-尾聚合,对于与早期基于地标的分割工作进行比较或计算更粗略的感兴趣区域(ROI)区域(例如,功能性MRI)是有用的;(b)将12个子区域聚合在一起,如本文所示;(c)一种称为“CA”的版本,其中内部标签(GC-ML-DG和分子层)被CA子区所吸收。更具体地说,将GC-ML-DG分配给CA4,将分子层中的体素分配给最近的既不在分子层也不在背景中的体素。
McHugo等人(2018)在关于精神病的研究中,为了更容易地与其他常用分割算法生成的数据(Mueller等人,2018;Yushkevich等人,2015)进行比较,并考虑到在没有多光谱输入数据的情况下,较小子区(CA3,GC-DG,分子层)的不完美边界定义,提出了两种聚合方案。这些方案是有趣的变体,特别是在研究海马沿纵轴的体积效应时。
4.3.4 | 多变量分析和结构协方差分析
鉴于大多数亚区体积的良好测量可靠性,多变量分析(包括机器学习方法)特别具有吸引力,可以检测复杂的形态学模式。例如,基于海马亚区信息的抑郁症治疗预测准确率达到了83%(Cao等人,2018)。同样,使用海马亚区信息(来自FS5.3和FS6.0)进行的线性判别分析在区分阿尔茨海默病患者和健康对照组方面优于总海马体积(Iglesias等人,2015)。这两项研究都为亚区分割提供了间接的临床有效性。
基于不同受试者之间的亚区体积模式的一致性的结构协方差分析是另一种有趣的方法:例如,Wang, Yu等人(2018)和Wang, Zhang等人(2018)报告了在失忆和血管性轻度认知障碍患者中,海马亚区和额外海马灰质体积之间的协方差较高,与对照组相比。无监督学习任务(如聚类)揭示了亚区之间以及与其他脑区的分组(van der Meer等人,2018)。据我们所知,迄今为止尚未报道过基于海马亚区模式对患者样本进行子组聚类。
(a) 表面亚区由最靠近表面的体积亚区定义。对于每个表面元素,我们在表面和中位线之间集成了3D亚区。饼图表示了体积亚区在表面线下的比例(红色)。虽然此图以2D方式绘制以说明,但这个原则可以等同地应用于表面的2D区块。
(b) 一个个体的海马模型与表面亚区,以及FS6.0的体积亚区的冠状切片。深紫色线是中位线。
如需原文及补充材料请添加思影科技微信:siyingyxf或18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布,如果我们的解读对您的研究有帮助,请给个转发支持以及右下角点击一下在看,是对思影科技的支持,感谢!
微信扫码或者长按选择识别关注思影
非常感谢转发支持与推荐
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf或18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):
北京:
南京:
第七届脑电机器学习班(Python版,南京,7.20-25)
北京: