基于FreeSurfer的海马亚区分割

Original 杨晓飞思影科技 2024-03-20

请点击上面“思影科技”四个字，选择关注我们，思影科技专注于脑影像数据处理，涵盖（影像组学，fMRI，结构像，白质高信号分析，PET，波谱，DWI，DTI-ALPS，QSM，ASL，DCE，DSC，氧摄取分数(OEF)与CMRO2，BOLD-CVR，灵长类动物脑影像，大小鼠脑影像，菌群，EEG/ERP，脑磁图，FNIRS，眼动）等，希望专业的内容可以给关注者带来帮助，欢迎留言讨论，也欢迎参加思影科技的课程，可添加微信号siyingyxf或18983979082进行咨询。(文末点击浏览）

结构性海马异常在许多神经和精神疾病中很常见，海马测量的变化与认知表现和其他复杂表型（如应激敏感性）有关。随着可用于映射和体积定量的自动化算法的出现，海马亚区域得到了越来越多的研究。在通过ENIGMA联盟的努力下，一些疾病工作组正在使用FreeSurfer软件来分析患有神经和精神病症的患者及匹配对照组的海马亚区域（亚区）体积。在这个概述中，我们解释了算法的原理，总结了测量可靠性研究，并用示例数据演示了两个附加方面（亚区自相关和体积/可靠性相关性）。然后，我们解释了为改进管道协同而对海马亚区分割质量控制（QC）程序进行标准化的原因。为了指导研究人员充分利用算法，我们讨论了如何对全球尺寸和年龄效应进行建模，如何将QC步骤纳入以及如何将亚区聚合成复合体积。这个讨论是基于162篇应用FreeSurfer海马亚区分割的已发表神经影像学研究的概要（01/2013-12/2019），涵盖了包括认知与健康老化、脑发育与神经退行性疾病、情感障碍、精神病、应激调节、神经毒性、癫痫、炎症性疾病、童年逆境与创伤后应激障碍以及候选和全基因组（表观）遗传学等广泛领域。最后，我们强调了基于FreeSurfer的海马亚区域研究可能被优化的要点。本文发表在human brain mapping杂志。(可添加微信号siyingyxf或18983979082获取原文，另思影提供免费文献下载服务，如需要也可添加此微信号入群，原文也会在群里发布)。

温故而知新，建议结合以下亚区分割相关解读阅读,另思影可承接相关数据处理业务（直接点击，即可浏览，加微信siyingyxf或18983979082获取原文及补充材料或咨询相关业务）：

思影科技脑结构磁共振成像数据处理业务

第二十七届磁共振脑影像结构班(重庆，7.15-20）

海马亚区微观结构及其与阿尔茨海默病血浆生物标志物的关系

人类杏仁核的核团：手动分割到自动图谱

海马亚区研究：超高分辨率MRI海马结构计算图谱

关于轻度认知障碍和阿尔茨海默病的MRI定量脑研究的方法学回顾

22q11缺失综合征患者在青春期后期的阳性精神疾病症状与海马体积的不同发育轨迹有关

Biological Psychiatry ：抑郁症病人的海马亚区分割

Molecular Psychiatry：抑郁症患者经ECT治疗后齿状回增大的7T磁共振成像研究

关键词：ENIGMA，FreeSurfer，海马亚区域，海马亚区，海马，MRI，质量控制，分割

海马在临床前和临床神经科学中是一个研究非常密集的脑区（Andersen, Morris, Amaral, Bliss, & O'Keefe, 2007）。它参与了认知的多个方面，包括空间导航（O'Keefe, 1990）、学习（Morris, 2006）、情景记忆（Burgess, Maguire, & O'Keefe, 2002）、情感处理（Koelsch et al., 2015）以及人类的应激反应调节（Herman et al., 2016；McEwen & Akil, 2020）。考虑到其多种功能以及在内侧颞叶上的狭小暴露位置，海马一直是神经学和精神病学体积研究的目标。早期计算机断层扫描的海马研究使用了间接指标，如扩大的海马裂、增加的海马透明度或颞角直径（de Leon, George, Stylopoulos, Smith, & Miller, 1989；George et al., 1990；Sandor, Albert, Stafford, & Harpley, 1988；Scheltens, Weinstein, & Leys, 1992）。与其他不太明确的脑结构相比，其在磁共振成像（MRI）上与脑室空间形成的对比度丰富的边界甚至可能导致了对这一结构的“调查偏见”。与此同时，基于MRI的海马形态测量已经通过改进对比度、空间分辨率和计算进步得到提高。现在，具有0.5-0.9mm等向空间分辨率的图像可以在3特斯拉平台上的标准解剖序列上定期收集（例如，人类连接组计划，http://protocols.humanconnectome.org）。高场MRI的推广进一步加速了这一发展。最近将活体7-Tesla人类MRI与组织学相结合的工作已经将MRI推向了“活体神经病理学”（DeKraker, Ferko, Lau, Köhler, & Khan, 2018），并允许亚区分割技术利用7特斯拉提供的分辨率和对比度（Giuliano等人，2017年）。

多年来，人们一直在尝试从MRI中将海马结构划分为子结构。基于子层和与邻近结构的边界，将海马划分为若干部分一直是几种手动分割协议的目标（Jeukens等人，2009；La Joie等人，2010；Mueller等人，2007；Mueller等人，2018；Mueller & Weiner, 2009；Shing等人，2011；Wisse等人，2012）。在复杂的“瑞士卷”样结构中检测和跟踪边界以及在内部对比度不足时识别地标，是一项需要专家解剖学知识和实践的复杂视觉任务。这个过程可能需要每例高达40小时（Winterburn等人，2013），在现实可用资源上消耗巨大，特别是在更大的影像遗传学研究中，其中一些现在超过50,000个个体（Satizabal等人，2019，Grasby, Jahanshad等人，2020）。手动分割仍然是金标准，并已经小心地融入到全自动算法中（Iglesias等人，2015；Van Leemput等人，2008, 2009；Yushkevich等人，2009；Yushkevich等人，2015）。

通过元分析增强神经影像遗传学（ENIGMA）联盟在国际多站点框架下对人群队列和临床样本进行影像和影像遗传学分析，将影像和遗传学团队聚集在一起进行大规模合作。分布式分析的原则——即本地站点在自己的权限下进行图像后处理和关联统计——使得协调成为提高可靠性的重要元素。合作研究允许检测小效应大小，但结果的汇总统计数据在很大程度上依赖于传入的本地关联结果和提取数据的质量。由于疾病工作组越来越多地参与跨诊断比较或真正的跨诊断（“去病理化”）研究（Thompson等人，2020），这些努力可能会受益于流程协调（图1）。

本报告的目的是概述在FreeSurfer（FS）中实现的海马亚区分割算法，并提出一种标准化质量控制（QC）的新方案。为了将流程放入上下文并引导研究者最佳地使用该算法，我们回顾了使用该工具的报告，指出了典型的方法论挑战和陷阱。在本文中，我们遵循最近确立的做法，将结果的子结构称为“亚区域”或“亚区”，尽管曾经的解剖学命名规则为海马的角（CA）保留了“亚区”。第1节提供了本研究的背景和基本原理。在第2节中，我们描述了基于FS的海马分割的核心算法，总结了可靠性研究的发现，并用亚区体积之间的相关性为例，讨论了尺寸和可靠性之间的关系。接下来，第3节描述了在ENIGMA联盟背景下开发的QC程序，以提高流程协调。在第4节中，我们概述了2013年1月至2019年12月之间发布的基于FS的海马亚区研究，重点关注（a）正在研究的临床或神经科学领域，（b）统计方法，以及（c）QC程序。最后，第5节以总结、讨论和展望作为结论。

2 | FS海马亚区分割算法

2.1 | 原理和输出

图1：在 2013 年至 2019 年间发表的 162 项 FreeSurfer 亚区研究所涵盖的领域。其中包括遗传学分析的 10 项研究（见补充表 1，“遗传学”领域/子领域），以避免遗传学研究的代表性不足，即饼图包含 172 个条目。还进行了以下附加汇总：汇总了重度抑郁症（MDD）和双相障碍（分别为 21 和 6 项研究）；将单一神经学（8）、单一精神病学研究（5）和一项关于感知压力的研究汇总为“其他（单一研究）”类别；将癫痫（10）和脑炎（5）的研究汇总。

AD，阿尔茨海默病；FTD，额颞叶痴呆；LBD，路易体病；MCI，轻度认知障碍；PTSD，创伤后应激障碍；SCD，主观认知缺陷

图 2 典型亚区大小排名、FreeSurfer 观察器中的叠加和示例年龄-体积关系。

(a) 依据其平均大小绘制典型的原始亚区体积排名，取自马克斯普朗克精神病学研究所（MPIP）基于 N = 614 名受试者的样本（T1WI，FS6.0，均值和1 SD）。该体积排名顺序在其他样本中具有极高的稳定性，包括 3 特斯拉样本（未显示数据）。彩色框架指向违反排名规则的子区域（详情请参阅第 2.3 节）。

(b) 一个 3T示例在 FS 中查看对应的三个平面（请参阅白色十字线），采用 FS 内置的颜色方案。ENIGMA 质量控制（QC）算法采用了与 12 个子区相同的方案。

(d) 以相同原则绘制总灰质体积与 ICV 之间的比率；可以从拟合值中读取较弱的非线性影响。

(e) 最近的 FS 开发版本中提供的三种聚合方案之一，称为“FS60”，解释了 12 个输出标签（即本研究中使用的 FS6.0 图谱中的标签）与底层区域之间的映射关系。

本文所研究的海马分割工具是广泛使用且开源的神经影像分析软件包FS（Fischl，2012）的一部分。该工具的当前版本是FreeSurfer 7.1，与版本6.0 [FS6.0]相比，此版本在海马亚区工具方面没有显著变化。FreeSurfer 7.1包括杏仁核的分割（Saygin等人，2017），这并不影响FS6.0引入的海马亚区分割。海马亚区的自动分割由一个概率图谱驱动，该图谱是根据两个手动划分的数据集构建的：一个包括15名死亡后受试者（其中4名患有阿尔茨海默病），通过7特斯拉（FLASH序列）的核磁共振成像（MRI）以非常高的分辨率（0.10-0.20毫米各向同性）获得；另一个包括29名对照组和10名轻度痴呆者的39个T1加权体内图像（1毫米各向同性体素）。从FS5.3到FS6.0的关键发展飞跃是包括手动标记的高分辨率体外MRI数据（Iglesias等人，2015）。贝叶斯算法将这两个标记数据集合并成一个概率图谱，该图谱以四面体网格编码，其中每个节点携带有关其分配到亚区域的概率信息（van Leemput，2009）。

将新的、未见过的海马体分割的挑战，然后被提出为一个贝叶斯推理问题，即在给定图谱和输入图像的情况下最大化分割的概率。通过将体素强度建模为条件于隐藏分割的高斯混合模型样本，实现了对MRI对比度变化的鲁棒性。该模型的参数是由个体输入扫描更具体地从五个强度区间获得的：灰质、白质、脑脊液、海马体、和分子层）。尽管海马体和分子层类似于白质，但它们是单独建模的，因为部分容积效应影响了它们的体素强度。海马分割的输出是左、右半球图像，标签分配给海马区域中的体素（各向同性分辨率为1毫米和0.333毫米），分为背景或12个亚区域之一。这些亚区域是（按平均大小排序）：CA1、分子层（ML）、海马尾、海马前区、海马前区、齿状回颗粒细胞层（GC-ML-DG）、CA4、CA3、海马裂、海马-杏仁核过渡区（HATA）和纤毛（图2a，b）。手动划线协议及其亚区域分组为12个输出标签的详细信息见Iglesias等人（2015）。备用聚合，例如考虑头部、身体和尾部细分的聚合，可在线获取（https://surfer.nmr.mgh.harvard.edu/fswiki/HippocampalSubfieldsAndNucleiOfAmygdala）。在本报告中，我们使用重新聚合来指代与三个标准聚合偏离的聚合。

2.2 | 测量可靠性和有效性

自动FS子区分割的输出包括子区的空间映射和其绝对体积，可靠性测量已经在第2.2.1和2.2.2节中详细报告。对于体积，测量之间的差异（例如，试验-再试验测量）可以表示为百分比误差或者作为类内相关系数（ICC）。后者量化了相同数量重复测量的一致性。存在不同类型的ICC，其中一些也对一次测量的系统偏差敏感，这是Pearson相关可能未检测到的特征。子区分割的空间可靠性通常表示为Sørensen-Dice指数，通常缩写为Dice指数；范围为0-1；1表示两个测量的完美重叠）。对于重复测量的子区域的单对，可以计算Dice指数，并且对于将子区分割用作其他（例如，功能成像）实验的感兴趣区域（ROI）是相关的。

2.2.1 | 试验-再试验可靠性（相同的扫描仪）

有几项研究检查了FS6.0子区体积的试验-再试验可靠性，所有研究都报告了大于0.5的ICC值，大部分在0.9左右（Brown等，2020；Elvsåshagen等，2016；Quattrini等，2020；Whelan等，2016；Worker等，2018）。更具体地说，Whelan等人（2016）包括了四个独立队列的数据（总数N > 1740），报告了3特斯拉样本的高ICC值（0.70-0.97），以及4特斯拉样本的中等至高ICC值（0.50-0.89）。另一项3特斯拉研究将FS6.0应用于22名健康受试者三次扫描的数据以及40名阿尔茨海默病患者两次扫描的数据，同样报告了24个被研究的海马子区中20个的高ICC值（>0.9），并且对于海马裂和髓状部分的ICC值明显较低（Worker等，2018）。此外，通过重复扫描的内部优化的共注册检测到高敏感性，既包括2年的随访时间，也包括6周的随访时间（Worker等，2018）。在关于双相障碍的报告中，Elvsåshagen等人（2016）报告了3特斯拉T1加权图像的齿状回/CA4的试验-再试验ICC大于0.94，分别针对会话内重复（N = 53）和两个单独扫描会话（N = 21）。Quattrini等人（2020）还报告了不同的3特斯拉扫描仪平台的良好体积可靠性（平均误差<5%，ICC > 0.92）和优异的空间一致性（平均Dice指数>0.92）。另一项关于FS6.0的最近报告（Brown等，2020）确认了高试验-再试验可靠性（通过体积差异、ICC和Dice重叠测量），具有类似的区域排名，即除了旁海马回、海马裂和HATA，所有子区域的可靠性都很高。

FS5.3海马子区分割的可靠性也已在13个地点扫描的65名受试者中进行了研究。Marizzoni等人（2015）报告了除海马裂和髓状部分之外的所有子区的良好或非常良好的体积（再现性误差2-5%）和空间再现性（Dice指数$0.9或>0.9）。

值得注意的是，自FS7.1（2020年4月发布）以来，海马子区分割可以与纵向输入数据相结合，以最佳地评估受试者内的变化。与两个独立分割相比，这种方法减少了测量噪声，提高了试验-重测可靠性，从而提高了对纵向变化的敏感性（Iglesias等人，2016）。两个较新的报告都强烈证实了这一发现，适用于扫描仪内和扫描仪之间的比较，尤其是对于年龄较大的受试者（Brown等人，2020；Quattrini等人，2020）。因此，对于重复测量，这种方法显然是值得推荐的。

2.2.2 | 跨供应商平台和磁场强度的可靠性

Whelan等人（2016）报告了一个FS6.0研究，将1.5特斯拉的T1WI与3特斯拉进行比较，发现11个子区域的ICC较高（0.721-0.915），而海马裂的值较低（0.575）。另一项跨平台分析（1.5和3特斯拉，FS5.3，对7个儿童进行测试）包含在Tamnes等人（2014）的报告中，显示除fimbria外，所有子区域的线性相关性较高（r值为.80- .97）。最近，已经详细报告了跨供应商（或在进行典型硬件升级之前和之后）的可靠性（Brown等人，2020；Quattrini等人，2020）。作为一种通用模式，这些研究表明，与子区域体积相比，空间重现性对MR扫描仪效果的敏感性更高。在会话内对T1进行平均是改善试验-重测可靠性的一种可能性。

2.2.3 | 平均子区域大小与测量可靠性之间的关系

对于FS5.3，Marizzoni等人（2015）报告称，特定的试验-重测测量（可重现性误差和Dice指数）与区域体积呈正相关。在这份报告的兴趣之处，基于已发布的结果（Whelan等人，2016），表2），我们将平均子区域大小的排名与两个FS6.0样本（两个样本和两个半球的未加权平均值）的相应ICC值进行了相关，并发现高度正向的排名相关（Spearman's rho 0.85）。这种模式进一步被Quattrini等人（2020）证实并扩展到了FS6.0的Dice重叠指数，他们还得出结论，对于>300 mm³的海马亚区，实现了最佳的试验-重测可重现性（请参见图2a中的典型尺寸排名）。这可能意味着检测组差异或其他临床相关性的能力可能偏向较大的子区域，因此在解释结果时应考虑这一点。

2.2.4 | 其他可靠性方面 T2WI（T2加权图像）作为输入

众所周知，T2加权图像（主要在冠状面，垂直于海马主轴）有助于识别分子层及其与CA1的边界，这些在标准T1加权数据上通常不清晰可见（Iglesias等人，2015；Wisse等人，2014）。在这方面，Mueller等人（2018）比较了四种自动分割协议，包括基于T1WI和T2WI的协议以及手动分割，特别关注提高对疾病效应的敏感性。事实上，对于包含高分辨率T2WI的方法，效应大小高于仅基于T1WI的方法。然而，没有关于单个T1WI和版本6.0的组合T1-/T2WI输入之间的直接比较的报告。这样的直接比较可以在Iglesias等人（2015）的报告中找到，他们证明了与MCI/对照组差异的组合输入的敏感性增加。

2.2.5 | 测量有效性

测试-再测试可靠性研究无法解释偏离基本事实标签的情况，因此，无论研究设计如何，这些研究都不能说明子领域测量的实际有效性。FS基于海马体亚区体积测量的一般外部有效性植根于离体样本标记的细胞结构原理。其他有效性方面仍在进行研究，潜在的假设是子领域测量包含关于功能或电路差异的间接信息，具有（病理）生理学相关性。这里，关于亚区域功能连接性（FC），包括海马内连接性，或形态协方差分析的研究提供了相关贡献（Dalton, McCormick, de Luca, Clark, & Maguire, 2019; Dalton, McCormick, & Maguire, 2019; Ge等人，2019）。一种引人入胜的方法是寻找子区域特异性连接模式，而不是硬的组织学基本事实：纯粹基于数据驱动的，基于FC的海马分割令人印象深刻地与手动和——在较小程度上——自动分割的子区域相匹配（Wu等人，2018）。此外，3特斯拉的联合解剖和功能特征提供了与7特斯拉数据相似的准确性。到目前为止，还没有FC研究直接结合了基于FS6.0的子领域体积，或将子领域体积与连接性测量相关联。

一份报告对FS5.3海马亚区协议的不同方面进行了批判性评估（Wisse等人，2014）：

1.使用低分辨率T1WI作为算法的唯一输入可能会产生的影响，因为这些图像可能无法提供足够的对比度，例如，齿状回和CA之间的白质纤维束。

2.原始分割方案中的偏见，将一个冠状切面外推到海马体的整个纵向轴（Van Leemput et al., 2008, 2009），导致CA1的估计过高和非典型结果模式。

3.开发算法时使用的高分辨率3特斯拉T2WI（0.19毫米等距）与其应用于低分辨率（1毫米等距）T1WI之间的不匹配。

第二个担忧，也由de Flores等人（2015）提出，针对的是算法的核心元素，并通过将离体数据整合到图谱中来解决。这提高了与手动分割的一致性（即有效性），就CA2/3、前海马回和海马回与CA1之间的转变而言（Iglesias et al., 2015）。

第一和第三个担忧在最近的评论中得到了重新强调（Wisse et al., 2020），归结为一个问题：低分辨率T1WI作为输入是否可以得到足够有效的亚区域结果。为了与金标准达到最佳对应，需要良好的GM/WM对比度来检测白质纤维束和分子层。目前还没有明确的证据表明，只有通过添加T2WI，而不是分辨率在0.4-0.5毫米等距或0.4×0.4×1.0毫米³的T1WI，才能实现这一点。在经验层面上，即使这个特征表现不佳，低分辨率T1WI也可以检测到预期的生物效应，例如在MCI和对照组之间具有良好的鉴别能力（Iglesias等人，2015）。然而，目前还缺少一项方法学而非临床验证研究，该研究将根据离体协议对非常高分辨率MRI数据（例如，0.2毫米等距）进行手动追踪与基于图谱的降采样图像分割或同一受试者新获取的低分辨率图像进行比较。

2.3 | 亚区体积之间的交叉相关性和多重检验考虑因素

由于许多海马亚区研究具有探索性质，需要进行多重检验校正以控制假阳性结果。在以下示例分析中，我们展示了（双侧相加的）亚区体积之间以及与两个样本中的总HV（hippocampal volume，海马体积）之间的相关性。这些分析的目的是演示全局校正变量（颅内体积[ICV]与总HV）如何影响相关结构，以及1.5特斯拉与3特斯拉平台上的亚区体积如何与总HV（海马体积）相关。样本A是1.5特斯拉的重度抑郁症（MDD）/对照组样本，由马克斯·普朗克精神病学研究所（MPIP）收集，并包含在以前的ENIGMA研究中（Schmaal等人，2017）（General Electric，Signa / Signa Excite，T1WI，SPGR-3D或自旋回波，体素大小0.9×0.9×1.2 mm³，N = 597 [209名对照组，388名MDD患者]，年龄19-89岁）；以及样本B，一组3特斯拉健康受试者（明斯特队列，3T飞利浦Gyroscan Intera，T1WI，3D快速梯度回波序列，体素大小0.5 mm等距；N = 211，年龄17-61岁）。数据用FS5.3（一般分割）和FS6.0（亚区分割）进行处理。

在样本A中，原始亚区域体积之间的皮尔逊相关系数在 r = -0.130（fimbria与fissure，p = 0.756）和 r = 0.988（CA4与GC-ML-DG，p < 1e-20）之间变化（中位数0.531）。校正ICV、年龄、年龄平方、性别和站点后，相关系数略微左移（平均值降低0.113，得到的中位数为0.379），整体范围相似（r = [−0.112；0.982]）。校正总HV而不是ICV导致显著的左移，r在-0.661（分子层与海马尾）和0.942（CA4与GC-ML-DG）之间（中位数-0.108）。这种“全局校正”效应可以通过亚区域体积与总HV之间的强共线性来解释，即使在校正ICV、年龄、年龄平方、性别和站点之后（r = [0.327；0.974]）（见补充图1a）。

在样本B中，原始体积之间的相关性类似（r在0.095（fimbria与hippocampal tail，p = .170）和0.994（CA4与GC-ML-DG，p < 1e-20）之间，中位数0.575）。与样本A中的相同协变量校正的亚区体积之间的部分相关系数再次轻微左移（范围r = [−0.085；0.992]，中位数0.475）。为了与已发布的残差亚区体积的交叉相关性（van der Meer et al., 2018）具有可比性，省略了年龄平方项，这仅在很小程度上改变了分布（r = [−0.074；0.992]，中位数0.471），基本上与所提到的报告相匹配。再次校正总HV（海马体积）导致分布的强烈左移（r = [−0.663；0.964]，中位数−0.024）（见补充图1b）。

2.3.1 | 比较样本A和B之间的亚区体积与总HV（海马体积）相关性（称为“自相关”）

为了更好地进行比较，这次分析将样本A仅限于对照组受试者（N = 209，年龄范围19-79岁）。在校正年龄、年龄平方、性别、ICV和地点后，两个样本中检测到类似的自相关范围（样本A：[0.201；0.967]与样本B：[0.390；0.979]）。经过Fisher's z变换后，未检测到样本之间的差异（双侧双样本t检验，假定不等方差，p = .385）。十二个亚区中的六个（三个相关性最低的和三个相关性最高的）在两个样本中的排名相等，而其余亚区的排名位置则不同（表1）。尽管如此，两个样本之间相应的Fisher's z分数的相关性很高（r = 0.967）。

表1：在1.5特斯拉和3特斯拉条件下，健康受试者的总海马体积（HV）与各亚区间的相关性，已根据颅内体积（ICV）、年龄、年龄的平方、性别和地点进行了校正。依据偏相关值（rp）的降序，各样本进行排序。最后两列表示3特斯拉样本相比1.5特斯拉样本的体积等级和相关性等级的相对变化。对于体积等级，两个最小的区域（parasubiculum, HATA）的变化微乎其微。在相关性等级方面，6个亚区间的排名一致，而其他亚区间的排名最多有两个等级的微小偏移。

2.3.2 | 自相关与亚区大小

亚区的自相关程度与平均原始体积呈线性相关（样本A：r = 0.766，样本B：r = 0.690）。

2.3.3 | 解释

亚区自相关与其大小之间的一致性可能反映了上述（2.2.3节）总结的较小亚区测量可靠性较低。尽管设计不完美，因为没有在相同受试者中重复测量，但这些横断面结果表明，与3特斯拉相比，1.5特斯拉的亚区体积对概率图谱与输入数据中的对比度的影响没有系统地更强。然而，在不同平台之间观察到一半亚区的排名变化，这突显了将不同磁场强度（或高度不同的采集方案）的结果汇集在一起是不推荐的；相反，应将它们视为不同的样本。

2.3.4 | 多重检验校正的影响

针对多重检验校正，考虑到已经展示和报道的亚区体积之间的高相关性（Elman等人，2019；van der Meer等人，2018），Bonferroni校正可能过于严格。最近，有人估计，在校正包括ICV在内的协变量后，12个亚区体积代表了7个有效独立的检验（软件可在https://neurogenetics.qimrberghofer.edu.au/matSpDlite上找到）（Couvy-Duchesne等人，2019；Li & Ji，2005；Li，Yeung，Cherny，& Sham，2012）。迄今为止，在若干研究中使用的基于假阳性发现率的校正方法似乎是一个很好的选择。可以考虑采用更复杂的方法，比如考虑实际相关模式的排列分析近似值（Conneely & Boehnke，2007；Zugman等人，2020）或谱分解（Nyholt，2004）。

如果您对脑结构数据分析感兴趣，可浏览思影科技课程及服务，另思影可承接海马亚区分析相关数据处理分析业务，感谢转发支持（可添加微信号siyingyxf或18983979082咨询，另思影提供免费文献下载服务，如需要也可添加此微信号入群）:

重庆：

第八十三届磁共振脑影像基础班(重庆，6.9-14）

第十三届脑网络数据处理提高班（重庆，7.3-8）

第二十七届磁共振脑影像结构班(重庆，7.15-20）

第八十七届磁共振脑影像基础班(重庆，7.23-28）

上海：

第三十三届扩散成像数据处理班(上海，6.22-27）

第八十五届磁共振脑影像基础班（上海，6.28-7.3）

第十一届影像组学班(上海，7.12-17）

第十五届任务态功能磁共振数据处理班（上海，7.19-24）

第四十届磁共振脑网络数据处理班（上海，7.27-8.1）

北京：

第十届影像组学班(更新：北京，6.11-16）

第三十九届磁共振脑网络数据处理班（北京，6.20-25）

第八十四届磁共振脑影像基础班（北京，6.28-7.3）

第八届扩散磁共振成像提高班（北京，7.18-23）

南京：

第三十八届磁共振脑网络数据处理班（南京，6.7-12）

第二十九届脑影像机器学习班（南京，6.15-20）

第八十六届磁共振脑影像基础班（南京，7.6-11）

第十二届磁共振ASL数据处理班(南京，7.14-17）

数据处理业务介绍：

思影科技功能磁共振(fMRI)数据处理业务

思影科技弥散加权成像（DWI）数据处理

思影科技脑结构磁共振（T1)成像数据处理业务

思影科技啮齿类动物（大小鼠）神经影像数据处理业务

思影科技定量磁敏感（QSM)数据处理业务

思影科技影像组学（Radiomics）数据处理业务

思影科技DTI-ALPS数据处理业务

思影数据ASL数据处理业务

思影科技灵长类动物fMRI分析业务

思影科技脑影像机器学习数据处理业务介绍

思影科技微生物菌群分析业务

思影科技EEG/ERP数据处理业务

思影科技近红外脑功能数据处理服务

思影科技脑电机器学习数据处理业务

思影数据处理服务六：脑磁图（MEG）数据处理

思影科技眼动数据处理服务

招聘及产品：

思影科技招聘数据处理工程师(北京，上海，南京，重庆）

BIOSEMI脑电系统介绍

目镜式功能磁共振刺激系统介绍

3 |3.1 质量控制方面

报告的质量控制程序

在162份审查报告中，约44%提及了质量控制程序（附表1，有关审查程序的详细信息，请参阅第4节），其中包含不同程度的详细程度，有时涉及多达三名独立评审员。这并不一定意味着在其余的研究中没有进行质量控制，因为对于大多数影像实验室来说，可预期的合理性检查可能会被低估。亚区分割的整体技术成功率受到安装前提条件的影响，很少明确说明（例如，Schmidt等人（2018）中FS6.0的96.5%），因此由于报告的异质性无法可靠地量化，只能估计在95%以上。大多数质量控制描述指向视觉和主要定性的整体评估。十项研究（占6%）仅根据异常值特征（例如，> 5个标准差）排除了案例，其中最大的研究是van der Meer等人（2018）（请参阅附表1，质量控制详细信息列）。反过来，大多数研究使用异常值特征来指导视觉检查，但在未识别出技术分割失败的情况下不排除异常值。五项研究（占3%）报告了手动编辑，但没有进一步详细说明（请参阅附表1，质量控制详细信息列）。仅在极个别情况下，由于分割完全失败，有些与严重脑病变有关的案例被排除。一些研究提到了用于检查分割的FS查看工具，或提到ENIGMA协议，或者没有详细说明。似乎存在共识，即在出现特殊情况或分割失败的情况下，整个案例（至少是受影响的半球）将被排除，而不是单个亚区。

3.2 | 质量控制的理论考虑

基于FS6.0的海马分割算法是完全自动化的，技术上可以进行手动更正，但没有明确指定。然而，不应该完全“无监督”的使用该算法，因为在复杂的多步过程中，由于多种原因可能出现分割失败。FS算法本身非常稳健，取决于在开始分割之前进行基本检查，通常会获得具有海马亚区体积的地图。FS工具包允许在背景图像上覆盖海马分割输出，通常是在原生空间中进行视觉质量控制（图2b），这在较小的研究中非常有用。

然而，FS中的海马分割工具没有标准化的质量控制程序。虽然需要一定的时间，但结合自动推荐关键案例的视觉质量控制步骤，似乎是一种控制技术或算法问题的风险的良好折衷方案，如果未被发现，可能导致结果和结论的失真。基于贝叶斯方法的概率图集网格与实际数据的匹配，输出表示该网格的数据通知修改，类似于其他基于变形的过程，例如张量基态形态测量。由于它们受到显式惩罚，一个子区域（在3D形状/表面和最终体积方面）的极端偏差因此不太可能发生，且不会独立于其他子区域发生。在我们看来，质量控制评估员不需要正式的神经放射学培训，但应该充分了解以区分：

1.在海马区域出现的正常解剖变异，可能不利于自动算法；

2.轻微的、视觉上明显的，但在体积上可以忽略的现象；

3.不完整的分割或其他非典型分割结果。

类别（1）包括例如，位于海马形成区内或附近的具有脑脊液强度的囊性结构，如沟壑残余囊肿（也称为“海马沟残余腔”）（Li等，2006；Sasaki，Sone，Ehara和Tamakawa，1993年）或脉络裂囊肿（从组织学上讲，可以表示为蛛网膜囊肿、神经胶质囊肿或神经上皮囊肿）（Osborn和Preece，2006年）。这些可能在原始图像、裂缝叠加或完整分割叠加上突出显示，但对实际相邻子区域体积测量的有效性影响很小。遵循这一逻辑，这一类别中的大多数受试者不需要排除。关于已知正常变异影响的研究正在进行中；最近，报道了CA1体积与不完全海马倒置（IHI）之间的相关性，IHI是一种非常常见的正常变异，约有20%的健康受试者发现（Colenutt，McCann，Knight，Coulthard和Kauppinen，2018年）。

图 4 作为示例的全分割结果覆盖，联合海马起始掩模和裂缝，以及全面的视觉质量控制（QC）输出。

(a) 3 特斯拉的（偏场校正的）T1加权输入图像示例以及轴向和矢状彩色亚区分割。

(b) 结合背景图像，海马起始掩模（来自一般亚皮质分割[recon-all]），以及海马裂缝的原理，可以一目了然地检查基本的方向/旋转，成功的基本海马分割（紫色透明覆盖）以及海马裂缝（黄色）在海马起始掩模内的正确位置。

(d) 一个案例的示例HTML输出（仅限于轴向和部分冠状输出图像）。

Sl.，切片编号。

类别（2）代表了可以称之为“小伪影”的现象，对最终体积没有严重影响。然而，识别这一类别中的示例似乎是有用的，特别是对于评估可能只包含很少这类现象的较小研究的评估者（请参阅图3b-e及图例以获取具体示例）。

图 3 显示了正常解剖变异、特殊性和现象的例子，以及二值海马掩模和分割结果之间的差异。图像以（未平滑的）1毫米等距分辨率显示，亚区覆盖以0.333毫米等距分辨率显示。匿名示例的对比度不同，因为它们来自具有不同显示设置的几个站点。所有显示的示例并不一定需要被排除，但请参见a2和a5的特定评论。

(a1) 成年人中25%的人在海马状回和阿蒙角之间发现的海马回残余囊肿的例子；被认为是无病理意义的偶然发现；被分类为海马裂缝（中行图像上的黄色）代表脑脊液强度。类似的周围或海马内囊肿存在，例如脉络裂囊肿（病因学上的蛛网膜或神经胶质或神经上皮囊肿）可能被类似地分类为海马裂缝，或者由算法将其视为海马外的（“背景”），取决于位置的详细信息。某些类型的囊肿可能与扩大的脑血管周围空间（Virchow Robin空间）共存，例如在下基底节或中脑（见a1中的开放箭头）。

(a2) 一个囊肿区域没有被分类为裂缝，而是被分类为海马外的背景，CA1的一部分似乎被忽视了。根据这种被切断的海马组织的数量，这种类型的极端情况应该被排除。

(a3–a5) 被明确分类为裂缝或背景（即，没有海马亚区）的囊肿的例子。a5可能正确地分类了裂缝，但由于部分体积效应，在原始图像上看起来比脑脊液亮。更极端的情况（海马裂缝在T1WI上的强度过亮或在T2WI上没有表示）应该被排除，海马裂缝的体积可能包含囊肿。

(b) 非常频繁（90%）但实际上可以忽略的CA1的不连续出现和/或CA1内的较小保留区域（“洞”）。

(d) 可定位到髂状突（淡粉色，d1）或CA3（绿色）或CA1（红色）如在d2或d3的“洞”是由于在最后的二值分类步骤中去除了海马上缘的白质层（髂状突）区域，这可能会造成分割突然结束的印象。

(e) CA1的“粗壮”外观，即这个亚区在一切片上强烈地占主导地位。这可能是由于在原生空间中严格的正交切片所导致的。

(f1) 标准海马分割（recon-all）缺少海马后部的部分，而亚区分割v6.0正确地检测到了这些部分。因此，标准二值海马起始掩模的不完整性本身不应该是排除的标准。

(f2) 前部看起来被切断，但位于杏仁体复合体内；这种外观是正常的，不表示分割失败。

类别（3）可能是复杂的，包括各种底层原因，包括技术故障（例如，算法故障或输入图像的错误方向）、输入图像质量低，或者极端病理学导致的严重萎缩或海马内信号强度变化。特别是后一类别——极端病理学——可能导致决定将受试者保留在样本中，或者在特殊情况下仅排除选定的子区域。这种情况可能是例如标记术后或颞叶损伤后变化，导致某些子区域难以正确检测，海马硬化、缺血或脑炎引起的强烈的海马内强度变化，或者是阿尔茨海默病或其他形式的神经退行性疾病的严重进展。出于这个原因，底层的T1WI将并行显示。

图3涵盖了类别（1）和（2）的示例。关于偏差的其他示例，请参见原始报告中关于离体图谱基础方法的图12和补充图22（Iglesias等人，2015）。

还有两点值得关注：首先，循环性是有问题的——在这个意义上，（视觉上）对那些将作为分析的因变量的特征进行评分。此外，由于海马分割是基于（尽管不完全依赖于）对海马进行正确的一般分割（作为FS recon-all命令的一部分），这样的控制步骤应该纳入QC（见下文）。因此，对于我们的QC管道，我们开发了一个三重覆盖：（a）生成的海马裂缝（子区域分割的输出）覆盖在（b）一般分割的起始海马掩模上，两者都覆盖在（c）作为视觉QC基础的T1加权背景图像上。除此之外，还有不是孤立的，展示海马子区域的完整集合（图2）。第二，一般的皮层和皮质下分割也应该接受QC，例如，自2017年4月起支持在线的程序包（http://enigma.ini.usc.edu/protocols/imaging-protocols），有两个主要原因：（a）生成的强度分布基于定义的白质区域和成功的皮层/皮质下分割；（b）全局测量，如颅内容积（ICV）、总脑容积或总灰质（TGM）通常需要用于统计模型，且依赖于适当的一般配准或分割。

当通用QC和子区域QC同时显示原始输入图像的示例切片时，这有助于检测到非常低质量的输入图像（例如，由于运动伪影导致的模糊边缘）。这种图像增加了通用分割失败的风险（例如，脑叶部分缺失，或者皮层厚度的显著低估）和/或海马分割未能完全延伸至海马边界。后者可能出现在极度退化的海马中，其中内部CSF信号可能模拟真实边界。根据我们的经验，这种全局低质量案例通常导致TGM值或TGM/ICV比例被严重低估，尤其是当它们与年龄进行对比绘图时，这些值看起来像异常值。

提出的质量控制（QC）流程

在ENIGMA联盟中，我们开发了一套用于FS6.0算法导出的海马亚区的质量控制的标准化的MATLAB、Linux shell和R脚本集合，这些脚本提供了几个功能，包括：（a）对已经进行了一般recon-all分割的一组受试者启动子区域分割，（b）从一般分割中获得子区域体积和全局体积的标准化读出表，（c）应逐个检查的案例列表，以及（d）一个可浏览的超文本标记语言（HTML）文件，允许在较大样本中执行此视觉质量控制（图4）。

步骤（a）和（b）基于Linux shell脚本。步骤（c）是基于两个原则的R脚本：首先，一个针对所有子区域体积，以及总脑体积、总灰质体积、ICV和GM/ICV比例的异常值计算方案（+/- 2.98 SDs，每个代表正态分布尾部大约1%的样本）。其次，由于子区域体积的秩次顺序在MR平台和样本间非常稳定（图2a），因此从N = 626个受试者的分析中定义了一组三种违反该排名顺序的情况，其中计算了实际排名与组平均排名的偏差模式：（a）CA1不是最大子区域（即不是排名#1；频率≥11%），（b）海马尾部排名低于3（频率≥2%），和（c）海马回不是排名#4（频率≥2%）。第一个规则是可选的（默认关闭），因为它可能在较大的样本中过于敏感和不够特异。

对于步骤（d），可以由用户定义每个HTML文件中汇总的案例数量。这样，将生成若干个单独的文件，例如，分发给几个评估员。此外，可以请求随机顺序模式（以避免质量控制顺序偏差），或HTML输出的稀疏版本，其中包含较少的示例切片，允许加速非常大的样本（例如，N>1000）的吞吐量。

总体而言，在使用我们的ENIGMA海马亚区质量控制协议时，我们建议在对子区域体积进行统计分析之前执行以下步骤，如图5所示：

1.执行一般FS分割并追加海马分割模块，最好使用相同的版本（目前为6.0或7.0）（注意：将FS.5.3一般分割与FS6.0子区域版本结合是可行的，并产生与FS6.0仅相当相似的结果；还请参阅van der Meer等人（2018）的补充材料）。

2.使用相应的ENIGMA脚本和说明执行一般皮层和皮层下分割的质量控制（http://enigma.ini.usc.edu/protocols/imaging-protocols）。

3.使用SUBFIELDS软件包中的脚本读取海马子区域体积和一般分割结果；在此输出上运行R脚本outliers_hippo_and_QC_support.R，生成可能存在问题的案例列表（请参阅图5以获得示例）。

4.运行三个质量控制(QC)准备脚本，最终生成QC-HTML文件；根据需要在脚本中调整图形和随机排序或稀疏输出设置。5.使用标准浏览器查看QC-HTML文件中的所有数据集，特别注意被标记的数据集。其他建议包括：

a.为了熟悉特定研究的分割方差，并避免顺序偏见，最有效的方法可能是以更快的速度查看随机选择的案例，首先收集“全球印象”。

b.在浏览静态HTML文件之前，如果对FS海马切割输出不熟悉，可能有益于使用FS查看器Freeview探索几个案例，该查看器允许在所有三个维度中滚动。由于FS输出在本机空间中，这个步骤有助于熟悉由于主体之间解剖切片位置不完全对应所引起的方差。

图5.对于基于FreeSurfer的海马亚区研究，这是一个总体的质量控制(QC)流程图。

根据本地的流程，有关原始数据质量、运动伪影和完全覆盖的一般QC步骤可以直接在图像存档系统上执行，并且是独立于研究的。在进行特定亚区操作之前，建议对FS的皮质/皮下分割结果进行一般检查。步骤2-7由一个使用MATLAB，R和Shell编写的脚本包支持。“freeview + subfields”指的是使用交互式FS查看工具进行个别检查(https://surfer.nmr.mgh.harvard.edu/fswiki/HippocampalSubfields)。

4.分析：临床神经科学出版物的状态 | 基于FS的海马亚区

从这些研究中，我们试图确定领域、主题和一些选定的方法学信息：场强、MRI序列（T1WI、T2WI或两者）、FS版本、全局体积校正（如果使用，以及使用的具体体积）、全球校正的统计方法（回归方法、比例方法、协变量方法）、年龄和性别是否作为协变量、非线性年龄效应的建模以及其他协变量。我们提取了是否报告了亚区分割的质量控制，是否排除了异常值，以及是否进行了手动校正。最后，我们记录了海马亚区是否被（重新）聚合以创建复合标记。三项研究仅将海马亚区分割用作定义感兴趣区域（ROI）的工具，剩下159项研究用于分析统计方面。

作为ENIGMA的一个目标是推进遗传关联研究的内表型概念（Gottesman & Gould, 2003），返回的海马亚区研究被组织成（a）遗传力研究；（b）临床诊断、行为和认知表型或其他生物标志物研究；以及（c）候选基因研究或探索性成像遗传学分析。关于（a）的结果以文本形式在第4.1节中总结。所有类别（a）和（c）的结果以三种不同的粒度呈现：首先，在基于完整论文的迭代过程中，研究被聚合成19个领域（15个临床/行为领域，4个（表观）遗传领域），如饼图（图1，详见图例关于类别融合的详细信息）所示。其次，在表2中，对单个研究或研究组进行了子分类和主题描述，以便快速概述和参考。第三，补充表1详细列出了所有162项研究，重点关注技术特征，以便进行方法学和质量控制审查。

表格2：2013年1月至2019年12月报告的基于FS的海马亚区研究概述。

第一类别的研究（遗传性研究）总结在4.2节中。临床/行为/生物标志物领域被划分为15个领域，遗传领域被划分为4个领域。为单一研究或研究组提供最少的关键词以描述子领域。

4.1 | 遗传力分析

FS6.0的海马亚区体积已经在遗传力方面进行了分析——主要是基于单卵/双卵双胞胎研究（Elman等人，2019；Greenspan等人，2016；Whelan等人，2016）或基因型信息（van der Meer等人，2018）来证实它们作为内表型的有效性。

Whelan等人（2016）报道了在控制年龄、性别和年龄-性别效应后，海马亚体积和总HV之间的遗传力在56%和88%之间。通过双胞胎研究测量的遗传力估计h2（体积中可归因于遗传的方差比例）对于相对较大的区域（整个海马体、分子层、CA1、CA3、CA4、海马尾、颗粒细胞层、海马嵴和前海马嵴）大于70%，对于较小的亚区（HATA、脑翼、副海马嵴、海马裂）中等到高（55% < h2 < 70%）。投影到海马表面模型表明，后部亚区（包括海马尾）的遗传力较大，而前内侧亚区（副海马嵴、前海马嵴、脑翼）的遗传力较小，这表明了遗传影响的梯度。尽管如此，亚区体积与测量可靠性之间的关系也可能影响遗传力的估计。Elman等人（2019）报道了在控制年龄和性别后，遗传力值在37%（HATA）和89%（分子层）之间。遗传相关作为衡量子区和总HV之间共享遗传影响的指标很高，这表明对于标准分辨率的T1WI，通过子区体积没有获得关于遗传基础的实质性附加信息（Elman等人，2019）。尽管发现了子区之间的显著遗传协方差，但在因子分析中没有发现稳定的潜在遗传特质（由子区组合组成）（Elman等人，2019）。

Greenspan等人（2016）报道了FS6.0亚区体积的遗传力估计在20%和87%之间，同时总HV的共享遗传方差较高（平均值0.79，范围0.50-0.98）。在剔除总HV之后——或者考虑基于子区体积/总HV比率的百分比时——遗传力在4%和86%之间波动（分别为7%和84%）。在这里，海马翼、海马裂和HATA的遗传力值并不显著。

根据一个最近关于海马亚区体积的GWAS研究，研究中的体积数据已经校正了ICV、年龄、性别和地点（van der Meer等人，2018），在非常大的样本中（N>20,000），报道了显著的SNP基遗传力，范围在14%（副海马嵴）到27%（海马尾）之间。

4.2 在临床诊断、行为和认知表型、（表观）遗传标记或其他生物标志物的应用。

我们发现迄今为止使用FS工具进行的海马亚区分析已经涉及到广泛的领域，这些领域在图1中进行了量化，并在表2中分为子领域/主题。除了海马依赖性认知功能、健康和病理性衰老、情感/精神病谱系的主要精神疾病以及不同的神经系统疾病等预期的主要领域之外，我们还注意到心理创伤学和神经毒性影响（包括系统性炎症）的研究越来越受到关注。在分析候选基因、表观遗传甲基化模式、多基因风险评分的研究中，现在也开始探讨亚区体积作为内表型，这些研究还包括探索与单个亚区相关的整个基因组（Nakahara等人，2019）或所有亚区相关的基因组（van der Meer等人，2018），以及进行方法学比较（Couvy-Duchesne等人，2019）。

4.3 | 统计方面 4.3.1 | 建模全局体积效应

大脑区域体积的个体差异的一个重要来源是整体头部大小的变化（Mathalon, Sullivan, Rawles, & Pfefferbaum, 1993）。为了提高区域结果的特异性，ICV通常会纳入统计模型 - 在亚区体积作为结果变量的159份报告中，78%的报告纠正了ICV。技术上，在FS中，ICV是根据将个体MRI扫描线性注册到Talairach空间时创建的矩阵进行估算的，因此也称为“估计的总颅内容积”（Buckner等人，2004年）。因此，基于FS的研究倾向于将此测量值作为ICV替代物。另外，在分割之后（例如，使用统计参数映射[SPM]软件），可以将TGM、白质和CSF体积相加。两种方法都与手动划线的金标准相关性良好，但对于SPM8和FS（版本5.1.0）都报告了过高估计（Nordenskjöld等人，2013年）。最近，通过手动编辑的颅内掩模（在MNI空间中）增强的基于SPM12的分割实现了与金标准的优秀一致性，优于FS5.3（Malone等人，2015年）。较小比例的研究认为总脑体积（4.4%）、颅上灰质体积（2.5%）或总HV（5.7%）是修正变量。选择这些变量会逐渐增加区域特异性，这在预期额外海马脑区域的影响时尤为相关（例如，神经退行性疾病）。纠正总HV允许研究超出总HV效应的亚区效应，最大化区域特异性。

ICV（或其他全局体积）可以通过多种方式进行建模（O'Brien 等人，2011）：首先，它可以作为一个干扰协变量包含在协方差分析、线性混合模型或回归分析中，与其他混淆变量一起（协方差分析方法）。在包含全局体积的136项研究中，绝大多数（79%）使用了这种方法。第二，可以通过回归分析调整体积（残差方法），因此 volcorr = vol - b*(ICV-ICVmean)，其中 b 是体积对 ICV 的回归的斜率（Hayes 等人，2017；Mathalon 等人，1993）。大约13%的136项研究采用了这种方法。第三，ICV 可用于对区域体积进行直接的个体标准化。这种方法在25%的报告中应用，被称为比例（或比率）方法。在最简单的形式中，volcorr = vol/ICV。在此基础上，可以将样本平均 ICV 与此项相乘。每种方法的优缺点是一个长期讨论的话题（Arndt, Cohen, Alliger, Swayze 2nd, & Andreasen, 1991; Buckner et al., 2004; Jack Jr et al., 1989; O'Brien et al., 2011; Sanfilipo, Benedict, Zivadinov, & Bakshi, 2004; Voevodskaya et al., 2014）。不能给出适用于所有研究类型和问题的普遍有效的建议，每种方法都需要一定的假设（O'Brien等人，2011）。例如，协变量允许明确归因于不同的方差来源；回归方法在小样本中可能不可靠，但与比例方法相比，产生更高斯分布。

越来越多地认识到的一个问题是，在总体和局部脑测量之间可能存在非线性（异速）而非等速关系（Jäncke, Liem, & Merillat, 2019；O'Brien 等人，2011；Reardon 等人，2016）。Toro 等人（2009）证明了在海马体积遗传研究中，关于脑异速的假设产生了关键性差异。最近，van Eijk 等人（2020）报道了海马亚区体积也可能存在异速缩放。

4.3.2 | 年龄效应建模

对于海马形态学研究，年龄效应建模是另一个关键点。对于校正后的 TGM 体积，通过非线性项获得的解释方差增益相当弱（见图 2d），而海马亚区体积（及其他皮质下结构）显示非线性效应，成人中期呈平台期，大约 65 岁开始减少（de Flores 等人，2015）（也见图 2c）。类似地，已经报道了8到30岁之间的亚皮质脑结构（包括整个海马）的非线性发育轨迹（Ostby等人，2009），以及4到22岁之间的海马亚区域（Krogsrud等人，2014）。这意味着，在涵盖较大年龄范围的海马亚区研究中，应使用包含非线性项的模型，这可以是基于理论考虑或数据探索。在我们收集的报告中，大多数研究（89%）对年龄效应进行了建模；其中四项（2.5%）研究对非线性年龄效应进行了建模。此外，衰老过程在临床状况下可能是异常的，疾病特异性的衰老过程可能错误地转化为组主效应。相应的年龄-性别和年龄-诊断交互项及其更高阶版本有助于完善模型，减少解释上的模糊。在这里，多站点数据的汇集（例如，巨量分析）是有用的，已经提出了在保留协变量效应的情况下消除批次效应的方法，用于年龄协调（Fortin等人，2018；Pomponio等人，2020）。

4.3.3 | 跳过或重新组合海马亚区

在一些研究中（约4%），跳过或反过来重新组合海马亚区，以创建与原始FS6.0或FS5.3方案不同的综合测量。由于其相对较低的可靠性而被排除的亚区主要是海马小翼和海马裂缝（因为后者并不代表海马组织，而是一个脑脊液裂缝）。一些研究将亚海马嵴、旁海马嵴和前海马嵴组合，定义为亚海马复合体（参见补充表1，最后一列，以及表图例的详细信息）。在FS6.0和FS7.1中，提供了三种将算法隐藏的精细海马亚区划分聚合到最终标签的方法：（a）头-身-尾聚合，对于与早期基于地标的分割工作进行比较或计算更粗略的感兴趣区域（ROI）区域（例如，功能性MRI）是有用的；（b）将12个子区域聚合在一起，如本文所示；（c）一种称为“CA”的版本，其中内部标签（GC-ML-DG和分子层）被CA子区所吸收。更具体地说，将GC-ML-DG分配给CA4，将分子层中的体素分配给最近的既不在分子层也不在背景中的体素。

McHugo等人（2018）在关于精神病的研究中，为了更容易地与其他常用分割算法生成的数据（Mueller等人，2018；Yushkevich等人，2015）进行比较，并考虑到在没有多光谱输入数据的情况下，较小子区（CA3，GC-DG，分子层）的不完美边界定义，提出了两种聚合方案。这些方案是有趣的变体，特别是在研究海马沿纵轴的体积效应时。

4.3.4 | 多变量分析和结构协方差分析

鉴于大多数亚区体积的良好测量可靠性，多变量分析（包括机器学习方法）特别具有吸引力，可以检测复杂的形态学模式。例如，基于海马亚区信息的抑郁症治疗预测准确率达到了83%（Cao等人，2018）。同样，使用海马亚区信息（来自FS5.3和FS6.0）进行的线性判别分析在区分阿尔茨海默病患者和健康对照组方面优于总海马体积（Iglesias等人，2015）。这两项研究都为亚区分割提供了间接的临床有效性。

基于不同受试者之间的亚区体积模式的一致性的结构协方差分析是另一种有趣的方法：例如，Wang, Yu等人（2018）和Wang, Zhang等人（2018）报告了在失忆和血管性轻度认知障碍患者中，海马亚区和额外海马灰质体积之间的协方差较高，与对照组相比。无监督学习任务（如聚类）揭示了亚区之间以及与其他脑区的分组（van der Meer等人，2018）。据我们所知，迄今为止尚未报道过基于海马亚区模式对患者样本进行子组聚类。

5 | 总结讨论和展望

基于FS的海马亚区分割算法是一种广泛应用的工具，可用于研究生理性海马依赖过程和病理条件。健康和病理性衰老研究，包括轻度认知障碍/阿尔茨海默病谱系，以及精神病和情感障碍谱系的研究约占所有研究的50%。早期环境和遗传影响以及对海马完整性的神经毒性影响的研究构成了剩余研究的大部分。该工具为许多神经精神性疾病（如总）海马容积测量发现的长期已知的非特异性提供了改进的机会（Geuze，Vermetten，和 Bremner，2005）。由于其易于操作和自动化使用，自然地促进了探索性研究，目前已有一些报告对海马亚区体积进行全基因组关联研究（Morey等人，2020；Nakahara等人，2019；van der Meer等人，2018）。在这方面，最近的方法学工作强调，对于海马亚区体积，多变量全基因组关联研究可能是对传统的多元单变量方法的有益补充（Couvy-Duchesne等人，2019）。

大多数临床/行为研究使用协方差分析或线性混合模型，调整年龄、性别和ICV。然而，在年龄和全局体积建模方面仍存在相当大的差异，这阻碍了回顾性荟萃分析。质量控制步骤的异质性程度也类似。现有数据集的前瞻性协调分析（如ENIGMA所进行的）以及对前瞻性获得的亚区数据的分析可能从我们的质量控制协议作为指南中受益。尽管如此，海马亚区数据的多元分析仍然很少使用，但已经开始显示出有希望的结果，例如预测MDD治疗反应（Cao等人，2018）。结合良好的跨站点和跨供应商可靠性（Brown等人，2020；Quattrini等人，2020），这增强了亚区体积作为临床试验生物标志物的潜力。与基于体素或基于顶点的特征相比，亚区体积的一个可能优势是更高程度的可解释性，因为效应权重可以转换回组织学或其他验证层次。

尽管有证据表明，通过检测关键的内部海马边界，第二个高分辨率T2WI可以提高亚区测量的可靠性和有效性（Iglesias等人，2015；Mueller等人，2018；Winterburn等人，2013），但只有很少的研究（3.1%）使用了两个MRI输入通道。我们建议，在目前可用的FS海马亚区研究中，算法的潜力尚未充分利用，未来的前瞻性研究应考虑优化的MRI协议。

至少还有两种自动化的海马亚区分割算法，都是在3特斯拉平台上开发和评估的，都是基于高分辨率MRI图像上的手动跟踪作为参考：MaGET-Brain（多个自动生成的模板）（Pipitone等人，2014）和海马亚区自动分割（ASHS）（Yushkevich等人，2015）。这个方法论领域中一个复杂的挑战是定义一个公认的手动分割协议：在这里，欧盟联合计划-神经退行性疾病研究的海马亚区小组旨在协调一个可靠且有效的死后数据协议，同时促进其转化为MRI数据。已经公布了一个7特斯拉MRI数据协议，该协议在手动和ASHS性能之间具有良好的一致性（Wisse等人，2016），并且将离体与高场MRI数据（9.4特斯拉）进行比较已经在协议定义方面取得了进一步的进展（de Flores等人，2019）。这项工作正在进行中，将成为MRI领域新的验证实验的基础（Olsen等人，2019）。IHI的影响——海马形成的一种常见的、非典型性旋转（Cury等人，2015），影响亚区体积（Colenutt等人，2018）——提出了另一个挑战。

展望未来，海马形状分析是有价值的，因为它可以与亚区信息相结合，以定位形状效应。ENIGMA的形状分析流程（http://enigma.usc.edu/ongoing/enigma-shape-analysis）基于FS皮层下分割，然后进行拓扑校正步骤和基于拓扑保持级别集算法的平滑处理（Gutman等人，2015；Xiao Han，Xu和Prince，2003）。在注册到标准模板后（Gutman等人，2015；Gutman，Wang，Rajagopalan，Toga和Thompson，2012），为每个顶点计算两个指标：一个可与“形状厚度”测量相比的径向距离，以及雅克比行列式（Gutman等人，2015；Wang等人，2011），一个相对于模板形状的局部化组织减少或表面积增大的度量。使用亚区表面投影（Cong等人（2014）首次为FS5.3提供），形状效应可以分配给特定亚区。最近，这种组合方法有助于定位MDD中的海马形状变化。（图6）

图6 表面与体积亚区的关系

(a) 表面亚区由最靠近表面的体积亚区定义。对于每个表面元素，我们在表面和中位线之间集成了3D亚区。饼图表示了体积亚区在表面线下的比例（红色）。虽然此图以2D方式绘制以说明，但这个原则可以等同地应用于表面的2D区块。

(b) 一个个体的海马模型与表面亚区，以及FS6.0的体积亚区的冠状切片。深紫色线是中位线。

总之，基于FS的海马亚区分割工具提供了一个具有良好测量可靠性和有效性的有价值的细微形态表型工具。使用标准化的QC程序可以帮助协调大规模的合作研究并减少方法论异质性。专为亚区研究设计的采集协议以及进一步的外部验证和多变量分析技术可以进一步提高其在临床神经科学中的实用性。

如需原文及补充材料请添加思影科技微信：siyingyxf或18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。另思影提供免费文献下载服务，如需要也可添加此微信号入群，原文也会在群里发布，如果我们的解读对您的研究有帮助，请给个转发支持以及右下角点击一下在看，是对思影科技的支持，感谢！

微信扫码或者长按选择识别关注思影

非常感谢转发支持与推荐

欢迎浏览思影的数据处理业务及课程介绍。（请直接点击下文文字即可浏览思影科技所有的课程，欢迎添加微信号siyingyxf或18983979082进行咨询，所有课程均开放报名，报名后我们会第一时间联系，并保留已报名学员名额）：

核磁：