请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论及转发推荐,也欢迎了解思影科技的课程及数据处理服务,添加微信号siyingyxf或18983979082咨询(咨询电话18580429226,杨晓飞)。(文末点击浏览)
目的:针对诊断时原发病灶不明的患者,基于不同脑转移瘤的MRI影像组学特征,通过一种多分类机器学习模型去预测肿瘤类型。材料和方法:这项单中心回顾性研究共纳入189例患者(101名女性,88名男性;平均年龄61岁;年龄范围32-85岁),分析基于T1加权对比剂增强(T1-weighted contrast material–enhanced)、T1加权非增强和FLAIR图像(fluid-attenuated inversion recovery)中的共658例脑转移瘤的放射学特征。在超过9年的时间内(从2007年9月到2016年12月)用不同的磁共振成像设备采集图像,以反映图像数据的异构性。研究包括以下原发转移瘤:乳腺癌(143例)、小细胞肺癌(151例)、非小细胞肺癌(225例)、胃肠道癌(50例)和黑色素瘤(89例)。采用随机森林机器学习算法对1423个影像组学特征和临床数据进行评价,采用模型外部数据进行五折交叉验证。对10个随机抽取的交叉验证集进行对比分析,验证结果的稳定性。同时,将分类器的性能与两位放射科医生各自的视觉预测结果进行比较。(1)五分类预测模型的AUC值介于0.64(非小细胞肺癌)和0.82(黑色素瘤)之间,P值均小于0.05;(2)分类器的预测性能优于放射科医生的视觉判断。其中,黑色素瘤的敏感性最高,分类器预测结果比两位读片医生的敏感性高出17个百分点,其P值小于0.02。机器学习分类器在预测脑转移瘤的肿瘤类型方面,常规脑MR图像的定量特征具有很高的鉴别准确性。本研究发表在Radiology杂志。(添加微信号siyingyxf或18983979082获取原文及补充材料)1 前言
脑转移瘤严重影响癌症患者的预后和健康情况。据估计,9%到50%的恶性肿瘤患者会发生脑转移,而其中的估计差异,取决于计算是基于外科、放射学还是尸检数据。不同原发部位脑转移的发病率分别为:肺癌为41%-56%,乳腺癌(BC)为13%-30%,恶性黑色素瘤(MM)为6%-11%,胃肠道癌(GI)为6%-9%,“其他”/未知肿瘤为4%-20%。脑转移患者可分为以下三个亚组:(a)异时表现(原发性肿瘤诊断后,分期时诊断为脑转移)的患者,(b)早熟表现(原发性肿瘤诊断前,诊断为脑转移)的患者,以及(c)同时出现(同时诊断为脑转移瘤和原发性肿瘤)的患者。我们的研究集中在b、c两个亚组,这两个亚组的数据统计,占所有脑转移患者的30%。对于这些患者来说,快速有效的确定原发病灶位置,对于他们的个人预后及治疗计划至关重要。欧洲神经病学学会和欧洲神经肿瘤协会的现行指南均强调了b、c亚组在诊断和治疗方面的临床挑战。由于标准CT和MR图像的经典语义评估(如位置、形状、环形增强)存在强烈的不同阅读者的组间和组内差异,不能提供足够的诊断能力来确定转移瘤类型。因此,额外成像及侵入性活检方式进行更明确的诊断成为必要。对于在放射学上怀疑有脑转移且无癌症病史的患者,建议进行以下影像学检查:胸部CT、腹部CT、全身氟脱氧葡萄糖PET。因此,在诊断脑转移瘤时,对于原发病灶位置未知患者的诊断决策需要许多检查步骤及各种技术设置。对于这些患者,基于影像学组织分化的先进技术,有助于更集中的检测原发性病变,从而缩小所需的诊断程序,快速开启明确治疗方案的开端。本研究旨在探讨以放射影像学为基础的多类别机器学习预测转移性肿瘤类型的可行性,并假设从MRI数据中得出的脑转移瘤的影像学生物标志物,可以用来预测相应的继发性肿瘤类型。2 材料和方法
伦理委员会(WF-018/15)批准了这一单中心回顾性数据评估,并免除了获得书面知情同意的必要性。图1给出了本研究对转移瘤类型预测的说明性概述,具体细节将在以下部分中详细介绍。
图1 转移瘤类型预测的概念概述。FLAIR = fluid-attenuated inversion recovery, T1w = T1 weighted.
2.1 患者
本研究对9年多(2007年9月至2016年12月)的MRI数据进行筛选,以确定是否存在小细胞肺癌(SCLC)、非SCLC(NSCLC)、BC(乳腺癌)、MM(恶性黑色素瘤)和GI(胃肠道癌)的继发性恶性脑肿瘤。纳入和排除标准如图2所示。基于可用性抽样,通过回顾性图表审查确认符合入组条件的患者。所有患者的原发性恶性肿瘤类型均经病理证实,且患者在MRI扫描之前,未接受过针对其脑转移瘤的特殊治疗(放疗、手术、化疗或靶向治疗)。最终,研究纳入189名患者(包括658例脑转移瘤):女性101名,平均年龄60,年龄范围32-84;男性88名,平均年龄63,年龄范围41-65。搜集转移相关患者数据资料,包括原发肿瘤类型、患者年龄和患者性别。
图2 患者纳入和排除标准流程图。BC = breast cancer, CE = contrast enhanced, CUP = cancer of unknown primary, FLAIR = fluid-attenuated inversion recovery, GI = gastrointestinal cancer, MM = malignant melanoma, NSCLC = non–small cell lung cancer, SCLC = small cell lung cancer, T1w = T1 weighted.
2.2 图像采集
图像通过使用1.5T磁共振成像设备(来自德国西门子医疗:Magnetom Sonata, Magnetom Symphony, 或 Magnetom Avanto)或3.0T磁共振成像设备(磁共振Skyra、西门子医疗,或荷兰贝斯特飞利浦医疗系统公司Ingenia)获得。成像方案包括无对比轴向FLAIR和非增强轴向t1加权自旋回波序列。在以0.1 mmol/kg的剂量调整注射钆基造影剂后,进行造影剂增强的轴向T1加权自回波序列或三维T1加权梯度回波序列。不同MRI设备的序列参数存在差异,反映了临床影像资料的异质性。2.3 肿瘤分割
由两位作者在原始t1加权增强图像上半自动分割肿瘤:S.G,拥有11年的诊断神经放射学临床经验,专注于图像处理和预测建模的临床应用研究;T.S,在一个学术性全方位服务医院拥有3年诊断神经放射学的临床经验。两位作者对所有患者的临床信息均不知情。使用Analyze 11.0软件(Biomedical Imaging Resource,Mayo Clinic, Rochester, Minn),根据可见肿瘤总体体积确定感兴趣区域(ROI)。采用两位作者勾画的ROI重叠部分进行放射组学分析。2.4 图像后处理
图像后处理流程如图3所示。为了最小化噪声和处理伪影,研究中尽可能避免图像数据的上采样。因此,使用蒙特利尔神经研究所(MNI)的152图谱,根据各自数据集中的最低采集分辨率(即最大体素维度)重新切片;使用NiftyReg进行图像矫正,图像校正标准为N4ITK偏倚,并进行归一化。利用图像配准得到的变换矩阵,将肿瘤ROI变换为MNI标准空间。两位作者(S.G.和T.S.)直观地验证了图像处理的规范化及可操作性。
图3 图像处理流程。三分类模型和五分类模型的空间分辨率以毫米为单位。CE = contrast enhanced, FLAIR = fluid-attenuated inversion recovery, MNI = Montreal Neurologic Institute, ROI = region of interest, T1w = T1 weighted
2.5 机器学习
为了保证稳健的结果,采用随机森林算法进行多分类研究(Python scikit-learn environment,版本0.18.1)。与其他分类算法相比,随机森林过拟合倾向较低,非常适合具有大量异质性预测因子和聚类相关观察结果(例如,有多个转移的患者)的数据集。在对模型泛华错误率进行稳定性分析的基础上,将树数设为3500棵,并假定每个类的先验概率相等,每个节点的特征数设置为特征总数的平方根。2.6 模型验证
本研究基于独立于模型训练集的验证集,运用五折交叉法进行模型验证。与模型的内部验证相比,模型外部验证结果更能表现模型的鲁棒性。因此,对于多发性转移的患者,相应的转移被分配到验证集或训练集,以防止聚类相关的偏差。通过对10个随机分组的5折交叉验证集的比较分析,验证结果的稳定性。2.7 特征值提取
为了进一步提高数据有效性,本研究只使用体积大于或等于125 mm3(相当于一个边长为5 mm的立方体)的转移瘤影像组学特征,并且只分析每个患者10个最大转移瘤的特征。最终确定的转移瘤总数为658(见表1)。每个ROI的影像组学特征是根据 Python的PyRadiomics包(版本1.2.0(16)),在其默认参数下进行提取的。提取的特征包括18个一阶特征、17个形状特征和56个纹理特征。在此基础上,所有一阶特征和纹理特征均进行8个小波分解(4个二维特征分解),最终每个ROI都计算得到1423个图像特征。
2.8 特征降维
在考虑基尼不纯度的情况下,对每个训练数据集分别进行基于随机森林算法的特征选择。【基尼不纯度越小,纯度越高,集合的有序程度越高,分类的效果则越好】
2.9 放射科医生主观判断
两位资深医师根据以下信息预测转移瘤类型:未经处理的T1加权对比增强、T1加权非增强和FLAIR MR图像、文献中描述的转移瘤的主要特异性形态学特征(表E1)以及患者年龄和性别。第一位读片医生:U.H,在学术性全科医院有8年的神经放射诊断临床经验;第二位读片医生:M.H.S.,在学术性全科医院有7年的神经放射诊断临床经验。两位医生对真实转移瘤类型所属、分类器预测转移瘤类型结果及对方的判断结果均一无所知。预测评价指标下,灵敏性和特异性是根据二分类的预测概率值计算的,医生的判断结果则根据每个病人的转移瘤数量加权计算获得。根据灵敏性比较医师与机器学习分类器的分类精度,具体以两位医师各自的分类特异性为临界值点的ROC曲线表示。
+ more likely/higher . - less likely/lower.
2.10 机器学习分析策略
通过两步设计对基于机器学习进行转移性肿瘤类型预测的可行性进行了如下分析:首先,设计三分类模型预测:包括与脑转移发生率最频繁相关的三种肿瘤类型,即肺癌,BC,和MM(表1)。由于已知的NSCLC肿瘤异质性特征,仅包括SCLC患者。为了避免异类图像数据和低空间分辨率带来的偏差,三分类模型进一步对高分辨率图像(体素尺寸小于0.5 * 0.5 * 1 mm的T1加权对比增强图像)的患者[图3])进行限制。然后,一个五分类模型整合了五种原发性肿瘤类型,覆盖了所有脑转移发生率的80%–90%,并使用了较低分辨率的图像(表1,图3)。因此,在当前的标准护理临床中,五分类模型全面地评估了放射医学的诊断潜力。对于这两种模型,都分别训练了3个模型:临床模型(评估常规临床信息对转移瘤的预测价值),影像组学模型(该模型与临床模型进行比较,证明影像组学特征的预测能力),临床结合影像组学的综合模型。此外,根据文献报道转移性肿瘤类型的先验概率,以相等的类别权重训练随机森林算法。2.11 数据分析
多分类问题的ROC曲线下面积(AUCs)通过使用阳性类别(即,各自的转移瘤类型)相对于所有其他类别的预测性能来计算。ROC曲线以各交叉验证集结果的均值进行计算、展示。在五折交叉验证下,每个随机森林分类器都由唯一的训练数据集进行训练,并使用唯一的模型外部验证数据集进行模型测试,所以平均的AUC值是对通用设置下模型分类性能的有效估计。模型的预测不稳定性(即ROC曲线的标准差)来自于10个随机抽取的5折交叉验证集结果导出。P值通过R语言(版本1.42)Mann-Whitney/Wilcoxon U统计数据计算,敏感性和特异性的置信区间(CIs)使用pROC和qwraps2包计算获得。应用Bonferroni调整控制误差增长,McNemar检验统计量用以评定敏感性差异的统计学意义,根据最小距离截断点确定灵敏度和特异性分析的分类临界值。如果您对脑影像数据处理及影像组学感兴趣,可浏览思影科技课程及服务(可添加微信号siyingyxf或18983979082咨询):第十二届脑影像机器学习班(重庆,11.11-16)
第十三届脑影像机器学习班(南京,12.13-18)
第三十一届磁共振脑影像基础班(重庆,9.14-19)
第十届磁共振脑影像结构班(重庆,11.2-7)
第十三届磁共振弥散张量成像数据处理班(南京,9.15-20)
第三十二届磁共振脑影像基础班(南京,9.21-26)
第三十三届磁共振脑影像基础班(重庆,10.11-16)
第十七届磁共振脑网络数据处理班(重庆,10.20-25)
第二届DWI提高班(南京,10.24-29)
3 结果
本文分析了189例BC(143例转移)、SCLC(151例转移)、NSCLC(225例转移)、GI癌(50例转移)或MM(89例转移)的658例脑转移MRI影像。3.1 最佳的三种模型
仅使用患者年龄和性别的临床模型,随机森林预测BC的AUCs为0.84(P < .001),SCLC为0.66(P < .05),MM为0.53(P > .05)。影像组学模型,AUCs在0.80(BC)和0.87(SCLC)之间,P值均小于0.001。临床和影像组学的综合模型,进一步改善了BC和SCLC的AUCs,显示了这些数据的互补价值,其AUCs从0.83(MM)到0.89(SCLC),所有P值均小于0.001(详情请参阅表2、表E2),SCLC的敏感性和特异性分别达到80%,BC为78%和77%,MM为76%,综合模型的预测95%的CI值,详见表3和表E3和E4。表2 不同预测集下三分类模型和五分类模型的AUCs
表3 三分类模型和五分类模型在最小距离操作点的敏感性和特异性
表E3 基于2000次Bootstrap重复的10个5折交叉验证集的三分类问题特异性的95%置信区间
表E4 基于2000次Bootstrap重复的10个5折交叉验证集的3分类问题敏感性的95%置信区间
3.2 综合的五分类模型
仅使用患者性别和年龄的临床模型,随机森林分类器获得BC的AUC为0.73(P < .01),而其他肿瘤类型的AUC与0.5无显著差异(预测准确性跟丢硬币随机猜测差不多的意思)。影像组学模型的AUC范围介于0.61(BC)和0.80(MM)之间,所有P值均小于0.05。临床结合影像组学的综合模型的AUC从0.64(NSCLC)到0.82(BC)不等,所有P值均小于0.01(表2,图4,表E5)。表3和表E6和E7显示了95%顺式结构的敏感性和特异性。
图4 ROC曲线下面积以及综合的五分类模型的最小距离截断点分析结果。A small cell lung cancer, B breast cancer, C malignant melanoma, D gastrointestinal cancer, and E non–small cell lung cancer. Red crosses = optimal minimum-distance cutoff points. sd = Standard deviation.表E5 对5类任务进行了10个5折交叉验证的ROC曲线下面积:AUC
表E6 基于2000次Bootstrap重复的10个5折交叉验证集的三分类问题特异性的95%置信区间
表E7 基于2000次Bootstrap重复的10个5折交叉验证集的3分类问题敏感性得95%置信区间
在训练过程中,根据已知的转移性肿瘤类型的先前概率调整类别权重并没有改变结果。主要还是因为训练数据的类别不平衡及随机森林算法本身对类别不平衡问题的敏感性一般较低,导致结果不理想。以上随机抽取的5折交叉验证集的分析比较,显示结果的可变性很低,表明预测性能稳定(表E2-E7)。3.3 特征重要性
本文选择了59个最重要的影像组学特征,包括:29个一阶T1加权对比增强特征(firstorder T1-weighted contrast-enhanced features)、20个T1加权对比增强纹理特征(T1-weighted contrast-enhanced texture features)和9个T1加权原生一阶特征(T1-weighted native first-order features)。利用标准差进行归一化后的平均特征值显示,MM和SCLC的特征与总平均值的偏差明显高于BC或NSCLC的特征。此外,MM转移的平均强度最高,而SCLC和GI癌转移的平均强度相对较低。NSCLC的特征表现出较低的特异性表达。3.4 放射科医生预测结果
放射科医师对BC和MM转移的预测能力最高(第一个医师在BC的预测上,特异性和敏感性分别为78%和59%,相应的,MM为91%和36%;第二个医师在BC的预测上,特异性和敏感性分别为91%和40%,相应的,MM为87%和43%),两个医师对NSCLC和GI癌的转移更难区分(第一个医师在NSCLC的预测上,特异性和敏感性分别为74%和44%,GI则为90%和12%;第二个医师在NSCLC的预测上,特异性和敏感性分别为67%和49%,GI则为88%和28%)。对于SCLC和GI,两个医师的预测比较差,可能反映了临床上视觉读数的异质性。这两个医师的假阳性预测均达到最小,从而导致高特异性/低敏感性的结果。在判断医师设定特异性时的敏感性比较分析表明,机器学习分类器对所有转移性肿瘤类型都具有较高的预测性能。然而,仅对MM(两个医师)、GI(第一个医师)和SCLC转移(第二个医师)的敏感性存在显著差异。两个医师的判断结果与分类器表现相比,MM转移的敏感性最高,分别高出分类器的17和18个百分点(P<0.05)。具体结果见表4。表4 医生视觉检查结果与机器学习结果的比较
4 讨论
本研究结果表明,对于脑转移瘤和原发灶不明的患者,脑转移瘤的MRI定量特征可以用来预测转移瘤的类型。在五分类模型中,训练数据涵盖了导致脑转移发病率的所有原发肿瘤类型的80%-90%,随机森林分类器的AUCs范围在0.64(NSCLC)和0.82(BC)之间。我们希望通过5折交叉验证法,运用不同分辨率和协议采集的MRI影像所建立的模型,能够很好的进行不同转移瘤类型的预测,但模型的预测性能仍然是比较保守的估计。通过与放射科医生的判断预测进行对比分析表明,本文所提出的分类方法对所有肿瘤类型都具有较高的敏感性,在MM、GI癌和SCLC转移方面分别观察到显著的统计学差异(分别为+17/+18、+17和+37个百分点)。因此,在临床上作为辅助决策工具时,进行肿瘤类型预测可以缩短所需的诊断步骤,并可加速原发病灶部位的识别。当只用影像组学特征进行训练时,MM和SCLC的AUC(0.80和0.74)最高,NSCLC和BC的AUC最低(0.63和0.61)。原因是NSCLC和BC特异性较低,相关组织的异质性较大,这些转移瘤的影像组学特征很难准确预测其真正类型。本文对NSCLC亚型图像特征进行聚类分析的结果与我们的研究结果一致。在非增强的T1加权成像中,由于顺磁性金属清除黑色素,MM转移瘤显示出高信号强度。此外,由于含水量较高,黏液性肿瘤(如胃肠道肿瘤)通常具有较低的T1加权信号强度。我们的热图分析也反映了这一点。放射科医生的预测结果与我们的预测相符:两位医师对具有特定形态学特征的转移瘤(如MM转移瘤为高强度黑色素)或与基本临床数据(BC与性别较为相关)有很强相关性的转移瘤都有很高的预测性能。而分类器对MM转移瘤的敏感度叫两位医师相比,提高了17和18个百分点,这表明机器学习算法可以更有效地评估定量图像特征。然而,对于NSCLC和BC转移,分类器的性能仅略高于放射科医生的判断。这也反映在仅使用影像组学模型的相对较低的AUC上,并且可能表明在底层图像特征集中这些肿瘤类型的特征分化不足。与我们研究不同的是,现有的基于影像组学的分析侧重于利用原发性肿瘤的影像组学特征进行分子、组织学和预后相关的分类,他们的AUC范围在0.65到0.90之间。这些研究大多是二分类模型,与多分类问题相比,二分类模型在本质上可以获得更高的AUC。Ortiz Ramón等人在一次会议上描述了两种继发肿瘤类型(肺癌和黑色素瘤)的二分类问题,他们使用包括50个转移瘤的30个患者的T1加权对比增强的放射影像学特征进行模型建立,最终预测模型的AUC值高达0.95。然而,他们没有出具关于控制聚类相关性的详细报告,也没有考虑到这可能严重高估了分类器的性能。(1)增加样本量将有助于进一步提高我们结果的有效性和稳定性。有限的样本量是放射学分析的普遍问题,也是缺乏标准化多中心数据库的结果。然而,对于评估转移瘤类型预测的可行性和局限性,本文所建立的随机森林分类器具有足够的稳健性。(2)由于超出当前研究范围,本文没有将原发性脑肿瘤纳入分析,尽管这肯定是未来研究的一个热点话题。转移和原发性脑肿瘤的鉴别诊断可能很困难。通常情况下,外周位置,球形,环形增强伴明显的肿瘤周围水肿和多处病变提示转移性疾病。脑膜瘤通常可以通过特殊的形态学特征来鉴别,而恶性胶质瘤和淋巴瘤具有相似的影像学特征。基于影像学的鉴别诊断方法已有相关报道:韦伯等人论证了perfusion MRI影像组学特征的预测价值,卢和他的同事则使用了动态增强磁共振成像进行肿瘤鉴别。然而,基于影像组学的方法尚未得到详细的研究。(3)本研究仅纳入了包含所有脑转移80%–90%的转移性肿瘤。由于预测性能的本质取决于不同类别的数量,因此整合额外的病变类型可能会降低模型的AUC值。因此,在临床应用中,必须权衡敏感性或者特异性的降低范围,来决定模型的最大类别。(4)本研究派出了低分辨率图像,以确保对较小病变进行有意义的纹理分析。如果包含低分辨率图像,模型的预测性能可能会降低,因为纹理特征实质上有助于增强模型的预测能力。(5)半自动ROI分割,意味着整个机器学习过程仍然在一定程度上依赖观察者。为了尽量减少这种依赖,本文使用一致性较高的ROI影像组学特征进行分析。研究还表明,在分割差异方面,影像组学特征是相对稳定的。为了解决以上局限性,如美国国立卫生研究院等机构正努力建立生物标志物标准化计划和定量成像网络。未来的研究可能会利用这些标准化的高分辨率图像,结合其他成像序列的影像组学特征及临床信息,探索基于影像组学的全部诊断潜力。同时,还需要进一步努力建立将肿瘤表型与特定图像特征标记相关的标准化数据库。一旦建立,这样的数据库就可以促进临床认可度,也可以作为基于影像组学标准化诊断以及将这些技术引入日常临床工作的基础。如需原文及补充材料请加思影科技微信:siyingyxf 或者18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。觉得对您的研究有帮助,请给个转发,以及右下角点击一下在看,是对思影科技莫大的支持。
微信扫码或者长按选择识别关注思影
非常感谢转发支持与推荐
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf或18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):
第十二届脑影像机器学习班(重庆,11.11-16)
第三十一届磁共振脑影像基础班(重庆,9.14-19)
第十四届DTI数据处理班(重庆,11.19-24)
第十届磁共振脑影像结构班(重庆,11.2-7)
第三十三届磁共振脑影像基础班(重庆,10.11-16)
第十七届磁共振脑网络数据处理班(重庆,10.20-25)
第十三届DTI数据处理班(南京,9.15-20)
第三十二届磁共振脑影像基础班(南京,9.21-26)
第六届任务态fMRI专题班(南京,10.16-21)
第二届DWI提高班(南京,10.24-29)
第七届磁共振ASL数据处理班(南京,10.12-15)
第十八届磁共振脑网络数据处理班(南京,11.6-11)
第三十四届磁共振脑影像基础班(南京,10.30-11.4)
第七届小动物脑影像数据处理班(南京,12.20-25)
第十三届脑影像机器学习班(南京,12.13-18)
第九届脑电数据处理入门班(重庆,9.22-27)
第二十三届脑电数据处理中级班(重庆,12.16-21)
第二十二届脑电数据处理中级班(南京,11.12-17)
第十届脑电数据处理入门班(南京,12.1-6)
第八届眼动数据处理班(重庆,10.26-30)
第十届近红外脑功能数据处理班(重庆,12.23-28)
第九届近红外脑功能数据处理班(上海,11.24-29)
此处点击在看,让更多朋友关注思影