文献解读 | 超大队列的肝细胞癌分化术前评估的深度学习放射组学模型
肝细胞癌
肝细胞癌(HCC)是最常见的恶性肿瘤之一,其发病率和死亡率分别居世界第7位和第3位[1]。目前,手术仍是主要的根治性治疗方法[2-3]。肿瘤分化的评估是一个紧迫的临床问题,有助于建立个体化治疗策略。因此,术前预测HCC病理分级对于改善HCC的预后分类是十分必要的。最近,多团队合作开发了一个基于计算机断层扫描 (CT) 数据的深度学习放射组学模型,用于肝细胞癌 (HCC) 分化的术前评估(低与高级)并初步探讨了放射组学模型的生物学基础。该研究成果发表在Clinical and Translational Medicine, 题目为 Novel deep learning radiomics model for preoperative evaluation of hepatocellular carcinoma differentiation based on computed tomography data 。
深度学习放射组学模型选择包含与肿瘤分化相关的丰富的生物学信息特征,经过开发和验证,在高级别和低级别 HCC 的术前区分中具有最佳性能,明显优于个体影像组学模型或深度学习模型,该模型可以作为预测HCC分化的无创工具,也是首次通过放射组学特征和生物多组学变量之间的相关性初步解释HCC分化的放射组学预测模型的研究。
实验设计
实验结果
1
队列和放射组学特征
该研究包括1234名HCC患者,其中1047名患者通过按 3:1 的比例分层抽样分为培训和内部验证队列,而其余187名患者构成独立测试队列。三个队列之间的临床特征分布没有显著差异。放射组学流程(图 1)主要涉及 CT 图像的数据采集、目标区域的分割、特征提取和选择、模型构建和评估以及多组学分析。从 CT 图像数据中总共提取了 707 个放射组学特征;但因为可重复性低或高冗余而过滤掉了其中的614个,最终选择了 25 个对目标有显著影响的特征。使用随机森林(RF)方法建立放射组学特征。3 个队列的放射组学特征,即训练组、内部验证组和外部测试组的 AUC 分别为 0.82、0.76 和 0.75。选定特征的小提琴图如图 3A 所示。训练组、验证组和测试组中放射组学特征的准确度分别为 0.75、0.72 和 0.66;灵敏度分别为 0.76、0.70 和 0.74;特异性分别为 0.72、0.75 和 0.54。
图1. 放射组学模块管线
2
深度学习模型
深度学习模型(图2)在训练、内部验证和测试队列中的 AUC 分别为 0.85、0.81 和 0.75。该模型的准确度分别为 0.77、0.75 和 0.66;灵敏度分别为 0.76、0.81 和 0.62;在 3 个队列中,特异性分别为 0.66、0.66 和 0.72。在深度学习模型与放射组学特征的比较中,来自 DeLong 测试的 P 值在训练、验证和测试队列中分别为 0.09、0.17 和 0.62。深度学习模型和放射组学特征之间没有显著差异,但前者的 AUC 略高。
图2. 深度学习架构示意图和中分化(上)和低分化(下)情况的中间层输出拼接图示
3
融合模型(FM)
在将临床模型、放射组学特征和深度学习模型的预测概率可视化后,我们发现这 3 个预测因子对不同病理等级的组显示出良好的区分能力(图 3B)。在训练后的逻辑回归公式中,临床模型、放射组学特征和深度学习模型的预测分数乘以各自的权重系数并求和。应用于 3 个队列的融合模型的 ROC 曲线如图 3C 所示。DeLong 检验的结果表明,融合模型的 AUC 比基础模型的 AUC 有显著提高。
注释: CM,临床模型;DL,深度学习模型;FM,融合模型;RS,放射组学特征。
图3. 肝细胞癌(HCC)术前病理分级深度学习放射组学模型的构建与评价
4
模型评估
临床模型、放射组学特征、深度学习模型和融合模型之间比较的定量指标以及 DeLong 测试的结果总结如表1 。
表1. 应用于三个队列的临床模型、放射组学特征、深度学习模型和融合模型的定量指标比较
融合模型在训练、验证和测试队列中表现出最佳性能, AUC 分别为 0.89、0.83 和 0.80;精度分别为 0.82、0.77 和 0.73;灵敏度分别为 0.85、0.81 和 0.71;特异性分别为 0.76、0.71 和 0.75;PPV 分别为 0.84、0.80 和 0.79;NPV 分别为 0.78、0.73 和 0.66;F1 得分分别为 0.77、0.72 和 0.71。校准曲线表明,与其他模型相比,融合模型在预测概率和实际概率之间具有更好的一致性(图3D)。比较测试集中4个模型的决策曲线后结果表明融合模型具有更大的临床效用(图3E),IDI表明融合模型的预测概率与其他模型相比显著提高。基于融合模型建立了术前预测HCC病理分级的列线图(图3F)。图4. 多组学分析结果
5
多组学分析
共有 69 名具有 CT 图像数据的患者被纳入多组学分析。数据预处理后,提取了 19723 个基因组学、42807 个转录组学和 3658 个蛋白质组学变量,在高级别和低级别 HCC 之间存在差异表达(有效数据 > 80%)。放射组学特征和多组学变量之间的 Pearson 相关系数显示在相关热图中(图 4A)。所选放射组学特征重建了 65.54%、64.65% 和 72.69% 的差异表达基因、转录本和蛋白质(图 4B)。仅具有 15 个放射组学特征的每种类型组学的覆盖率为 60%。放射组学相关的多组学变量显示不同病理等级(高与低等级)之间存在显著差异(图 4C)。
25 个放射组学特征的基因富集分析结果总结在图 4D。在 wavelet_LL_first-order_entropy 的富集结果中,确定了 21 个 GO 类目和通路,它们可能与 HCC 发展有关。例如,wavelet_LL_first-order_entropy 与酒精脱氢酶活性异常相关,会导致异常发育和细胞凋亡。与 original_shape2D_sphericity 相关的关键基因与磷脂酰肌醇 3-激酶 (PI3K)/蛋白激酶 B (AKT) 信号通路有关(图 4F),该信号通路参与细胞凋亡、癌细胞增殖、DNA 修复和癌症分化等生物学过程。
总之,这个可用于 HCC 术前病理分级的深度学习放射组学模型在现实世界的数据集中表现出出色的性能,可以作为一种无创预测工具来指导临床决策和预后分层。
参考文献
[1] Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, Jemal A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin 2018;68(6):394-424.
[2] Zhou J, Sun HC, Wang Z, Cong WM, Wang JH, Zeng MS, et al. Guidelines for diagnosis and treatment of primary liver cancer in China (2017 Edition). Liver Cancer 2018;7(3):235-60.
[3] Heimbach JK, Kulik LM, Finn RS, Sirlin CB, Abecassis MM, Roberts LR, et al. AASLD guidelines for the treatment of hepatocellular carcinoma. Hepatology 2018;67(1):358-80.
原文链接:DOI: 10.1002/ctm2.570
撰文:陈善军
审核:钱丽琴
推荐阅读
关于西湖欧米
专注于生物技术攻关与辅助临床诊断与治疗的创新型生物科技公司。针对与生命健康有关的核心问题,西湖欧米致力于以技术创新为驱动力、以多模态大数据为基础,使用 AI 赋能微量临床组织的高通量蛋白质组分析等组学技术辅助精准医学和药物研发。
西湖欧米公众号
西湖欧米官网