同济大学研究团队:基于人工智能的肺癌NOG/PDX模型驱动基因匹配预测 | Engineering
肺癌是人类癌症死亡的原因之一,全球每年有超过100万人死于肺癌。大约 85%的肺癌为非小细胞肺癌(NSCLC),小细胞肺癌(SCLC)占肺癌的15% 。随着驱动基因的引入和分子检测技术的进步,肺癌患者基于化疗的治疗模式发生了转变,尤其是对于表皮生长因子受体(EGFR)基因突变和间变性大细胞淋巴瘤激酶(ALK)基因重排的患者。然而靶向治疗面临一系列困难,包括不同的个体反应和频繁的获得性耐药。免疫检查点抑制剂(ICI)被推荐用于肺癌患者。然而,只有大约20%的肺癌患者对免疫治疗有反应。因此,确定肺癌患者的耐药机制具有重要意义。
同济大学杨洋研究团队在中国工程院院刊《Engineering》2022年8月刊发表了题目为《基于人工智能的肺癌NOG/PDX模型驱动基因匹配预测》的研究性文章,建立了53例肺癌患者的患者源性肿瘤异种移植物(PDX)模型,基因型匹配率为79.2%(42/53)。文章检查了17个临床病理学特征,并基于最低赤池信息量准则(AIC)、最小绝对收缩和选择算子(LASSO)-逻辑回归(LR)、支持向量机(SVM)递归特征消除(SVM-RFE)、极端梯度增强(XGBoost)、梯度增强和分类特征(CatBoost),以及合成少数过采样技术(SMOTE)输入逐步逻辑回归模型。最后,文章通过100个试验组的准确度、受试者工作特征曲线下面积(AUC)和F1评分评价所有模型的性能。两个多变量LR模型显示,年龄、驱动基因突变的数量、表皮生长因子受体(EGFR)基因突变、既往化疗的类型、既往酪氨酸激酶抑制剂(TKI)治疗和样本来源是强有力的预测因素。此外,CatBoost(平均精度= 0.960;平均AUC= 0.939;平均F1分数= 0.908)和八特征SVM-RFE(平均精度= 0.950;平均 AUC= 0.934;平均F1分数= 0.903)在算法中表现出最好的性能。同时,除CatBoost外,SMOTE的应用提高了大多数模型的预测能力。基于SMOTE,单一模型的集成分类器达到了最高的准确度(平均值= 0.975)、AUC(平均值= 0.949)和F1评分(平均值= 0.938)。总之,文章建立了一个最佳预测模型来筛选肺癌患者的NOD/Shi-scid白细胞介素-2受体(IL-2R)γnull(NOG)/PDX模型,并为建立预测模型提供了一种通用方法。
值得注意的是,文章仍存在一些局限性:首先,纳入研究的患者数量有限,应开展更大规模的实验来进一步验证这些结论。其次,由于训练数据有限,该模型的预测结果不能准确到每个驱动基因突变。第三,EGFR突变状态既是自变量,也是结果,可能引起共线性。最后,潜在的选择偏倚是不可避免的,这项研究的性别比是不均匀的。应进行更大规模的试验来进一步验证这些结论。
文章建立了基于机器学习(ML)的NOG/PDX模型与患者样本驱动基因突变不一致性的预测模型,有望提高PDX建立的成功率,减少巨大的经济损失。尽管NOG小鼠没有得到很好的研究,但文章中使用的NOG小鼠被认为是构建癌症免疫治疗PDX模型的极好选择,因此文章建立的模型具有免疫治疗筛选和开发的潜力。
关键词:
机器学习 ; 患者源性肿瘤异种移植物 ; NOG小鼠
以上内容来自:Yayi He, Haoyue Guo, Li Diao, Yu Chen, Junjie Zhu, Hiran C. Fernando, Diego Gonzalez Rivas, Hui Qi, Chunlei Dai, Xuzhen Tang, Jun Zhu, Jiawei Dai, Kan He, Dan Chan, Yang Yang. Prediction of Driver Gene Matching in Lung Cancer NOG/PDX Models Based on Artificial Intelligence [J]. Engineering, 2022, 15(8): 102-114.
扫二维码 | 查看原文
原文链接:http://www.engineering.org.cn/ch/10.1016/j.eng.2021.06.017