查看原文
其他

科研 | 福建医科大学:基于多组学的人工智能建模技术在炎症性肠病无创诊断中的应用(国人佳作)

微科盟草重木雪 代谢组metabolome 2022-09-22

点击蓝字↑↑↑“微科享”,轻松关注不迷路

编译:微科盟草重木雪,编辑:微科盟Tracy、江舜尧。

微科盟原创微文,欢迎转发转载。

导读

炎症性肠病(IBD)是一种难以诊断和分类的疾病。本研究的目的是建立基于粪便多组学数据的人工智能模型,用于IBD及其亚型的多分类诊断。本研究共纳入299项临床队列研究,其中健康者86例,CD患者140例,UC患者73例。基于分层建模的思想,我们分别对总体和自我评价非常好和略低于par的群体进行建模。原始的总特征为粪便多组学数据,包括宏基因组学、宏转录组学、蛋白质组学、代谢组学、病毒组学、粪便钙卫蛋白,我们采用重要性、共线性等特征工程方法对特征进行评价,最后,得到了3个特征较少、准确率较高的个性化诊断模型。首先,我们筛选111个特征构成总体的最优特征集,建立了AUC为0.83的三分类个体诊断模型,该模型可同时诊断健康、CD和UC。其次,根据总体的层次模型,我们建立了两种不同自我评价的总体模型。对于非常好的人群,我们筛选了59个特征,建立了AUC为0.85的三分类诊断模型。对于略低于par的自我评价人群,我们最终纳入22个特征,建立AUC为0.84的三分类诊断模型。最优特征集仅包含代谢组学和元转录组学特征。本研究为IBD患者的高准确性、无创诊断和亚型识别提供了一种有价值的方法。研究者可以根据患者的不同自我评价在不同的模型中选择生物标志物。简单的无创粪便取样可用于检测代谢组学和元转录组学数据,从而替代临床冗长而痛苦的结肠镜检查和活检程序。


论文ID


原名:Application of Artificial Intelligence Modeling Technology Based on Multi-Omics in Noninvasive Diagnosis of Inflammatory Bowel Disease译名:基于多组学的人工智能建模技术在炎症性肠病无创诊断中的应用
期刊:Journal of Inflammation Research
IF:4.953发表时间:2021.05通讯作者:胡志远
通讯作者单位:福建医科大学基础医学院

实验设计



实验结果


模型1包含的所有样本同时用于6个组学的分析。该模型的特征工程过程共包括144个样本(69人)。144个样本按3:1的比例随机分为训练集(100个样本)和测试集(44个样本),然后将训练集按照4:1的比例分为训练样本(75个)和验证集(25个样本)。首先,我们将所有特征输入特征工程筛选。所有特征均经过RFECV滤波三次,步长分别为0.01、3、1。我们将累积重要度阈值设为1,剔除所有贡献度为0的特征,得到355个特征,然后通过共线性对355个特征进行过滤,剔除所有共线性大于0.9的特征,剩下111个特征(由96个代谢物和15个转录子组成)。通过这两个筛选步骤,我们成功地过滤掉了对子类型识别最重要的非冗余特征。剩余的噪声特征不参与最终的模型预测。我们使用这111个特征在所有数据集中进行测试;训练集、验证集和测试集之间不使用交叉验证。testB包含155个样本(76人),样本数量为非IBD: UC: CD =38:41:76(人数=18:20:38)。综上所述,该模型共包含299个样本用于预测,其中非IBD: UC: CD样本比例为86:73:140(人数=26:28:46)。为了进一步检验降维后特征的优势,我们将相同数量未降维的随机111个特征(精度=0.5678;AUC=0.7314)(图1G-I)和所有特征(精度=0.5779;AUC=0.6885)(图1J-L)进行对比,来确定最优的111个特征的预测性能(Accuracy=0.6683;AUC=0.8280)(图1D-F)。结果表明,虽然未降维的原始特征数量远远超过111个,但模型的预测性能远远低于最优的111个特征。这说明原始特征中含有大量的噪声,干扰甚至误导了模型的预测。111随机特征的可预测性也远低于最佳的111个特征。 

图1 模型1建模的关键信息及结果
在重要度筛选过程中,第三次重要度筛选得到的特征(左)与重要度评分最高的20个特征(右)的累积重要度评分(A)。共线性筛选得到的111个特征之间的相关性,111个特征,包括15个转录子和96个代谢物(B)。111个特征在299个样本中的表达。样本按非IBD、UC、CD的顺序排列,特征之间的距离采用Canberra距离计算,聚类方法采用完全链接(C)。利用最优的111个特征建模,最优111个特征的混淆矩阵(E)。最优111个特征的AUC评分(F)。使用随机111个特征建模,随机111个特征的混淆矩阵(H)。随机111个特征的AUC评分(I)。使用所有特征建模,所有特征的混淆矩阵(K),所有特征的AUC评分(L)。 为了改进建模结果(包括1、减少功能的数量和2、提高预测的准确性),我们根据IBD患者的自我评价对样本进行分层。我们丢弃了较差以及十分糟糕的少量样本。通过评估组学的最大数量和可以包含的样本数量,我们最终包含了6个组学,并为自我评价非常好和略低于平均水平的人建立了两个分层模型。从人口统计学的角度来看,在性别和诊断比率方面,“非常好”和“略低于平均水平”的人群之间几乎没有差别。我们评估了肛裂、脓肿、腹痛、24小时内液体或极软便数、关节痛、hbi、关节痛、白天排便次数、排便急迫、大便带血、sccai等11项指标。基本上,所有指标都显示,自我评价为“非常好”的人的症状比那些“略低于平均水平”的人更温和、更稳定。我们采用基于患者自我评价的样本分层方法,通过对采样期间的证候的评价来确定其疾病活动度,从而将混杂数据细分为2层。这两层样本可以覆盖总样本的90.97%,足以代表混合样本本身。我们可以看出,自我评价略低于平均水平的人比自我评价非常好的人有明显更多的活动性疾病状态(补充表s1)。因此,通过分层建模得到的生物标记物更符合该层所包含样本的特征,我们对噪声特征进行过滤和删除,以较少的特征获得更好的预测结果。在自我评价很好的人群中,第二个模型预测的样本总数为207个(83人),非IBD: UC: CD样本比为86:39:82(26:19:38人)。其中,参与特征工程降维的数据集包括107个样本。我们按照3:1的比例得到测试集33个样本,剩余的样本按4:1的比例分为训练集55个样本和验证集19个样本。训练集、验证集和测试集之间不使用交叉验证。testB包含100个样本(59人),样本数量为非IBD: UC: CD =38:18:44(人数=18:14:27)。与模型1类似,我们使用所有特征作为特征工程筛选的输入。所有特征首先由RFECV进行两次筛选,步长分别为0.03和4。我们设置累积重要度阈值为0.999,去除低贡献特征,得到164个特征。然后,我们通过共线性过滤164个特征,去掉所有共线性大于0.9的特征,剩下64个特征。最后调整为5,再次进行RFECV筛选,最终得到59个特征(图2A)。这59个特征包括5个转录子和54个代谢物(图2C),它们参与了预测模型的构建。我们发现分层建模不仅大大减少了特征的数量,而且获得了更好的预测性能,特别是AUC。分层后建模得到的最优59个特征比分层前的111个特征减少了近1/2。我们再一次比较了59个最优特征的性能预测性能(精度=0.7068;AUC=0.8503)(图2D F,补充图s2B-E),具有相同数量的随机59个特征(精度=0.5263;AUC=0.6895)(图2G I)和未降维的所有特征(精度=0.5489;AUC = 0.6292)。结果表明,最优59个特征在大大减少特征数量的同时,不仅比未降维的原始特征具有更好的预测效果,而且优于非层次模型得到的最优111个特征(精度=0.6683;AUC = 0.8280),而随机59个特征的预测性能最差。在自我评价略低于平均水平的人群中,第三个模型预测共151个样本(69人),非IBD: UC: CD样本的比例为86:29:36(26:17:26人),参与特征工程降维的数据集包括77个样本(45人)。将数据集按照与上述两个模型完全相同的方式进行分割,得到训练集(39个样本)、验证集(14个样本)和测试集(24个样本)。同样,这个模型没有使用交叉验证。testB包含74个样本(46人),样本数量为非IBD: UC: CD = 38:18:18(人数= 20:9:14)。在模型3中,所有特征只被RFECV过滤一次,步长为0.66。我们将累积重要性阈值设为1,并去除贡献为0的特征。之后,我们删除了所有共线性大于0.9的特征,留下22个特征(图3B),包括3个转录子和19个代谢物(图3C),他们共同参与了预测模型的构建。与非层次模型相比,我们使用更少的特征来构建更好的预测模型,并且模型的精度是三种模型中最好的。我们通过对所有自我评估稍差(略低于标准杆)的IBD患者样本进行建模而获得的最佳22个特征为基础,这三个模型中的准确率最高。同样,我们比较了22个最优特征(精度=0.7245;AUC=0.8355)(图3D-F,补充图s3BE)与相同数量的随机22个(精度=0.4592;AUC=0.5866)(图3G I)特征和未降维的所有特征(精度=0.5306;AUC = 0.6148)。根据具体标签对整体样本进行分层得到的最优预测结果,第二次验证了分层建模方法的可行性和优越性。该模型在大大减少特征数目的同时,也提高了识别的正确率和AUC。 

图2 模型2建模的关键信息及结果
在重要度筛选过程中,第三次重要度筛选得到的特征(左)与重要度评分最高的20个特征(右)的累积重要度评分(A)。共线性筛选得到的59个特征之间的相关性,59个特征,包括5个转录子和54个代谢物(B)。59个特征在207个样本中表达。样本按非IBD、UC、CD的顺序排列,特征之间的距离采用Canberra距离计算,聚类方法采用完全链接(C)。利用最优59个特征建模,最优59个特征的混淆矩阵(E)。最优59个特征的AUC评分(F)。使用随机59个特征建模,随机59个特征的混淆矩阵(H)。随机59个特征的AUC评分(I)。使用所有特征建模,所有特征的混淆矩阵(K),所有特征的AUC评分(L)。 建模结果证明了样品分层建模方法的优越性。如预期所示,与混合样本(模型1)相比,样本分层方法使用的特征较少,预测效果更好。我们仅使用59个特征在自我评价非常好群体的测试集中获得0.8503的AUC(模型2),而仅使用22个特征在自我评价略低于par群体的测试集中获得0.8355的AUC(模型3)。Franzosa等人做了类似的工作,他们的研究使用随机森林分类器对非IBD、UC和CD进行分类,训练集的准确率为65.16%(155个样本),验证集的准确率为76.92%(65个样本)。我们后采用随机森林方法对构建的3个模型的111/59/22特征进行检验,预测准确率分别为69.35%、64.66%和64.29%。三种模型中使用相同的生物标志物,随机森林分类器得到的预测精度低于人工神经网络得到的结果。在111个特征中,一个名为亚甲基四氢叶酸还原酶(1.5.1.20: Methylenetetrahydrofolate reductase(NAD(P)H))的转录子可能与IBD有关。其突变体677T导致同型半胱氨酸的积累,这可能会增加IBD患者血栓形成的风险。肽脱甲酰基酶(3.5.1.88:肽脱甲酰基酶|g__Parabacteroides.s__Parabacteroides_merdae)是一类金属酶,负责催化翻译后n -末端蛋氨酸中n -甲酰基的去除。它在细菌合成蛋白质的过程中起着关键作用,但正常的人类细胞并不需要合成蛋白质。因此,PDF是少数抗菌靶点之一。它与IBD的关系需要进一步的实验来分析。为了进一步探索非IBD、UC和CD中生物标志物之间的潜在联系,我们采用Wilcoxon秩和检验进行差异分析。1-脱氧-d-木酮糖-5-磷酸还原异构酶(1.1.1.267:1-脱氧-d-木酮糖-5-磷酸还原异构酶|g__Parabacteroides.s__Parabacteroides_distasonis)是2-c-甲基-d-赤藓糖醇-4-磷酸(MEP)途径中的第二个关键限速酶。MEP途径是致病微生物合成萜类化合物的重要途径。因此,它也被用作筛选抗生素的重要靶点。我们发现UC (log2FC=1.52, p=0.0006)和CD(log2FC=0.7703, p=0.4311)相对于非IBD有上调的趋势,但CD (log2FC= 0.7497, p= 0.0021)的表达水平与UC相比显著降低,这说明UC和CD都存在不同程度的肠道菌群MEP途径代谢紊乱,影响了肠道菌群的正常生理功能。富马酸水合酶(FH)异常(4.2.1.2:富马酸水合酶| g__Faecalibacterium .s__Faecalibacterum_prausnitzii)可导致癌症,代谢失调不仅是致癌转化的结果,也是致癌的驱动因素。差异分析结果显示,CD FH表达相对于UC (log2FC= 1.0173, p =0.0007)和非IBD (log2FC= 0.4424, p =0.0104)显著下调,而UC (log2FC=0.5749, p =0.2580)相对于非IBD有轻微上调的趋势。FAD合成酶(2.7.7.2:FAD合成酶| g__Clostridium.s__Clostridium_leptum)负责FAD的合成。FAD参与生物体的关键代谢过程,肠道细菌中FAD的缺乏会导致宿主肠道细胞中FAD的缺乏和相关酶功能的降低;FAD也参与许多功能的执行;FAD是最强的自由基清除剂,谷胱甘肽(GSH)是细胞最重要的抗氧化屏障;FAD还可以将同型半胱氨酸转化为S-腺苷甲硫氨酸(SAM),从而避免同型半胱氨酸的积累;FAD的紊乱可能导致患者肠道细胞线粒体功能下降,DNA损伤后修复能力下降,肠细胞的大量死亡与局部肠溃疡和炎症的形成有关。与非IBD组相比,UC组(log2FC= 1.6483, p =0.0841)和CD组FAD酶明显降低,尤其是CD组(log2FC= 0.6701, p =0.0035),暗示CD组肠道代谢紊乱和肠道屏障损伤更为严重。在模型2中获得的59个特征中,5个元转录本中的4个在组间有显著差异。研究表明,部分抑制DNA合成刺激无机二磷酸酶的生产。值得注意的是,与以往的研究结果一致,我们发现与非IBD相比,UC和CD中DNA解旋酶显著下调(3.6.4.12:DNA解旋酶|g__Ruminococcus.s__Ruminococcus_lactaris) (log2FC= 0.5214,p=0.0198) (log2FC= 0.4085, p=0.0410),伴随着无机二磷酸酶的显著上调(3.6.1.1:无机二磷酸酶|g__Lachnospiraceae_noname.s__Lachnospiraceae_bacterium_7_1_58FAA) (log2FC=3.7212, p=0.0665)(log2FC=1.8134, p=0.0143),这一现象与IBD之间的潜在联系值得进一步研究。磷酸烯醇式丙酮酸羧激酶(PC)(4.1.1.49:磷酸烯醇式丙酮酸羧激酶(ATP)|g__Odoribacter.s__Odoribacter_splanchnicus)调节代谢适应,实现非糖依赖肿瘤生长,与非IBD相比,CD的表达水平显著上调(log2FC=0.7869, p=0.5727),UC(log2FC=1.8889, p=0.0007)。相比之下,UC的PC与非IBD相比显著下调(log2FC= 1.1021, p=0.0008),这可能暗示UC的保护机制具有一定的代偿功能。 

图3 模型3建模的关键信息及结果
在重要度筛选过程中,重要度筛选得到的特征(左)与重要度评分最高的20个特征(右)的累积重要度评分(A)。共线性筛选得到的22个特征之间的相关性,22个特征,包括3个转录子和19个代谢物(B)。样本按非IBD、UC、CD的顺序排列,特征之间的距离采用Canberra距离计算,聚类方法采用完全链接(C)。利用最优的22个特征建模,最优22个特征的混淆矩阵(E)。最优22个特征的AUC评分(F)。使用随机22个特征建模,随机22个特征的混淆矩阵(H)。随机22个特征的AUC评分(I)。使用所有特征建模,所有特征的混淆矩阵(K),所有特征的AUC评分(L)。 当我们在非IBD,UC和CD三组中寻找显著不同的标志物时,有趣的是,我们发现它们基本上都是代谢物。最显著的差异都是未知化合物,这强调了需要进一步的化合物注释工作,并进一步确定这些化合物在IBD中的重要性。我们为后续研发提供丰富的候选信息,包括m/z和保留时间(RT)信息。在111个特征中,差异最大的特征包括C18n_QI6575 (m/z = 386.2704, RT = 15.34 min)和HILn_QI3222(m/z为460.2348,RT为6.59 min)。与非IBD相比,C18n_QI6575 (log2FC=12.963, p=3.15E-22)(log2FC=11.6072, p=2.08E-11)和HILn_QI3222 (log2FC=8.9885, p=8.43E-19)(log2FC=8.2486, p=2.60E- 06)在UC和CD中的表达均显著上调,而相对于UC, CD中的表达均下调(log2FC= 1.3558, p=3.94E-08) (log2FC= 0.7399,p=4.60E-07)。通过模型2获得的59个特征中,差异最大的C18n_QI382(m / z = 123.0076,RT = 1.58 min)以及模型3中差异最大的C18n_QI3056(m / z = 273.0519,RT = 0.75 min),与111个特征之间最大差异的两个标记的表达模式显示出惊人的相似性。总体差异最大的特征是UC明显增加(log2FC = 3.9564,p = 4.84E-11)(log2FC = 7.8504,p = 3.32E-10)和CD(log2FC = 2.8606,p = 5.50E-12)(log2FC = 7.2542, p = 0.0002),而CD的上调受到抑制(log2FC = -1.0958,p = 0.0009)(log2FC = -0.5963,p = 0.0100)。这说明UC和CD的代谢生理紊乱,CD可能存在一定的代偿机制,可在一定程度上抑制这种紊乱。我们建立的IBD诊断和亚型识别的人工智能模型是适用的。首先,根据万能近似定理,人工神经网络可以无限逼近目标函数。虽然模型类似于黑盒,但我们仍然可以通过特征的重要性权重和组间的相对表达丰度来尝试解释特征与模型交互的机制。其次,从应用角度来看,本模型具有重要的临床应用价值。首先,收集患者粪便样本进行代谢组学和转录组学检测。我们可以获得3种不同的最佳生物标志物组合的个体表达谱,包括细菌转录本的丰度和代谢相关信息,如质量电荷比(m/z)和保留时间。根据患者不同的自我评价状态,我们可以选择最优模型进行进一步的预测。我们开发的方法是高度准确和无创的,缺点是成本高。在未来的研究中,我们可以考虑设计特异性的靶向引物,直接检测模型中包含的转录子生物标志物。随着测序分析技术的发展,代谢物被注释,标准产品可以靶向检测,我们可以直接靶向代谢物(而不是组学),进一步降低成本。基于以上考虑,我们的方法可以直接检测粪便样本中待检测的生物标志物,用于IBD的诊断和亚型鉴定,而不是临床复杂痛苦的结肠镜检查和活检过程。综上所述,我们采用分层的方法来提高IBD及其亚型的人工智能建模精度。我们从6组学中筛选出了最重要的特征,这些特征都直接来源于粪便样本,直接与肠道状态相关。有趣的是,三种模型筛选的生物标志物同时只包括代谢物和转录子,说明IBD亚型与这两组学的关系最为密切。通过宏转录组的特征,我们还可以追溯元转录子来自于哪些细菌,这可能揭示宿主与其肠道微生物之间的潜在联系,为后续研究提供重要价值。另外,在这个模型中,自我评价差的人数太少(包括poor, very poor和terrible),我们建模的样本没有涵盖这部分人群。此外,人工神经网络建模得到的模型1精度不够高,没有使用其他分类器建模。最后,我们获得的许多生物标记物都是未知的,这需要进一步的研究来识别和分类这些有价值的代谢物。

结论


在本研究中,我们利用无创数据建立人工智能模型用于IBD诊断。我们总共包含了6个组学特征的表达谱。为了准确分层目标人群,我们对不同自我评价的患者实施了特征工程和深度学习建模。通过样本分层建模,减少了特征数,提高了诊断准确率。模型可包含90.97%的个体总数。与非IBD组相比,溃疡性结肠炎(UC)和克罗恩病(CD)患者中许多选定的特征生物标志物表达上调,且其在CD中的表达水平较UC有一定程度的抑制,这可能暗示了CD组存在代偿作用。此外,本研究构建的模型可以应用于临床。根据患者不同的自我评价状态,选择不同模型中的生物标志物进行预测。我们开发的方法仅通过收集粪便样本就可以诊断和分型IBD,准确率高,无创,无需临床复杂痛苦的结肠镜检查和活检。


原文链接:  
https://pubmed.ncbi.nlm.nih.gov/34017190/

----------微科盟更多推荐---------- 


   免费生信作图平台——生科云




长按左侧二维码 

进入生科云

生科云所有分析工具可以免费使用,不收取任何直接或间接费用;您还可以在微信上联系微生态老师,随时获取免费的指导,帮助您解决分析时遇到的问题;专业的生信分析团队,持续添加、更新、优化生信云上的分析工具,集成多种生信分析流程,一键批量生成主流科研图,帮您节省时间,有更多的时间探究生物学意义。


----------微科盟精彩文章----------
 


综述 | Circulation:心脏再生——丙二酸修复受损的心脏

科研 | Embo.j :HSP70分子伴侣HSPA1在新生和新合成蛋白质质量控制中的双重作用(国人佳作)

   

如果需要原文pdf,请扫描文末二维码,加助理获取





微科享期待与您交流更多代谢组学问题

(联系代谢组学老师即可申请入群)

请关注下列二维码

了解更多代谢组学知识


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存