查看原文
其他

客户文章 | 蛋白组学研究揭示新冠患者长阳机制

西湖欧米wOmics 西湖欧米 2022-11-18

图1 文章标题

2022年7月25日,由西湖大学郭天南团队、西湖欧米、温州医科大学黄建平团队、迪安诊断孔子青团队等单位共同参与研究的一篇名为Enhanced inflammation and suppressed adaptive immunity in COVID-19 with prolonged RNA shedding的文章发表于Cell Discovery(IF=38.079)上,西湖欧米生信团队深入参与此项研究,负责多组学数据整合及模型建立预测的工作,西湖欧米数据总监葛伟刚是文章的共同一作。此项目为西湖欧米的第一个研究性项目,意义重大,团队耗时两年,在此研究期间对算法和模型进行数十次优化,最终该项目研究成果发表见刊。本研究从时间角度纵向深度分析了新冠患者的血清蛋白质组和代谢组特征,发现新冠病毒RNA长时间脱落与肝脏X受体/视黄素X受体(LXR/RXR)通路抑制、多种代谢物大幅抑制、补体系统激活、细胞迁移抑制和病毒复制增强有关。此外,研究还建立了一个10个分子组成的(9种蛋白质和精氨酸)模型,可以预测病毒RNA的脱落时间。本文为纵向研究COVID-19的宿主反应提供了丰富的数据资源,并且还为病毒RNA阳性持续时间较长的COVID-19患者提出了潜在的诊断和可能的治疗策略。

实验样本

(1)取样来源:38名COVID-19患者(包含36例普通病例+2例重症)和35名非COVID-19患者;

(2)样本类型:血清,痰拭子,全血样本;

  •  痰拭子:38例COVID-19患者16周的298份痰拭子样本,和35名非COVID-19患者的70份痰拭子样本用于核酸检测;

  • 血清:190份血清样本用于SARS-CoV-2特异性抗体的免疫学检测;217份血清样本用于蛋白质组学分析,193份血清样本用于代谢组学分析;

  • 全血:43份新鲜的全血样品用于的免疫细胞计数;

图2 队列的概述时间表,记录38名患者的RNA脱落过程,包括SC组和LC组各19名患者

(y轴显示患者ID;x轴显示RNA脱落时间长度)

实验设计

(1)分组:根据病毒RNA脱落时间中位数分为Short disease course (SC)短病程(N = 19)、Long disease course(LC)长病程(N = 19)以及Control控制组(N = 35)三个组别。为进一步研究,又将LC组分为LLC组(RNA脱落时间超过44天,N = 5)和MLC组(RNA脱落时间介于23和44天之间,N = 14)。

(2)蛋白质组学:本研究采用TMT标记定量方法,在217份血清样本中总共定量到2192种蛋白质,在排除缺失值超过80%的蛋白质后,对1252种蛋白质进行下游数据分析。

(3)代谢组学:研究者分析了来自同一患者队列的193个血清样本中的945种代谢物。

*本文综合性的实验设计如图3所示

图3 实验研究设计

文章结果


研究者比较了SC组和LC组患者入院时痰液中的SARS-CoV-2病毒载量,未观察到差异,表明RNA脱落的差异可能是由于宿主反应而不是病毒载量引起的。

为确定与病毒RNA脱落时间长相关的分子,研究者使用Mfuzz分别对SC和LC组的4种不同的变化趋势的蛋白质簇进行比较分析。结果发现LC组和SC组之间第3簇的蛋白质表达量变化是不同的,SC组患者的第三簇的144种蛋白质在第8周和第9周水平下降,主要富集在肝纤维化/肝星状细胞活化和其他5种炎症通路(包括补体系统,IL-15信号传导,急性期反应信号传导,LXR / RXR激活和凝血系统),表明该患者处于恢复期。相比之下,LC组患者中第3簇的59种蛋白质在第8周和第9周表达增加。而LC组和SC组在第1,2,4簇则更为相似,但不同点在于LC组相应簇的蛋白变化相对SC组均延迟。

图4 用Mfuzz分析计算的SC组和LC组具有不同表达动态变化的四组蛋白质

(单因子方差分析,B-H调整P值<0.05)



进一步研究LC组和SC组患者在9周内失调的蛋白质和通路,研究者在两组中共得到295种显著差异表达的蛋白质,这295种蛋白质的富集通路与免疫和代谢有关。

同时,研究发现LC组在第1周LXR/RXR激活通路显著被抑制,且其脂质代谢相关分子(包括RBP4,APOA4,APOF,二酰基甘油和胆固醇)下调,这与LXR/RXR对脂质代谢的积极调节作用一致。

图5 LXR/RXR与其下游蛋白质之间的关系


然后通过LC组、LLC组、MLC组和SC组间的比较,发现在LLC组和SC组之间差异表达的383种蛋白中,有268种与LC组和SC组之间差异蛋白重叠。另外,与SC或MLC组相比,LXR / RXR通路也是LLC组中抑制最显著的通路,并且LLC组抑制持续时间比LC组更长。



研究者分别在SC和LC患者组中,联合蛋白质组学和代谢组学数据,使用Mfuzz分析了四种不同变化趋势的蛋白质和代谢物表达变化簇,结合通路富集发现,补体系统的激活可能诱导COVID-19患者严重炎性损伤。

图6 蛋白质组和代谢组的综合分析



了在早期阶段预测COVID-19患者病毒RNA脱落的时间,研究者基于前三周收集的患者血清蛋白质组学和代谢组学数据利用机器学习建立了一个数据模型。

图7 用于疾病病程预测的机器学习模型

该模型包含了9种蛋白质(NRP2,H3-3A,GNPTG,LGALS1,IGKV2-30,HLA-B,PRSS1,IGKV1-6,KPRP)和1种代谢物(精氨酸), 训练数据集和验证数据集的曲线下面积 (AUC) 值分别为 1 和 0.95,模型准确率较高。在独立测试集中,该模型正确分类了37名患者中的29名,总体准确率为80%(AUC = 0.74)。其余8例病例的错误预测可能归因于其复杂的临床病史。

本文对这些病例的错误预测表明了病毒RNA脱落时间预测的复杂性,和在更大的样本集中对该模型进行验证的必要性。总而言之,本文数据表明了该模型预测SARS-CoV-2 RNA的脱落时间的潜力。



原文链接

doi.org/10.1038/s41421-022-00441-y

编译:江燕

审校:周承、钱丽琴、孙瑞

西湖欧米优势总结


在本研究中,研究者采用TMT技术分析多达217例的血清样本,西湖欧米在类似数量乃至更大的样本量的TMT设计上,具有非常丰富的经验,不仅仅针对血液样本,对于FFPE、新鲜组织等样本,西湖欧米在批次设计和数据分析能力上,都具有独特优势,组织蛋白鉴定量高达10000左右,血液蛋白鉴定量高达1000左右,且有相当多的客户文章发表在各类高分杂志上。此外,在临床大队列样本数据分析这块,西湖欧米拥有非常专业且丰富的经验,除常规的分析外,各类个性化分析更是欧米生信团队的强项。


如有意向,欢迎咨询


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存