Cell Reports Medicine | COVID-19 的多组学研究:照亮被忽视的角落
摘要
COVID-19 仍在全球肆虐,且似乎不会从地球消失。在这篇评述中,Lu 等人讨论了多组学技术在揭示 COVID-19 发病、进展和传播背后的分子机制中所起的作用,并讨论了标准化的缺失如何限制了它们在临床中的应用。正文
Main text
△ 图1. 多组学能够系统地表征 COVID-19 中的分子调节。
大象指的是 COVID-19 患者,而放大镜指用于检查有限分子数量的传统技术。多组学技术,就像卫星一样,可以全面分析分子调控机制,其中大部分是放大镜看不到的东西。
病原体
The pathogen
多组学技术极大加深了我们对 SARS-CoV-2 以及宿主反应的理解,这些技术包括但不限于第二代测序 (next-generation sequencing, NGS)、蛋白质组学和代谢组学(图 2)。事实上,新冠大流行病原体的确定还需要归功于基因组学。基于这个结果,人们开发了PCR试剂盒,并将之迅速应用于临床,取代了原始的体温检测法,有效提高了COVID-19诊断的准确性。
△ 图2.关于 SARS-CoV-2 和宿主反应的多组学研究。
改编自由 BioRender.com(2022年)撰写的 “SARS-CoV-2 关注变体的潜在传播机制”;来源于 https://app.biorender.com/biorender-templates;病毒的基因组和蛋白质组研究让人们快速建立了用于 COVID-19 诊断的 PCR 检测方法。基因组的监测使我们能够对病毒的进化和传播进行流行病学调查。目前已经根据序列和表面蛋白设计了多种疫苗。大多数多组学分析都集中在宿主对感染或疫苗接种的反应上,蛋白质组学和代谢组学是这方面最重要的主力军。
SARS-CoV-2的突变会导致其致病性、传染性、传播性或抗原性的变化。1例如,研究发现 E484K 是一种免疫逃逸突变,可以减少抗体介导的中和作用。1 NGS 技术的迅速应用不仅有助于Delta 和 Omicron 等突变毒株的发现,而且有助于跟踪调查它们在不同地区的传播情况。在津巴布韦对 SARS-CoV-2 变异毒株流行病学调查的一项研究中发现,60% 的病例是输入性的,这表明人口流动是其传播的关键因素,进一步支持了检疫和限制人口流动的重要性。2 基于质谱(MS)的对新冠病毒刺突(S)糖蛋白质的研究也有助于疫苗的研发。病毒的 S 蛋白会与宿主细胞中的 ACE2蛋白产生相互作用,利用这一点,抗体通过靶向作用于 S 蛋白来中和病毒。因此,S蛋白的结构,包括其糖基化位点,对疫苗的设计十分关键。Watanabe 等人表达了重组刺突蛋白三聚体,并通过质谱确定了 22 个糖基化位点的糖基组成(例如,N234 和 N709 位点上糖基主要属于寡甘露糖型)。这个研究不仅深化了我们对 S 蛋白结构的了解,而且还为评估疫苗和治疗性抗体开发中的免疫原质量提供了基准。3
宿主对病原体的反应
Host responses to the pathogen
虽然多组学帮助我们在了解病原体的性质和结构上取得了一定的进展,但新冠病毒感染患者的症状,如哪些患者会发展成重症,仍然难以预测。如果有一种精确而实用的方法来根据疾病严重程度对患者进行分类,并确定那些能在 SARS-CoV-2 感染中幸存下来的大多数患者,那么许多对全球大流行的担忧就可以得到缓解。此外,不同人群对新出现的突变毒株的免疫反应是否存在差异?不同的疫苗和接种次数是如何影响人体对 SARS-CoV-2 的免疫力的?要解决这些问题及许多其他关键问题,我们需要全面了解宿主对这种病原体及其疫苗的反应。大多数多组学研究能够基于多种器官和临床标本,探究宿主对病原体的成千上万种分子变化,这是传统的方法难以实现的。
COVID-19 宿主反应研究最初仅限于观察如发烧和咳嗽等的临床症状,进一步延伸到观察胸部 CT 及如 CRP 和 SAA1 等的循环蛋白生物标志物指标的变化。这些标志物已用于其他传染病的观察,基于这些经验,它们也被用于监测 COVID-19 的临床进展。多组学研究监测了人体内大量由于感染新冠发生改变的分子,极大地拓展潜在的标志物种类,这些发现通常难以用传统的分析方法检测到(图2)。例如,基于COVID-19患者血清的蛋白质组学和代谢组学研究已有效地应用于测量约 2000 个血液中的分子,其中 93 种蛋白质和 204 种代谢物在重症患者中表现出显著的特异性失调。4该研究还强调了血小板脱颗粒、巨噬细胞和补体系统的关键作用。大多数关键分子变化已在多个国家/地区的其他新冠多组学研究中得到证实,验证了蛋白质组学和代谢组学技术的可靠性以及他们在临床决策中的潜在价值。
值得一提的是,尿液作为一种非侵入性的临床生物标本,其中包含的蛋白质和小分子代谢物也可以很容易地被质谱检测到。研究人员在尿液中检测到了近 4000 种蛋白质,而由于血清中高丰度蛋白质的存在,使用相同的质谱方法仅能检测到约1500种蛋白质。值得注意的是,可在血清中检测到的蛋白有 80% 可在尿液中检测到,而在尿液中检测到的蛋白仅有 31% 可以在血清中检测到。5
为什么我们需要检测这些分子呢?这些发现对抗疫有何帮助?多项组学研究表明,在经过合理设计的组学实验中,机器学习可以筛查用于分类和监测疾病进展的生物标志物。例如,基于血清中表达的 22 种蛋白质和 7 种代谢物的随机森林模型可以可靠地指示 COVID-19 的严重程度,并在一定程度上预测疾病预后。4同样,基于尿液蛋白的模型也可用于监测 COVID-19 疾病进展。5
除了血液中的循环分子外,其他器官中的分子变化对于揭示宿主反应也至关重要。病理切片检查在宏观和微观层面为诊断提供了丰富的信息,被广泛认可为疾病诊断的“金标准”。然而,在新冠患者的多器官病理切片中观察到的改变与非典型性肺炎(SARS)和中东呼吸综合征(MERS) 患者中呈现的的组织病理学区别并不明显,而是高度相似。6基于质谱的蛋白质组学现在能够在多器官尸检样品中表征超过 10,000 种蛋白质,并发现了参与凝血,血管生成,纤维化和脂肪酸代谢等过程的多种失调蛋白质。7如果没有这样的高深度的蛋白质组学技术,而使用基于假设的研究方法来探索新冠感染后人体的变化,那么目前已知的几个重要发现,如肺部组织蛋白酶 L(Cathepsin L) 的上调与 COVID-19死亡率之间存在潜在联系或INSL3 蛋白减少与睾丸中间质细胞受损之间的关联,将耗费无法估量的精力与时间。7蛋白质组学使我们能够“看到”病理表现背后的分子变化。患者的组织标本,特别是肺组织,可能具有传染性,在分析之前必须进行灭活,这通常通过福尔马林固定来实现,而其通常会导致mRNA 降解,使得基于福尔马林固定的样本的转录组学分析存在挑战性。相比之下,蛋白可以被有效地从福尔马林固定的组织中提取,然后进行质谱分析。8
组学技术还能够发现病毒的靶细胞,这是传统技术难以实现的。鼻咽拭子的单细胞 RNA 测序 (Single-cell RNA sequencing, scRNA-seq)显示,在 COVID-19 感染期间,咽部的纤毛细胞 (ciliated cell) 减少,同时分泌细胞 (secretory cell)、次胞质体 (deuterosomal cell) 扩增和巨噬细胞 (macrophages) 增加。9没有其他技术可以替代单细胞 RNA 测序直接从临床标本中获得这样的结果。不仅如此,scRNA-seq 也可以用于解码同种细胞的多种亚细胞群。例如,淋巴细胞减少症(血液中循环淋巴细胞的显著减少)是 COVID-19 患者的常见症状。各种淋巴细胞在抗病毒免疫中发挥着不同的作用,基于这些淋巴细胞的 scRNA-seq研究发现了三种不同淋巴细胞亚细胞群响应模式与患者的预后有关。10
对疫苗的反应
Host responses to vaccines
多组学研究还可能为疫苗的使用提供指导意见,尽管这些数据目前尚不充分。全球已接种超过 100 亿剂疫苗,包括 mRNA 疫苗、灭活病毒疫苗和基于腺病毒的疫苗等。虽然所有疫苗都对预防SARS-CoV-2 感染起到了一定的保护作用,但 mRNA 疫苗被证实比其他疫苗带来了更高的中和抗体滴度。11然而,这种保护作用不仅通过中和抗体起作用,而且还由其他免疫效应机制介导,包括 T 细胞和先天免疫细胞。例如,在没有检测到中和抗体的情况下,即使只接种一剂,mRNA 疫苗对预防感染也达到了 80%的有效性。11此外,高达 6% 的被接种人在第二次注射后血清中仍然检测不到中和抗体。11
据美国疾控中心报道,截至 2022 年 2 月 12 日,超过0.004% 的被接种人出现了严重的副作用,包括过敏反应、血栓形成伴血小板减少综合征、吉兰-巴雷综合征甚至死亡。中和抗体的浓度随时间推移而下降,突破性感染时有发生,尤其是当面对新兴的免疫逃逸突变毒株如 Omicron时。12迄今为止,针对特定突变毒株的定制疫苗尚未出现,尽管其在预防 COVID-19 方面具有不可否认的重要性。解决疫苗的保护性免疫不确定性的一项有争议但务实的政策是强制加强疫苗的接种。
疫苗接种的这些局限性,是目前多个国家数亿被接种人次所遇到的普遍问题。理论上,通过实时监测血清抗体含量变化可以为人群的流行病学追踪提供信息,更重要的是,可能为指导疫苗剂量和接种间隔提供有用的信息。然而,即使是中和抗体的检测也没有被广泛用于指导临床决策,这可能是因为大规模血液采样的可行性有限,并且缺乏通用的标准流程。监测尿蛋白的变化可能是评估对病毒免疫力的更实际的手段,但是,目前也还没有相关的数据公布。
为什么临床实践很大程度上忽视了蛋白质组学和代谢组学?
Why are proteomics and metabolomics largely overlooked in the clinic?
虽然已经发表的与 COVID-19 相关的组学论文已有近 10,000 篇(截至 2022 年 2 月 12 日的 PubMed 搜索),但除了 PCR 和病毒的基因组分析外,大部分组学研究的结果尚未成功进入 COVID-19 的临床应用。一个可能的原因是,人们的认知中多组学技术还不成熟(主要指蛋白质组学和代谢组学),重复性和可靠性不高,无法提供临床上可靠的结果。然而,最近世界各地的多个实验室发表的蛋白质组学数据在失调的分子的种类和变化趋势上显示出惊人的一致。相比之下,众所周知的是假阴性在 SARS-CoV-2 的 PCR 检测中很常见。最近一项针对 95,919 名患者的研究报告显示PCR检测新冠病毒的假阴性率 (false-negative rate, FNR) 和敏感性分别为 9.3% (95% CI 1.5–17.0%) 和 90.7% (95% CI 82.6–98.9%)。13有些人可能会争辩说,蛋白质太不稳定了,在实际应用中难以成为稳定可信的生物标志物。然而,研究表明,通过质谱测量的蛋白质比 NGS 测量的mRNA更稳定。14
那是因为蛋白质和代谢物的测量在技术和分析上太具有挑战性,而且成本太高吗?确实,蛋白质组学和代谢组学数据的获取需要许多步骤,依赖于特殊的专业知识和昂贵的仪器。例如,蛋白质组学的数据采集依赖于高分辨率质谱仪。然而,更复杂和昂贵的技术如正电子发射断层扫描 (positron emission tomography, PET) 等已经在临床上广泛使用,所以这些也不应该是不可逾越的障碍。此外,通过质谱法测量一种蛋白质的成本已从 2006 年的约 3 美元降至 2020 年的不到 0.1 美元。15
蛋白质组学和代谢组学临床应用的主要障碍可能是缺乏标准化。由于蛋白质组学领域正在快速发展,不同实验室几乎不会使用完全相同的标准操作流程 (standard operating protocols, SOP);而代谢组学的情况更加令人困惑,出于商业考虑,即使是在不同实验室中生成的原始数据文件也很少得到共享。尽管代谢组学的商业化先于蛋白质组学的商业化,但大多数代谢组学平台并不公开其开发的资源(例如,用于分子测量的化合物库)和技术,甚至在科学交流中也不共享其原始数据。想要实现必要的透明度和标准化,扭转这种令人气馁的局面绝非易事。相比之下,蛋白质组学界的状况更加科学透明、心态更加开放共享。我们相信,在不久的将来,通过蛋白质组学科学家、临床从业者和其他利益相关者的共同努力,可以制定出几个能够获得国际共识的用于临床的蛋白质组学 SOP。
其他挑战
Other challenges
整合对相同样本使用不同组学方法测量的数据对多组学的临床应用也是一大挑战。基因组数据大多是定性的,而转录组、蛋白组和代谢组的数据大多是定量的。因此,人们很难通过算法直接分析这复杂多样的数据。此外,与在相同个体的不同组织之间保持一致的基因组不同,蛋白质组和代谢组具有组织特异性和环境依赖性,能够反映生理和病理上的复杂的实时状态,其时空异质性也为数据采集和分析带来巨大的挑战。
除了这些技术限制之外,在大流行期间收集潜在的传染性样本还带来了额外的挑战。COVID-19 研究中使用的最常见样本是血液或支气管肺泡灌洗液样本,而尿液和粪便等非侵入性样本的数据也已逐渐被证明能够有效反映宿主反应。然而,医院缺乏用于安全收集和有效预处理这些样本的SOP以进行多组学研究,这可能成为队列内和不同队列之间偏倚的来源之一。考虑到生物安全的问题,对 COVID-19 样本的获取有诸多限制,但这也限制了对这些珍贵样本的进行全面深入研究的可能,从而限制了人们对 COVID-19 的探索来发展有效防疫措施。如果能够建立适当的处理和获取这些潜在传染性标本且技术上可行的 SOP,我们对 COVID-19 的研究将会更快地发展和深入。COVID-19 不太可能消失,这也不会是最后一次大流行病。因此,人类绝不能自满于目前所取得的成就。国际社会现在必须采取行动,为未来做好更充分的准备。
参考文献
1. Harvey, W.T., et al. SARS-CoV-2 variants, spike mutations and immune escape. Nat Rev Microbiol 19, 409-424 (2021).
2. Mashe, T., et al. Genomic epidemiology and the role of international and regional travel in the SARS-CoV-2 epidemic in Zimbabwe: a retrospective study of routinely collected surveillance data. Lancet Glob Health 9, e1658-e1666 (2021).
3. Watanabe, Y., Allen, J.D., Wrapp, D., McLellan, J.S. & Crispin, M. Site-specific glycan analysis of the SARS-CoV-2 spike. Science 369, 330-333 (2020).
4. Shen, B., et al. Proteomic and Metabolomic Characterization of COVID-19 Patient Sera. Cell182, 59-72 e15 (2020).
5. Bi, X., et al. Proteomic and metabolomic profiling of urine uncovers immune responses in patients with COVID-19. Cell Rep 38, 110271 (2022).
6. Deshmukh, V., Motwani, R., Kumar, A., Kumari, C. & Raza, K. Histopathological observations in COVID-19: a systematic review. J Clin Pathol 74, 76-83 (2021).
7. Nie, X., et al. Multi-organ proteomic landscape of COVID-19 autopsies. Cell 184, 775-791 e714 (2021).
8. Zhu, Y., et al. High-throughput proteomic analysis of FFPE tissue samples facilitates tumor stratification. Mol Oncol 13, 2305-2328 (2019).
9. Ziegler, C.G.K., et al. Impaired local intrinsic immunity to SARS-CoV-2 infection in severe COVID-19. Cell 184, 4713-4733 e4722 (2021).
10. Mathew, D., et al. Deep immune profiling of COVID-19 patients reveals distinct immunotypes with therapeutic implications. Science 369(2020).
11. Sadarangani, M., Marchant, A. & Kollmann, T.R. Immunological mechanisms of vaccine-induced protection against COVID-19 in humans. Nat Rev Immunol 21, 475-484 (2021).
12. Kuhlmann, C., et al. Breakthrough infections with SARS-CoV-2 omicron despite mRNA vaccine booster dose. Lancet (2022).
13. Kanji, J.N., et al. False negative rate of COVID-19 PCR testing: a discordant testing analysis. Virol J 18, 13 (2021).
14. Shao, W., et al. Comparative analysis of mRNA and protein degradation in prostate tissues indicates high stability of proteins. Nat Commun 10, 2524 (2019).
15. Xiao, Q., et al. High-throughput proteomics and AI for cancer biomarker discovery. Adv Drug Deliv Rev176, 113844 (2021).
编译:陆恬,钱丽琴
作者:陆恬,王瑛睿 ,郭天南
西湖欧米近期活动:
西湖实验室、西湖大学生命科学学院携手细胞出版社于2021年8月起,以线上线下结合的方式举办十场“西湖实验室-《细胞》系列研讨会”。系列研讨会将围绕“肿瘤、代谢、衰老”等议题邀请西湖大学以及国内外科学家交流讨论相关领域的诸多新研究进展和成果。
* 会议方式:线上直播
* 北京时间 2022年3月25日 8:00-10:00
大脑生态包括由神经元组成的和非神经元细胞组成的各种系统,它们之间进行着错综复杂的稳态互作。在衰老和包括阿尔茨海默病在内的神经退行性疾病中,近期的发现逐渐显示脑内各大系统间互作失调与脑衰老和退行性病变密切相关。
近年来,科学家们在研究血管细胞、胶质细胞和免疫细胞,以及循环血液因子等非神经元成分对神经元的影响方面取得了重大进展,也发现了利用这种脑生态系统帮助治疗的潜在应用。在本次网络研讨会上,Chenghua Gu博士、Tony Wyss-Coray博士和Li Gan博士将分享他们在这一主题上令人欣喜的研究。
关于西湖欧米
专注于生物技术攻关与辅助临床诊断与治疗的创新型生物科技公司。针对与生命健康有关的核心问题,西湖欧米致力于以技术创新为驱动力、以多模态大数据为基础,使用 AI 赋能微量临床组织的高通量蛋白质组分析等组学技术辅助精准医学和药物研发。
西湖欧米公众号
西湖欧米官网