赋能科研 | ChinaMAP项目:华大智造核心工具助力上海交大瑞金医院发布首个中国人群血液病毒组图谱
全基因组测序技术可发现人类血液中所含有的各类已知的或尚未明确的病毒序列,可为病毒感染预防、疫苗开发和病毒基因组、流行病学等研究提供重要数据基础。2022年10月,上海交通大学医学院附属瑞金医院,上海交通大学转化医学研究院联合华大,基于华大智造DNBSEQ测序平台,对来自中国代谢解析计划(ChinaMAP)的 10,585 人全基因组测序数据中的非人源基因序列进行了深入分析,构建了首个中国人群血液病毒组学图谱,分析了 14 种病毒的人群携带率、病毒丰度和地理分布,为疾病预防与流行病学研究提供了参考。
检出率最高的是指环病毒(Anellovirus),在76.7%的个体中发现了包括TTV(Torque teno virus) 和TLMV (TTV-like mini virus)等在内的指环病毒基因序列;在 30.3% 的个体中检测到HHV-4 (Human gammaherpesvirus 4, EBV),高于欧洲人群队列的报道(14%)。
乙型疱疹病毒(Betaherpesvirus)也被广泛检出,其中,HHV7(Human herpesvirus 7)、 HHV6A(Human betaherpesvirus 6A)、HHV6B(human betaherpesvirus 6B)和HHV5(Human betaherpesvirus 5, HCMV)分别在13.2%、0.36%、1.09% 和 1.03%个体中发现。
人内源性逆转录病毒(Human endogenous retrovirus K, HERV-K)、人腺病毒C(Human mastadenovirus C )和乙型肝炎病毒(Hepatitis B virus, HBV)分别在 8.20%、2.41% 和 1.69% 的个体中被发现。
此外,研究团队在 50个个体(0.47%)中检出了HPV序列,涉及的亚型有Gammapapillomavirus 1、Betapapillomavirus 1和Alphapapillomavirus 4。
最受关注病毒——乙肝病毒
乙肝是我国重大传染性疾病,目前仍是肝癌发生的主要原因之一。研究团队在1.69%的个体中(n=179)检测到乙肝病毒(HBV)序列,主要由HBV-B(n=79)和HBV-C(n=59)两种亚型构成(占比77%)。进一步,研究团队对人类基因组中的病毒整合事件进行了分析,在 10个样品中发现了 HBV-B 病毒序列整合,在18 个样品中发现了HBV-C 病毒序列整合,这一结果表明:整合事件与病毒序列更高丰度显著相关,且HBV病毒序列在人基因组上的整合位点没有明显的富集区域。
病毒感染与遗传变异的相关性分析
研究团队通过全基因组关联研究(GWAS),对病毒感染与遗传变异是否存在相关性展开了进一步探讨。研究结果表明:ACR 基因中的错义突变 (rs79314756) (c. 71C>T, p. Thr24Met) 与 HHV6 病毒携带显著相关 (P = 3.21 × 10-15),该基因位点富集于东亚人群(gnomAD 频率0.000651,gnomAD EAS频率0.0164,ChinaMAP频率0.02971)。
HHV6属于betaherpesviruses,包括了HHV6A和HHV6B两种基因组序列一致性高达90%的病毒[1]。尽管HHV6感染对大多数人无害,但是也有研究发现HHV6感染与多发性硬化、阿尔茨海默病等神经系统疾病相关[2,3],说明了 HHV6感染的潜在危害性不容忽视。这为未来HHV6病毒的传播机制研究,以及HHV6感染高风险区域人群的遗传风险评估提供重要的数据基础。
图:HHV6感染的全基因组关联分析(曼哈顿图)
综上,该研究利用基于DNBSEQ测序平台的高深度 WGS 数据,系统性研究了大规模人群中血液病毒组的情况,分析了 14 种病毒的人群携带率、病毒丰度和地理分布,研究发现:在30%的个体中检出的EBV是人群携带频率最高的致病病毒、血液中HBV病毒丰度与整合事件相关、ACR的错义突变rs79314756与 HHV6 病毒携带显著相关等。这些发现将为疾病预防与流行病学研究提供重要信息。与此同时,也为更多的大人群基因组项目的开展提供了参考和借鉴。
本项研究基于中国代谢解析计划 (ChinaMAP) ,由上海交通大学附属瑞金医院与华大基因合作完成,上海交通大学曹亚南/王卫庆/李林为通讯作者,华大基因郭佳/黄宣霖/张晨茜为第一作者。该研究得到了国家重点研发计划项目(2020YFA0112800、2020YFA0112801)、国家自然科学基金项目(82270842)、中国科学院医学科学创新基金项目(2020-12M-5-002)的资助。研究得到了国家代谢性疾病临床医学研究中心(上海)、转化医学国家重大科技基础设施(上海)和医学基因组学国家重点实验室以及上海交通大学—华大联合创新研究中心的支持。该研究中的测序数据使用华大智造DNBSEQ测序平台完成,测序前处理工作使用华大智造自动化设备MGISP-100/960完成,测序数据的部分处理使用华大智造ZTRON平台完成。
关于ChinaMAP
ChinaMAP,即中国代谢解析计划 (China Metabolic Analytics Project),是由国家代谢性疾病临床医学研究中心(上海)基于上海交通大学医学院附属瑞金医院牵头,联合全国29家研究机构和医院,依托转化医学国家重大科技基础设施(上海)和医学基因组学国家重点实验室,开展了的一项覆盖全国的队列研究项目。在该项目中,研究团队对队列中代表中国不同地区和民族的10588人DNA样本,使用华大智造的高通量测序平台进行了40X深度全基因组测序,完成了高质量的中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较以及变异频谱和致病性变异解析。部分已发表研究成果如下:
基于ChinaMAP数据库和千人基因组项目(1000 Genomes Project, 1KGP)数据库等,对新冠病毒受体ACE2相关变异在全球不同人群中的比较分析[4]。
首次发布最大规模中国人群高深度全基因组测序和表型研究的一期成果[5],在ChinaMAP一期数据库中,包含1.36亿个基因多态性位点(SNP)和1千万个插入或缺失位点(INDEL),其中一半是在国际通用的dbSNP、千人基因组、gnomAD和TOPMed数据库中均没有的新位点,相关数据可在国家代谢性疾病临床医学研究中心的www.mBiobank.com网站搜索,为我国的医学和生命科学研究提供数据支持。
2021年9月正式公开ChinaMAP插补服务器(www.mbiobank.com),为中国和东亚人群的遗传研究提供参考序列集[6]。
基于ChinaMAP数据库,与华大智造联合开发了一款支持多方联合进行GWAS全流程分析的隐私计算工具——TrustGWAS[7],实现了以一种安全和保护隐私的方式对个体水平的数据进行GWAS联合分析,为大型队列数据隐私化共享提供可靠的软件支持和全流程的解决办法。
基于ChinaMAP数据库,发表中国人群血液病毒基因组研究成果[8],为大人群的疾病预防与流行病学研究提供重要信息。
参考文献
[1] Ablashi D, Agut H, Alvarez-Lafuente R, Clark DA, Dewhurst S, DiLuca D, et al. Classification of HHV-6A and HHV-6B as distinct viruses. Arch Virol. 2013 Nov 6;159(5):863–870.
[2] Leibovitch EC, Jacobson S. Evidence linking HHV-6 with multiple sclerosis: an update. Curr Opin Virol. 2014 Dec;9:127–33.
[3] Readhead B, Haure-Mirande JV, Funk CC, Richards MA, Shannon P, Haroutunian V, et al. Multiscale analysis of independent Alzheimer's cohorts finds disruption of molecular, genetic, and clinical networks by human Herpesvirus. Neuron. 2018 Jul 11;99(1):64–82.e7.
[4] Cao Y et al. Comparative genetic analysis of the novel coronavirus (2019-nCoV/SARS-CoV-2) receptor ACE2 in different populations. Cell Discov. 2020; 6:11.
[5] Cao Y et al. The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals. Cell Res. 2020;https://doi.org/10.1038/s41422-020-0322-9.
[6] Li L, Huang P, Sun X, Wang S, Xu M, Liu S, et al. The ChinaMAP reference panel for the accurate genotype imputation in Chinese populations. Cell Res. 2021 Dec;31(12):1308-1310.
[7] Yang M, Zhang C, Wang X, Liu X, Li S, Huang J, et al. TrustGWAS: A full-process workflow for encrypted GWAS using multi-key homomorphic encryption and pseudorandom number perturbation. Cell Syst. 2022 Sep 21;13(9):752-767.e6.
[8] Guo J, Huang X, Zhang C, Huang P, Li Y, Wen F, et al. The blood virome of 10,585 individuals from the ChinaMAP. Cell Discov. 2022 Oct 18;8(1):113.
点击阅读原文查看更多