Nature综述: 宏基因组关联分析-深入研究微生物组
本文由谢忠杰编译,董小橙、江舜尧编辑,本文较长,建议用电脑阅读。
“微生太”原创微文,转载已获授权。
问题1:哪些疾病与人体微生物明确相关?
问题2:如何研究人体微生物与健康的关系?
宏基因组关联分析(MWAS)可以高分辨率研究微生物组与复杂疾病的关联,比如二型糖尿病、肥胖症、肝硬化、结直肠癌和类风湿性关节炎。MWAS不仅能鉴定疾病相关的微生物种类差异、丰度差异,还能发现相关微生物功能的增强或减弱。本文介绍了MWAS的最近发现,讨论了这些发现对疾病预防、诊断和治疗的潜在影响。提出我们需要在人类微生物组中更好地描述细菌生物学特性,才能理解MWAS鉴定的细菌菌株与疾病有何关系。
论文ID
原名:Metagenome-wide association studies: fine-mining the microbiome
译名:宏基因组关联分析:深入研究微生物组
期刊:Nature Reviews Microbiology
IF:31.851
发表时间:2016年
通信作者:王俊(碳云智能、华大生命科学研究院)
通信作者单位:贾慧珏(华大生命科学研究院)
综述内容
1 简介
宏基因组鸟枪法测序,能够获取整个微生物群落的遗传信息。而人体微生物组,尤其是人体肠道微生物组,基因数量远超过宿主,更是被称为人体“第二套基因组”。综述前人研究,大多使用16S rRNA基因扩增子测序来研究微生物与人类疾病之间的关联。研究表明,肠道微生物失调或许是多种复杂疾病的关键环境因素。但是,16S测序结果在物种分辨率和功能探索上都有局限性。宏基因组测序能够对微生物群落中全部DNA序列进行描述,提供所有物种分类水平和功能通路上的基因丰度信息。但是,宏基因组测序技术比较昂贵,而且宏基因组数据的分析方法更为复杂。
近年来高通量测序技术的快速进步,生物信息学工具的不断发展以及功能数据库知识的积累,使得宏基因组测序成为研究人类微生物组的有效工具。其中最为典型的是,应用宏基因组测序来研究微生物与疾病之间的关联,被称之为宏基因组关联分析(MWAS)。现有的MWAS研究,是将宏基因组数据中特定基因的相对丰度与感兴趣的疾病建立关联,常见做法是对基因进行聚类,可以降低数据的维度,将物种分辨率提高至菌株水平。聚类方法有三种:建立MLG(metagenomic linkage groups)、MGC(metagenomic clusters)或MGS(metagenomic species),参见图1和表1。
通过MWAS,使得人类微生物组与复杂疾病,如二型糖尿病、肥胖症、肝硬化、结直肠癌和类风湿性关节炎等之间高分辨率的关联研究成为可能。基于人肠道的微生物组研究关联研究目前更多处在科研探索阶段,除了确定该关联是否代表因果关系,还需要进一步考虑如何在未来使用MWAS进一步阐明疾病的病因、预防和治疗干预。
图1:MWAS研究微生物与复杂疾病的关联。(a,MWAS研究中队列选择;b,样本采集;c,宏基因组测序;d,基因注释和定量;e,基于基因丰度变化的宏基因组binning;f,鉴定微生物与疾病的关联;g,数据集和实验验证。)
2 微生物与复杂疾病
2.1 微生物与二型糖尿病
二型糖尿病(T2D)是一种由遗传和环境因素共同引起的复杂内分泌疾病,其病因和发病机制比较复杂,目前认为是多基因、多因素的异质性疾病。肠道菌群组成的变化与T2D的发生相关。早期16S研究发现[ref8],在T2D患者肠道中厚壁菌门(Firmicutes)和梭菌纲(Clostridia)的比例总体减少。
MWAS研究发现,健康人群和T2D患者在肠道菌群结构和功能上有较大的差异。健康人肠道菌群中富含促进有益代谢产物(如短链脂肪酸、维生素)生成的菌群。短链脂肪酸(SCFA)经肠道上皮细胞吸收,与受体结合诱导Treg细胞的分化,进而抑制炎症反应,促进组织损伤修复,有利于维持肠道的完整性和能量平衡。SCFA也可以促进胰高血糖素样肽1和肽YY的分泌,从而调节血糖平衡并控制食物摄取。T2D患者中这些细菌和功能的丰富程度明显少于正常人。
T2D患者肠道菌群的改变与代谢紊乱和炎症相关,如H2S和LPS生成的增加会刺激炎症反应。此外,经二甲双胍治疗的T2D患者肠道菌群结构得到改善,Intestinibacter spp.物种丰度下降,肠杆菌(Enterobacteriaceae spp.)物种丰度增加,大肠杆菌(Escherichia coli)丰度的增加可能跟胰高血糖素样肽1分泌增加有关。
图2:肠道菌群与T2D的关联模型。(健康人群和T2D患者在肠道菌群结构和功能上有较大的差异。a,健康人肠道菌群中富含促进有益代谢产物生成的菌群,有利于维持肠道的完整性和能量平衡。b,T2D患者肠道菌群的改变与代谢紊乱和炎症相关,二甲双胍治疗可以改善患者肠道菌群。)
2.2 微生物与肥胖症
科学家发现肥胖与宿主肠道菌群组成存在关联。早期16S rRNA研究发现[ref20,21],在肥胖患者肠道中微生物多样性降低、厚壁菌门与拟杆菌门比值(Firmicutes : Bacteroidetes)增加。MWAS研究发现,将丹麦人群分为肥胖(BMI > 30)、超重(BMI 25-30)以及健康(BMI < 25)个体,宏基因组测序数据显示,肥胖患者肠道内的基因丰度较低[ref18]。低基因丰度,即低基因丰富性,与一些人体生理指标相关,例如体脂肪率高、胰岛素抵抗、血脂异常以及炎症发生[ref18,19]。
产丁酸盐菌(butyrate-producing bacteria),如普拉梭菌(Faecalibacterium prausnitzii)、丁酸弧菌(Butyrivibrio spp.)、罗氏伊琳妮佛伦菌(Roseburia inulinivorans)、阿克曼菌(Akkermansia spp.)和史密斯甲烷短杆菌(Methanobrevibacter smithii)在具有低基因丰富样本中减少,而拟杆菌属(Bacteroides spp.)和活泼瘤胃球菌(Ruminococcus gnavus)在肠道微生物中丰度更高。此外,研究表明,比较于人类遗传因素,肠道微生物的物种组成被用于更准确地预测肥胖疾病,基于9个细菌菌株的疾病分类器(disease classifier)准确区分健康人和肥胖患者(AUC=0.78),而基于32个遗传位点的疾病分类器不能区分健康人和肥胖患者(AUC=0.58)。
MWAS研究发现[ref19],对法国超重人群以及肥胖患者进行6周能量限制饮食然后接着6周体重维持处理,表现为肠道内基因丰富度增加,而体脂肪率、胆固醇以及炎症反应等生理指标均降低。停止饮食干预以后,仍然是低基因丰度样本的宿主个体具有更高的生理指标。因此,肠道微生物不仅可以依据宿主的健康肥胖状态进行区分,还可以预测宿主对饮食干预的响应能力。
2.3 微生物与结直肠癌
结直肠癌(CRC)是常见恶性肿瘤,通常由结直肠腺瘤(腺瘤的定义)缓慢发展而成,具有高度破坏性和侵袭性,在中老年中有较高发病率。肠道微生物被认为与CRC的发生有关。正常情况下,人肠道菌群处于一个相对平衡的状态,产生肠毒素的有害菌群丰度较低。一旦生活方式或饮食习惯发生改变(如红肉摄入量增加或水果、蔬菜及纤维摄入量减少),有害菌群的丰度或毒素产量就会发生变化,造成肠道菌群失调,肠道屏障功能受损,最终导致癌变概率增加。
MWAS研究发现,一些厌氧口腔菌与CRC相关联,如梭杆菌(Fusobacterium spp.)和微小微单胞菌(Parvimonas micra)。与CRC相关的功能改变包括:氨基酸发酵或胆汁酸代谢产生致癌物质,产短链脂肪酸功能下降。
图3:肠道菌群与CRC的关联模型。(a,正常情况下,人肠道中的产生肠毒素的有害菌群丰度较低;b,生活方式或饮食习惯的改变会导致相关菌群的丰度或毒素产量发生变化;c,肠道菌群失调会导致肠道屏障功能受到损伤,使肠道上皮细胞暴露在微生物或其代谢物中的机会增加,其中某些微生物代谢产物可能是致癌诱变剂。)
2.4 微生物与类风湿关节炎
类风湿性关节炎(RA)是一个主要影响关节的长期持续性疾病,其成因不明,但和基因与环境因素有关。人体微生物可能与宿主基因和环境因子相互作用,增加RA患病风险。MWAS分析发现,人体口腔菌群和肠道菌群与RA疾病具有相关性。RA患者口腔和肠道菌群中一些共有的微生物物种会同时增加,如唾液乳杆菌(Lactobacillus salivarius)。此外口腔和肠道样本检测到的RA患者菌群变化具有相关性,如肠道中的克雷白氏肺炎杆菌(Klebsiella pneumoniae)丰度和口腔菌群中的乳球菌(Lactococcus spp.)丰度是正相关的;而肠道中的天门冬形梭菌(Clostridium asparagiforme)与口腔中的中间普氏菌(Prevotella intermedia)丰度负相关。
图4:口腔和肠道菌群与RA的关联模型。(RA患者的口腔和肠道菌群变化存在相关性。如口腔和肠道菌群中某些共有物种的会同时增加,此外口腔和肠道菌群不同物种之间也存在正相关或负相关的关系。)
2.5 微生物与其他疾病
除了上述四种疾病,MWAS还用于研究其他复杂疾病,参见表1。有研究表明,与健康人相比,动脉粥样硬化患者(symptomatic atherosclerosis)肠道微生物中编码八氢番茄红素脱氢酶的基因丰度较低,并且血清中β-胡萝卜素的含量减少[ref49]。有研究表明,相比于健康人,肝硬化(LC)患者口腔富集了韦荣球菌(Veillonella spp.)、链球菌(Streptococcus spp.)以及副流感嗜血杆菌(Haemophilus parainfluenzae)等细菌。此外,15个肠道细菌的基因作为特征,被用于构建肝硬化疾病的预测模型[ref51]。
2.6 人体健康微生物组
MWAS研究发现,一些细菌分类和功能同时存在于多种疾病的健康对照组中,表明这些分类和功能可能是健康微生物组的特征。例如罗氏伊琳妮佛伦菌(Roseburia inulinivorans)和普拉梭菌(Faecalibacterium prausnitzii)这两种产短链脂肪酸菌,存在于二型糖尿病和肥胖症研究的对照组中,参见图2。拟杆菌属(Bacteroides)是人体肠道中丰度最高的一类细菌,在新生儿自然分娩和母乳喂养中发挥重要作用,拟杆菌属既包括与健康相关的菌群也包括与某些疾病相关的菌群,参见表1。一方面,拟杆菌属的一些细菌帮助消化植物多糖(plant-derived sugars),为宿主提供能量;另一方面,它们会利用宿主多聚糖(host glycans),并产生毒素,促进结直肠癌的发生,参见图3。乳杆菌属(Lactobacillus)和双歧杆菌属(Bifidobacterium)可以训练免疫系统、抑制其他有害细菌的繁殖,通常被认为是益生菌,但是唾液乳杆菌(Lactobacillus salivarius)和齿双歧杆菌(Bifidobacterium dentium)被发现于RA患者中含量较高。总的来说,我们可以通过人体健康菌群的状态来初步判断人体的状态(健康或疾病),但要揭示菌群与宿主的复杂关系还需要在菌株层级上进行更深入的研究。
相对而言,基因功能与健康的关系就更为明确一些。在肠道厌氧环境中,氧耐受能力的增加是肠道菌群失调的一种标志,说明耐氧菌的存在以及宿主免疫系统被激活,参见图2。肠道菌群失调的另一个功能标志是硫酸盐或亚硫酸盐还原生成硫化氢。在饮食富含抗性淀粉的人群中,发酵淀粉、产生氢气并最终反应生成甲烷是肠道菌群的主要功能,而在肠道菌群较少的人群中,这一代谢功能也受到了限制。短链脂肪酸如丁酸盐(有时也包括丙酸盐)的产生也与健康肠道菌群相关联,在二型糖尿病、肥胖及结直肠癌MWAS研究中都发现了这一关联。这些代谢功能为肠道上皮细胞提供能量,有助于维持健康的肠道环境。此外,短链脂肪酸也可以通过抑制组氨酸的脱乙酰作用,诱导调节性T细胞(Treg)的分化,促进组织损伤修复,抑制炎症反应,对机体健康产生有益作用,参见图2。
3 从关联到因果
3.1 微生物与疾病的关联分析
我们可以使用附加数据集(其他队列)来验证微生物基因与疾病之间的关联,目的是增加样本大小,以及减少采样、提DNA、制文库、高通量测序、生信分析等带来的误差。但是很重要的一点,也是GWAS和MWAS两者最大的区别,人类基因组相对稳定,而人类的微生物基因组容易受到基因变异的影响。这加大了数据验证的难度,但也增加了通过调控体内微生物来改善疾病干预潜力的希望。
除了宏基因组数据,一些其他形式的数据,例如宏转录组(metatranscriptomic)、宏代谢组(metaproteomic)、宿主基因数据(host genetic data),都可以为MWAS鉴定的微生物-疾病关联提供进一步支持。将来研究会使用宏转录组、宏代谢组数据来识别患者微生物中差异富集的RNA和蛋白质。多组学数据联用,优势是可以证明MWAS鉴定的微生物标志物在体内是有活性的。
3.2 微生物与疾病的因果推论
从分析微生物与疾病的关联,到推断疾病状态下微生物的功能,需要研究微生物标志物(MWAS鉴定得)与感兴趣疾病之间的因果关系。具体方法有三个:纵向队列研究(longitudinal studies)、动物模型研究(animal models studies)、体外功能研究(in vitro functional studies),参见图1。
纵向队列指的是疾病发生之前和疾病发展期间,从同一个体采集的时间序列样本。纵向队列研究方法,可以确定微生物基因富集发生的时间,是在疾病发展之前还是疾病发展之后,有利于推测特定基因与疾病发生的因果关系。该方法同样可以应用于人工干预实验,例如药物的治疗、饮食结构的调整以及微生物的移植。
使用动物模型可以确保实验设计可控,最大限度地减少环境因素和宿主因素的影响。但是我们在实验设计时要考虑,不同来源的小鼠体内的微生物组成是显著不同的。小鼠模型适合于研究MWAS鉴定的菌株。无菌小鼠(GF mice)是常用的研究微生物组的动物模型,因为它们提供肠道内的无菌环境,对特定微生物的定植灵敏性很高。然而,GF小鼠在代谢、免疫和神经发育上均表现为异常,所以GF小鼠实验获得的结果需要推敲讨论。无特定病原体小鼠(SPF mice)是无菌小鼠的替代品,SPF小鼠和基因突变小鼠实验获得的结果具有更高的解释性。
虽然上述两种方法能够从MWAS鉴定的关联来推断微生物与疾病的因果关系,但阐明因果关系的机制机理需要依赖于单个菌株的功能研究,以及菌株水平的相互作用研究,甚至特定菌株与宿主代谢小分子、宿主细胞的相互作用研究。体外功能研究还有助于表征驱动疾病发展的微生物的功能基因以及代谢产物,而这些基因和产物可能尚未收录在现有的知识数据库中。
总之,纵向队列研究、动物模型实验以及体外功能研究,有助于明确MWAS鉴定得的关联性如何与疾病病理相关联。由于MWAS研究处于起步阶段,目前报道的研究数量较少、样本规模较小,因此阐明微生物与疾病之间的因果关系仍然是一个重要的挑战。
4 结论与展望
MWAS是在宏基因组范围内检测复杂疾病相关微生物变化的一种群体关联分析方法。自2012年华大发表第一篇MWAS研究文章,相关文章数目逐年增长,目前已经发现代谢类疾病、免疫类疾病、胃肠道类疾病甚至精神类疾病都与人体微生物组密切相关。
MWAS鉴定得到的关联因子可以作为疾病相关标志物用于指导临床诊断,有的关联因子发现时间早于临床症状表现,即可以实现早发现早预防的目的。对于结直肠癌和类风湿性关节炎的疾病诊断,粪便和口腔样本的微生物检测比常规的筛查方法效果更好。
MWAS筛选得到的关联因子可能只是少部分疾病患者的表型特征,该表型特征可用来监测疾病治疗效果。如微生物的特定基因标志物可以用来评估疾病的治疗效果,在使用抗类风湿性关节炎药物(DMARD)的治疗过程中,持续监测相关的基因丰度变化可用于指导治疗方案。
对于普通人群而言,MWAS可以用于研究饮食、生活方式以及不同成长阶段的表型特征与微生物的关联,用于指导人体选择最佳的生活方式、抑制或延迟疾病的发生。但目前这些应用仍面临较大困难,例如我们根据微生物数据来关联人体血糖水平,但是健康人群在相同饮食情况下也会表现很大的血糖差异。
根据相关标志物(MWAS鉴定获得)的饮食干预或者菌群移植,都可以作为疾病治疗的手段之一,例如赵立平教授曾通过饮食调节自身肠道菌群,成功达到减肥目的,而艰难梭菌感染的经典治疗方法就是粪菌移植。另外我们也可以将相关标志物作为药物靶点,开展药物设计研发的工作。
目前MWAS已成功应用于二型糖尿病、肥胖症、肝硬化、结直肠癌和类风湿性关节炎的研究,并发现已知的与健康相关的功能(产丁酸盐功能)以及其他与疾病或健康关联的功能。更深入的关联分析依赖于宏基因组学研究在取样、测序、生信分析、功能分析等各方面的进步。例如,随着二代测序技术的发展、宏基因组拼接技术的优化以及单细胞测序技术的推广,我们可以得到更全面、更完善的微生物基因组信息,不断完善物种注释数据库,为更深入的疾病关联分析提供扎实基础。
评论
这篇文章是华大基因发表在Nature Reviews Microbiology的综述,解读了MWAS的研究现状,明确了与人体微生物密切相关的几种疾病,梳理了人体微生物与健康的关系。小编提示,华大基因团队提出的MWAS,和赵立平团队提出的MWAS,其实并不一致,至少从名称就能看出,前者(本文)为Metagenome-Wide Association Studies,后者(参考文献最后一条)为Microbiome-Wide Association Studies。感兴趣的读者可以花点时间去琢磨。
主要参考文献及表1见最后
了解更多菌群知识可以长按或扫描以下二维码关注“微生太”。
Table 1: 几种疾病相关的MWAS研究
主要参考文献
1. Qin, J. et al. A human gut microbial gene catalogue established by metagenomic sequencing. Nature, 464, 59–65 (2010). 【华大基因发表】
53. Bäckhed, F. et al. Dynamics and stabilization of the human gut microbiome during the first year of life. Cell Host Microbe, 17, 690–703 (2015). 【华大基因发表】
二型糖尿病
9. Qin, J. et al. A metagenome-wide association study of gut microbiota in type 2 diabetes. Nature, 490, 55–60 (2012). 【华大基因发表】
13. Karlsson, F. H. et al. Gut metagenome in European women with normal, impaired and diabetic glucose control. Nature, 498, 99–103 (2013).
15. Forslund, K. et al. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota. Nature, 528, 262–266 (2015). 【华大基因发表】
动脉粥样硬化
49. Karlsson, F. H. et al. Symptomatic atherosclerosis is associated with an altered gut metagenome. Nat. Commun., 3, 1245 (2012).
肥胖症
18. Le Chatelier, E. et al. Richness of human gut microbiome correlates with metabolic markers. Nature, 500, 541–546 (2013). 【华大基因发表】
19. Cotillard, A. et al. Dietary intervention impact on gut microbial gene richness. Nature, 500, 585–588 (2013).
肝硬化
51. Qin, N. et al. Alterations of the human gut microbiome in liver cirrhosis. Nature, 513, 859–864 (2014). 【李兰娟团队秦楠发表】
结直肠癌
31. Zeller, G. et al. Potential of fecal microbiota for earlystage detection of colorectal cancer. Mol. Syst. Biol., 10, 766 (2014).
32. Feng, Q. et al. Gut microbiome development along the colorectal adenoma–carcinoma sequence.Nat. Commun., 6, 6528 (2015). 【华大基因发表】
33. Yu, J. et al. Metagenomic analysis of faecal microbiome as a tool towards targeted non-invasive biomarkers for colorectal cancer. Gut, 66, 70-78 (2017). 【华大基因发表】
类风湿性关节炎
45. Zhang, X. et al. The oral and gut microbiomes are perturbed in rheumatoid arthritis and partly normalized after treatment. Nat. Med., 21, 895–905 (2015). 【华大基因发表】
赵立平团队发表
Zhao, L. The gut microbiota and obesity: from correlation to causality. Nature Reviews Microbiology, 11, 639–647 (2013). [https://www.nature.com/articles/nrmicro3089]
Rob Knight团队发表
Gilbert, J. A. et al. Microbiome-wide association studies link dynamic microbial consortia to disease. Nature, 535, 94–103 (2016). [https://www.nature.com/articles/nature18850]
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2200+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”