查看原文
其他

【一作解读】1520个人肠道单细菌参考基因组,助力菌群研究

Luo Guangwen 多维组学 2022-07-05

 15

文章速递


高质量参考基因组和活体菌株对于疾病与肠道菌群的相互作用机制的深入研究显得愈发重要。为了进一步扩充肠道菌株库和参考基因组,华大研究者收集了 155 份健康人的粪便样本,通过 11 种培养条件,获得了 6000 多株肠道细菌,并选择其中 1700 多株菌进行全基因组测序,最终构建了 1520 株高质量的肠道细菌基因组草图。

通过基因组水平的物种聚类,共产生 338 个 Clusters(物种分类簇),其中超过三分之一是新的物种,整体覆盖了中国人肠道微生物常见的9大核心菌属;同时也发现了 38 个宏基因组分析中低丰度(< 1%)的菌属。

该研究丰富了现有肠道微生物研究的物种多样性,也表明了肠道细菌培养技术对于深入解析肠道微生物的群落结构和功能的必要性。

关键字: Culturable Genome Reference, Novel species, Functional microbiome analyses

Title: 1,520 reference genomes from cultivated human gut bacteria enable functional microbiome analyses

DOI: 10.1038/s41587-018-0008-8

Journal: Nature biotechnology [IF 35.724]

First Authors: Yuanqiang Zou, Wenbin Xue, Guangwen Luo, Ziqing Deng, Panpan Qin

Correspondence: Junhua Li, Huijue Jia, Liang Xiao

Affiliation: BGI-Shenzhen, Shenzhen, China

Published: 2019-02-04

1

研究背景

目前,NCBI 收录的细菌基因组中只有不到 4 % 的是属于肠道细菌,而且集中于临床相关的致病菌。尽管 HMP(人类微生物组项目)项目测了 2000 多株人体相关菌株,其中 437 个肠道菌,但远远未到饱合状态。

2

研究思路

收集 155 份中国健康人的粪便样本,在严格厌氧条件下通过在 11 种不同的培养基培养,获得了 6487 个细菌克隆培养物,先进行全长 16s rDNA 测序和数据库检索,筛选出 1759 株重要的或潜在新菌的菌株,再进行全基因组测序和组装,依据 HMP 标准和 ChenkM 标准进行过滤,最终获得 1520 个高质量基因组。

3

研究结果

扩展了人肠道细菌基因组集

1520 个基因组构成了可培养基因组参考数据集(Culturable Genome Reference,CGR),通过平均核苷酸相似性的两两比对,在 95% 的阈值下,采用 R 软件的 hclust 进行聚类,获得 338 个种水平的基因组簇,取每个簇 N50 最长的基因组作为代表,构建系统进化树。这 338 个簇覆盖了人肠道细菌的主要门,其中 134 个簇未比对上 NCBI 收录的基因组,50 个簇未比对上 NCBI 收录的菌属。研究者通过将基因组中提取出来的 16s rDNA 序列与 EzBioCloud 数据库比对,进一步证实了所筛菌株的新颖性。CGR 还覆盖了 38 个 IGC 数据集 [1] 中低丰度(< 1%)的属,此外还新培养出  9 个 IGC 里未含有的属。

图 1. 338 个基因组簇代表的系统发育树。新菌种和新菌属分别用红色和橙色的枝表示。最外圈的条形高度表示该基因组簇内的基因组个数。

提高了宏基因组和 SNP 分析的分辨率

为了评估 CGR 对宏基因组分析的价值,研究者将 IGC 数据集中所用的宏基因组测序的 reads 数据与 CGR 数据集进行比对。并以 IGC 里整理的 3449 个基因组集(IGCR)为基准。结果显示,当 IGCR 加入 CGR 后,无论是中国人的肠道数据,还是美国人、丹麦人或西班牙人的肠道数据,reads 比对上数据集的比对率比率都有了显著提高(图 2)。相对于其他三个国家,中国人的肠道数据中之前未覆盖部分被覆盖的幅度最大(图 3),这可能与构建 CGR 数据集的所有样品都是来源于中国人有关。在基因和蛋白水平层面,相较于单独的 IGCR,IGCR 与 CGR 的合并分别增加了 373,555 基因集和 149,945 蛋白簇,相比提高了 22% 和 16%(图 4)。

图 2. 宏基因组 reads 数据比对数据集的比对率。

图 3. 宏基因组 reads 数据比对补充情况。

图 4. CGR 在基因集和蛋白簇水平的提高情况。

为了进一步阐明 CGR 的实用性,研究者利用 TwinsUK 研究中的 250 名双胞胎样品的肠道数据 [2] 进行肠道微生物组单核苷酸变异(SNPs)分析。在之前满足入选要求的 152 个参考基因组的基础上,CGR 增加了 282 个满足相同入选要求的参考基因组(图 5,6)(不少还是属于新的参考基因组)。SNP 密度表示该菌种水平内基因组的变异程度。 Ruminococcus sp. CAG:108 (Clu 21),unclassified Firmicutes (Clu 157),Eubacterium rectale (Clu 6),Escherichia coli (Clu 22),和 Ruminococcus sp. CAG:57 (Clu 19) 具有较高的 SNP 密度,而Lactobacillus gasseri (Clu 241),Enterococcus fecalis (Clu 316),Enterococcus durans (Clu 274) 和 Streptococcus mutans (Clu 217) 具有较低的 SNP 密度。

综上,CGR 提高了宏基因组和 SNPs 分析的分辨率,体现了作为一种基因组集数据资源的价值。


图 5.  CGR 的 282 个基因组在 TwinsUK 研究中的 250 份样品中的SNP密度和累积深度。从左到右按照累积深度从低到高排列,红色表示新的参考基因组。

图 6. TwinsUK 研究中 250 份样品使用的参考基因组(绿色)和 CGR 的参考基因组(蓝色)的重叠情况。紫色表示新的参考基因组。

CGR 中肠道微生物组的细菌功能

为了解析肠道微生物群的功能,研究人员深入分析比较了 1520 个基因组的功能基因分布的情况,其中覆盖了 9 类 KEGG 基础功能与 7 类有益相关的和 2 类潜在危害性相关的功能基因。结果表明,在 KEGG 代谢通路二级分类水平,涉及碳水化合物和氨基酸代谢的通路在所有的菌株中都是富含的,显示它们是肠道微生物群的核心功能(图 7)。

图 7.  1520 个肠道细菌 KEGG 代谢通路二级分类水平概貌;圈图中基因组簇的代表菌株的系统发育树同图1

KEGG 代谢通路三级分类水平(图 8)显示,在革兰氏阴性菌主要所属的门(梭杆菌门,拟杆菌门和变形菌门),广泛分布了脂多糖生物合成相关的基因。拟杆菌门则富含多糖降解相关的基因,这与先前研究报道拟杆菌门的细菌是肠道中帮助降解膳食中多糖和粘膜多糖的主要共生菌的观点是一致的。变形菌门中编码异物质降解的基因含量相对较高,可能与肠道内环境化学物质和药物的降解有关。编码信号转导和异物质降解的基因在类芽孢杆菌、芽孢杆菌、克雷伯氏菌、大肠杆菌,柠檬酸杆菌和肠杆菌(它们也出现在环境生态位,如土壤和水)中普遍存在;丰富的信号转导和异物质降解系统使这些菌属能够感知和响应自然环境中存在的各种压力和有毒物质。

图 8 显示,编码毒力因子和抗生素耐药性的基因在变形菌门中含量丰富,提示变形菌门可能是条件致病菌库;类芽孢杆菌属、芽孢杆菌属、克雷伯氏菌、大肠杆菌属、柠檬酸杆菌属和肠杆菌属中的兼性厌氧菌氧耐受性更强;拟杆菌门和双歧杆菌属的细菌普遍缺乏耐酸基因,说明以这些细菌为基础的潜在益生菌在口服后的酸性胃液环境中的存活性可能受损;编码氨基酸和维生素 B 合成的基因广泛存在于各种肠道细菌中,这表明肠道微生物群的代谢产物可能是素食中缺乏的营养物质的替代来源;编码胆盐水解酶的基因在大多数肠道细菌中也普遍存在;编码 β -半乳糖苷酶的基因则在拟杆菌门中相对丰富。

以上分析研究系统地揭示了 CGR 数据集中的功能基因组的特性。


图 8. 1520个肠道细菌基因组特定功能概貌;颜色条带代表菌门,颜色点代表菌属,横轴菌株顺序同图 1。

代表性肠道细菌的核心和泛基因组

对其中 38 种有代表性的肠道细菌分别进行了泛基因组分析,发现拟杆菌门的泛基因组具有更加开放的趋势,放线菌门的泛基因组则相对闭合(图 9)。

图 9. 38个代表物种的泛基因组拟合曲线

从基因水平分析这 38 种细菌的功能通路分布,发现普氏栖粪杆菌、直肠真杆菌等有益菌的产丁酸通路存在于核心基因组上,表明其产丁酸功能是相对保守的(图 10.a)。四环素耐药基因广泛存在于这些簇的非核心基因组中 (图 10.b)。

值得注意的是,大肠杆菌的泛基因组中几乎包含所有抗生素耐药基因(antibiotic resistance genes, ARGs),一半的ARGs存在于核心基因组中 (图 10.b)。相比之下,双歧杆菌的泛基因组很少含有 ARGs。

图 10. a) 丁酸合成通路热图;b) 抗生素耐药基因热图;粉色表示核心基因组,蓝色表示非必需基因组,空白表示未注释上。

COG 注释结果表明,管家功能显著富集于核心基因组中,包括翻译修饰、蛋白质翻转和伴侣;翻译,核糖体结构和生物转化;能源生产和转换;氨基酸运输和代谢;核苷酸转运与代谢;辅酶转运与代谢;脂质转运与代谢和无机离子转运与代谢(图 11)。相反地,在非核心基因组中富集的 COG 功能则包括细胞壁-膜-包膜生物发生,细胞运动性,信号转导机制,细胞内转运分泌及囊泡转运,防御机制,转录和复制重组与修复。

图 11.  COG 功能在核心基因组和非必需基因组的分布

4

讨论与总结

CGR 在肠道菌属和种水平上的高覆盖度,证明了基于培养的方法从肠道菌群中分离菌株的研究价值。此种培养方法可以用来扩大 CGR,直到可培养的肠道细菌的基因组达到饱和,在此之后,单细胞测序可以用来研究不可培养细菌的基因组,总体目标是构建一组饱和的肠道菌群参考基因组,从而更好地理解肠道菌群生物学。

本文应用 CGR 基因组数据集对肠道细菌进行了功能解析,表明了 CGR 将促进宏基因组分析、基因组变异分析、功能解析和泛基因组分析。这些分离的肠道细菌可能有益于旨在改变菌群功能的研究,例如作为新型益生菌,或用于疾病相关细菌标记物的验证。

5

M 菌说

① 用严格厌氧方法分离了6000 多株人粪便菌株,获得 1520 个高质量细菌基因组,构成可培养基因组参考(CGR)数据集;

② CGR 包括了人肠道的主要菌门和菌属,含有至少不少新的参考基因组,且有不少低丰度菌,丰富了现有参考基因组,提高了宏基因组学分析的分辨率;

③ 对 CGR 的功能注释加深了对肠道细菌功能的认识;

④ 对 38 种重要菌种进行泛基因组分析,揭示不同菌门的泛基因组开合趋势和在各自核心和非核心基因组上功能富集的差异情况。


参考文献

1. Li J, Jia H, Cai X, et al. An integrated catalog of reference genes in the human gut microbiome[J]. Nature biotechnology, 2014, 32(8): 834.

2. Xie H, Guo R, Zhong H, et al. Shotgun metagenomics of 250 adult twins reveals genetic and environmental impacts on the gut microbiome[J]. Cell systems, 2016, 3(6): 572-584. e3.

3. Zou Y, Xue W, Luo G, et al. 1,520 reference genomes from cultivated human gut bacteria enable functional microbiome analyses[J]. Nature biotechnology, 2019, 37(2): 179.


撰稿 | Luo Guangwen

责编 | NSC


本文系菌探Momics(ID:Momics)原创,欢迎个人转发分享。其他任何媒体、网站如需转载,须在正文前注明来源菌探Momics

菌探Momics

一起探索微生物的奥秘


点击“阅读原文”,阅读英文原文


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存