查看原文
其他

NC:MetaSort通过降低微生物群落复杂度以突破宏基因组组装难题

2017-08-16 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

点评:目前本领域研究最大的问题是缺少大量细菌基因组作为参考宏基因组序列。这一问题严重限制了研究的准确度和进一步功能研究。而目前的研究还主要集中在扩增子和宏基因组数据的宏观描述上,即使发布了大量宏基因组数据并没有推动本领域高质量参考基因组数据的积累。
本文的分析方法正是为解决此问题,研究宏基因数据同时获得大量高质量的新物种基因组,即推动本领域的基础数据积累,也定能为研究结果增色不少。

文章作者简介

这篇文章为赵方庆团队独立完成,今年发表在Nature Communication上。赵老师是中科院北京生科院的研究员,之前人事关系在中科院遗传发育所(现转至动物所),集体活动经常见面;而且我的导师经常请赵老师指导组内学生的各类开题、中期、答辩等活动。

赵老师主要研究方向有基因组变异与精准医学、环形非编码RNA组学、宏基因组技术与人体健康三块。每块都做的非常好,具体成果详见引文的赵老师个人主页。

单看宏基因组领域,近两年赵老师已经发表了7篇高水平文章。
今天我把赵老师最新方法学文章解读笔记分析给大家。

摘要

当今大多数宏基因组分析方法依赖参考基因组。而新微生物群落的组成远超参考基因库,从头组装宏基因组仍然存在巨大挑战。
我们提出一种实验和分析的工作流程 — metaSort,可以从宏基因组样品中有效构建细菌基因组。MetaSort方法基于流式细胞术和单细胞测序提供排序的迷你宏基因组方法,并依赖有效的算法从宏基因组中重构高质量的基因组。基于广泛的比较,MetaSort方法在基因组重构和组装上表现极wffg且无偏。
更进一步,我们应用MetaSort分析海藻表面末知的微生物群落,一次性成功重构了75个高质量的基因组。此方法将极大的改进复杂微生物组群体的认识和分析。

主要结果

图1. MetaSort技术路线

第一,提取宏基因组DNA并测序,将测序结果组装成重叠群(contigs)。然后,这些contig称作meta-O,用于构建重叠群连接图(点代表contig,边连接两个可重叠的contigs)。第二,使用流式细胞仪(FCM)对样品进行分离,比如按微生物细胞大小或其它属性。对于每一个分离的子集,提取DNA,并采用单细胞测序(MDA)的方法扩增和测序。结果采用SPAdes assembler软件进行组装。基于每个子集组装的contig称作meta-S,并采用分箱算法(BAF)进行组装为基因组。第三,采用机器学习与图形组装算法(MGA),对子集的基因组进一步完善,获得目标基因组。

图2. 应用MetaSort研究口腔微生物组

(a) meta-O和metaS在各物种中的测序深度(热图)和基因组的覆盖度(柱状图)。混合组装后NGA75(类似N90)提高的倍数。(b) MGA组装中三个关键步骤的敏感性评估。(c) 组装中目标序列的组装和污染的过滤评估。(d) 以Prevotella salivae为例演示基因组重建的过程。绿色结点代表种子contigs,它与meta-S中靶基组匹配,它在meta-O中进行扩展的步骤用橙色节点表示。此外,在连接步骤,采用路径延伸来重建目标contigs,蓝色节点为无法重建的目标contigs (e) Prevotella salivae的contig连接图。

图3. 肠道宏基因组样本分析菌株水平变异

(a) 最高的5个株菌的NGA75值和基因组覆盖度增加值;(b) 气泡密度和相似度分布展示菌株水平差异; (c) 存在株水平差异的菌:采用柱状图展示Alpha多样性,和箱线图展示气泡距离。 (d) 比较肠道和口腔中某些菌的距离,发现单株水平存在显著差异。

图4. 重建海藻细菌基因组的进化树和组装验证

(a) 组装的75个细菌基因组进化上分为五个门。基因组主要来自7个科,而且用颜色高亮标出,此外仍有一些PhyloPhlAn无法分科的物种。每个基因组的完整度和N50分别用饼图和热图展示。 (b-e) 采用PacBio验证组装的基因组。PacBio reads采用BLASR比对至基因组。当比对的序列采用比对长度和序列相似度过滤后,序列可按比对结果分为四类。(b) 比对后序列分类情况比例 (c) 唯一比对位置的分类情况  (d) 排除4%不确定的序列,其它的序列平均长度很短 (e) 多基因组中共有的序列比对长度

图5. 重建海藻细菌基因组的功能

(a) 海藻KEGG与肠道和海样差异比较;(b) 水平转移基因的EGGNOG功能; (c) 比较CAZyme基因;(d) 异常示Planctomycetaceae菌科的基因组大小和CAZyme基因密度

02-08 热心肠日报

赵方庆团队:突破宏基因组组装难题的新方法MetaSort
原标题:MetaSort通过降低微生物群落复杂度以突破宏基因组组装难题
① 大部分分析宏基因组数据的现有方法有赖于参考基因组,而新的微生物群落的数量远远超出参考数据库的覆盖范围,从复杂的微生物群落做从头合成的宏基因组组装仍然是巨大挑战;② 研究者建立了新的实验和生物信息学平台MetaSort,用于宏基因组样本中细菌基因组的有效组装;③ MetaSort提供基于流式细胞仪和单细胞测序方法学的分类迷你宏基因组方法,并采用新的计算算法以有效地从分类迷你宏基因组并结合原始宏基因组中重建高质量基因组;④ MetaSort在基因组重建和组装中表现优异且无偏性,利用它分析在一种海藻表面定殖的未被探究的菌群,一次性成功重建75个高质量基因组。

英文摘要

Nature Communications    [IF:12.124]
MetaSort untangles metagenome assembly by reducing microbial community complexity
DOI: 10.1038/ncomms14306
Abstract:
Most current approaches to analyse metagenomic data rely on reference genomes. Novel microbial communities extend far beyond the coverage of reference databases and de novo metagenome assembly from complex microbial communities remains a great challenge. Here we present a novel experimental and bioinformatic framework, metaSort, for effective construction of bacterial genomes from metagenomic samples. MetaSort provides a sorted mini-metagenome approach based on flow cytometry and single-cell sequencing methodologies, and employs new computational algorithms to efficiently recover high-quality genomes from the sorted mini-metagenome by the complementary of the original metagenome. Through extensive evaluations, we demonstrated that metaSort has an excellent and unbiased performance on genome recovery and assembly. Furthermore, we applied metaSort to an unexplored microflora colonized on the surface of marine kelp and successfully recovered 75 high-quality genomes at one time. This approach will greatly improve access to microbial genomes from complex or novel communities.
First Authors:
Peifeng Ji
Correspondence:
Fangqing Zhao
All Authors:
Peifeng Ji,Yanming Zhang,Jinfeng Wang,Fangqing Zhao
2017-01-23Article

Reference

  1. 文章地址 https://www.nature.com/articles/ncomms14306

  2. 热心肠日报 http://www.xunludkp.com/papers/read/1087459080?kf=mobile.search

  3. 赵方庆简介 http://sourcedb.biols.cas.cn/cn/rck/yjdw/201309/t20130923_3936798.html

  4. 赵方庆实验室主页 http://bioinfo.biols.ac.cn/


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存