查看原文
其他

Nature Method:HUMAnN2实现宏基因组和宏转录组种水平功能组成分析

宏基因组 宏基因组 2019-07-15


HUMAnN2实现宏基因组和宏转录组种水平功能组成分析

Species-level functional profiling of metagenomes and metatranscriptomes

Nature Methods, [IF 26.919],  Article, 2018-10-30

DOI: http://dx.doi.org/10.1038/s41592-018-0176-y

第一作者: Eric A. Franzosa, Lauren J. McIver

通讯作者:Curtis Huttenhower

主要单位:哈佛医学院统计系;哈佛和麻省理工博德(Broad)研究所

其它作者:Gholamali Rahnavard,  Luke R. Thompson,  Melanie Schirmer,  George Weingart,  Karen Schwarzberg Lipson,  Rob Knight,  J. Gregory Caporaso,  Nicola Segata

简介

HUMAnN是一款快速宏基因组功能组成定量工具,第一版2012年发表于PLoS computational biology (当年还没有影响因子,最新17年3.9,历史最高14年4.6),截止2018年11月1号Google Scholar统计引用557次。

HUMAnN2是HUMAnN1的升级版,可实现快速宏基因组、宏转录组的物种和功能定量,同时提供功能通路内物种组成信息,软件在文章发表前已经在圈内广泛使用,关于它的使用教程请参阅公众号之前关于此软件的教程和相关流程的文章。

有参分析

虽然HUMAnN第一版只发了3分水平的杂志,是金子自然是要发光的,第二版HUMAnN2于2018年10月30日在线发表于《Nature Method》,影响因子高达26分,绝对是实至名归。

今天就以Nature Method长达12页的Article全文的要点进行解读,带大家进一步了解该软件的魅力。

导读

HUMAnN2是一款快速获得宏基因组、宏转录组物种和功能组成的软件;

与传统的翻译比对方法相比,采用分层式算法比对标记基因、泛基因组和蛋白数据库,速度更快且准确率更高;

结果同时获得功能通路中具体物种组成,建立起了物种与功能的联系,可进一步研究功能组成的贡献者;

提出贡献多样性的概念,使我们从类多样性角度重新认识微生物组功能组成,以及与物种间的联系;

完善的文档和实战教程,轻松上手实现宏基因组分析与多组学整合。

摘要

想要获得微生物组的功能组成,常用的手段是采用宏基因组或宏转录组的手段进行研究。然而这些方法在分析阶段非常耗时、产生大量错误比对结果,并通常仅获得群体水平的定量。因此,我们开发了HUMAnN2软件:采用分层式(tiered)检索策略,可以在环境和宿主相关群体中快速、准确获得种水平的功能组成。HUMAnN2采用比对泛基因组的方法鉴定群体的已知物种,并进一步翻译检索末分类的序列,最终定量基因家族和通路。与单纯的翻译检索相比,HUMAnN2获得的基因家族结果更快、更准确。应用HUMAnN2研究海洋代谢和生态贡献模式的阶梯变异(clinal variation),实现了人类微生物组通路、物种基因组变异与转录贡献和株水平组成的分析。此外,作者引入了贡献多样性的概念(contributional diversity),以解释不同微生物群体类型生态学组装的模式。

主要图表

图1. HUMAnN2分层式搜索在同类软件中准确率最高


a. HUMAnN2分层式搜索算法获得宏组学功能组成概览。HUMAnN2的输入文件为宏组学序列,即可以是DNA层面,也可以是RNA层面;第一步采用标记基因检索已知物种;第二步层级检索己知物种的泛基因组;第三步翻译末知物种序列比对至蛋白数据库;最后计算基因家族和通路的丰度,包括群体和物种层面。

b. 基于人工合成的肠道菌群评估HUMAnN2分层搜索与纯翻译搜索方法间异同。c, d 计算基因家族(c)和通路(d)丰度组成的敏感度、精度和总准确度(1 - Bray-Curtis差异)。HUMAnN2分层搜索各评估指标完胜,非常接近真实情况。

e. HUMAnN2与其它方法在8核CPU条件下比较群体COG定量计算结果。HUMAnN2分层算法在精度和准确率上最优,运行时间和敏感性次优,内存消耗水平中等。

图2. 人类核心微生物组的贡献多样性

a. 人类微生物组计划(HMP)宏基因组的核心代谢通路(点)样本内和样本间的贡献多样性。星号代表整体个群体背景物种水平的多样性。样本分别为自前鼻孔(Anterior nares)、舌背(Tongue dorsum)、粪便(Stool)和阴道后穹隆(Posterior fornix)。横坐标是样本内Gini-Simpson方法计算的贡献多样性(contributional diversity),纵坐标为基于Bray-Curtis距离计算的样本间贡献多样性;点代表每类样本中核心通路;颜色为按两种贡献多样性指数对通路进行分类十字分类为四组:紫色代表样本内贡献多样性低(即多样性简单)、样本间贡献多样性高(变异程度大,可变);红色代表样本内贡献多样性高(复杂)、样本间贡献多样性高(可变);蓝色为样本内贡献多样性低(简单)、样本间贡献多样性低(保守);黄色代表样本内贡献多样性高(复杂)、样本间贡献多样性低(保守)。图中数字颜色与颜色点数量对应。贡献多样性的提出,使我们从新的角度来认识微生物组功能组成,以及与物种间的联系。

b-e为四种极端多样性的例子。横坐标为样本,纵坐标为通路对应贡献菌的Log10转换相对丰度。物种和末分类的分层结果采用线性(比例)标准化为总体的柱高度。

红色的磷酸泛酸生物合成通路(Phosphopantothenate biosynth., PANTO-PWY)代表样本内贡献多样性高(复杂)、样本间贡献多样性高(可变)的典型。即同一功能通路有很多物种拥有,且在同类样品间波动非常大。

黄色的嘌呤核糖核苷降解(Purine ribonucleosides
degradation, PWY0-1296)通路代表样本内贡献多样性高(复杂)、样本间贡献多样性低(保守)的典型。即同一功能有很多物种拥有,且在同类样品间各物种保持稳定的比例。

紫色腺苷核苷酸从头生物合成(Adenosine ribonucleotides de novo biosynth.,  PWY-7219)通路代表样本内贡献多样性低(即多样性简单)、样本间贡献多样性高(变异程度大,可变)。即同一通路,只由少数几种菌才拥有的功能,但在样本间种类变化较大。

蓝色戊二酰辅酶降解(Glutaryl-CoA
degradation, PWY-5177)通路代表样本内贡献多样性低(简单)、样本间贡献多样性低(保守)。即同一通路,只由少数几种菌才拥有的功能,且在样本间各种类贡献比例稳定。

图3. 海洋浮游生物界温跃层相关微生物的酶

a-e, 45个红海宏基因组样本显示5个KEGG Orthogroups(KOs)与温度明显相关。全部采用HUMAnN2分析重新定量,且与原始发表结果相关。f. HUMAnN2和HUMAnN1定量4609个KOs结果的皮尔森相关系数。’GAIW’是亚丁湾中层水(Gulf of Aden Intermediate Water)的缩写, 它是红海中冷且营养富集的水团。共45个样本按深度分组,其中258m归类为500m样本组,按纬度着色,蓝色代表红海北部,红色代表红海南部。

图4. HUMAnN2实现宏转录组定量和多组学整合

a. 78对炎症性肠病(inflammatory bowel disease, IBD)患者个体宏基因组和宏转录组的181个核心功能通路样本内贡献多样性的相关分布散点图,点的颜色为RNA与DNA比值的对数;我们看到DNA层面多样性更高,因为RNA层面只是可转录的部分,多样性肯定小于DNA。

B. 宏基因组(DNA)和宏转录组(RNA)在蔗糖降解(sucrose degradation, PWY-621)通路的物种组成。在DNA层面有非常高的样本内贡献多样性,但在RNA层面样本内贡献多样性很低。而且此样式在IBD、节段性回肠炎/克罗恩氏病(Crohn’s disease, CD)、溃疡性结肠炎(ulcerative colitis, UC), 和非IBD对照中保守存在。每个样品中此通路的物种贡献重新标准化为1并使用堆叠柱状图展示。

总结

HUMAnN2功能分层引入了群体水平多样性类似的概念——贡献多样性,开启了微生物组功能新的分析角度。群体水平的功能比群体的物种组成更保守,与生态位定义的功能库一致,并满足不同的微生物聚集体。功能多样性增加了另一层含义:一些功能在群体中均匀分布,另一些仅限某些物种。相似的,现代的多组学分析微生物群体,主要分为群体功能潜能(基因组)和功能活性(基因或蛋白表达)。贡献多样性提供了一种新的研究手段,如发现广泛编码的功能仅由1种或几种物种主导表达。

HUMAnN2方法打开了宏组学中功能多样性宏分析的领域,具有如下新发现的潜能:

(i) 新微生物群体的生化与信号;

(ii) 功能的物种来源和贡献多样性样式;

(iii) 种水平精度的功能潜能与活性间的差异。

在人类微生物组中,HUMAnN2提供了验证与健康相关联功能的种、株水平假设的机会。为支持这些将来的发现,此方法发布为开源、帮助文档完善的软件,提供测试数据和学习材料,并且有活跃的用户群。网址:http://huttenhower.sph.harvard.edu/humann2

Reference

HUMAnN软件第一版引文:Abubucker, Sahar, Nicola Segata, Johannes Goll, Alyxandria M. Schubert, Jacques Izard, Brandi L. Cantarel, Beltran Rodriguez-Mueller et al. “Metabolic reconstruction for metagenomic data and its application to the human microbiome.” PLoS computational biology 8, no. 6 (2012): e1002358.

HUMAnN2软件第二版引文:Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Schwarzberg Lipson K, Knight R, Caporaso JG, Segata N, Huttenhower C. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15: 962-968 (2018).

用户手册:https://bitbucket.org/biobakery/humann2/wiki/Home

教程:https://bitbucket.org/biobakery/biobakery/wiki/humann2

软件中文教程:HUMAnN2:人类微生物组统一代谢网络分析2

以HUMAnN2为核心的分析流程,推荐:宏基因组有参流程Metagenomics Tutorial (HUMAnN2)

猜你喜欢

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2400+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存