9文聚焦:宏基因组学与微生物组分析方法和工具 | 热心肠日报
今天是第1559期日报。
宏基因组学能回答什么问题?什么不能?(综述)
Annual Review of Microbiology[IF:11]
① 鸟枪法宏基因组测序改变了我们检测和表征复杂微生物群落多样性和功能的能力;② 本文介绍了宏基因组学的优点及使用当前可用分析工具所能得出的结论,例如种株分辨率的物种和功能组成,同时强调了宏基因组学数据分析的挑战;③ 鉴于与模式生物相比,环境细菌功能数据库的缺乏以及异质环境样品中宏基因组组装和定量的技术难度,功能注释仍面临重大挑战;④ 使用多种技术平台的数据整合将使人们更好地了解如何利用宏基因组技术。
What Is Metagenomics Teaching Us, and What Is Missed?
06-30, doi: 10.1146/annurev-micro-012520-072314
【主编评语】本文介绍了使用宏基因组学的优势,以及当前可用的分析工具得出的结论的范围,例如跨门和功能组成在物种和菌株水平的高分辨率,同时强调了宏基因组学数据分析的挑战,且表明将来技术和方法的改进和创新将导致成本降低,并预期我们将不仅能够表征复杂的微生物群,而且能够操纵群落以实现人类健康、农业和环境可持续性发展的结果。(@刘永鑫-中科院-宏基因组)
微生物群落的菌株水平研究(综述)
Genome Medicine[IF:10.675]
① 作者讨论了人类微生物组中菌株的作用差异、菌株分布的定量方法和潜在的菌株宏基因组信息研究方法等内容;② 人类微生物组中,菌株多样性和分布与不同的身体部位、疾病和健康状况、饮食结构及药物使用等有关,不同菌株的功能存在巨大差异;③ 通过高通量测序的单核苷酸变异(SNV)等标记,或者结合培养、成像以及其他分子生物学方法能够鉴定、定量和跟踪不同的菌株;④ 菌株水平的鉴定及其功能信息有助于疾病标志物鉴定和菌群治疗方法创新。
Strain-level epidemiology of microbial communities and the human microbiome
08-13, doi: 10.1186/s13073-020-00765-y
【主编评语】本文回顾了菌株的操作定义(例如遗传和结构变异),因为现在可以使用不同的高通量技术(通常与培养无关的技术)从微生物群落中鉴定出菌株。作者总结了菌株在人体的分布和多样性,以及它们与健康维护、疾病风险和进展的新联系,以及对饮食或药物等扰动的生化反应。文中列出了利用高通量测序以及其他分子和“培养组学”技术鉴定,定量和追踪菌株的方法,最后作者讨论了人口研究在桥接试验空白和更好地了解菌株对人类微生物组健康影响方面的意义。(@刘永鑫-中科院-宏基因组)
国内团队:人类微生物组研究设计、样本采集和生物信息分析指南(综述)
Chinese Medical Journal[IF:1.585]
① 本综述为医学研究人员,特别是那些没有生物信息学背景的研究者提供简单易懂的微生物组学知识;② 介绍了基本概念,例如微生物群(microbiota)、微生物组(microbiome)和宏基因组(metagenome)等;③ 讨论了研究设计方案、样本量计算方法以及提高研究可靠性的方法;④ 讨论了微生物组研究中常用的统计分析方法,重点关注多重比较的问题以及组间β多样性分析的方法;⑤ 最后,文章介绍了生物信息学分析的具体流程。
A guide to human microbiome research: study design, sample collection, and bioinformatics analysis
06-26, doi: 10.1097/CM9.0000000000000871
【主编评语】本文讨论了用于微生物组研究的研究设计、样本收集、统计方法和生物信息学分析方法。在“研究设计”部分,强调了研究设计的重要性,特别是设计方案、样本量计算以及用于提高研究可靠性的多种措施。在“统计分析”部分,介绍了详细的多重比较P值校正方法。选择合适的统计方法对于准确解释微生物组数据很重要。最后,“生物信息学分析”部分介绍了用于分析微生物组数据分析的方法。对于微生物组研究而言,严谨的研究设计在获得有意义的结果方面具有举足轻重的作用,而适当的统计方法对于准确解释微生物组数据非常重要。循序渐进的分析流程为研究者掌握最新生物信息学分析方法提供了帮助。通过阅读这篇文章,研究者能获得研究设计、样本采集和生物信息分析等全方位的微生物组学知识。(@刘永鑫-中科院-宏基因组)
Nature子刊:偏差校正的微生物组成分析方法
Nature Communications[IF:12.121]
① 生态系统中单个分类单元的绝对丰度,能够改变所有分类单元的相对丰度;② 基于文库大小的标准方法忽视了抽样率,会由交叉样本变化引起偏差性;③ 与其他方法相比,偏差校正的微生物组成分析(ANCOM-BC)的归一化方法可以消除样本间抽样率差异所带来的偏差;④ ANCOM-BC不仅控制假阳性率在5%的水平,对所有模拟设置中保持足够的准确性;⑤ ANCOM-BC考虑了菌群结构,在属、门水平分析了肠道菌群,证明了ANCOM-BC的有效性。
Analysis of compositions of microbiomes with bias correction
07-14, doi: 10.1038/s41467-020-17041-7
【主编评语】由于数据的组成型问题,微生物组数据的差异丰度(DA)分析仍然是一个具有挑战性的问题。在本文,作者定义了“抽样比例”的概念,并证明了进行微生物组数据的DA分析的主要障碍是样本之间抽样比例差异所带来的偏差。本文引入了一种方法,该方法称为偏差校正法分析微生物群落的组成(ANCOM-BC),该方法可以估计未知的抽样比例,并校正由样品之间的差异引起的偏差,绝对丰度数据使用线性回归框架建模,该方法在该领域取得了根本性的进步。(@刘永鑫-中科院-宏基因组)
相对丰度会歪曲实际丰度,联合16S扩增子测序和总菌qPCR获得的绝对丰度可靠吗?
mSystems[IF:6.633]
① 16S扩增子测序可定量分析细菌类群的相对丰度,但样品之间总细菌负荷的差异限制了其反映单个细菌物种绝对丰度的能力;② 对20名个体的1320份样本通过16S扩增子测序获得相对丰度和qPCR总细菌载量的乘积来推断每个细菌的绝对丰度;③ 当一个物种的相对丰度大于10%时,基于两种技术联合推断的绝对丰度是可以代替靶向qPCR的检测结果;④ 靶向qPCR更适合检测相对丰度低的细菌,并且对于表征单个物种的生长和衰变动力学靶向qPCR是第一选择。
Complementing 16S rRNA Gene Amplicon Sequencing with Total Bacterial Load To Infer Absolute Species Concentrations in the Vaginal Microbiome
04-07, doi: 10.1128/mSystems.00777-19
【主编评语】微生物组研究主要使用16S rRNA基因扩增子测序来评估细菌类群的相对丰度。但是16S rRNA基因扩增子测序不能准确反映物种的绝对丰度。本研究试图确定通过细菌16S通用引物qPCR获得总细菌载量和16S rRNA基因扩增子测序获得的物种相对丰度的两者乘积是否可以准确地代替特异性qPCR所检测的单个物种的绝对丰度。总体而言,基于两种技术联合推断的特定物种的绝对丰度在某种程度上是物种特异性qPCR检测结果的合理替代,尤其是当细菌以较高的相对丰度存在时。这种方法提供了一个机会来评估细菌物种的绝对丰度,而无需为每个特定物种开发单独的qPCR分析方法。(@刘永鑫-中科院-宏基因组)
微生物组功能注释和结果优化工具DRAM
Nucleic Acids Research[IF:11.501]
① DRAM是一个可扩展的、代谢层面的微生物基因组功能注释工具;② 该工具通过Prodigal预测基因,比对Pfam、Uniref90、CAZy、KEGG和VOGDB等数据库并整合、提炼,按代谢通路和功能整理基因注释结果;③ DRAM的注释率高于其他工具(Prokka等),既能够准确地定量微生物在生物地球化学循环中的作用,也能够实现酶特异性的微生物功能分类;④ 其病毒模式DRAMv制定了相应的病毒辅助代谢基因(AMGs)判断标准,对环境中存在的大量AMGs进行分类注释。
DRAM for distilling microbial metabolism to automate the curation of microbiome function
08-07, doi: 10.1093/nar/gkaa621
【主编评语】微生物(含病毒)群落改变了地球化学生态系统,但是由于缺乏可扩展的、分解代谢的注释软件,这些生物催化的特定反应难以解读。本文介绍了DRAM(新陈代谢的精炼注释),一个将海量的微生物基因组信息转化为微生物性状集的框架,本文表明,DRAM精确地分配了微生物对地球化学循环的贡献,并在底物水平自动划分肠道微生物碳水化合物代谢。作为DRAM的病毒模式,DRAM-v建立了识别病毒编码的辅助代谢基因(AMGs)的规则,从而对来自土壤和肠道的数千个假定的辅助代谢基因进行了代谢分类。DRAM和DRAM-v一起提供了关键的代谢谱分析功能,这些功能可用于破解微生物组功能。(@刘永鑫-中科院-宏基因组)
华大基因:SOAPMetaS实现分布式集群高效分析宏基因组大数据
Bioinformatics[IF:5.61]
① SOAPMetaS是一个高效的宏基因组大样本分析软件,可在30分钟内分析80个样本(416GiB)数据;② 基于Bowtie2和MetaPhlAn2算法,通过分布式计算技术提高分析效率;③ 主要功能包括数据(data)、比对(alignment)和定量(profiling)三个模块,分别实现数据读取分发、分组并行比对和宏基因组物种定量三个功能;④ 使用不同的宏基因组数据验证,其准确率与MetaPhlAn2相当,而性能和扩展性均超过其他软件。
SOAPMetaS: profiling large metagenome datasets efficiently on distributed clusters
08-07, doi: 10.1093/bioinformatics/btaa697
【主编评语】在宏基因组研究中,数据量的快速增长对有效处理大型数据集的新工具提出了更高的要求。为了在大数据情况下加速宏基因组分析过程,作者开发了SOAPMetaS,这是一种基于标记基因的多样本宏基因组分析工具,该工具建立在Apache Spark之上。SOAPMetaS展示了处理大型数据集的高性能和可扩展性。SOAPMetaS可以加速大量多样本宏基因组数据的分析过程,并生成准确的分析结果并可以帮助研究人员有效地获取各种微生物组群落的物种分类和基因组成信息。除了对宏基因组分析外,用户还可以将“比对”模块用作快速的独立分布式比对工具。(@刘永鑫-中科院-宏基因组)
Kraken 2——快速的宏基因组物种分类注释工具
Genome Biology[IF:10.806]
① Kraken基于k-mer的方法对宏基因组数据进行快速的分类,但其高内存需求会限制某些应用;② Kraken 2引入压缩的哈希表和内部分类ID号,对Kraken的数据结构和算法进行优化,与Kraken相比减少85%的内存使用量、保持高准确性且速度提高五倍;③ Kraken 2还引入了类似于Bowtie 2 最新版本中的翻译搜索模式,从而提高了病毒宏基因组学分析的敏感性;④ Kraken 2是开源软件且安装使用方便,提供Conda安装方式,单样本分析仅需几分钟。
Improved metagenomic analysis with Kraken 2
2019-11-28, doi: 10.1186/s13059-019-1891-0
【主编评语】Kraken 2是对Kraken的优化升级后的全新版本,带来了对宏基因组数据进行快速分类注释的质的飞跃,相较于Kraken,Kraken 2拥有更先进的数据库索引方式,可以大大减少计算机内存的使用,并提高分类速度,并保持较高准确率。支持源代友、conda、docker等多种方式方便安装,分析也只需一行命令即可完成,结果格式有多种可选格式可与常见的下游分析工具STAMP、LEfSe等联用,是宏基因组物种分类的首选工具,也是Cell杂志评估20种物种分类工具中综合表现最好的工具(https://www.mr-gut.cn/papers/read/1033790381)。(@刘永鑫-中科院-宏基因组)
PhiSpy:在细菌基因组中识别噬菌体
Nucleic Acids Research[IF:11.501]
① 溶源噬菌体是将自身的基因整合到宿主细菌基因组中,并作为宿主细菌基因组的一部分进行复制,可对宿主的基因组和表型产生巨大影响;② 本研究基于噬菌体蛋白长度、转录链方向性、AT/CG的偏斜性(skew)、噬菌体特异字长(words)的丰度、噬菌体插入位点和噬菌体蛋白相似性等7个特征,开发了一种加权噬菌体检测算法PhiSpy;③ PhiSpy还使用基于相似性的方法,从而能够完全识别基因组中的噬菌体。
PhiSpy: a novel algorithm for finding prophages in bacterial genomes that combines similarity- and composition-based strategies
2012-05-14, doi: 10.1093/nar/gks406
【主编评语】在微生物基因组中发现溶源噬菌体仍然是一个没有明确解决办法的问题。之前的大多数工具依赖于检测含有已知噬菌体同源物的蛋白质编码基因的基因组区域,这阻碍了噬菌体区域的从头发现。在本文中,作者结合了两种方法(基于相似性和基于成分的分析),提出了一种自动化应用程序-PhiSpy,该应用程序可以识别与已知噬菌体基因具有或不具有同源性的噬菌体。PhiSpy是一个在细菌(或者古菌)基因组中识别溶源噬菌体的工具。输入一个经过注释的基因组,它会识别出其中最可能是噬菌体的区域。PhiSpy的原理是识别出溶源噬菌体的几个显著特征,包括:蛋白质长度,转录链的方向,AT、CG的偏斜性,噬菌体特异字长的丰度,噬菌体的插入位点和噬菌体蛋白的相似性。在测试数据集中,其可以准确预测94%的溶源噬菌体,假阴性率为6%,假阳性率为0.66%。(@刘永鑫-中科院-宏基因组)
感谢本期日报的创作者:白蓝木,波比,刘永鑫-中科院-宏基因组,Jack Chen,orchid
点击阅读过去10天的日报:
0821 | 今日Science:特定肠道噬菌体或增强抗肿瘤免疫
0820 | 从肠至脑 or 从脑至肠?帕金森病与肠道的超强综述发出
0815 | 助损伤修复,促组织再生,9文关注肠道干细胞最新进展
0814 | 小爆发:Science聚焦助抗癌菌群产物+Cell子刊7篇综述
0813 | “看不见”的战役:人体vs菌群对微量营养素的合作与竞争
0812 | 二甲双胍降糖效果不好?可能是一种菌群代谢物在捣乱
点击阅读原文,查看更多热心肠日报的内容