查看原文
其他

9文聚焦:微生物组生信工具的“十八般武艺” | 热心肠日报

热心肠小伙伴们 热心肠研究院 2022-08-31

今天是第2112期日报。

基于鸟枪法读长开展细菌菌株的计算分析

Briefings in Bioinformatics[IF:11.622]

① 由于菌株的重要性,作者调查了 20 种关于细菌菌株基因组分析的工具;② 在模拟和实验数据集上评估了六种工具,包括所有关于从头细菌菌株基因组重建的工具;③ 发现尽管一些工具可以很好地预测菌株的数量和丰度,但没有一个工具可以完全预测细菌菌株中的实际菌株变化;④ 细菌菌株基因组的未来重建可能会考虑在多个宏基因组样本中具有相似丰度的辅助基因和细菌菌株。

Computational analyses of bacterial strains from shotgun reads
02-08, doi: 10.1093/bib/bbac013

【主编评语】确定菌株水平的微生物组成至关重要,这项研究调查了 20 种计算工具,试图从鸟枪读长中推断出细菌菌株的基因组,并第一次讨论了这些工具背后的方法。作者还在相同数据集上系统地评估了六种新型菌株靶向工具,发现 BHap、mixtureS 和 StrainFinder 的性能优于其他工具,但由于最佳工具的性能仍然欠佳,作者讨论了可能解决这些限制的未来方向。(@刘永鑫-中科院-宏基因组)

Nature子刊:从大量宏基因组数据中对病毒基因组进行分箱

Nature Communications[IF:14.919]

① 开发了一个基于重叠群分箱的框架 (PHAMB),以直接从大量宏基因组数据中发现病毒基因组;② 当应用于人类微生物组计划2(HMP2) 数据集时,PHAMB 从1024个病毒群中恢复了6077个高质量基因组,并确定了病毒-微生物宿主的相互作用;③ 与现有的病毒预测工具相比,它可以从任何数据集中以非常高的准确度(93-99%)对非噬菌体分箱进行分类;④ PHAMB可以有利地应用于现有和未来的宏基因组,以用其他菌群成分阐明病毒生态动力学。

Genome binning of viral entities from bulk metagenomics data
02-18, doi: 10.1038/s41467-022-28581-5

【主编评语】人类肠道病毒组及其与胃肠道细菌的相互作用目前尚不清楚,是由于缺乏全病毒组数据集以及当前识别宏基因组数据中病毒序列的方法存在局限性。在此,作者将基于深度学习的宏基因组分箱算法与配对的宏基因组和宏病毒组数据集相结合,开发了来自宏基因组分箱的噬菌体(PHAMB),这种方法允许直接从大量宏基因组数据中分箱数千个病毒基因组,同时能够将病毒基因组聚类成准确的病毒分类种群,PHAMB 工作流程可在 https://github.com/RasmussenLab/phamb 获得。(@刘永鑫-中科院-宏基因组)

METABOLIC:对微生物基因组的功能特征、新陈代谢、生物地球化学和群落尺度功能网络进行高通量分析

Microbiome[IF:14.65]

① 微生物基因组在个体生物和群落尺度上的代谢功能谱对于了解生态系统过程是至关重要的,并且也是实现基于功能特征的生物地球化学建模的一个渠道;② 作者介绍了一个工具:METABOLIC,可以基于微生物基因组或宏基因组组装基因组(MAGs)来分析单个微生物或者菌群的代谢功能网络;③ METABOLIC促进了标准化,超越了目前的基因组/蛋白质注释平台框架,提供蛋白质注释和代谢途径分析。

METABOLIC: high-throughput profiling of microbial genomes for functional traits, metabolism, biogeochemistry, and community-scale functional networks
02-16, doi: 10.1186/s40168-021-01213-8

【主编评语】作者展示了 METABOLIC 软件(微生物的代谢和生物地球化学分析),它以基于基因组的微生物代谢为基础,能够对菌群生态学和生物地球化学进行一致且可重复的研究,并将推动未培养的生物体整合到代谢和生物地球化学模型中。作者预计 METABOLIC 将使从宏基因组和基因组中更容易解释微生物代谢和生物地球化学,并使菌群研究在不同领域成为可能。METABOLIC 是用 Perl 和 R 编写的,网址为 https://github.com/AnantharamanLab/METABOLIC。(@刘永鑫-中科院-宏基因组)

BarBIQ:菌群中单菌的高通量鉴定和定量的新方法

Nature Communications[IF:14.919]

① 开发BarBIQ对单个细菌细胞进行分类群(cOTUs)鉴定并以高通量的方式对每个cOTU进行量化,该方法具有单碱基准确性;② 用BarBIQ准确鉴定并量化来自小鼠粪便的3.4x10^5个细菌细胞的810个cOTUs,其结果高度可重复;③ 对比VA充足和VA缺乏的小鼠发现粪便菌群cOTUs丰度在肠道不同位置均有差异,且cOTUs在近端位置比远端位置差异更大;④ 以上现象无法用传统的基于16S rRNA基因的方法(ASV和OTUs)准确识别,说明基于细胞的BarBIQ更准确且全面。

High-throughput identification and quantification of single bacterial cells in the microbiota
02-22, doi: 10.1038/s41467-022-28426-1

【主编评语】BarBIQ(条形码细菌的鉴定和定量 )方法基于具有单碱基精度的细胞条形码 16S rRNA 序列,将单个细菌细胞划分为分类群——本文命名为基于细胞的可操作分类单元 (cOTU),并以高通量方式量化菌群中每个 cOTU 的细胞数。BarBIQ 是一种被开发的高通量和准确的方法,在单细胞水平上定义了菌群,可用于与菌群相关的广泛研究领域。BarBIQ 可以准确地可视化全体菌群和单个细菌成员,将有助于有效了解菌群的功能。(@刘永鑫-中科院-宏基因组)

评测菌群数据无监督聚类方法的性能决定因素

Microbiome[IF:14.65]

① 本研究系统地比较了来自四项已发表研究对菌群观察结果进行聚类的方法;② 尽管没有一种方法始终优于其他方法,但作者确定了某些方法可能表现不佳的关键场景;③ Bray Curtis (BC) 指标在高丰度 OTUs 相对稀少的数据集中导致聚类效果不佳,未加权的 UniFrac (UU) 指标在低丰度 OTUs 普遍存在的数据集上聚类效果不佳;④ 作者合理地结合了 BC 和 UU 来生成一个新的指标,其在所有数据集上都显示出高的性能。

Performance determinants of unsupervised clustering methods for microbiome data
02-05, doi: 10.1186/s40168-021-01199-3

【主编评语】本文系统地比较了菌群分析中常用的 β 多样性和聚类方法。作者将这些应用于四个已发布的数据集,其中可以在样本组之间看到高度不同的微生物组,以及在组之间分离不太清晰的临床数据集。作者表示没有现有的聚类方法可以在所有数据集中普遍表现最佳,并提出了 BC(Bray Curtis) 和 UU (unweighted UniFrac) 的组合指标,利用了这两个指标的互补优势。(@刘永鑫-中科院-宏基因组)

Nature子刊:SignalP 6.0 利用蛋白语言模型可预测全部五种类型的信号肽

Nature Biotechnology[IF:54.908]

① 信号肽(SPs)控制着所有生物体的蛋白质分泌和易位,可从序列数据中推测其类型;② 研究者编译了一个含5种信号肽的蛋白序列数据集,并根据SP类型定义了区域标记规则,同时采用三重嵌套交叉验证来训练和评估模型;③ 基于蛋白质语言模型(LMs),作者升级了SignalP,与5.0版本(只能推测3种,Sec/SPIII和Tat/SPII无法预测)相比可以预测全部 5 种信号肽类型;④ 6.0新版本可适用于宏基因组数据,能够准确预测未知起源和进化遥远的蛋白质序列。

SignalP 6.0 predicts all five types of signal peptides using protein language models
01-03, doi: 10.1038/s41587-021-01156-3

【主编评语】信号肽 (SPs) 是控制所有生物体中蛋白质分泌和易位的短氨基酸序列,其可以从序列数据中被预测,但现有算法无法检测所有已知类型的SPs。本研究,作者介绍 了SignalP 6.0,这是一种机器学习模型,可检测所有五种 SP 类型并适用于宏基因组数据。SignalP 6.0 可在 https://services.healthtech.dtu.dk/service.php?SignalP-6.0 上获得。(@刘永鑫-中科院-宏基因组)

测序数据鉴别和去除rRNA序列利器RiboDetector

Nucleic Acids Research[IF:16.971]

① RiboDetector是一款用于从宏基因组、宏转录组、ncRNA和核糖体测序数据中准确而快速地检测和去除rRNA序列的软件;② RiboDetector能抓取更长距离的序列特征,从而具有更好的准确性;③ 在测试数据上,RiboDetector比其他软件的错误预测率低6到2000倍;④ RiboDetector有很好的泛化能力,能预测发现新的rRNA序列;⑤ 在测试数据上它的假阳性预测序列没有显著的对某些功能的偏向性。

Rapid and accurate identification of ribosomal RNA sequences via deep learning
02-21, doi: 10.1093/nar/gkac112

【主编评语】rRNA序列污染是广泛存在于各类高通量测序数据中的。除了在实验建库过程中对文库进行去核糖体的处理,数据分析层面也可通过一些序列比对的策略去除。本研究中,作者基于深度学习算法开发了高效准确去除核糖体序列的工具-RiboDetector,其是基于深度学习的BiLSTM(一款双向的循环神经网络架构)开发的软件,其可以快速准确地识别转录组、宏基因组、宏转录组、非编码 RNA 和核糖体测序数据中的 rRNA 读长,RiboDetector 可在 https://github.com/hzi-bifo/RiboDetector 获得。(@刘永鑫-中科院-宏基因组)

iMeta:刘洋彧等基于物种组合的深度学习方法预测菌群结构

iMeta[IF:N/A]

① 本研究提出了一个深度学习框架可以在菌群动力学未知的情况下仅从训练数据学习物种组合到菌群结构的映射;② 作者使用由经典生态动力学模型生成的合成数据系统地验证了其框架;③ 该框架应用于体外和体内群落的真实数据,包括海洋和土壤菌群、黑腹果蝇肠道菌群,以及人类肠道和口腔菌群;④ 仅从一小部分训练样本便可准确地预测菌群的结构组成;⑤ 研究结果证明了深度学习可以帮助我们理解和操控复杂菌群。

Predicting microbiome compositions from species assemblages through deep learningt
03-01, doi: 10.1002/imt2.3

【主编评语】复杂微生物群落的众多物种和未知的种群动力学一直是我们理解菌群结构变化(例如移除或添加物种)的根本障碍。推动这个领域向前发展可能需要失去一些解释机制的能力。从这个意义上说,深度学习方法可以使我们合理操控和预测复杂微生物群落的动态变化。哈佛医学院刘洋彧团队与合作者近期在iMeta发表研究,开发了一个深度学习框架来预测物种组合的群落组成,该框架不需要了解任何微生物动力学,并且各种数据的验证显示了其准确的预测能力。(@刘永鑫-中科院-宏基因组)

iMeta:陈同等开发高颜值高被引绘图网站imageGP

iMeta[IF:N/A]

① ImageGP 可以在线生成常见的线图、柱状图、散点图、箱线图、集合图、热图和直方图等;② 用户只要粘贴数据矩阵,即可一键快速出图;③ ImageGP 还支持火山图、富集分析泡泡图、主成分分析类图等和 4 种微生物领域的功能预测和生物标志物鉴定分析,包括 FAPROTAX, BugBase, PICRUSt 和 LEFSe;④ 在满足方便易用的同时, ImageGP 也提供了灵活性,可以设置多种参数、调整样式,输出发表质量的图,提供脚本实现可重复分析和用户进一步修改。

ImageGP: An easy-to-use data visualization web server for scientific researchers
02-21, doi: 10.1002/imt2.5

【主编评语】2022年2月21日,iMeta 期刊在线发表了中国中医科学院黄璐琦院士、陈同副研究员和中国科学院遗传与发育生物学研究所刘永鑫高级工程师合作题为“ImageGP: An easy-to-use data visualization web server for scientific researchers”的研究论文。该论文介绍了一款简单易用、功能强大的在线绘图工具 ImageGP,访问地址是http://www.ehbio.com/ImageGP/ 。(@刘永鑫-中科院-宏基因组)

感谢本期日报的创作者:Yuice,刘永鑫-中科院-宏基因组,王玲玲,点点,Hairong

点击阅读过去10天的日报:

0313 | 高脂饮食乱代谢、伤肝肠,吃啥可助改善?

0312 | 复旦Cell子刊突破:“坏”菌群产物或助乳腺癌免疫治疗

0311 | 欲护脑,先护肠!Nature子刊揭示菌群影响大脑衰老的新机制

0310 | “癌王”早筛新突破:粪便菌群助准确检测胰腺癌

0309 | 分析1.3万中国人数据,浙大团队揭示“吃草”的学问

0308 | 今日Cell:肠球菌如何毒害宿主细胞?发现关键毒素

0307 | 于君等GUT:促肠癌、乱肠菌,一种关键脂代谢酶被锁定

0306 | 人未老,脑先衰?Cell子刊2文聚焦“补脑”新知

0305 | 46.8分综述详解:基于肠道菌群的疾病标志物

0304 | 牛!王军等喜提NBT:用AI在肠道超高效“挖”抗菌肽(附独家专访

点击阅读原文,查看更多热心肠日报的内容


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存