查看原文
其他

新春大礼包:9文一览最新菌群生信分析方法 | 热心肠日报

热心肠小伙伴们 热心肠研究院 2022-08-31

今天是第2082期日报。

黄适+徐健+王师:2bRAD-M实现对低生物量或降解菌群进行种水平测序

Genome Biology[IF:13.583]

① 2bRAD-M是一种高度简化且低成本的策略,仅对约 1% 的宏基因组进行测序,可产生物种水平的细菌、古菌和真菌图谱;② 对于DNA总量只有1pg,宿主DNA污染程度高或降解样本中DNA出现严重碎片化等难以测序的样品,2bRAD-M可准确生成物种水平分类图谱;③ 2bRAD-M 在各种粪便、皮肤、环境和临床中福尔马林固定石蜡包埋的样本上测试,可以成功重建全面、高分辨率的微生物图谱。

Species-resolved sequencing of low-biomass or degraded microbiomes using 2bRAD-M
01-26, doi: 10.1186/s13059-021-02576-9

【主编评语】中科院青岛能源所黄适和徐健与中国海洋大学王师作为共同通讯作者,近期在Genome Biology发表研究。为了克服传统宏基因组测序方法的瓶颈,作者开发了一种新的宏基因组学方法 (2bRAD-M),该方法可以经济高效地为具有挑战性的低生物量、高宿主污染和降解的菌群样本生成准确、种水平的物种分类图谱。对模拟数据集、模拟菌群和实际菌群样本的测试表明2bRAD-M 通过仅对约 1% 的基因组进行测序,准确地为仅包含 1 pg 总 DNA、99% 宿主 DNA 污染或由高度降解的片段组成的仅 50 bp 长度的样本生成种水平的物种分类图谱 . 此外,它可以准确地为真实的粪便、皮肤、环境表面和福尔马林固定石蜡包埋 (FFPE)样本重建细菌、古细菌和真菌的全面、物种水平的图谱,2bRAD-M 极大地扩展了我们在具有挑战性的环境中进行菌群研究的机会。(@刘永鑫-中科院-宏基因组)

孙志宏团队:用超深度混合宏基因组测序,研究人类肠道菌群中低丰度物种的基因组和功能

Gut Microbes[IF:10.245]

① 将第三代测序与超深二代测序相结合,在提升宏基因组组装性能的基础上,额外增加了对低丰度物种的覆盖度;② 直接组装得到44个Mb级别重叠群和4个环状基因组(CMAGs),并生成了475个宏基因组组装基因组(MAGs),包括287个低丰度和77个极低丰度的基因组;③ 微生物的生长速率、受到的选择压力及染色体上编码的可移动遗传元件存在个体异质性;④ 鉴定出数千个染色体外的可移动遗传元件,包括5097个噬菌体和79个新的质粒基因组。

Hybrid, ultra-deep metagenomic sequencing enables genomic and functional characterization of low-abundance species in the human gut microbiome
01-22, doi: 10.1080/19490976.2021.2021790

【主编评语】内蒙古农业大学孙志宏团队近期在Gut Microbes发表研究,设计了一种 HiSeq-PacBio 混合、超深度宏基因组测序方法,并用于从 8 名人类受试者获得的 12 份粪便样本中重建宏基因组组装基因组(MAGs),研究结果表明该策略超过了人类肠道菌群中低丰度和超低丰度物种的基因组和功能表征的现有方法。该方法流程能够揭示功能宏基因组水平的更完整信息,突出了深度测序在揭示复杂菌群中存在的稀有物种的全面基因组特征和功能宏基因组潜力方面的价值。(@刘永鑫-中科院-宏基因组)

纳米孔自适应采样:一种富集宏基因组样本中低丰度物种的方法

Genome Biology[IF:13.583]

① 自适应采样是纳米孔测序平台独有的一种软件控制的富集方法;② 为了测试其在宏基因组样本中富集稀有物种的潜力,作者创建了一个合成群落并构建了具有一系列平均读长长度的测序文库;③ 最长读长文库中丰度最低的物种富集高达 13.87 倍,考虑到排斥分子导致的产量下降,计算出的效率将其提高到 4.93 倍;④ 最后,作者介绍了一个基于分子长度和相对丰度的富集数学模型,其预测与模拟和复杂的现实世界微生物群落密切相关。

Nanopore adaptive sampling: a tool for enrichment of low abundance species in metagenomic samples
01-24, doi: 10.1186/s13059-021-02582-x

【主编评语】对于研究 DNA 分子长度对自适应采样效率和功效的影响,以确定其对宏基因组组装基因组(MAG)和诊断应用的有用性,在本文中,作者提出了一个数学模型,该模型可以在已知的相对丰度和读长长度分布的情况下预测宏基因组群落中可能的富集水平。使用合成落,作者证明模型的预测与观察到的行为密切相关,并量化了采用自适应采样对流动池产量造成的负面影响。(@刘永鑫-中科院-宏基因组)

宁康团队:菌群数据挖掘的新框架——本体感知神经网络(综述)

Briefings in Bioinformatics[IF:11.622]

① 首先将本体感知神经网络(ONN)方法作为从菌群数据进行模式挖掘的通用框架;② 讨论 ONN 在多种环境中的应用,包括基因挖掘、物种挖掘和动态模式挖掘;③ 强调 ONN 最重要的特征之一,即新颖的知识发现,这使得 ONN 在所有菌群数据挖掘方法中脱颖而出;④ 提供几个应用程序来展示 ONN 在菌群数据挖掘中相对于其他方法的优势;⑤ ONN 代表从菌群数据进行模式挖掘的范式转变:从传统的机器学习方法到本体感知和基于模型的方法。

Ontology-aware neural network: a general framework for pattern mining from microbiome data
01-29, doi: 10.1093/bib/bbac005

【主编评语】菌群实体通常以本体结构组织,考虑本体结构的模式挖掘方法可以在挖掘效率和准确性方面提供优势。华中科技大学宁康团队近期在Briefings in Bioinformatics发表综述,总结了本体感知神经网络(ONN)作为菌群数据挖掘的新框架,讨论了 ONN 在多种环境中的应用,强调了 ONN 最重要的特征之一,即新颖的知识发现,最后,提供了几个应用程序来展示 ONN 在微生物组数据挖掘中相对于其他方法的优势。(@刘永鑫-中科院-宏基因组)

Nature子刊:菌群差异丰度法在38个数据集中产生不同的结果

Nature Communications[IF:14.919]

① 本文比较了14种差异丰度检测方法(DA)在38个16S rRNA基因数据集(共9405个样本)上的性能;② 这些DA识别重要ASVs的数量和集合不一样,且结果取决于数据预处理,如limma voom、edgeR、Wilcoxon (CLR)和LEfSe识别大量ASVs,而ALDEx2和ANCOM-II相反;③ 对大部分DA来说,识别的特征数量与数据各个方面相关,如样本大小、c和群落差异的影响大小;④ ALDEx2和ANCOM-II在不同的研究中产生了最一致的结果,并且与不同DA结果的交集最一致。

Microbiome differential abundance methods produce different results across 38 datasets
01-17, doi: 10.1038/s41467-022-28034-z

【主编评语】识别差异丰富的微生物是菌群研究的共同目标。然而,很少有大规模的研究系统地探讨互换使用这些工具(差异丰度检测方法(DA))的适当性,以及它们之间差异的程度和意义。本研究通过 38 个两组 16S rRNA 基因数据集对常见DA工具进行了额外评估,其工作能够改进对这些 DA 工具的评估,并强调了在独立评估中被持有的先前研究提出的关键建议,此外,其分析显示了DA 工具的各种特征,作者可以用其来评估该领域内已发表文献。作者建议研究人员应使用基于多种差异丰度方法的共识方法,以帮助确保稳健的生物学解释。(@刘永鑫-中科院-宏基因组)

宏基因组学和宏转录组学定量分析工具AGAMEMNON

Genome Biology[IF:13.583]

① AGAMEMNON 用于从鸟枪法宏基因组学和宏转录组学样本、单微生物测序实验或测序宿主样本中获取微生物丰度;② 软件在属、种和菌株水平下提供准确的丰度,结合一种节省时间和空间的索引方案,用于快速模式匹配,能够对大量数据集进行索引和分析;③ 宿主特异性模块为 RNA/DNA 测序的微生物丰度定量提供卓越的准确性,能扩展缺乏宏基因组/宏转录组分析的实验;④ 软件提供一个 R-Shiny 应用程序,允许从图形界面执行探究和可视化。

AGAMEMNON: an Accurate metaGenomics And MEtatranscriptoMics quaNtificatiON analysis suite
01-31, doi: 10.1186/s13059-022-02610-4

【主编评语】AGAMEMNON是一种节省时间和空间的计算机框架,可用于分析宏基因组/宏转录组样本,在属、种和菌株分水平上提供高准确度的微生物丰度估计,其新颖的索引方案和分析引擎使我们能够通过提供微生物丰度估计来超越分类等级,同时绕过类似的基于比对的量化方法的巨大内存需求。AGAMEMNON 可在以下网址获得:https://github.com/ivlachos/agamemnon(@刘永鑫-中科院-宏基因组)

Nature:Robert C Edgar等开发Serratus可处理PB级序列并建立全球最大病毒组数据库

Nature[IF:49.962]

① 开发了一个云计算基础设施Serratus,以实现 PB级的超高通量序列比对;② 搜索了570万个生物多样性样本,并鉴定出超过105种新型 RNA病毒,从而将已知物种的数量扩大了大约一个数量级;③ 分别表征了与冠状病毒、丁型肝炎病毒和巨大噬菌体相关的新型病毒,并分析了它们的环境宿主;④ 建立了这些数据和工具的免费和全面的数据库;⑤ 扩展已知的病毒序列多样性可以揭示新出现病原体的进化起源,并改善病原体监测,以预测和缓解未来的大流行。

Petabase-scale sequence alignment catalyses viral discovery
01-26, doi: 10.1038/s41586-021-04332-2

【主编评语】我们需要对病毒多样性进行全球监测,以改进对未来流行病的预测和预防,受高通量测序可用性增加的推动,序列分析的计算成本仍然很高,尤其是将短读长组装成重叠群,这限制了分析样本的广度。为了促进全球病毒发现,作者提出了一种替代的基于比对的策略,它比组装便宜得多,并且能够处理大量数据集,作者开发了用于超高通量序列比对的 Serratus 云计算基础设施,筛选了 570 万个生态多样化的测序文库或 10.2PB 的数据,识别地球的病毒组是为下一次大流行做准备的基本步骤。(v0.3.0) 可在 https://github.com/ababaian/serratus上 获取。(@刘永鑫-中科院-宏基因组)

香港城市大学:使用基于GCN的半监督学习预测原核病毒的宿主

BMC Biology[IF:7.431]

① 提出了一个半监督学习模型,命名为HostG,用于对新原核病毒进行宿主预测;② 利用病毒蛋白质相似性和病毒与宿主DNA序列相似性构建知识图;③ 利用图卷积网络同时对已知宿主和未知宿主的病毒进行训练,以提高模型的接受域和学习能力;④ 在图卷积网络(GCN)训练过程中,作者最小化了预期校准误差,以确保预测的可信度;⑤ 将其与专为病毒宿主分类设计的最先进的方法进行比较,HostG的结果优于其他已知的方法,其还可以预测来自新分类群的宿主。

Predicting the hosts of prokaryotic viruses using GCN-based semi-supervised learning
2021-11-24, doi: 10.1186/s12915-021-01180-4

【主编评语】在本研究中,香港城市大学孙燕妮团队提出了一个名为 HostG 的半监督学习模型,用于对新型病毒进行宿主预测。作者在模拟和真实测序数据上测试了 HostG,结果表明它优于最先进的流程。这项工作将有助于识别宏基因组数据中的病毒-宿主相互作用,并将扩展我们对新发现的病毒的理解。HostG 的源代码位于:https://github.com/KennthShang/HostG。(@刘永鑫-中科院-宏基因组)

香港城市大学:高准确度病毒株识别工具VirStrain

Genome Biology[IF:13.583]

① VirStrain可以快速识别一个或多个与短读长测序数据中病毒来源序列最接近的参考毒株;② 作者设计了一种贪婪覆盖算法,将参考基因组划分为多个簇,使每个簇中的基因组拥有唯一的 k-mer 集;③ 在具有不同复杂性的所有基准数据集中,VirStrain 显示出比其他测试工具更高的准确性;④ VirStrain 可用于从低质量测序数据中识别毒株,这是组装工具的难点;⑤ VirStrain 在检测多毒株感染病例方面具有很高的准确性。

VirStrain: a strain identification tool for RNA viruses
01-31, doi: 10.1186/s13059-022-02609-x

【主编评语】病毒的毒株层面分析可以为病毒的定性以及流行病学研究提供重要的信息,在本研究中,香港城市大学孙燕妮团队开发了VirStrain,一个以二代测序数据与参考数据库为输入,以 (已知的) 病毒菌株组成为输出的毒株识别工具。作者在多个模拟与真实数据集上测试了VirStrain的性能,结果表示,VirStrain在灵敏度和准确度方面都优于目前较为流行的毒株识别工具或病毒单倍型重构工具。VirStrain 的源代码可在 https://github.com/liaoherui/VirStrain 免费获得。(@刘永鑫-中科院-宏基因组)

感谢本期日报的创作者:九卿臣,刘永鑫-中科院-宏基因组,白蓝木,周梦情

点击阅读过去10天的日报:

0211 | 今日Science:少吃点为何好处多多?关键因子被锁定

0210 | 今日Nature:肠道如何指导大脑"饱暖思淫欲"

0209 | 9文聚焦:肥胖的危害和减肥的学问

0208 | Gastroenterology专题:9文详解炎症性肠病

0207 | 春节七天,惊喜连连:9文一览近期高水平肠菌研究

0130 | 含糖饮料到底如何毁健康?43分权威综述系统分解

0129 | 9文聚焦:近期必读肠道类器官/干细胞论文

0128 | 今日Science:冬眠动物保肌肉,肠道菌群显神功

0127 | 黄秀娟团队再发GUT:肠道菌群影响新冠后遗症?

0126 | 《柳叶刀》27页长文聚焦:系统剖析抗生素及耐药的危害

点击阅读原文,查看更多热心肠日报的内容

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存