微生物组数据分析:近期有哪些值得关注的新方法新工具?| 热心肠日报
今天是第2509期日报。
Nature子刊:高精度去污方法SCRuB助力微生物组数据分析
Nature Biotechnology[IF:68.164]
① 开发出一种高精度去污方法(微生物组污染物去除的来源追踪;SCRuB),通过结合多个样品和对照的共享信息,进而精确识别和清除污染;② 在多个数据驱动的模拟和实验数据集中,SCRuB的准确性比最先进的方法(microDecon及decontam等)平均高出15-20倍;③ SCRuB在多个生态系统、数据类型和测序深度方面均展现出较好的稳健性;④ SCRuB可从血浆DNA中改善黑色素瘤分类,并利用被净化的肿瘤微生物组数据对黑色素瘤患者的治疗反应进行较好预测。
Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data
03-16, doi: 10.1038/s41587-023-01696-w
【主编评语】基于测序的微生物群落分析方法很容易受到污染,这可能会掩盖生物信号或产生假象。使用对照组进行计算去污染的方法是常规使用的,但不能最佳地利用不同样品的共享信息,也不能处理来自污染或生物材料泄漏到对照组的分类群。近日,哥伦比亚大学研究人员在Nature Biotechnology发表最新研究,开发出一种高精度去污方法SCRuB(https://github.com/Shenhav-and-Korem-labs/SCRuB),通过结合多个样品和对照的共享信息,可精确识别和清除污染,值得关注。(@九卿臣)
基于菌株特异性法或可用于检测交叉样本的污染?
Microbiome[IF:16.837]
① 宏基因组分析会受到DNA污染影响,其本身的污染还未报道,采用高分辨率菌株特异性法,评估两个大规模临床宏基因组学数据集污染;② 将菌株共享映射到DNA提取板,在一个数据集中识别到阴性对照和生物样本中的孔间污染,污染可能发生在萃取板相同或相邻列/行上的样品,不是相隔很远的样品;③ 在其他数据集中,也存在外部衍生物对DNA样本污染,生物量较低样本污染更显著。④ 建议使用基因型特异性监测法和阴性对照,确保结果完整性和可重复性。
Using strain-resolved analysis to identify contamination in metagenomics data
03-02, doi: 10.1186/s40168-023-01477-2
【主编评语】在高通量测序中,污染是不可避免的,虽然DNA提取试剂盒等外部污染源已经被广泛报道和调查,但来自研究本身的污染仍然被低估。近日,美国加利福尼亚大学研究人员在Microbiome发表最新研究,对于低生物量样品来说,污染尤其成问题,并且孔间污染比外部污染更难检测,是微生物组领域应该关注的问题。未来建议使用基因型特异性监测方法和阴性对照,以确保结果的完整性和可重复性。(@九卿臣)
国内团队:基于宏基因组测序数据组装方法的基准测试
Briefings in Bioinformatics[IF:13.994]
① 多种宏基因组组装工具被开发用于简化组装并解决微生物基因组中序列重复的问题;② 使用由一系列测序技术(短读长、链读长和长读长测序)生成的32个宏基因组测序数据集,对19种主流组装工具进行全面的基准测试;③ 长读长组装工具可产生较高的contig连续性,但未能揭示一些中/高质量的MAGs;④ 链读长组装工具可从人类肠菌中获得最高数量的接近完整的MAGs,基于短和长读长测序的杂合组装是提高总组装长度、获得近乎完整MAGs有希望的方法。
Benchmarking genome assembly methods on metagenomic sequencing data
03-14, doi: 10.1093/bib/bbad087
【主编评语】宏基因组组装是一种利用宏基因组测序数据重建微生物基因组的有效方法,多种组装工具也被开发用于简化组装并解决微生物基因组中序列重复的问题。然而,目前还没有对宏基因组测序技术进行全面评估,也缺乏选择合适的宏基因组组装工具的实用指南。近日,香港浸会大学张璐及团队在Briefings in Bioinformatics发表最新研究,使用由一系列测序技术生成的32个宏基因组测序数据集,对19种主流组装软件工具进行了全面的基准测试,发现通过杂合组装是提高总组装长度、获得近乎完整MAGs有希望的方法,值得关注。(@九卿臣)
国内团队:从宏基因组序列中加速识别病原体的新工具GPMeta
Briefings in Bioinformatics[IF:13.994]
① GPMeta基于GPU加速方法,可以快速且准确地从复杂的微生物组数据中识别病原体;② 基于模拟数据和临床样本的菌群数据集,GPMeta在速度和准确性方面均优于现有的鉴定工具(如Bowtie2, Bwa及Kraken2等);③ GPMeta还提供了一种聚类算法(GPMetaC),用于提升高度同源序列的鉴定准确性,且GPMetaC表现出比其他产品更高的精度和召回率;④ GPMeta支持多GPU同时对拆分数据库进行微生物序列比对和分类,可自动合并多个子数据库的结果。
GPMeta: a GPU-accelerated method for ultrarapid pathogen identification from metagenomic sequences
03-14, doi: 10.1093/bib/bbad092
【主编评语】宏基因组测序由于其无偏性和低成本特性,是临床微生物检测中识别病原体的有力工具。然而,在临床相关的时间框架内对序列进行分类的挑战阻碍了测试技术的临床实践。近日,华大基因Zengquan He、Dongfang Li、Xuebin Wang及团队在Briefings in Bioinformatics发表最新研究,开发了GPMeta(https://github.com/Bgi-LUSH/GPMeta),可以快速且准确地从复杂的微生物组数据中识别病原体,相比其他工具性能较好,值得关注。(@九卿臣)
从宏基因组数据中鉴定真核生物的工具CORRAL
Microbiome[IF:16.837]
① 开发出CORRAL工具,通过与真核生物特异性标记基因的比对和马尔可夫聚类在鸟枪宏基因组数据中鉴定真核生物;② 通过结合模拟数据集、模拟社区标准和大型公开的人类微生物组研究,CORRAL不仅灵敏准确,而且能够推断出标记基因参考中未包含的真核生物的存在,如新菌株;③ 在MicrobiomeDB.org资源上公开了CORRAL,生成了人体各种环境中存在的真核生物图谱,并将它们的存在与研究协变量联系起来;④ CORRAL允许真核生物检测自动化并大规模进行。
Improved eukaryotic detection compatible with large-scale automated analysis of metagenomes
04-10, doi: 10.1186/s40168-023-01505-1
【主编评语】微生物群落中,真菌和原生生物等真核生物经常与细菌和古菌共存。大多数环境中,由于原核信号占主导地位,因此很难用“鸟枪法”宏基因组测序来研究它们的存在。最近的真核生物检测方法是使用真核生物特异性标记基因,但它们没有包含处理参考标记基因集中没有代表的真核细胞存在的策略,并且它们与基于网络的用于下游分析的工具不兼容。Microbiome近期发表的文章,开发出从鸟枪宏基因组数据中鉴定真核生物的工具——CORRAL,并进行公开分享。(@章台柳)
用于病毒宏基因组数据分析的新工具ViroProfiler
Gut Microbes[IF:9.434]
① 开发了一种用于病毒宏基因组数据分析的新工具ViroProfiler,将分析工具、数据库与工作流管理系统结合,可对病毒组数据进行灵活且可重复的分析,并显著缩短处理时间;② 在模拟数据集中,ViroProfiler性能优于现有病毒分类工具,对病毒的分类准确度也高于属级;③ ViroProfiler可检测病毒复制周期,预测宿主并识别病毒序列中的辅助代谢基因;④ 基于先前发表的病毒宏基因组数据,ViroProfiler在病毒识别、分类及功能注释等方面均有显著提升。
ViroProfiler: a containerized bioinformatics pipeline for viral metagenomic data analysis
03-30, doi: 10.1080/19490976.2023.2192522
【主编评语】噬菌体通过调节细菌群落,在大多数生态系统的维持和功能中发挥着核心作用。然而,由于缺乏健全的生物信息学标准,目前对其多样性的理解仍然有限。近日,德国亥姆霍兹慕尼黑中心病毒所Li Deng及团队在Gut Microbes发表最新研究,开发了一种用于病毒宏基因组数据分析的新工具ViroProfiler(https://github.com/deng-lab/viroprofiler),可对病毒组数据进行灵活且可重复的分析,并显著缩短处理时间。此外,ViroProfiler可以大大提高病毒组研究中的数据分析质量,并为更标准化地描述复杂生态系统中的病毒群落奠定新基础,值得关注。(@九卿臣)
用于微生物基因组学研究的工具箱GEN-ERA
GigaScience[IF:7.658]
① 开发了GEN-ERA工具箱,专为细菌和小型真核生物比较基因组学设计,无需任何安装,允许下载、组装和储存(宏)基因组数据;② GEN-ERA还提供了同源推断、分类树重建、核苷酸序列比较和代谢建模等流程;③ 在早期分支蓝藻的18个基因组数据集上测试,可提供最新的Gloeobacterales(蓝藻细菌进化树中第一个分化群体)系统基因组分析;④ GEN-ERA可供没受过专门生信培训的用户使用,也可供微生物分类学和比较基因组学的实验室使用,应用价值广泛。
The GEN-ERA toolbox: unified and reproducible workflows for research in microbial genomics
04-10, doi: 10.1093/gigascience/giad022
【主编评语】用于分类学研究的可重复基因组工具的可用性与微生物收集相关。近日,比利时研究人员在GigaScience发表最新研究,开发了GEN-ERA工具箱(https://github.com/Lcornet/GENERA),一种专门用于细菌和小型真核生物比较基因组学平台,包含多种常见的分析流程(核苷酸序列比较和代谢建模等),可供没受过专门生信培训的用户使用,应用价值非常广泛,值得关注。(@九卿臣)
低丰度物种和抗性基因的最优宏基因组组装比较(综述)
Briefings in Bioinformatics[IF:13.994]
① 生成一种半合成的长读(LR)和短读(SR)宏基因组数据集;② 发现SR组装者以高精度恢复更多抗生素抗性基因(ARG),而LR组装允许将ARG放置在更长大肠杆菌特定重叠群中,确定其分类起源;③ 分离物中掺入竞争菌株时,所有装配器类型的强度保持不变,但精度都降低;④ 对于菌株鉴定和已知基因背景LR组装最优,对于基本准确的基因鉴定SR组装器最优;⑤ 混合装配提供连续性和基本精度,但要在多个平台上生成数据,存在应变多样性时出现高误装配率。
Comparison of long- and short-read metagenomic assembly for low-abundance species and resistance genes
02-20, doi: 10.1093/bib/bbad050
【主编评语】测序和计算机技术的进步使高分辨率评估复杂菌群的宏基因组组装成为现实。基于此,Briefings in Bioinformatics发表的综述专门评估了长读(LR)和短读(SR)以及混合(HY)宏基因组组装器在低丰度物种上的性能和优缺点。(@好雨)
国内团队:空间宏转录组测序技术SMT
Genome Research[IF:9.438]
① 开发了空间宏转录组测序及一体化生信分析技术SMT,可实现宿主基因表达和微生物分布的空间定位及联合分析;② 基于小鼠大小肠组织及结直肠癌病人手术样品,利用荧光原位杂交、传统批量测序等技术证明SMT分析结果可靠性较高;③ 通过模拟可控的组织驻留菌,发现不同浓度菌液内的菌形成深浅不同的电子“菌斑”,通过计算可定量显示SMT捕获率和召回率;④ SMT还可复现一些菌群与宿主的互作,如螺杆菌属的高免疫原性及梭菌属穿越肠壁的移行能力。
Simultaneous profiling of host expression and microbial abundance by spatial metatranscriptome sequencing
03-27, doi: 10.1101/gr.277178.122
【主编评语】近年来,空间转录组技术发展迅速,可解析实体组织基因表达的空间异质性,确定其细胞组成及功能特点。然而标准的ST技术在评估宿主细胞与驻留微生物的互作研究方面仍存在精度及通量方面的局限性。近日,上海市免疫学研究所陈磊及团队在Genome Research发表最新研究,开发了空间宏转录组测序及一体化的生物信息分析技术SMT, 通过结合空间转录组数据和微生物丰度数据,可在空间层面揭示宿主细胞和微生物的大致分布与互作状态。总之,该研究为微生态研究提供了有力的工具,值得关注。(@九卿臣)
Nature子刊:新型单细胞RNA测序或可助力预测细菌毒素?
Nature Microbiology[IF:30.964]
① 开发了基于探针的细菌测序(ProBac-seq),是一种使用DNA探针库和现有商业微流体平台进行单细胞RNA测序的方法;② 对每个实验的数千个单细菌细胞的转录组进行测序,平均每个细胞中可检测数百个转录本;③ 应用于枯草芽孢杆菌和大肠杆菌,ProBac-seq可正确识别已知细胞状态,并揭示先前未报道的转录异质性;④ ProBac-seq发现不产生毒素的产气荚膜梭菌细胞可得到充足营养,而产毒的细胞似乎缺乏多种关键的营养物质,这类亚群可由醋酸盐控制。
Probe-based bacterial single-cell RNA sequencing predicts toxin regulation
04-03, doi: 10.1038/s41564-023-01348-4
【主编评语】克隆细菌种群依赖于单个细胞间的转录变异来产生特殊的状态,从而增加适应性。要了解所有的细胞状态,就需要在单细胞水平上研究等基因细菌种群。近日,哈佛大学、普林斯顿大学等研究人员在Nature Microbiology发表最新研究,利用DNA探针库和现有商业微流体平台开发了一种基于探针的细菌单细胞RNA测序方法(ProBac-seq),发现细菌群落中基因相同的细胞(如产气荚膜梭菌)具有不同的功能,一些成员表现得更温顺,而另一些成员则会产生毒素,值得关注。(@九卿臣)
感谢本期日报的创作者:九卿臣,YANG WEI,往、昔℡,章台柳,Leo,Sunflower
0419 | 房静远等Nature子刊:他汀类药物或能抑肠癌?锁定关键肠菌代谢物
0417 | Nature领衔+4篇高分综述,一览5种消化道肿瘤研究前沿
0415 | 马迎飞/戴磊等Cell子刊领衔!11文一览噬菌体/病毒组研究前沿
0414 | 武阳丰等Nature子刊:降低老年人血压,代盐vs限盐谁胜出?
0413 | 李娟/周宏伟/陈世贤等Cell子刊:促关节炎的“坏”肠菌被锁定