善事利器:9文一览菌群研究新方法 | 热心肠日报
今天是第1699期日报。
人类微生物组计划多组学数据库
Nucleic Acids Research[IF:11.501]
① NIH建立人类微生物组项目数据协调中心(HMPDACC),免费开放微生物及宿主研究的组学数据;② 包括一期HMP和二期整合微生物组计划(iHMP) 的31596个样本,约48TB微生物组及宿主代谢组、蛋白质组、表观组和血清学数据;③ 并提供高级查询工具、标准化分析方法及相关培训课程,成为微生物研究的独特资源;④ 未来,NIH将建成共同基金数据生态系统, 整合HMPDACC及其他项目的海量数据,确保数据的持续可发现性、可访问性、可操作性和可重用性。
HMPDACC: a Human Microbiome Project Multi-omic data resource
2020-12-10, doi: 10.1093/nar/gkaa996/6030231
【主编评语】人类微生物组计划(HMP)和整合人类微生物组计划(iHMP)花费数十亿,产生的海量数据再利用一直困扰着广大同行。本文是由NIH主导的数据中心,不仅对数据进行分类整理,同时提供多种可用工具,为HMP和iHMP相关数据的深度挖掘和再利用提供基础,将进一步推动该数据资源的全球化使用。(@刘永鑫-中科院-宏基因组)
Nature子刊:宏基因组的分箱和组装的新方法
Nature Biotechnology[IF:36.558]
① 研究人员开发了用于宏基因组分箱的变体自动编码器(VAMB),该程序使用深度变体自动编码器在聚类之前对序列多丰度和k-mer分布信息进行编码;② VAMB的表现优于现有的分箱工具,其利用模拟和真实数据分别重建了29-98%、平均45%近乎完整的基因组;③ VAMB能够分离出平均核苷酸同一性(ANI)达99.5%的密切相关菌株,并将1,000个人类肠道微生物组样本数据集中重构255个和91个接近完整的多形拟杆菌和多雷拟杆菌特异性基因组。
Improved metagenome binning and assembly using deep variational autoencoders
01-04, doi: 10.1038/s41587-020-00777-4
【主编评语】丹麦哥本哈根大学Simon Rasmussen课题组的最新研究利用深度变体自动编码器(VAMB)改进了宏基因组的组装。该项研究成果发表在2021年1月4日出版的《自然-生物技术》上。其通过将宏基因组分箱与无监督的深度学习相结合,作者展示了在不同类型和大小的数据集上与最先进的方法相比的改进。他们的发现的重要性不局限于微生物组和宏基因组学领域,因为数据集成是许多生命科学研究领域的核心过程。通过跨多个组学数据集的数据集成,将大大提高精密医学领域的未来发现。(@刘永鑫-中科院-宏基因组)
Nature子刊:CheckV评估宏基因组组装病毒基因组的质量和完整性
Nature Biotechnology[IF:36.558]
① CheckV是一种用于识别封闭的病毒基因组、估计基因组片段的完整性并从整合原病毒中去除侧翼宿主区域的自动化流程;② CheckV通过将序列与完整病毒基因组的大型数据库进行比较来评估其完整性,该数据库包括系统搜索出的76262个病毒基因组;③ 将CheckV应用到宏基因组组装的病毒序列的各种庞大集合中,包括IMG/VR和全球海洋病毒组,揭示了44,652个高质量的病毒基因组;④ 去除宿主污染大大改善辅助代谢基因的准确识别和对病毒编码功能的解释。
CheckV assesses the quality and completeness of metagenome-assembled viral genomes
2020-12-21, doi: 10.1038/s41587-020-00774-7
【主编评语】本文介绍了CheckV(一种用于评估单重叠群病毒基因组质量的自动化流程),以及从环境数据源中系统地识别出的完整病毒基因组的扩展数据库。作者预计,CheckV将在未来的病毒宏基因组学研究和MIUViG清单所需的质量统计报告中广泛使用,也期望CheckV的完整病毒基因组数据库将成为一个有用的群落资源,其中包含对来自不同环境的大量未开发新型病毒的见解。(@刘永鑫-中科院-宏基因组)
香港城市大学:宏基因组菌株分析的新算法
Bioinformatics[IF:5.61]
① PStrain是一种可根据基因型频率和覆盖多个单核苷酸变异(SNV)基因座的读长,通过动态规划和线性规划从鸟枪法宏基因组数据中推断菌株的优化算法;② 与最新方法相比,PStrain平均将推断菌株丰度和基因型的性能分别提高87.75%和59.45%;③ 将PStrain软件应用于两个大肠癌(CRC)宏基因组数据集,发现CRC和对照样品之间的拟杆菌属菌株之间存在显著差异,这是首次报道拟杆菌属菌株在CRC肠道菌群中的潜在作用。
PStrain: An Iterative Microbial Strains Profiling Algorithm for Shotgun Metagenomic Sequencing Data
2020-12-21, doi: 10.1093/bioinformatics/btaa1056
【主编评语】鸟枪法宏基因组测序使我们能够实际分析菌群中的菌株。然而,由于菌株之间的序列高度相似,目前的方法还不完善。作者发现可以通过基因型频率推测在同一单核苷酸变异(SNV)基因座处的菌株基因型,以及相同读长覆盖的不同基因座中的变异可以提供证据,证明它们存在于同一菌株上。基于此作者设计了PStrain算法,可以根据基因型频率和覆盖多个SNV基因座的读长从鸟枪法宏基因组测中迭代地推断菌株。(@刘永鑫-中科院-宏基因组)
Nature子刊:助力研究“谁干了啥”的微生物细胞分选平台
Nature Protocols[IF:10.419]
① 本研究通过结合拉曼光谱、稳定同位素标记、微流控及光镊技术,建立了一套高通量活细胞自动分选系统;② 通过结合拉曼光谱细胞分选和光镊技术,可实现根据拉曼光谱对微生物群落中的感兴趣的单个细胞进行分选;③ 与手动分拣相比,该技术具备更高的通量(每小时最多500个细胞),更高的分类精度(98.3±1.7%),以及基于算法的分拣操作排除了个人偏好误差;④ 该技术可用于微型宏基因组学、单细胞基因组学或培养组学等研究。
Optofluidic Raman-activated cell sorting for targeted genome retrieval or cultivation of microbial cells with specific functions
2020-12-11, doi: 10.1038/s41596-020-00427-8
【主编评语】本研究开发了一个基于拉曼光谱对来自微生物群落中的感兴趣的单个细胞进行自动分选的平台。这种细胞的分类及其下游DNA分析(例如通过微型宏基因组学或单细胞基因组学或培养)允许在复杂微生物群落中的微生物细胞的代谢作用和基因组之间建立直接联系,并有针对性地分离具有特定生理功能的新型微生物。作者预计,该方法将为特定环境和宿主相关微生物组研究提供多一种通用工具,以阐明微生物类群在其复杂群落中的代谢贡献。(@刘永鑫-中科院-宏基因组)
研究肠道菌群组成和功能的新兴计算工具和模型(综述)
Current Opinion in Biotechnology[IF:8.288]
① 本文综述了宏基因组学和代谢组学时间序列分析的最新进展,并讨论了在纵向微生物组研究的背景下对这些方法和其他组学数据进行整合的方法;② 介绍了三种用于纵向研究的时间序列组学数据进行重要性检验和建模的通用方法:纵向差分丰度检验,时间网络生成和时间模式聚类;③ 整合不同类型的组学数据分析通常试图确定观察对之间的相关性,另一种方法将多元方法应用于协方差分析,越来越多的研究提出对上述组学数据整合方法的扩展。
Emerging computational tools and models for studying gut microbiota composition and function
2020-11-25, doi: 10.1016/j.copbio.2020.10.005
【主编评语】高通量测序、质谱和其他组学分析平台的进步提高了我们生成大量数据的能力,从而能够探索微生物群落组成和功能的时间变化。方法和工具是阐明机制必需的,其可以对时序数据中的依赖性进行严格建模。纵向数据通常是稀疏且采样不均匀的,在确定统计显著性,跨不同数据类型进行归一化以及模型验证方面仍然存在不小的挑战。本综述重点介绍了用于分析时间序列微生物组和代谢组数据以及整合这些数据的模型和软件工具的最新发展。(@刘永鑫-中科院-宏基因组)
高通量的粪便宏蛋白质组学方法,助力大规模临床研究
mSystems[IF:6.633]
① 粪便蛋白质组学有助于理解宿主-肠道菌群的互作机制,但由于存在通量较低等局限性,限制了其在临床上的大规模应用;② SHT-Pro是一个新的粪便蛋白质组处理流程,可定量、可重复,且大幅提高了样品处理效率;③ 用该方法在~1.5星期内,分析了来自饮食干预研究的290份样本,发现在食用富含纤维vs发酵食品的受试者间,差异蛋白质的数量随时间显著增多;④ 用饮食改变的蛋白质组谱对研究个体分类,发现通过增加受试者数量,分类准确率可高达89%。
High-Throughput Stool Metaproteomics: Method and Application to Human Specimens
2020-06-30, doi: 10.1128/mSystems.00200-20
【主编评语】mSystems上发表的一项研究,报道了一种高通量的粪便蛋白质组分析流程——SHT-Pro,具有可定量、可重复、高效率等优点,或能助力粪便蛋白质组学在大规模临床研究中的应用。(@mildbreeze)
山大团队:地球上多大比例的原核生物已有基因组测序?
Microbiome[IF:11.607]
① 原核生物是地球上最古老、最广泛的生命形式,生活在几乎所有的生态系统中,是地球元素循环的主要推动者;② 目前在地球上主要的原核生物群落中,已知基因组信息的细胞或类群占比的中位数已经分别达到38.1%(16.4%-86.3%)和18.8%(9.1%-52.6%);③ 全球原核生物类群整体上的基因组测序比例实际上仅有2.1%;④ 原核生物基因组测序目前仍集中于少数广布类群和高丰度类群,对于大量稀有类群基因组信息的了解尚非常有限。
Estimate of the sequenced proportion of the global prokaryotic genome
2020-09-16, doi: 10.1186/s40168-020-00903-z
【主编评语】地球微生物组是一个巨大的微生物资源库,长期以来的1%可培养微生物在最近很多场合被大家拿出来表示质疑。但目前我们空间获得了多少微生物的基因组呢?本文通过基因组数据的收集整合,推测这一比例至少为2%,但即使是这样,这也是一个比较小和保守的估计。此外,本文通过地球微生物组项目和微生物基因组数据的比对,也展示了地球微生物组中原核生物基因组的测序现状。(@刘永鑫-中科院-宏基因组)
微生物群落降解复杂微生物聚合物的酶
Microbiome[IF:11.607]
① 糖苷水解酶类(GHS)是宏基因组学中广泛研究的工业应用酶之一,其另一个应用是降解多糖以去除生物膜;② 微生物基因组的很大一部分基因编码GTs(约占基因总数的1-2%),但这些酶仍然不如GHs那样广为人知;③ 添加WH15EPS在依赖于培养和不依赖于培养的方法中,导致GHs编码基因得到了富集;④ 使用WH15EPS进行培养可研究和分离尚未知的微生物,如未分类的Proteobacteria和Planctomycetes,增加了可培养微生物数量。
Cultivation-independent and cultivation-dependent metagenomes reveal genetic and enzymatic potential of microbial community involved in the degradation of a complex microbial polymer
2020-06-01, doi: 10.1186/s40168-020-00836-7
【主编评语】本研究利用Acidobacteria Granulicellas菌株WH15的胞外多糖复合体结构(WH15EPS)作为富集因子,使用不依赖于微生物培养和依赖于微生物培养的方法,鉴定潜在的GH微生物产生菌和具有生物技术应用潜力的GH基因。本研究的主要目的是利用温带森林凋落物微宇宙培养和培养基培养实验,来研究靶向降解EPS的微生物和功能。作者使用稳定性同位素标记技术(SIP)结合宏基因组技术研究了使用WH15EPS改良的表层土壤,并通过宏基因组数据与固体培养-EPS改良培养基进行耦合研究。(@刘永鑫-中科院-宏基因组)
感谢本期日报的创作者:小圆儿,刘永鑫-中科院-宏基因组,白蓝木,Johnson,爱吃番茄的Mona
点击阅读过去10天的日报:
0107 | 今日Nature:肠道菌群"训练"免疫细胞,助大脑抗炎
0106 | 2020年度回顾:"肠道类器官"研究的3大发现
0105 | 再添6年跟踪数据:城市化菌群vs孩子过敏,强相关!
1231 | 年末聚焦:6文详解"粪菌移植"的有效性和安全性
点击阅读原文,查看更多热心肠日报的内容