查看原文
其他

微生物分类学研究利器:模式微生物基因组数据库

宏基因组 2023-02-18

       由国家微生物科学数据中心(世界微生物数据中心)建立的模式微生物基因组数据库(gcType)http://gctype.wdcm.org/,是为分类学家进行基因组研究、新种鉴定的一个非常有价值的工具平台。平台不仅集成了目前所有公共来源的模式微生物物种和基因组数据,还发布了大量自测模式微生物基因组数据,是目前国内外模式微生物基因组数据最为丰富的平台。并且集合了数据搜索下载,新种鉴定,基因组拼接与注释等在线分析工具,为全球各个保藏中心和广大分类学家提供一个分类学研究的利器。


gcType数据库主页

16702个物种截止到2020年6月,所有有效发表的原核微生物物种信息及其对应的菌株信息



      可以直接通过点击主页上的数字16702查询这些物种名称所对应的模式菌株编号(strain),测序状态(sequencing status)和测序中心(sequencing center)。也可以通过点击主页左边Data→Valid published species进入到相同的查询页面。




       如果想查询这16702个有效发表物种名称的16s rDNA 基因序列,可以通过点击主页左侧Data→16S rDNA sequences进行全部的查询。数据库还利用打分程序,对多条序列进行了质量评估,为研究人员推荐最佳质量序列。



67125个模式菌株所有有效发表的原核微生物物种,在全球微生物保藏中心共保藏有67125个模式菌株。




      可以直接通过点击主页上的数字67125查询这些模式菌株所对应的物种信息。




       也可以按照保藏中心来查询模式菌株的测序情况,通过点击主页左侧Data→Type strains by Culture Collection,可以查询得到86家不同保藏中心的全部模式菌株的数量(type strain (total)),已经测序的模式菌株的数量(type strain (sequenced)和未测序的模式菌株的数量(type strain (un-sequenced))。还可以近一步点击或者搜索单个保藏中心了解该保藏中心模式菌株的测序情况。



12715个基因组所有已经完成测序的模式微生物基因组数据



      可以直接通过点击主页上的数字12715查询这些基因组数据所对应的物种名称(species)、模式菌株编号、测序状态(project status)、基因组大小(genome size)、N50数值、Scaffold数值和GC含量(GC %)。也可以通过点击主页左侧Data→Type strain genomes进入到相同的查询页面。还可以利用过滤工具,按照不同条件选择目标基因组。






       数据库还利用打分程序,对基因组数据进行了质量评估,为研究人员推荐最佳质量基因组。基因组序列的fasta文件,还可以一键批量下载!


1726个自测基因组


       世界微生物数据中心(World data center for microorganisms,WDCM)在2018年启动了全球微生物模式菌株基因组测序计划(GCM2.0),目标是完成全世界所有模式微生物的基因组测序。已经吸引了来自14个国家超过20个保藏中心的加入。在这里,有最新发布的自测基因组数据!



通过GCM测序平台测序的基因组数据


搜索数据库



过物种名称搜索

在搜索框中输入待搜索的物种名称,不仅能够通过GCM数据库搜索到与物种名称相关的所有模式菌株编号,GCM项目编号,测序状态和测序中心的信息。还可以通过点击物种名称下面的“LPSN”图标跳转到LPSN网站查询其他相关信息。


以物种名称Streptomyces rubiginosus 为例的搜索界面



通过菌株编号搜索

在搜索框中输入待搜索的菌株编号,可以通过GCM数据库搜索到菌株编号对应的物种名称(species),GCM项目编号(project ID),测序状态(sequencing status)和测序中心(sequencing center)的信息。




     点击GCM项目编号,查看对应的测序信息 (Sequencing information)和注释结果(Annotation results)。也可以直接下载基因组fasta格式的文件





以GCM项目编号GCM60017754为例的搜索界面





       如果需要通过一些关键字或者其他特定的筛选条件来搜索需要的信息,可以通过高级搜索来实现。


高级搜索页面

 


       可以利用16S rRNA基因序列,与生物信息数据库中的16S rRNA基因序列进行比对,达到对该微生物分类鉴定的目的。将测序获得的16S rRNA基因序列放在“Input sequence”框中,在“Job title”中填写菌株编号或者其他名字,点击“Blast”,就可以搜索出该基因序列所对应的物种名称(species),一致性(Identities), 序列比对长度(Alignment Length),不匹配数(Mismatches), 缺失或插入(Gap Opens)等信息。



以物种名称“Acanthopleuribacterpedis”的16S rRNA基因序列为例的搜索页面



树形结构浏览

点击主页左侧Search→Tree browser进入树形结构浏览搜索页面,可以通过NCBI生物分类数据库(NCBI taxonomy)树形结构和基因组分类学数据库(GTDB taxonomy)树形结构两种方法在古菌和细菌两类中浏览已经测序过的物种。


以物种名称“Acidilobussaccharovorans”为例的搜索界面



基因组拼接、注释和物种鉴定




    不知道用什么工具分析?没有足够的计算资源?需要写代码太麻烦?在这个平台里都可以得到免费的一站式解决方案。



      点击主页左侧Tools→Genome Analysis可以在线进行基因组分析(包括基因组拼接和注释)。点击主页左侧Tools→Species  Identification可以在线进行物种鉴定,所有的操作都是图形化界面,只需要选择参数,上传序列文件就可以。物种鉴定模块可以计算ANI,直接用于IJSEM文章发表!



     如果是第一次使用这两个功能,请点击主页左侧Tools→Manual阅读流程说明手册。

 

在线基因组分析界面


在线物种鉴定界面


免费的新种测序和分析


      平台还可以为用户提供免费的潜在微生物模式菌株基因组测序和分析,详情请看模式微生物基因组可以免费测序了~



地址:北京市朝阳区北辰西路一号院3号 中国科学院微生物研究所

电话:010-64807385

邮箱:nmdc@im.ac.cn


猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存