查看原文
其他

史上最详细的微生物扩增子数据库整理

2017-09-04 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

声明:文章内所有链接内容均来自“生信控”公众号,已经获作者向屿授权。

本人对每个数据库的使用目的和经验配导读,需要使用的小伙伴读点击链接跳转原文学习。

“生信控”相关文章推荐

听说不用再在各种公众号+网页检索微生物扩增子数据库的资料了,惊不惊喜?

听说史上最详细的微生物扩增子数据库整理已经在生信控上更新完成了?
是的,是的,就在生信控!在生信控!生信控!【三遍洗脑模式…】

给个面子,此处需要大家配合一下略显浮夸的围观

所有数据库的链接和简介如下(蓝色标题为链接,点击跳转详细图文):

1简介

扩增子研究的基本背景知识,包括16S和ITS结构,扩增区域选择等。

2数据库概述

几个公共数据库有RDP, SILVA, GreenGene, UNITE的基本信息统计,如官网链接、更新周期、数据量和主要用途。

RDP

RDP数据库全称“RibosomalDatabase Project”,是由密歇根州立大学开发维护的在线工具,包括数据库和分析工具两部分。两者都很好,但都没有做到最好。分析工具最早是用于一代测序产生的16S数据分析,其后逐步拓展了在28S、ITS、功能基因的分析功能,并支持二代测序平台产生的数据,而数据库部分则提供高质量、已注释的细菌、古菌16S rRNA基因和真菌28S rRNA基因序列。目前其数据库最新版本为RDP Release 11.5,于2016年9月30日更新。文章《Ribosomal Database Project: data and tools for high throughput rRNA analysis>》被引829次。使用Mother分析的用户对它应该比较熟悉,更新也算比较频繁,推荐。Usearch之前推荐使用RDP数据库用于去嵌合,现在又推荐Sliva了。

NCBI taxdmp

研究中有时不只有细菌、真菌;比如18S/ITS可以扩增出所有真核生物,最全的数据库那当然还是NCBI。很可惜这么强大的需求下没有整理。想要注释最全的物种信息,大家只能按文中的说明,自己整理吧。注:NCBI数据无人把关,比较乱,假阳性率或错误比较多;但有信息总比没有强。
通常注释需要将序列blast到NCBI的NR的核酸或蛋白库中,获得最相拟序列,再结果相似序列的GI号转换Taxonomy,链接中有详细的教程。

SILVA

最大最全的数据库,全的缺点是假阳性率会更高。SILVA是一个rRNA基因序列的综合数据库,收录原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S和18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S和28SrRNA)。细菌真菌都有,更新频繁,自己也在在线分析工具,SlivaNGS,使用详见SILVAngs: 扩增子16S/18S免费在线分析。唯一的问题是它的物种注释采用的是14级,且与常用的七级不同,不能转换和比较。

GreenGene

16S物种数据库里面可以说是大名鼎鼎了,即便是多年没有更新,但是使用该数据库进行物种注释依然是很多科研工作者不变的选择,而且16S功能分析工具PICRUSt也是基于该数据库的,可想而知其影响力。QIIME的默认数据也是它。主要是人工整理,比较准确。分类采用常用的七级界门纲目科属种,方便理解和阅读。

PR2

PR2数据库的2013年发表在Nucleic Acids Research上,是针对 18S测序分析比较好用的数据库

UNITE

16S(常选RDP或Greengene)和18S(常选SILVA或PR2)的几种常用数据库
ITS(全称ribosomal internal transcribed spacer,核糖体基因内转录间隔区)是最常用的真菌鉴定及多样性检测的marker基因,UNITE数据库是专门针对真菌ITS序列(包括ITS1和ITS2区)最全的数据库,不用考虑ITS注释数据库的选择,UNITE就是近乎唯一的存在!

FunGene

FungGene (http://fungene.cme.msu.edu/) 是RDP延伸的一个针对微生物功能基因序列的数据库。其按照功能分为抗生素抗性(Antibiotic resistances)、植物致病基因(Plant Pathogenicity)、生物地球化学循环(Biogeochemical cycles)、系统进化标志(Phylogenetic markers)、生物降解(Biodegradation)、金属循环(Metal Cycling)及其他(Other)等七类功能基因。每类都包含几到上百种功能基因,可被用于功能marker基因高通量测序后的比对及功能基因引物设计等。

喜欢上面数据库文章的小伙伴,推荐关注生信控,阅读更多相关文章!

更多相关文章,请点击“宏基因组”文章目录阅读;

想了解更多16S扩增子、宏基因组文献和分析相关文章,快关注“宏基因组”公众号,干货每日推送


系统学习生物信息,快关注“生信宝典”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存