查看原文
其他

sxr2 2018-05-23

一、综合数据库

(一)NCBI

NCBI介绍

(二)EMBL

欧洲分子生物学实验室( EuropeanMolecular Biology Laboratory  EMBL )(http //www.embl.org/  ,1974 年由几乎全部西欧国家及以色列等 16国资助在德国海德堡建立的国际研究学院网络,致力于分子生物学研究,在德国、法国、意大利、英国设有 5 个分支机构。1980 年,建立了世界上第一个核酸序列数据库,即 EMBL 核酸序列数据库。

EBI

欧洲生物信息学研究所( EuropeanBioinformatics Institute  EBI )(http  //www.ebi.ac.uk/)是EMBL 的一部分, 1992 年由欧盟资助建立在英国的一个非盈利性学术机构,也是生物信息学研究与服务的欧洲中心。该研究所开发有多种生物学数据库,包括:核酸序列数据库(EMBL 核酸序列数据库、 Ensembl  EMEST MitBase Server  EDGP  Parasites等),蛋白质序列数据库(SWISS-PROT  TrEMBL  InterPro 等),全部基因组数据库,序列结构分类数据库(DSSP  HSSP  DALI 等),大分子结构数据库(EBI-MSD 等),人类蛋白质组数据库( HPI 等),序列图谱数据库(RHdb Server GenomeMaps98 等);也提供CLUSTAL  FASTA  SRS WU-BLAST 等工具,为各国研究人员提供来自学术界的分子生物学、医学与农业、遗传学、化学、生物技术、药学工业等多方面的资源信息。

(三)ExPASy

蛋白质分析专家系统(Expert Protein Analysis System , ExPASy )( http://www.expasy.org/ ),是 1994 年由瑞士生物信息学院(Swiss Institute of Bioinformatics ,SIB )( http : //www.isb-sib.ch/ ),创建的世界上第一个分子生物学网站,专门从事蛋白质序列、结构、功能和蛋白质 2D-PAGE 图谱的分析。在瑞士、澳大利亚、玻利维亚、加拿大、中国( http : //cn.expasy.org/)、韩国、美国等国家和地区设立有镜像站点。通过该网站可链接到国际上包括 ENZYME 、 PROSITE 、 TrEMBL 、 SWISS-PROT 、 SWISS-2DPAGE 、SWISS-3DIMAGE 等数据库的有关核酸、蛋白质、基因组序列,结构与功能的 1000 多个相关站点,以及SWISS-MODEL 等软件工具

(四)RCSB

结构生物信息学研究联合实验室( the Research Collaboratory for Structural Bioinformatics ,RCSB )( http : //www.rcsb.org/index.html ),是一个非盈利性研究机构,主要通过对生物大分子三维结构的研究来探索生物系统的功能。 RCSB 提供有 PDB 生物大分子结构数据库(PDB , http : //www.rcsb.org/pdb/ )和 NDB 核酸数据库( NDB , http ://ndbserver.rutgers.edu/ )等数据库,并提供其开发的结构分析工具、标准和教学服务信息等。

(五)NIG

日本国立遗传学研究所 日本国立遗传学研究所( National Institute of Genetics , NIG )( http: //www.nig.ac.jp/ ),是日本遗传学各方面研究的中心研究机构及生命科学所有领域的研究基地,其建立的日本 DNA 数据库( DNA DataBank of Japan , DDBJ )( http ://www.ddbj.nig.ac.jp/ ),与欧洲 EBI 维护的 EMBL 数据库和美国 NCBI 的 GenBank 数据库并列为国际上最著名的三大 DNA 数据库。通过该数据库的检索界面( http://www.srs.ddbj.nig.ac.jp/index-e.html )可以链接 PDB 、 DDBJ 、 PIR 、 ENZYME 、SWISSPROT 、 PROSITE 等多个数据库。


二、专题数据库


主要包含11个专题:

共表达数据库;酶、代谢和调控路径数据库;基因组数据库;文献数据库;序列为基础的数据库检索; 系谱分析;基因结构预测分析专题;蛋白质结构预测分析;功能基因组分析 ;植物数据库专题;调控专题;绘图工具专题


(一)共表达数据库


1.植物 ATTED-II 

http://atted.jp/

2.水稻RiceFREND

http://ricefrend.dna.affrc.go.jp/

3. 动物 COXPRESdb

http://coxpresdb.jp/


(二)酶、代谢和调控路径数据库

1. KEGG 

http://www.genome.ad.jp/kegg/ 

用法:最新实用KEGG介绍

2. Enzyme Nomenclature Database

 http://expasy.hcuge.ch/sprot/enzyme.html

3.Protein Kinase Resource (PKR)

 http://www.sdsc.edu/kinases/ 

4. LIGAND

 http://www.genome.ad.jp/dbget/ligand.html 

5.WIT 

http://www.cme.msu.edu/WIT/ 

6. EcoCyc

 http://ecocyc.PangeaSystems.com/ecocyc/ 

7.UM-BBD 

http://www.labmed.umn.edu/umbbd/ 

8. 多种代谢路径数据库

 http://www.unl.edu/stc-95/ResTools/biotools/biotools8. html 

9.基因调控路径数据库(TRANSPATH) 

http://transfac.gbf.de

(三)基因组数据库 

1.综合数据库

Phytozome:http://www.phytozome.net/

Ensemble:http://ensembl.gramene.org/genome_browser/index.html 

NCBI:http://www.ncbi.nlm.nih.gov/assembly/?term=

2.基因组复制数据库PGDD

http://chibba.agtec.uga.edu/duplication/

3.禾本科比较基因组

http://www.gramene.org GrainGene http://www.graingenes.org 4.Botanical Databases http://www.transgenica.com/botanicaldatabase.htm 

5.Botanical Data

 http://www.calflora.org/calflora/batanical.html 

6.C. elegans genome

 http://www.acedb.org 

 7.粘菌(Dictyostelium)基因组

 http://dictygenome.bcm.tmc.edu 

8.Animal genomes (ArkDB)

 http://www.thearkdb.org 

9.FlyBase 

http://flybase.bio.indiana.edu/.bin/fbidq.html?FBgn0003 075 

10.Mouse Genome Informatics http://www.informatics.jax.org/bin/query_accession?id= MGI:97555 11.Saccharomyces Genome Database 

http://genome-www.stanford.edu/cgi-bin/dbrun/Sacch DB?find+Locus+%22PGK1%22 

12多种基因组数据库 

http://www.hgmp.mrc.ac.uk/GenomeWeb

(四)文献数据库


1. 几乎所有SCI文献免费下载网站

http://www.sci-hub.cc/

2. PubMed文献检索

http://www.ncbi.nlm.nih.gov/PubMed/

3. gnosis

第一个是刘晓乐团队开发的文献挖掘系统,输入关键词,会列出相关的文献,可以设定SCI影响因子优选文献。搜出的文献相关性非常高。

工具链接:http://gnosis.cistrome.org/#


(五)序列为基础的数据库检索

1.BLAST http://www.ncbi.nlm.nih.gov/BLAST/ 

2.FASTA http://www.ebi.ac.uk/fasta33/index.html 

3.BLITZ http://www2.ebi.ac.uk/bicsw/ 

4.SSearch http://www2.igh.cnrs.fr/bin/ssearch-guess.cgi

5.Electronic PCR http://www.ncbi.nlm.nih.gov/STS/ 

6.Proteome analysis http://www.ebi.ac.uk/proteome/

7.Clustal multiple sequence alignment http://searchlauncher.bcm.tmc.edu/multi-align/multi-ali gn.html 

8.BCM 

http://searchlauncher.bcm.tmc.edu/ 

9.EBI 

ClustalW analysis http://www.ebi.ac.uk

(六) 系谱分析

1.PAUP

 http://onyx.si.edu/PAUP/ 

2. EBI ClustalW analysis 

http://www.ebi.ac.uk 

3. GCG package 

http://www.gcg.com/ 

4. PHYLIP

 http://evolution.genetics.washington.edu/phylip.html 

5. MEGA/METREE

 http://www.bio.psu.edu/imeg 

6. Hennig86 

http://www.vims.edu/~mes/hennig/software.html 

7. GAMBIT http://www.lifesci.ucla.edu/mcdbio/Faculty/Lake/Research/Programs/ 

8. MacClade

 http://phylogeny.arizona.edu/macclade/macclade.html 

9. Phylogenetic analysis 

http://www.unl.edu/stc-95/ResTools/biotools/biotools2. html 

10.MEGA 

http://www.megasoftware.net

11. iTOL在线工具 tree of life 

用法:在线编辑进化树工具

http://www.tolweb.org/tree/

12.EvolView

an online tool for visualizing, annotating and managing phylogenetic trees

网址:http://www.evolgenius.info/evolview/

(七)基因结构预测分析专题


AUGUSTUS

http://bioinf.uni-greifswald.de/webaugustus/

Genewise

http://www.ebi.ac.uk/Tools/psa/genewise/

GENSCAN

http://genes.mit.edu/GENSCAN.html

http://bioweb.pasteur.fr/seqanal/interfaces/genscan-simple.html

http://bioweb.pasteur.fr 

GeneFinder

http://genomic.sanger.ac.uk/gf/gf.shtml

http://www.softberry.com/nucleo.html

Gene Feature Searches

 http://dot.imgen.bcm.tmc.edu:9331/ 

Grail

 http://compbio.ornl.gov/Grail-1.3/ 

GrailEXP 

http://grail.lsd.ornl.gov/grailexp/

GeneMark

 http://opal.biology.gatech.edu/GeneMark/eukhmm.cgi 

http://genemark.biology.gatech.edu/GeneMark/hmmchoice.html

Veil 

http://www.cs.jhu.edu/labs/compbio/veil.html 

AAT 

http://genome.cs.mtu.edu/aat.html 

GENEID

 http://www.imim.es/GeneIdentification/Geneid/geneid_input.html 

Genlang

 http://cbil.humgen.upenn.edu/~sdong/genlang_home.ht ml 

GeneParser 

http://beagle.colorado.edu/~eesnyder/GeneParser.html 

Glimmer

 http://www.cs.jhu.edu/labs/compbio/glimmer.html 

MZEF

 http://www.cshl.org/genefinder 

Procrustes

 http://www-hto.usc.edu/software/procrustes/

(八)蛋白质结构预测分析


2ZIP

Function: Prediction of leucine zipper domains

Website: http://2zip.molgen.mpg.de/index.html

3of5

Function: find user-defined patterns inprotein sequences

Website: http://www.dkfz.de/mga2/3of5/3of5.html

AACompIdent

Function:protein identification by aa composition

Website: http://web.expasy.org/aacompident

AACompSim

Function:amino acid composition comparison

Website:http://web.expasy.org/aacompsim/

Agadir

Function:Prediction of the helical content of peptides

Website:http://agadir.crg.es/

ALF

Function:simulation of genome evolution

Website:http://www.cbrg.ethz.ch/alf

Alignmenttools

Function:Four tools for multiple alignments

Website:http://coot.embl.de/Alignment/

AllAll

Function:protein sequences comparisons

Website:http://www.cbrg.ethz.ch/services/AllAll

APSSP

Function:Advanced Protein Secondary Structure Prediction

Website:http://imtech.res.in/raghava/apssp/

Ascalaph

Function:Molecular modeling software

Website:http://www.biomolecular-modeling.com/Products.html

big-PI

Function:predict GPI modification sites

Website:http://mendel.imp.ac.at/sat/gpi/gpi_server.html

BiochemicalPathways

Function:Biochemical Pathways

Website:http://web.expasy.org/pathways/

BLAST

Function:sequence similarity search

Website:http://web.expasy.org/blast/

BLAST(UniProt)

Function:BLAST search on the UniProt web site

Website:http://www.uniprot.org/blast

BLAST-NCBI

Function:Biological sequence similarity search

Website:http://www.ncbi.nlm.nih.gov/BLAST/

BLAST-PBIL

Function:BLAST search on protein sequence databases

Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_blast.html

Blast2Fasta

Function:Blast to Fasta conversion

Website:http://imed.med.ucm.es/Tools/blast2fasta.html

boxshade

Function:MSA pretty printer

Website:http://embnet.vital-it.ch/software/BOX_form.html

CFSSP

Function:Protein secondary structure prediction

Website:http://www.biogem.org/tool/chou-fasman/

ChloroP

Function:chloroplast transit peptides & cleavage sites

Website:http://www.cbs.dtu.dk/services/ChloroP/

Click2Drug

Function:Directory of computational drug design tools

Website:http://www.click2drug.org/

ClustalO (UniProt)

Function:Align two or more protein sequences

Website:http://www.uniprot.org/align

ClustalW

Function:Multiple sequence alignment

Website:http://embnet.vital-it.ch/software/ClustalW.html

ClustalW-PBIL

Function:Multiple sequence alignment program

Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_clustalw.html

ClustalW2

Function:Multiple sequence alignment program

Website:http://www.ebi.ac.uk/Tools/msa/clustalw2/

Coiled-Coilsprediction

Function:Prediction of coiled coils regions

Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_lupas.html

COILS

Function:Prediction of Coiled CoilRegions in Proteins

Website:http://embnet.vital-it.ch/software/COILS_form.html

ColorSeq

Function: Color Protein Sequence

Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_color.html

Compute pI/MW

Function: theoretical pI and Mw computation

Website: http://web.expasy.org/compute_pi/

CPHmodels

Function: Protein homology modeling

Website: http://www.cbs.dtu.dk/services/CPHmodels/

CSS-Palm

Function: Prediction of palmitoylation sites in proteins

Website: http://csspalm.biocuckoo.org/

DAS-TMfilter

Function: Prediction of transmembrane regions

Website: http://mendel.imp.ac.at/sat/DAS/DAS.html

Decrease redundancy

Function: Sequence redundancy reduction

Website: http://web.expasy.org/decrease_redundancy/

DIALIGN

Function: Local multiple sequence aligment

Website: http://bibiserv.techfak.uni-bielefeld.de/dialign/

DictyOGlyc

Function: GlcNAc O-glycosylation sites in D.discoideum

Website: http://www.cbs.dtu.dk/services/DictyOGlyc/

DisEMBL

Function: Prediction of disordered protein regions

Website: http://dis.embl.de/

DLP-SVM

Function: Domain linker predictor

Website: http://www.tuat.ac.jp/~domserv/cgi-bin/DLP-SVM.cgi

Dotlet

Function: sequence similarity plots

Website: http://myhits.isb-sib.ch/cgi-bin/dotlet

ELM

Function: Eukaryotic Linear Motifs

Website: http://elm.eu.org/

EMBnet services

Function: bioinformatics tools,databases and courses

Website: http://embnet.vital-it.ch/

EMBOSS translation tools

Function: sequence translation tools

Website: http://www.ebi.ac.uk/Tools/st/

epestfind

Function: Identification of PEST motifs

Website:http://emboss.bioinformatics.nl/cgi-bin/emboss/epestfind

FASTA/SSEARCH/GGSEARCH/GLSEARCH

Function: Sequence similarity searching of protein db

Website: http://www.ebi.ac.uk/Tools/sss/fasta/

FindMod

Function: protein post-translationalmodification prediction

Website: http://web.expasy.org/findmod/

FindPept

Function: peptide identification fromunspecific cleavage

Website: http://web.expasy.org/findpept/

FingerPRINTScan

Function: scan sequences againstPRINTS 

Website:http://www.bioinf.manchester.ac.uk/cgi-bin/dbbrowser/fingerPRINTScan/FPScan_fam.cgi

FUGUE

Function: Sequence-structure homologyrecognition

Website: http://tardis.nibio.go.jp/fugue/

GENIO/logo

Function: RNA/DNA & Amino AcidSequence Logos

Website: http://www.biogenio.com/logo/

Geno3D

Function: Protein molecular modelling

Website:http://geno3d-pbil.ibcp.fr/cgi-bin/geno3d_automat.pl?page=/GENO3D/geno3d_home.html

GlobPlot

Function: Proteindisorder/globularity/domain predictor

Website: http://globplot.embl.de/

GlycanMass

Function: oligosaccharide structure masscalculation

Website: http://web.expasy.org/glycanmass/

GlycoDigest

Function: exoglycosidase digestion ofglycans

Website: http://glycoproteome.expasy.org/glycodigest/

GlycoDomain Viewer

Function: visual browser forglycoproteomic data

Website: http://glycodomain.glycomics.ku.dk/

GlycoMod

Function: oligosaccharide structure prediction

Website: http://web.expasy.org/glycomod/

GlycoSiteAlign


Function: alignment of sequences aroundglycosylation sites

Website: http://glycoproteome.expasy.org/glycositealign/

Glycoviewer

Function: visualize a set of glycanstructures

Website: http://www.glycoviewer.babs.unsw.edu.au/

Glydin'

Function: network of glycoepitopes

Website: http://glycoproteome.expasy.org/epitopes/

GlyS3

Function: glycan sub-structure search

Website: http://glycoproteome.expasy.org/substructuresearch

GOR

Function: Protein secondary structureprediction

Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_gor4.html

GPI-SOM

Function: identify GPI-anchor signals

Website: http://gpi.unibe.ch/

GPMAW lite

Function: protein physical and chemicalparameters

Website: http://www.alphalyse.com/gpmaw_lite.html

GPS

Function: Prediction of kinase-specificphosphorylation site

Website: http://gps.biocuckoo.org/

(九)功能基因组分析 

1.Transcription profiling technologies 

http://www.ncbi.nlm.nih.gov/ncicgap/expression_tech_i nfo.html 

2.Protocols for cDNA array technology

 http://cmgm.stanford.edu/pbrown/array.html 

3.Data management and analysis of gene expression arrays 

http://www.nhgri.nih.gov/DIR/LCG/15k/HTML/ 

4.Examples of commercially available filter arrays: GeneFiltersTM (Research Genetics) 

http://www.resgen.com 

5.Gene Discovery Arrays (Genome Systems)

 http://www.genomesystems.com 

6.AtlasTM Arrays (CLONTECH) 

http://www.clontech.com 

(十)植物数据库专题

原文来自:http://wangyufeng222.blog.163.com/blog/static/128222070201510433511330/


http://bioinf.scri.sari.ac.uk/cgi-bin/plant_snorna/home 

植物种的snoRNA基因数据库。

http://dayhoff.generationcp.org 

多种不同植物的抗胁迫基因数据库。

http://gabi.rzpd.de 

GABI初级数据库始建于2000年,作为植物基因组计划的中心数据库,该数据库包含的信息特别多,从序列的各个部分,到实验获得的一些蛋白2-D胶图,以及基因表达谱数据、代谢途径等都具有,因此是一个生物信息翔实的数据库。

http://markers.btk.fi 芬兰

一个植物的预测的标记的数据库。

http://mendel.cs.rhul.ac.uk/mendel.php?ic=plantprom 

农作物当中的生化途径及酶。

http://plantrbp.uoregon.edu 

POGs/PlantRBP 是一个关系型数据库,整合了拟南芥、水稻、玉米的可以得到的基因组、蛋白组及序列数据,生成一个假定的同源基因组(POGs),基因注释的重点在于对那些预测的RNA结合蛋白(RBPs)。除了上述之外,同时也对这些蛋白的一些保守结构域提供查找功能。

http://plantta.tigr.org 

TIGR的植物转录本(TA)集合数据库收集了来自于NCBIGenBank Nucleotide数据库的试验验证的EST、全长cDNA数据,包括目前所有已有相关信息的植物的信息,可以通过序列的BLAST、物种等方式查找数据,并且可以自由下载这些数据。

http://podb.nibb.ac.jp/Organellome 

植物器官研究的植物器官图片和协议数据库。

http://ppdb.gene.nagoya-u.ac.jp 

TropGENE DB是一个管理热带作物的遗传和基因组信息的数据库,该数据库将作物按数个模式作物归类,目前在线公布的模式作物有香蕉、可可、椰子、棉花、油椰子、水稻和甘蔗。其他模式作物正有待开发。每个模式作物都包括遗传来源信息(如形态学、起源、等位基因数据),标记信息,遗传图谱,长序列多态性(QTL)分析结果,测序图谱,序列、基因及相应的参考文献。允许进行快速查询及复杂查询。

http://wheat.pw.usda.gov 

小麦、大麦、黑麦、三系杂交麦和燕麦的和表型信息数据库。

http://www.barleybase.org/ 

BarleyBase 是一个在线的植物微阵列数据及分析平台的数据库,目前收集了超过1000份的来自于Affymetrix Barley1 GeneChip的原始或者规范化后的芯片数据,同时提供基因的功能注释,蛋白功能区域预测、代谢途径及基因家族信息。还与PLEXdb PlantGDB的信息有相关联接。

http://www.bioinfo.wsu.edu/gdr/ 

苹果,樱桃,梨,桃,悬钩子,玫瑰和草莓的基因组数据库。

http://www.drastic.org.uk 

植物细胞的信号转导分析数据库。

http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html 

植物基因组中心提供了大规模测序计划、遗传图谱和大规模ESTs测序的数据,所有物种的分类都超链接到NCBI的分类数据库。

http://www.pathoplant.de 

PathoPlant 是一个涉及植物与病原体之间相互作用的信号转导的相关物质成分的数据库,包括一系列已知的信号转导通路的基因序列,最近还增加了相关的拟南芥的基因芯片数据,以及用于查找相应刺激所涉及的基因的工具。

http://www.phytome.org 

Phytome 是一个比较基因组学数据库,设计用于植物功能基因组学、育种和进化研究。其包括预测的蛋白序列数据、蛋白家族分类数据,多序列比对数据、进化史,及源于一个大的、系统发生的多样性植物索引的蛋白注释。Phytome通过来自不同物种的蛋白序列的直系同源或者旁系同源的进化史,将全异的各类植物基因数据库整合成一个可以交互查找的数据平台。该库允许复杂的查询,进行基因/蛋白家族的查询及下载。

http://www.plantgdb.org/ 

PlantGDB是一个植物基因组序列数据库,主要是ESTs数据。还有对于这些数据的基因注释,EST的基因组定位以及与其它数据库的链接。满足通常的数据查找功能。

http://www.plantgdb.org/AtGDB 

AtGDB是一个正在开发中的植物基因组数据库和分析工具集,该资源库的目的是方便以序列为中心的拟南芥数据的浏览,可以分区段地浏览感兴趣的基因,看其结构及基因注释,并可与cDNAEST进行比对。也可以将数据全部下载本地化。

http://www.plantontology.org 

Plant Ontology(PO)数据库由数个植物数据库系统和植物分类学、植物学和遗传学专家协作开发的,目的是建立一个基础的功能强大的植物学数据库,包括整合形态学、解剖学上的一些信息。目前该库有超过5000个来自于拟南芥、玉米、水稻的基因注释可供搜索。在同一个浏览界面下,用户可以搜索植物的器官结构、不同发育时期的信息。所有信息可以自由下载。

http://chloroplast.cbio.psu.edu/ 

叶绿体基因组数据库。

http://bioinformatics.cau.edu.cn/DPUPS/ 

该数据库主要收集了杨树的泛素化蛋白,加上预测的共计1027个基因。

http://bioinformatics.cau.edu.cn/easygo/ 

EasyGO数据库用于提供一系列待查基因的功能注释,以及微阵列探针信息,目前包括来自15个物种(主要是植物)的40多个数据类型的数据。被广泛使用。

http://dptf.cbi.pku.edu.cn/ 

DPTF:北京大学杨树转录因子数据库。

http://plantbiol.genetics.ac.cn/ 

国内多家单位完成的关于水稻的cDNA微阵列试验结果数据库。

http://planttfdb.cbi.pku.edu.cn/ 

http://plntfdb.bio.uni-potsdam.de/v2.0/ 

大豆蛋白质组数据库。

http://sundarlab.ucdavis.edu/smrnas/ 

水稻玉米小RNA数据库,该数据库包含了miRNA,siRNAta-siRNA的信息。

http://urgi.versailles.inra.fr/phyrot/ 

预测的植物蛋白簇数据库。

http://www.ncpgr.cn/ 

(NCPGR)地域植物基因研究中心。

http://www.plantenergy.uwa.edu.au/applications/mpimp/index.html 

植物线粒体蛋白运输机制。

http://www.plexdb.org 

PLEXdb是一个统一的公共的植物和其病原体的基因表达数据库,用于将迅速扩展的基因表达谱数据和传统的基因组结构数据和表型数据联结整合起来。并开发出相应的整合软件方便研究人员针对大规模表达谱数据的功能基因组学研究。

http://www.scbit.org/qtl2gene/new/ 

PlantQTL-GE是一个专为数量性状研究建立的一个数据库,它主要收集了水稻、拟南芥等植物的芯片数据及表达谱数据和基因组标志序列。同时也提供基于已知信息基因注释及顺式调控元件注释。

http://harvest.ucr.edu/ 

目前该数据库收集了大麦、短柄草属、柑橘、咖啡、豇豆、大豆、水稻、小麦等作物的表达谱数据,及相关的一些信息(Barley, Brachypodium, Citrus, Coffea, Cowpea, Soybean, Rice,Wheat)。

http://www.gramene.org/ 

Gramene Database是一个各种作物基因组信息的数据库,同时具备高级的各基因组间的分析功能。

http://ukcrop.net/ 

UK CROPNET:农作物生物信息学网络数据库。拥有很多其自己开发的数据库和分析软件,同时也收集相关的一些文献和该领域的一些信息。1996

http://ars-genome.cornell.edu/rice/ 

GrainGenes是农业部和地域农业图书馆的植物基因组计划支持的麦燕麦和甘蔗遗传数据库

http://bioserver.myongji.ac.kr/ricemac.html 韩国

韩国水稻基因组数据库。

http://cdna01.dna.affrc.go.jp/cDNA/ 

KOME:水稻的生物数据库

http://cdna01.dna.affrc.go.jp/PIPE 

水稻数据库的统一化工具数据库。

http://drtf.cbi.pku.edu.cn/ 

水稻转录因子数据库,该数据库包括了来自水稻品种indicajaponica中所有已知的和可能存在的转录因子信息。

http://gbrowse.ncpgr.cn/cgi-bin/gbrowse/japonica/ 

Rice水稻基因组注释数据库

http://gene64.dna.affrc.go.jp/RPD/ 

水稻蛋白组学数据库。

http://golgi.gs.dna.affrc.go.jp/SY-1102/rad/ 

RAD: 水稻基因组注释数据库。

http://ine.dna.affrc.go.jp/giot/ 

INE: 水稻基因组整合数据浏览器。

http://mips.gsf.de/proj/plant/jsf/rice/index.jsp 

MOsDB: The MIPS Oryza sativa database,水稻基因组数据库,包括序列数据,未来将把突变体信息、表达谱信息整合起来。

http://mpss.udel.edu/rice/ 

Rice MPSS database水稻大规模平行测序数据库。

http://orygenesdb.cirad.fr/ 

OryGenesDB:一个用于水稻反向遗传学研究的交互式工具;有水稻基因T-DNA以及Ds侧冀序列标签数据库,基因注释。

http://rapdb.dna.affrc.go.jp/ 

RAP-DB: 水稻注释计划数据库。

http://red.dna.affrc.go.jp/RED/ 

RED: 水稻表达谱数据库。

http://redb.ncpgr.cn/ 

REDB: 水稻EST数据库。

http://rgp.dna.affrc.go.jp/giot/INE.html 

水稻的基因组数据库(INE)整合了目前大规模测序后获得的关于水稻的基因组信息、cDNA 信息,遗传图谱、物理图谱的信息,并随着水稻测序的进行,持续增加新的信息。

http://rice.big.ac.cn/rice/index2.jsp 

RISE: 水稻信息系统,包括水稻基因组的最新信息以及与其他谷类作物的比较基因组分析数据。

http://rice.genomics.org.cn/ 

水稻是一种主要的粮食作物,也是一种谷物基因组研究的模式物种,北京基因组研究所(BGI)在水稻等作物基因组的测序、信息分析和生物学研究方面久负盛名。为了更好地研究,我们建立了水稻信息系统(BGI-RIS),整合了最新的数据以及比较基因组学分析数据。为了分析水稻的两大亚种,japonica indicaBGI-RIS除了包括自己测序的indica序列数据外,同时也收集了japonica及其他已知的谷类作物的基因组和EST数据。 BGI-RIS对两亚种间的相关基因、重复元件、基因重复、SNP都进行了注释。

http://rice.plantbiology.msu.edu/ 

水稻基因组注释计划。

http://ricefox.psc.riken.jp/index.php?contetns 

RiceFOX:水稻过表达拟南芥全长cDNA突变体数据库。

http://ricegaas.dna.affrc.go.jp/ 

Rice GAAS:水稻基因组信息自动注释系统。

http://rkd.ucdavis.edu/ 

水稻蛋白激酶数据库。

http://www.tigr.org/tdb/rice/ 

TIGR研究所维护着几个与水稻基因组有关的数据库,包括基因组注释库重复序列库,以及基因索引。

http://algodon.tamu.edu/ 

cottonDB南方平原农业研究中心所维护的棉花数据库

http://cottondb.org/ 

CottonDB是一个包含有棉花基因组学、遗传学和分类学数据的数据库,同时它也是一个不断增加新数据和棉花研究者资料的数据库。

http://www.cottonmarker.org/ 

棉花标记数据库,由多家科研团体协作完成,包含有大量的已公布的序列标记数据。

大麦 http://barley.ipk-gatersleben.de/ebdb.php3 欧洲

欧洲大麦数据库(EBDB)收集的信息主要来源于ECP/GR Working Group对于大麦的研究数据,由GaterslebenIPK植物基因组和作物研究所维护。

大麦 http://bioinf.scri.ac.uk/barley_snpdb/index.html 

该在线数据库包括在SCRI开展的通过交叉测序的方法挖掘到小麦和大麦的基因的SNPs的信息,目前由SCRI植物生物信息学组维护。

http://www.shigen.nig.ac.jp/barley/ 

该数据库中包含由冈山大学生物资源研究中心收集的大麦种质资源和基因组分析数据。

http://pgrc.ipk-gatersleben.de/cr-est/ 

大麦,小麦,豆类番茄EST数据库

http://synteny.nott.ac.uk/ 

UK CropNet该数据库主要提供了各类有关农作物的基因数据,包括Arabidopsis thalianaBarleyBrassicaspp.Forage GrassesMillet and tefAlfalfaChlamydomonasDictyostelium18个物种基因数据库(我未能点击进入)。

http://wheat.pw.usda.gov/GG2/index.shtml 

谷类作物信息数据库,该数据库包括了小麦,大麦,燕麦黑麦和黑小麦等品种的遗传信息和遗传图谱。

http://www.ecpgr.cgiar.org/databases/crops/wheat.htm 

由捷克共和国的作物种植研究所维护的小麦数据库。

http://www.shigen.nig.ac.jp/wheat/.html 

小麦网,由6所大学和研究所联合维护

http://www.tigr.org/tdb/e2k1/tae1/ 

TIGR institute维护的小麦基因组数据,提供小麦的基因组及基因注释,并且可用于基因组注释等分析。同时,还提供其他谷类作物的同源基因数据,如玉米、大麦、高粱、水稻等。

拟南芥&http://greenphyl.cirad.fr/cgi-bin/greenphyl.cgi 

水稻拟南芥比较基因组数据库,该数据库提供了一个水稻与拟南芥对比分析的平台。

http://affymetrix.arabidopsis.info 

诺丁汉拟南芥保存中心芯片数据库。

http://asrp.cgrb.oregonstate.edu/ 

拟南芥小RNA工程。

http://atpid.biosino.org/ 

拟南芥蛋白相互作用数据库。

http://datf.cbi.pku.edu.cn 

拟南芥转录因子数据库(DATF)收集了所有的拟南芥转录因子数据(总共1922个位点,2290个基因),划分为64个家族。该数据库序列是基于TAIR 数据库(20051108),可以采用多种方式查询数据。除此之外,另外添加了每个家族的DNA结合区域的多序列比对数据、进化树,另有GO注释,并与水稻转录因子作了同源比对。最后还增加了PDB数据的一些数据,以做核酸结合位点的定位。

http://mips.gsf.de/proj/thal/db 

MIPS的拟南芥数据库。

http://mpss.udel.edu/at/ 

拟南芥大规模平行测序信号的基因表达数据库。

http://rarge.gsc.riken.jp/ 

拟南芥cDNA、突变体和微阵列数据库。

http://urgv.evry.inra.fr/CATdb 

拟南芥转录因子数据库,拟南芥转录因子数据库整合了所有转录因子实验所获得的数据信息。

http://urgv.evry.inra.fr/projects/FLAGdb/HTML/index.shtml 

拟南芥功能基因组数据库。

http://www.arabidopsis.org/ 

拟南芥基因组数据库。

http://www.athamap.de/ 

拟南芥的全基因组范围的假定的转录因子结合位点数据库。

http://www.catma.org/ 欧洲

拟南芥基因序列标签数据库,该数据库涵盖了拟南芥中大部分的基因信息。

http://www.GABI-Kat.de 

T- DNA插入突变体在拟南芥的研究当中,具有十分重要的作用,GABI-Kat SimpleSearch是一个由GABI-Kat工程所建的拟南芥的基于侧翼序列标签(FST)的T-DNA插入突变体查找库,目前该库有从64000 lines中超过108,000定位的FSTs,这些lines覆盖了64%的目前已有注释的基因。该库允许常规的一些基因搜索,并与突变体系连接在一块。同时,该库还提供引物等信息。

http://www.plantenergy.uwa.edu.au/applications/phosphat/index.html 

拟南芥蛋白磷酸化位点数据库。

http://www.plprot.ethz.ch/ 瑞士

拟南芥质体蛋白数据库。

http://www.seedgenes.org/ 

拟南芥发育关键基因数据库。

http://www.suba.bcs.uwa.edu.au/ 

SUBAArabidopsis Subcellular Database)是由University of WesternAustraliaARC Centre of Excellence in Plant Energy Biology维护的,包含了源自各个领域的关于拟南芥蛋白的亚细胞定位的数据,如荧光定位数据、亚细胞组分的蛋白质组学研究、文献及源于(Gene Ontology annotations, Swiss-Prot and gene descriptors)的同族蛋白的信息,还有采用软件(10个)预测得到的数据,包括了非重复的将近7000个拟南芥蛋白及将近30000个采用生物信息预测的方法获得的蛋白亚定位信息。

http://psi081.ba.ars.usda.gov/SGMD/default.htm 

大豆基因组和微阵列数据库。

http://scaffold.biologie.uni-kl.de/Beanrdf/ 

豆类基因图谱数据库。

http://soybase.org/ 

Integrating为大豆研究者建立的基因组学和生物学数据库。

http://soybeangenome.siu.edu/ 

大豆基因组浏览器数据库整合了大豆基因组的信息,方便用户查找到所需信息。

http://ss.jircas.affrc.go.jp/DB/guide-eng.html 

由农业科学国际研究中心主导维护的东北部大豆基因组数据库。

http://www.comparative-legumes.org/ 

豆类作物基因组ESTx信息数据库,基因蛋白表达信息,该数据库给出了多个品种的信息。

http://www.ildis.org/LegumeWeb/ 

ILDIS国际豆科植物数据库和信息服务

http://www.soybeantilling.org/ 

该数据库为了TILLING (Forrest and Williams82)的大豆诱变突变体第二代库工程而开发的,大约有3000M2lines按照其表型分类存储。

http://maize.tigr.org/ 

TIGR的玉米数据库。

http://mips.gsf.de/proj/plant/jsf/maize/index.jsp 

mgsp:玉米基因组数据库,基于基因组测序。

http://mtm.cshl.org/ 

mtmDB:玉米定点诱导突变体数据库。

http://www.agron.missouri.edu/ 

该数据库储存有玉米基因组的进展信息。

http://www.maizegdb.org/ 

MaizeGDB:玉米基因组信息数据库,该数据库包括所有遗传学,基因产物,功能分析,以及相关文献查阅等的信息。

http://www.panzea.org 

玉米基因组工程数据库,该数据库是用于玉米基因组中和功能多样性分析。

http://www.polebio.scsv.ups-tlse.fr/MAIZEWALL/ 

MAIZEWALL

的玉米细胞壁生物合成和装配的生物信息分析和基因表达数据库。

http://zmdb.iasstate.edu/ 

玉米基因组数据库

http://bioinfo.noble.org/gene-atlas/ 

MtGEA: 蒺藜苜蓿基因表达谱数据库。收集了Affymetrix公司的苜蓿基因芯片的关于苜蓿多个器官的基因表达谱数据。

http://brassica.bbsrc.ac.uk/ 

Brassica Genome Gateway 2008芸苔基因组数据库。

http://medicago.cau.edu.cn/ 

苜蓿数据库,包括基因组注释信息及部分表达谱数据。

http://medicago.toulouse.inra.fr/Mt/EST/ 

MENS: Medicago EST Navigation System 苜蓿表达谱数据导航系统。包括EST测序数据,微阵列数据等。

http://www.medicago.org/genome/ 

蒺藜苜蓿序列数据库,由苜蓿基因组计划完成测序。

http://www.medicago.org/MtDB 

蒺藜苜蓿基因组数据库。

http://www.ncgr.org/research/mgi/ 

MGI,NCGRSamuel Roberts Noble基金会联合开展的豆科苜蓿属植物Medicago truncatula的基因组研究,在2000年4月已经提交15000多条EST

http://www.noble.org/mediccyc/ 

苜蓿的生化途径数据库。

http://hornbill.cspp.latrobe.edu.au/cgi-binpub/brassica/index.pl 

BASC系统提供遗传的、基因组的、表型的数据的整合挖掘和浏览的工具。该公布资源拥有支持芸苔的多国芸苔基因组测序计划的信息,直接基于5个模块,ESTDB,Microarray, MarkerQTL, CMap  EnsEMBLESTDB包括通过与GenBank, UniRef, and the genome sequence of Arabidopsis进行序列比对后的ESTs数据及基因注释;Microarray模块拥有ESTDB中注释的ESTs的表达谱数据;MarkerQTL是最复杂的整合了遗传标记、图谱、个体、基因型和特性的数据系统;另两个模块包括了拟南芥的EnsEMBL基因组可视化系统,以及整合了遗传和基因组信息的可视化的遗传图谱比对的CMap

http://mips.gsf.de/proj/plant/jsf/tomato/index.jsp 

西红柿基因组测序计划数据库。

http://ted.bti.cornell.edu/ 

西红柿功能基因组数据库整合和扩展了数个早期的诸如西红柿表达谱数据库和西红柿代谢数据库,及西红柿小RNA数据库的信息。

http://www.pfgd.org/pfgd/ 

马铃薯晚疫病和大豆疫病EST数据库,该数据库的建立是为了更好的了解病毒的发病机制以及抗性原理。

https://gabi.rzpd.de/PoMaMo.html 

PoMaMo是由植物基因组计划建立的关于马铃薯的信息库,包括目前已知的马铃薯的各个方面的生物信息数据,并通过BLAST对其基因进行了注释。

 http://genome.ukm.my/nrestdb/ 

橡胶树EST数据库,该数据库介绍了相关的cDNA文库,分析渠道KOG分类,GO注释等。

 http://foresttree.org/ftdb 

ForestTreeDB搜集了大规模测定数个树木品种的EST序列的数据,并开发和采用已有的软件对各序列进行基因注释,希望为该领域的研究人员提供帮助。同时还对相关数据库作了链接,并为设计微阵列进行基因表达谱研究创造条件。


(十一)调控专题


1、SNP2TFBS – a database of regulatory SNPs affecting predicted transcription factor binding site affinity 

snp2tfbs是一个研究人类基因组调控原件变异引起相关分子调控机制改变的数据库。

数据库网址:http://ccg.vital-it.ch/snp2tfbs/.

2、TFBSTools: an R/bioconductor package for transcription factor binding site analysis

 TFBSTools 是一个全基因组水平鉴定转录结合位点及可视化的工具。

下载网址:http://bioconductor.org/packages/TFBSTools/


3、TcoF-DB v2: update of the database of human and mouse transcription co-factors and transcription factor interactions 

 TcoF-DB v2 是一个收录人和小鼠的调控转录因子的 co-factors 数据库。

 网址:http://tcofdb.org/.

4、PEDLA: predicting enhancers with a deep learning-based algorithmic framework

 PEDLA 是一个基于深度学习预测增强子的软件。

下载地址:https://github.com/wenjiegroup/PEDLA

5、PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants

PlantTFDB  是一个收集植物转录因子及对应的靶基因数据库

网址:http://planttfdb.cbi.pku.edu.cn/

6、JASPAR 2016: a major expansion and update of the open-access database of transcription factor binding profiles

JASPAR 是一个收集经过注释的非冗余的转录因子数据库

网址:http://jaspar.genereg.net

7.PlantPAN 2.0

The Plant Promoter Analysis Navigator 

网址:http://plantpan2.itps.ncku.edu.tw/


8.AtPan

AtPAN( A rabidopsis t haliana P romoter A nalysis N et) is a database 

网址:http://atpan.itps.ncku.edu.tw/




9.PlantCare

植物启动子

网址:http://bioinformatics.psb.ugent.be/webtools/plantcare/html/



10.EPDnew 

is a collection of databases of experimentally validated promoters for selected model organisms. Evidence comes from TSS-mapping from high-throughput expreriments such as CAGE and Oligocapping. 

网址:http://epd.vital-it.ch/EPDnew_database.php


11.更多启动子数据库

Eukaryotic promoter database

http://www.epd.isb-sib.ch http://www.genome.ad.jp/dbget/dbget2.html

http://bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases
http://www.fruitfly.org/seq_tools/promoter.html
http://sdmc.lit.org.sg/promoter/CGrich1_0/CGRICH.htm
http://www.gene-regulation.com/pub/programs.html#pmatch
http://ihome.cuhk.edu.hk/~b400559/arraysoft_pathway.html#Promoter
http://www.dna.affrc.go.jp/PLACE/signalup.html
http://www.cbs.dtu.dk/services/Promoter/
http://bimas.dcrt.nih.gov/molbio/proscan/
http://thr.cit.nih.gov/molbio/signal/

12.转录因子 PlantTFDB 4.0

 PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants. Nucleic Acids Research, 45(D1):D1040-D1045.

网址:http://planttfdb.cbi.pku.edu.cn/index.php

(十三)绘图工具专题

  1. 在线热图

    Matrix2png是进行微阵列数据和许多其他数据类型的可视化。一个简单但功能强大的程序它可以从文本文件的数据生成PNG格式的图像。它快速,易于使用和合理灵活。它可以用于生成可发布图片,或作为图像发生器为web应用程序。使用于各种数组型数据

    网址:http://www.chibi.ubc.ca/matrix2png/bin/matrix2png.cgi

    用法:在线绘制热图

  2. 绘制Venn图

    网址:http://bioinformatics.psb.ugent.be/cgi-bin/liste/Venn/calculate_venn.htpl

    用法:在线绘制venn图工具介绍

  3. 绘制GO注释结果图 

    网址:http://wego.genomics.org.cn/cgi-bin/wego/index.pl

  4.  CIRCOS

    功能:绘制圈图

    网址:http://mkweb.bcgsc.ca/tableviewer/visualize/

    用法:在线绘制简单的circos图

  5. IBS

    功能:进行序列结构示意图绘制

    网址:http://ibs.biocuckoo.org/online.php

    6. GSDS

    功能:基因外显子内含子,UTR,domain等区域特征展示

    网址:http://gsds.cbi.pku.edu.cn/

欢迎关注生信人


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存