一、综合数据库
(一)NCBI
(二)EMBL
欧洲分子生物学实验室( EuropeanMolecular Biology Laboratory , EMBL )(http ://www.embl.org/ ) ,1974 年由几乎全部西欧国家及以色列等 16国资助在德国海德堡建立的国际研究学院网络,致力于分子生物学研究,在德国、法国、意大利、英国设有 5 个分支机构。1980 年,建立了世界上第一个核酸序列数据库,即 EMBL 核酸序列数据库。
EBI
欧洲生物信息学研究所( EuropeanBioinformatics Institute , EBI )(http : //www.ebi.ac.uk/)是EMBL 的一部分, 1992 年由欧盟资助建立在英国的一个非盈利性学术机构,也是生物信息学研究与服务的欧洲中心。该研究所开发有多种生物学数据库,包括:核酸序列数据库(EMBL 核酸序列数据库、 Ensembl 、 EMEST 、MitBase Server 、 EDGP 、 Parasites等),蛋白质序列数据库(SWISS-PROT 、 TrEMBL 、 InterPro 等),全部基因组数据库,序列结构分类数据库(DSSP 、 HSSP 、 DALI 等),大分子结构数据库(EBI-MSD 等),人类蛋白质组数据库( HPI 等),序列图谱数据库(RHdb Server GenomeMaps98 等);也提供CLUSTAL 、 FASTA 、 SRS 、WU-BLAST 等工具,为各国研究人员提供来自学术界的分子生物学、医学与农业、遗传学、化学、生物技术、药学工业等多方面的资源信息。
(三)ExPASy
蛋白质分析专家系统(Expert Protein Analysis System , ExPASy )( http://www.expasy.org/ ),是 1994 年由瑞士生物信息学院(Swiss Institute of Bioinformatics ,SIB )( http : //www.isb-sib.ch/ ),创建的世界上第一个分子生物学网站,专门从事蛋白质序列、结构、功能和蛋白质 2D-PAGE 图谱的分析。在瑞士、澳大利亚、玻利维亚、加拿大、中国( http : //cn.expasy.org/)、韩国、美国等国家和地区设立有镜像站点。通过该网站可链接到国际上包括 ENZYME 、 PROSITE 、 TrEMBL 、 SWISS-PROT 、 SWISS-2DPAGE 、SWISS-3DIMAGE 等数据库的有关核酸、蛋白质、基因组序列,结构与功能的 1000 多个相关站点,以及SWISS-MODEL 等软件工具
(四)RCSB
结构生物信息学研究联合实验室( the Research Collaboratory for Structural Bioinformatics ,RCSB )( http : //www.rcsb.org/index.html ),是一个非盈利性研究机构,主要通过对生物大分子三维结构的研究来探索生物系统的功能。 RCSB 提供有 PDB 生物大分子结构数据库(PDB , http : //www.rcsb.org/pdb/ )和 NDB 核酸数据库( NDB , http ://ndbserver.rutgers.edu/ )等数据库,并提供其开发的结构分析工具、标准和教学服务信息等。
(五)NIG
日本国立遗传学研究所 日本国立遗传学研究所( National Institute of Genetics , NIG )( http: //www.nig.ac.jp/ ),是日本遗传学各方面研究的中心研究机构及生命科学所有领域的研究基地,其建立的日本 DNA 数据库( DNA DataBank of Japan , DDBJ )( http ://www.ddbj.nig.ac.jp/ ),与欧洲 EBI 维护的 EMBL 数据库和美国 NCBI 的 GenBank 数据库并列为国际上最著名的三大 DNA 数据库。通过该数据库的检索界面( http://www.srs.ddbj.nig.ac.jp/index-e.html )可以链接 PDB 、 DDBJ 、 PIR 、 ENZYME 、SWISSPROT 、 PROSITE 等多个数据库。
二、专题数据库
主要包含11个专题:
共表达数据库;酶、代谢和调控路径数据库;基因组数据库;文献数据库;序列为基础的数据库检索; 系谱分析;基因结构预测分析专题;蛋白质结构预测分析;功能基因组分析 ;植物数据库专题;调控专题;绘图工具专题
(一)共表达数据库
1.植物 ATTED-II
http://atted.jp/
2.水稻RiceFREND
http://ricefrend.dna.affrc.go.jp/
3. 动物 COXPRESdb
http://coxpresdb.jp/
(二)酶、代谢和调控路径数据库
1. KEGG
http://www.genome.ad.jp/kegg/
用法:最新实用KEGG介绍
2. Enzyme Nomenclature Database
http://expasy.hcuge.ch/sprot/enzyme.html
3.Protein Kinase Resource (PKR)
http://www.sdsc.edu/kinases/
4. LIGAND
http://www.genome.ad.jp/dbget/ligand.html
5.WIT
http://www.cme.msu.edu/WIT/
6. EcoCyc
http://ecocyc.PangeaSystems.com/ecocyc/
7.UM-BBD
http://www.labmed.umn.edu/umbbd/
8. 多种代谢路径数据库
http://www.unl.edu/stc-95/ResTools/biotools/biotools8. html
9.基因调控路径数据库(TRANSPATH)
http://transfac.gbf.de
(三)基因组数据库
1.综合数据库
Phytozome:http://www.phytozome.net/
Ensemble:http://ensembl.gramene.org/genome_browser/index.html
NCBI:http://www.ncbi.nlm.nih.gov/assembly/?term=
2.基因组复制数据库PGDD
http://chibba.agtec.uga.edu/duplication/
3.禾本科比较基因组
http://www.gramene.org GrainGene http://www.graingenes.org 4.Botanical Databases http://www.transgenica.com/botanicaldatabase.htm
5.Botanical Data
http://www.calflora.org/calflora/batanical.html
6.C. elegans genome
http://www.acedb.org
7.粘菌(Dictyostelium)基因组
http://dictygenome.bcm.tmc.edu
8.Animal genomes (ArkDB)
http://www.thearkdb.org
9.FlyBase
http://flybase.bio.indiana.edu/.bin/fbidq.html?FBgn0003 075
10.Mouse Genome Informatics http://www.informatics.jax.org/bin/query_accession?id= MGI:97555 11.Saccharomyces Genome Database
http://genome-www.stanford.edu/cgi-bin/dbrun/Sacch DB?find+Locus+%22PGK1%22
12多种基因组数据库
http://www.hgmp.mrc.ac.uk/GenomeWeb
(四)文献数据库
1. 几乎所有SCI文献免费下载网站
http://www.sci-hub.cc/
2. PubMed文献检索
http://www.ncbi.nlm.nih.gov/PubMed/
3. gnosis
第一个是刘晓乐团队开发的文献挖掘系统,输入关键词,会列出相关的文献,可以设定SCI影响因子优选文献。搜出的文献相关性非常高。
工具链接:http://gnosis.cistrome.org/#
(五)序列为基础的数据库检索
1.BLAST http://www.ncbi.nlm.nih.gov/BLAST/
2.FASTA http://www.ebi.ac.uk/fasta33/index.html
3.BLITZ http://www2.ebi.ac.uk/bicsw/
4.SSearch http://www2.igh.cnrs.fr/bin/ssearch-guess.cgi
5.Electronic PCR http://www.ncbi.nlm.nih.gov/STS/
6.Proteome analysis http://www.ebi.ac.uk/proteome/
7.Clustal multiple sequence alignment http://searchlauncher.bcm.tmc.edu/multi-align/multi-ali gn.html
8.BCM
http://searchlauncher.bcm.tmc.edu/
9.EBI
ClustalW analysis http://www.ebi.ac.uk
(六) 系谱分析
1.PAUP
http://onyx.si.edu/PAUP/
2. EBI ClustalW analysis
http://www.ebi.ac.uk
3. GCG package
http://www.gcg.com/
4. PHYLIP
http://evolution.genetics.washington.edu/phylip.html
5. MEGA/METREE
http://www.bio.psu.edu/imeg
6. Hennig86
http://www.vims.edu/~mes/hennig/software.html
7. GAMBIT http://www.lifesci.ucla.edu/mcdbio/Faculty/Lake/Research/Programs/
8. MacClade
http://phylogeny.arizona.edu/macclade/macclade.html
9. Phylogenetic analysis
http://www.unl.edu/stc-95/ResTools/biotools/biotools2. html
10.MEGA
http://www.megasoftware.net
11. iTOL在线工具 tree of life
用法:在线编辑进化树工具
http://www.tolweb.org/tree/
12.EvolView
an online tool for visualizing, annotating and managing phylogenetic trees
网址:http://www.evolgenius.info/evolview/
(七)基因结构预测分析专题
AUGUSTUS
http://bioinf.uni-greifswald.de/webaugustus/
Genewise
http://www.ebi.ac.uk/Tools/psa/genewise/
GENSCAN
http://genes.mit.edu/GENSCAN.html
http://bioweb.pasteur.fr/seqanal/interfaces/genscan-simple.html
http://bioweb.pasteur.fr
GeneFinder
http://genomic.sanger.ac.uk/gf/gf.shtml
http://www.softberry.com/nucleo.html
Gene Feature Searches
http://dot.imgen.bcm.tmc.edu:9331/
Grail
http://compbio.ornl.gov/Grail-1.3/
GrailEXP
http://grail.lsd.ornl.gov/grailexp/
GeneMark
http://opal.biology.gatech.edu/GeneMark/eukhmm.cgi
http://genemark.biology.gatech.edu/GeneMark/hmmchoice.html
Veil
http://www.cs.jhu.edu/labs/compbio/veil.html
AAT
http://genome.cs.mtu.edu/aat.html
GENEID
http://www.imim.es/GeneIdentification/Geneid/geneid_input.html
Genlang
http://cbil.humgen.upenn.edu/~sdong/genlang_home.ht ml
GeneParser
http://beagle.colorado.edu/~eesnyder/GeneParser.html
Glimmer
http://www.cs.jhu.edu/labs/compbio/glimmer.html
MZEF
http://www.cshl.org/genefinder
Procrustes
http://www-hto.usc.edu/software/procrustes/
(八)蛋白质结构预测分析
2ZIP
Function: Prediction of leucine zipper domains
Website: http://2zip.molgen.mpg.de/index.html
3of5
Function: find user-defined patterns inprotein sequences
Website: http://www.dkfz.de/mga2/3of5/3of5.html
AACompIdent
Function:protein identification by aa composition
Website: http://web.expasy.org/aacompident
AACompSim
Function:amino acid composition comparison
Website:http://web.expasy.org/aacompsim/
Agadir
Function:Prediction of the helical content of peptides
Website:http://agadir.crg.es/
ALF
Function:simulation of genome evolution
Website:http://www.cbrg.ethz.ch/alf
Alignmenttools
Function:Four tools for multiple alignments
Website:http://coot.embl.de/Alignment/
AllAll
Function:protein sequences comparisons
Website:http://www.cbrg.ethz.ch/services/AllAll
APSSP
Function:Advanced Protein Secondary Structure Prediction
Website:http://imtech.res.in/raghava/apssp/
Ascalaph
Function:Molecular modeling software
Website:http://www.biomolecular-modeling.com/Products.html
big-PI
Function:predict GPI modification sites
Website:http://mendel.imp.ac.at/sat/gpi/gpi_server.html
BiochemicalPathways
Function:Biochemical Pathways
Website:http://web.expasy.org/pathways/
BLAST
Function:sequence similarity search
Website:http://web.expasy.org/blast/
BLAST(UniProt)
Function:BLAST search on the UniProt web site
Website:http://www.uniprot.org/blast
BLAST-NCBI
Function:Biological sequence similarity search
Website:http://www.ncbi.nlm.nih.gov/BLAST/
BLAST-PBIL
Function:BLAST search on protein sequence databases
Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_blast.html
Blast2Fasta
Function:Blast to Fasta conversion
Website:http://imed.med.ucm.es/Tools/blast2fasta.html
boxshade
Function:MSA pretty printer
Website:http://embnet.vital-it.ch/software/BOX_form.html
CFSSP
Function:Protein secondary structure prediction
Website:http://www.biogem.org/tool/chou-fasman/
ChloroP
Function:chloroplast transit peptides & cleavage sites
Website:http://www.cbs.dtu.dk/services/ChloroP/
Click2Drug
Function:Directory of computational drug design tools
Website:http://www.click2drug.org/
ClustalO (UniProt)
Function:Align two or more protein sequences
Website:http://www.uniprot.org/align
ClustalW
Function:Multiple sequence alignment
Website:http://embnet.vital-it.ch/software/ClustalW.html
ClustalW-PBIL
Function:Multiple sequence alignment program
Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_clustalw.html
ClustalW2
Function:Multiple sequence alignment program
Website:http://www.ebi.ac.uk/Tools/msa/clustalw2/
Coiled-Coilsprediction
Function:Prediction of coiled coils regions
Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_lupas.html
COILS
Function:Prediction of Coiled CoilRegions in Proteins
Website:http://embnet.vital-it.ch/software/COILS_form.html
ColorSeq
Function: Color Protein Sequence
Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_color.html
Compute pI/MW
Function: theoretical pI and Mw computation
Website: http://web.expasy.org/compute_pi/
CPHmodels
Function: Protein homology modeling
Website: http://www.cbs.dtu.dk/services/CPHmodels/
CSS-Palm
Function: Prediction of palmitoylation sites in proteins
Website: http://csspalm.biocuckoo.org/
DAS-TMfilter
Function: Prediction of transmembrane regions
Website: http://mendel.imp.ac.at/sat/DAS/DAS.html
Decrease redundancy
Function: Sequence redundancy reduction
Website: http://web.expasy.org/decrease_redundancy/
DIALIGN
Function: Local multiple sequence aligment
Website: http://bibiserv.techfak.uni-bielefeld.de/dialign/
DictyOGlyc
Function: GlcNAc O-glycosylation sites in D.discoideum
Website: http://www.cbs.dtu.dk/services/DictyOGlyc/
DisEMBL
Function: Prediction of disordered protein regions
Website: http://dis.embl.de/
DLP-SVM
Function: Domain linker predictor
Website: http://www.tuat.ac.jp/~domserv/cgi-bin/DLP-SVM.cgi
Dotlet
Function: sequence similarity plots
Website: http://myhits.isb-sib.ch/cgi-bin/dotlet
ELM
Function: Eukaryotic Linear Motifs
Website: http://elm.eu.org/
EMBnet services
Function: bioinformatics tools,databases and courses
Website: http://embnet.vital-it.ch/
EMBOSS translation tools
Function: sequence translation tools
Website: http://www.ebi.ac.uk/Tools/st/
epestfind
Function: Identification of PEST motifs
Website:http://emboss.bioinformatics.nl/cgi-bin/emboss/epestfind
FASTA/SSEARCH/GGSEARCH/GLSEARCH
Function: Sequence similarity searching of protein db
Website: http://www.ebi.ac.uk/Tools/sss/fasta/
FindMod
Function: protein post-translationalmodification prediction
Website: http://web.expasy.org/findmod/
FindPept
Function: peptide identification fromunspecific cleavage
Website: http://web.expasy.org/findpept/
FingerPRINTScan
Function: scan sequences againstPRINTS
Website:http://www.bioinf.manchester.ac.uk/cgi-bin/dbbrowser/fingerPRINTScan/FPScan_fam.cgi
FUGUE
Function: Sequence-structure homologyrecognition
Website: http://tardis.nibio.go.jp/fugue/
GENIO/logo
Function: RNA/DNA & Amino AcidSequence Logos
Website: http://www.biogenio.com/logo/
Geno3D
Function: Protein molecular modelling
Website:http://geno3d-pbil.ibcp.fr/cgi-bin/geno3d_automat.pl?page=/GENO3D/geno3d_home.html
GlobPlot
Function: Proteindisorder/globularity/domain predictor
Website: http://globplot.embl.de/
GlycanMass
Function: oligosaccharide structure masscalculation
Website: http://web.expasy.org/glycanmass/
GlycoDigest
Function: exoglycosidase digestion ofglycans
Website: http://glycoproteome.expasy.org/glycodigest/
GlycoDomain Viewer
Function: visual browser forglycoproteomic data
Website: http://glycodomain.glycomics.ku.dk/
GlycoMod
Function: oligosaccharide structure prediction
Website: http://web.expasy.org/glycomod/
GlycoSiteAlign
Function: alignment of sequences aroundglycosylation sites
Website: http://glycoproteome.expasy.org/glycositealign/
Glycoviewer
Function: visualize a set of glycanstructures
Website: http://www.glycoviewer.babs.unsw.edu.au/
Glydin'
Function: network of glycoepitopes
Website: http://glycoproteome.expasy.org/epitopes/
GlyS3
Function: glycan sub-structure search
Website: http://glycoproteome.expasy.org/substructuresearch
GOR
Function: Protein secondary structureprediction
Website:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_gor4.html
GPI-SOM
Function: identify GPI-anchor signals
Website: http://gpi.unibe.ch/
GPMAW lite
Function: protein physical and chemicalparameters
Website: http://www.alphalyse.com/gpmaw_lite.html
GPS
Function: Prediction of kinase-specificphosphorylation site
Website: http://gps.biocuckoo.org/
(九)功能基因组分析
1.Transcription profiling technologies
http://www.ncbi.nlm.nih.gov/ncicgap/expression_tech_i nfo.html
2.Protocols for cDNA array technology
http://cmgm.stanford.edu/pbrown/array.html
3.Data management and analysis of gene expression arrays
http://www.nhgri.nih.gov/DIR/LCG/15k/HTML/
4.Examples of commercially available filter arrays: GeneFiltersTM (Research Genetics)
http://www.resgen.com
5.Gene Discovery Arrays (Genome Systems)
http://www.genomesystems.com
6.AtlasTM Arrays (CLONTECH)
http://www.clontech.com
(十)植物数据库专题
原文来自:http://wangyufeng222.blog.163.com/blog/static/128222070201510433511330/
http://bioinf.scri.sari.ac.uk/cgi-bin/plant_snorna/home
植物种的snoRNA基因数据库。
http://dayhoff.generationcp.org
多种不同植物的抗胁迫基因数据库。
http://gabi.rzpd.de
GABI初级数据库始建于2000年,作为植物基因组计划的中心数据库,该数据库包含的信息特别多,从序列的各个部分,到实验获得的一些蛋白2-D胶图,以及基因表达谱数据、代谢途径等都具有,因此是一个生物信息翔实的数据库。
http://markers.btk.fi 芬兰
一个植物的预测的标记的数据库。
http://mendel.cs.rhul.ac.uk/mendel.php?ic=plantprom
农作物当中的生化途径及酶。
http://plantrbp.uoregon.edu
POGs/PlantRBP 是一个关系型数据库,整合了拟南芥、水稻、玉米的可以得到的基因组、蛋白组及序列数据,生成一个假定的同源基因组(POGs),基因注释的重点在于对那些预测的RNA结合蛋白(RBPs)。除了上述之外,同时也对这些蛋白的一些保守结构域提供查找功能。
http://plantta.tigr.org
TIGR的植物转录本(TA)集合数据库收集了来自于NCBI的GenBank Nucleotide数据库的试验验证的EST、全长cDNA数据,包括目前所有已有相关信息的植物的信息,可以通过序列的BLAST、物种等方式查找数据,并且可以自由下载这些数据。
http://podb.nibb.ac.jp/Organellome
植物器官研究的植物器官图片和协议数据库。
http://ppdb.gene.nagoya-u.ac.jp
TropGENE DB是一个管理热带作物的遗传和基因组信息的数据库,该数据库将作物按数个模式作物归类,目前在线公布的模式作物有香蕉、可可、椰子、棉花、油椰子、水稻和甘蔗。其他模式作物正有待开发。每个模式作物都包括遗传来源信息(如形态学、起源、等位基因数据),标记信息,遗传图谱,长序列多态性(QTL)分析结果,测序图谱,序列、基因及相应的参考文献。允许进行快速查询及复杂查询。
http://wheat.pw.usda.gov
小麦、大麦、黑麦、三系杂交麦和燕麦的和表型信息数据库。
http://www.barleybase.org/
BarleyBase 是一个在线的植物微阵列数据及分析平台的数据库,目前收集了超过1000份的来自于Affymetrix Barley1 GeneChip的原始或者规范化后的芯片数据,同时提供基因的功能注释,蛋白功能区域预测、代谢途径及基因家族信息。还与PLEXdb 和PlantGDB的信息有相关联接。
http://www.bioinfo.wsu.edu/gdr/
苹果,樱桃,梨,桃,悬钩子,玫瑰和草莓的基因组数据库。
http://www.drastic.org.uk
植物细胞的信号转导分析数据库。
http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html
植物基因组中心提供了大规模测序计划、遗传图谱和大规模ESTs测序的数据,所有物种的分类都超链接到NCBI的分类数据库。
http://www.pathoplant.de
PathoPlant 是一个涉及植物与病原体之间相互作用的信号转导的相关物质成分的数据库,包括一系列已知的信号转导通路的基因序列,最近还增加了相关的拟南芥的基因芯片数据,以及用于查找相应刺激所涉及的基因的工具。
http://www.phytome.org
Phytome 是一个比较基因组学数据库,设计用于植物功能基因组学、育种和进化研究。其包括预测的蛋白序列数据、蛋白家族分类数据,多序列比对数据、进化史,及源于一个大的、系统发生的多样性植物索引的蛋白注释。Phytome通过来自不同物种的蛋白序列的直系同源或者旁系同源的进化史,将全异的各类植物基因数据库整合成一个可以交互查找的数据平台。该库允许复杂的查询,进行基因/蛋白家族的查询及下载。
http://www.plantgdb.org/
PlantGDB是一个植物基因组序列数据库,主要是ESTs数据。还有对于这些数据的基因注释,EST的基因组定位以及与其它数据库的链接。满足通常的数据查找功能。
http://www.plantgdb.org/AtGDB
AtGDB是一个正在开发中的植物基因组数据库和分析工具集,该资源库的目的是方便以序列为中心的拟南芥数据的浏览,可以分区段地浏览感兴趣的基因,看其结构及基因注释,并可与cDNA和EST进行比对。也可以将数据全部下载本地化。
http://www.plantontology.org
Plant Ontology(PO)数据库由数个植物数据库系统和植物分类学、植物学和遗传学专家协作开发的,目的是建立一个基础的功能强大的植物学数据库,包括整合形态学、解剖学上的一些信息。目前该库有超过5000个来自于拟南芥、玉米、水稻的基因注释可供搜索。在同一个浏览界面下,用户可以搜索植物的器官结构、不同发育时期的信息。所有信息可以自由下载。
http://chloroplast.cbio.psu.edu/
叶绿体基因组数据库。
http://bioinformatics.cau.edu.cn/DPUPS/
该数据库主要收集了杨树的泛素化蛋白,加上预测的共计1027个基因。
http://bioinformatics.cau.edu.cn/easygo/
EasyGO数据库用于提供一系列待查基因的功能注释,以及微阵列探针信息,目前包括来自15个物种(主要是植物)的40多个数据类型的数据。被广泛使用。
http://dptf.cbi.pku.edu.cn/
DPTF:北京大学杨树转录因子数据库。
http://plantbiol.genetics.ac.cn/
国内多家单位完成的关于水稻的cDNA微阵列试验结果数据库。
http://planttfdb.cbi.pku.edu.cn/
http://plntfdb.bio.uni-potsdam.de/v2.0/
大豆蛋白质组数据库。
http://sundarlab.ucdavis.edu/smrnas/
水稻玉米小RNA数据库,该数据库包含了miRNA,siRNA,ta-siRNA的信息。
http://urgi.versailles.inra.fr/phyrot/
预测的植物蛋白簇数据库。
http://www.ncpgr.cn/
(NCPGR)地域植物基因研究中心。
http://www.plantenergy.uwa.edu.au/applications/mpimp/index.html
植物线粒体蛋白运输机制。
http://www.plexdb.org
PLEXdb是一个统一的公共的植物和其病原体的基因表达数据库,用于将迅速扩展的基因表达谱数据和传统的基因组结构数据和表型数据联结整合起来。并开发出相应的整合软件方便研究人员针对大规模表达谱数据的功能基因组学研究。
http://www.scbit.org/qtl2gene/new/
PlantQTL-GE是一个专为数量性状研究建立的一个数据库,它主要收集了水稻、拟南芥等植物的芯片数据及表达谱数据和基因组标志序列。同时也提供基于已知信息基因注释及顺式调控元件注释。
http://harvest.ucr.edu/
目前该数据库收集了大麦、短柄草属、柑橘、咖啡、豇豆、大豆、水稻、小麦等作物的表达谱数据,及相关的一些信息(Barley, Brachypodium, Citrus, Coffea, Cowpea, Soybean, Rice,Wheat)。
http://www.gramene.org/
Gramene Database是一个各种作物基因组信息的数据库,同时具备高级的各基因组间的分析功能。
http://ukcrop.net/
UK CROPNET:农作物生物信息学网络数据库。拥有很多其自己开发的数据库和分析软件,同时也收集相关的一些文献和该领域的一些信息。1996
http://ars-genome.cornell.edu/rice/
GrainGenes是农业部和地域农业图书馆的植物基因组计划支持的麦燕麦和甘蔗遗传数据库
http://bioserver.myongji.ac.kr/ricemac.html 韩国
韩国水稻基因组数据库。
http://cdna01.dna.affrc.go.jp/cDNA/
KOME:水稻的生物数据库
http://cdna01.dna.affrc.go.jp/PIPE
水稻数据库的统一化工具数据库。
http://drtf.cbi.pku.edu.cn/
水稻转录因子数据库,该数据库包括了来自水稻品种indica和japonica中所有已知的和可能存在的转录因子信息。
http://gbrowse.ncpgr.cn/cgi-bin/gbrowse/japonica/
Rice水稻基因组注释数据库
http://gene64.dna.affrc.go.jp/RPD/
水稻蛋白组学数据库。
http://golgi.gs.dna.affrc.go.jp/SY-1102/rad/
RAD: 水稻基因组注释数据库。
http://ine.dna.affrc.go.jp/giot/
INE: 水稻基因组整合数据浏览器。
http://mips.gsf.de/proj/plant/jsf/rice/index.jsp
MOsDB: The MIPS Oryza sativa database,水稻基因组数据库,包括序列数据,未来将把突变体信息、表达谱信息整合起来。
http://mpss.udel.edu/rice/
Rice MPSS database水稻大规模平行测序数据库。
http://orygenesdb.cirad.fr/
OryGenesDB:一个用于水稻反向遗传学研究的交互式工具;有水稻基因T-DNA以及Ds侧冀序列标签数据库,基因注释。
http://rapdb.dna.affrc.go.jp/
RAP-DB: 水稻注释计划数据库。
http://red.dna.affrc.go.jp/RED/
RED: 水稻表达谱数据库。
http://redb.ncpgr.cn/
REDB: 水稻EST数据库。
http://rgp.dna.affrc.go.jp/giot/INE.html
水稻的基因组数据库(INE)整合了目前大规模测序后获得的关于水稻的基因组信息、cDNA 信息,遗传图谱、物理图谱的信息,并随着水稻测序的进行,持续增加新的信息。
http://rice.big.ac.cn/rice/index2.jsp
RISE: 水稻信息系统,包括水稻基因组的最新信息以及与其他谷类作物的比较基因组分析数据。
http://rice.genomics.org.cn/
水稻是一种主要的粮食作物,也是一种谷物基因组研究的模式物种,北京基因组研究所(BGI)在水稻等作物基因组的测序、信息分析和生物学研究方面久负盛名。为了更好地研究,我们建立了水稻信息系统(BGI-RIS),整合了最新的数据以及比较基因组学分析数据。为了分析水稻的两大亚种,japonica 和indica,BGI-RIS除了包括自己测序的indica序列数据外,同时也收集了japonica及其他已知的谷类作物的基因组和EST数据。 BGI-RIS对两亚种间的相关基因、重复元件、基因重复、SNP都进行了注释。
http://rice.plantbiology.msu.edu/
水稻基因组注释计划。
http://ricefox.psc.riken.jp/index.php?contetns
RiceFOX:水稻过表达拟南芥全长cDNA突变体数据库。
http://ricegaas.dna.affrc.go.jp/
Rice GAAS:水稻基因组信息自动注释系统。
http://rkd.ucdavis.edu/
水稻蛋白激酶数据库。
http://www.tigr.org/tdb/rice/
TIGR研究所维护着几个与水稻基因组有关的数据库,包括基因组注释库重复序列库,以及基因索引。
http://algodon.tamu.edu/
cottonDB南方平原农业研究中心所维护的棉花数据库
http://cottondb.org/
CottonDB是一个包含有棉花基因组学、遗传学和分类学数据的数据库,同时它也是一个不断增加新数据和棉花研究者资料的数据库。
http://www.cottonmarker.org/
棉花标记数据库,由多家科研团体协作完成,包含有大量的已公布的序列标记数据。
大麦 http://barley.ipk-gatersleben.de/ebdb.php3 欧洲
欧洲大麦数据库(EBDB)收集的信息主要来源于ECP/GR Working Group对于大麦的研究数据,由Gatersleben的IPK植物基因组和作物研究所维护。
大麦 http://bioinf.scri.ac.uk/barley_snpdb/index.html
该在线数据库包括在SCRI开展的通过交叉测序的方法挖掘到小麦和大麦的基因的SNPs的信息,目前由SCRI植物生物信息学组维护。
http://www.shigen.nig.ac.jp/barley/
该数据库中包含由冈山大学生物资源研究中心收集的大麦种质资源和基因组分析数据。
http://pgrc.ipk-gatersleben.de/cr-est/
大麦,小麦,豆类番茄EST数据库
http://synteny.nott.ac.uk/
UK CropNet该数据库主要提供了各类有关农作物的基因数据,包括Arabidopsis thaliana、Barley、Brassicaspp.、Forage Grasses、Millet and tef、Alfalfa、Chlamydomonas、Dictyostelium等18个物种基因数据库(我未能点击进入)。
http://wheat.pw.usda.gov/GG2/index.shtml
谷类作物信息数据库,该数据库包括了小麦,大麦,燕麦黑麦和黑小麦等品种的遗传信息和遗传图谱。
http://www.ecpgr.cgiar.org/databases/crops/wheat.htm
由捷克共和国的作物种植研究所维护的小麦数据库。
http://www.shigen.nig.ac.jp/wheat/.html
小麦网,由6所大学和研究所联合维护
http://www.tigr.org/tdb/e2k1/tae1/
由TIGR institute维护的小麦基因组数据,提供小麦的基因组及基因注释,并且可用于基因组注释等分析。同时,还提供其他谷类作物的同源基因数据,如玉米、大麦、高粱、水稻等。
拟南芥&http://greenphyl.cirad.fr/cgi-bin/greenphyl.cgi
水稻拟南芥比较基因组数据库,该数据库提供了一个水稻与拟南芥对比分析的平台。
http://affymetrix.arabidopsis.info
诺丁汉拟南芥保存中心芯片数据库。
http://asrp.cgrb.oregonstate.edu/
拟南芥小RNA工程。
http://atpid.biosino.org/
拟南芥蛋白相互作用数据库。
http://datf.cbi.pku.edu.cn
拟南芥转录因子数据库(DATF)收集了所有的拟南芥转录因子数据(总共1922个位点,2290个基因),划分为64个家族。该数据库序列是基于TAIR 数据库(20051108),可以采用多种方式查询数据。除此之外,另外添加了每个家族的DNA结合区域的多序列比对数据、进化树,另有GO注释,并与水稻转录因子作了同源比对。最后还增加了PDB数据的一些数据,以做核酸结合位点的定位。
http://mips.gsf.de/proj/thal/db
MIPS的拟南芥数据库。
http://mpss.udel.edu/at/
拟南芥大规模平行测序信号的基因表达数据库。
http://rarge.gsc.riken.jp/
拟南芥cDNA、突变体和微阵列数据库。
http://urgv.evry.inra.fr/CATdb
拟南芥转录因子数据库,拟南芥转录因子数据库整合了所有转录因子实验所获得的数据信息。
http://urgv.evry.inra.fr/projects/FLAGdb/HTML/index.shtml
拟南芥功能基因组数据库。
http://www.arabidopsis.org/
拟南芥基因组数据库。
http://www.athamap.de/
拟南芥的全基因组范围的假定的转录因子结合位点数据库。
http://www.catma.org/ 欧洲
拟南芥基因序列标签数据库,该数据库涵盖了拟南芥中大部分的基因信息。
http://www.GABI-Kat.de
T- DNA插入突变体在拟南芥的研究当中,具有十分重要的作用,GABI-Kat SimpleSearch是一个由GABI-Kat工程所建的拟南芥的基于侧翼序列标签(FST)的T-DNA插入突变体查找库,目前该库有从64000 lines中超过108,000定位的FSTs,这些lines覆盖了64%的目前已有注释的基因。该库允许常规的一些基因搜索,并与突变体系连接在一块。同时,该库还提供引物等信息。
http://www.plantenergy.uwa.edu.au/applications/phosphat/index.html
拟南芥蛋白磷酸化位点数据库。
http://www.plprot.ethz.ch/ 瑞士
拟南芥质体蛋白数据库。
http://www.seedgenes.org/
拟南芥发育关键基因数据库。
http://www.suba.bcs.uwa.edu.au/
SUBA(Arabidopsis Subcellular Database)是由University of WesternAustralia的ARC Centre of Excellence in Plant Energy Biology维护的,包含了源自各个领域的关于拟南芥蛋白的亚细胞定位的数据,如荧光定位数据、亚细胞组分的蛋白质组学研究、文献及源于(Gene Ontology annotations, Swiss-Prot and gene descriptors)的同族蛋白的信息,还有采用软件(10个)预测得到的数据,包括了非重复的将近7000个拟南芥蛋白及将近30000个采用生物信息预测的方法获得的蛋白亚定位信息。
http://psi081.ba.ars.usda.gov/SGMD/default.htm
大豆基因组和微阵列数据库。
http://scaffold.biologie.uni-kl.de/Beanrdf/
豆类基因图谱数据库。
http://soybase.org/
Integrating为大豆研究者建立的基因组学和生物学数据库。
http://soybeangenome.siu.edu/
大豆基因组浏览器数据库整合了大豆基因组的信息,方便用户查找到所需信息。
http://ss.jircas.affrc.go.jp/DB/guide-eng.html
由农业科学国际研究中心主导维护的东北部大豆基因组数据库。
http://www.comparative-legumes.org/
豆类作物基因组ESTx信息数据库,基因蛋白表达信息,该数据库给出了多个品种的信息。
http://www.ildis.org/LegumeWeb/
ILDIS国际豆科植物数据库和信息服务
http://www.soybeantilling.org/
该数据库为了TILLING (Forrest and Williams82)的大豆诱变突变体第二代库工程而开发的,大约有3000个M2lines按照其表型分类存储。
http://maize.tigr.org/
TIGR的玉米数据库。
http://mips.gsf.de/proj/plant/jsf/maize/index.jsp
mgsp:玉米基因组数据库,基于基因组测序。
http://mtm.cshl.org/
mtmDB:玉米定点诱导突变体数据库。
http://www.agron.missouri.edu/
该数据库储存有玉米基因组的进展信息。
http://www.maizegdb.org/
MaizeGDB:玉米基因组信息数据库,该数据库包括所有遗传学,基因产物,功能分析,以及相关文献查阅等的信息。
http://www.panzea.org
玉米基因组工程数据库,该数据库是用于玉米基因组中和功能多样性分析。
http://www.polebio.scsv.ups-tlse.fr/MAIZEWALL/
MAIZEWALL:
的玉米细胞壁生物合成和装配的生物信息分析和基因表达数据库。
http://zmdb.iasstate.edu/
玉米基因组数据库
http://bioinfo.noble.org/gene-atlas/
MtGEA: 蒺藜苜蓿基因表达谱数据库。收集了Affymetrix公司的苜蓿基因芯片的关于苜蓿多个器官的基因表达谱数据。
http://brassica.bbsrc.ac.uk/
Brassica Genome Gateway 2008芸苔基因组数据库。
http://medicago.cau.edu.cn/
苜蓿数据库,包括基因组注释信息及部分表达谱数据。
http://medicago.toulouse.inra.fr/Mt/EST/
MENS: Medicago EST Navigation System 苜蓿表达谱数据导航系统。包括EST测序数据,微阵列数据等。
http://www.medicago.org/genome/
蒺藜苜蓿序列数据库,由苜蓿基因组计划完成测序。
http://www.medicago.org/MtDB
蒺藜苜蓿基因组数据库。
http://www.ncgr.org/research/mgi/
MGI,NCGR和Samuel Roberts Noble基金会联合开展的豆科苜蓿属植物Medicago truncatula的基因组研究,在2000年4月已经提交15000多条EST
http://www.noble.org/mediccyc/
苜蓿的生化途径数据库。
http://hornbill.cspp.latrobe.edu.au/cgi-binpub/brassica/index.pl
BASC系统提供遗传的、基因组的、表型的数据的整合挖掘和浏览的工具。该公布资源拥有支持芸苔的多国芸苔基因组测序计划的信息,直接基于5个模块,ESTDB,Microarray, MarkerQTL, CMap 和 EnsEMBL。ESTDB包括通过与GenBank, UniRef, and the genome sequence of Arabidopsis进行序列比对后的ESTs数据及基因注释;Microarray模块拥有ESTDB中注释的ESTs的表达谱数据;MarkerQTL是最复杂的整合了遗传标记、图谱、个体、基因型和特性的数据系统;另两个模块包括了拟南芥的EnsEMBL基因组可视化系统,以及整合了遗传和基因组信息的可视化的遗传图谱比对的CMap。
http://mips.gsf.de/proj/plant/jsf/tomato/index.jsp
西红柿基因组测序计划数据库。
http://ted.bti.cornell.edu/
西红柿功能基因组数据库整合和扩展了数个早期的诸如西红柿表达谱数据库和西红柿代谢数据库,及西红柿小RNA数据库的信息。
http://www.pfgd.org/pfgd/
马铃薯晚疫病和大豆疫病EST数据库,该数据库的建立是为了更好的了解病毒的发病机制以及抗性原理。
https://gabi.rzpd.de/PoMaMo.html
PoMaMo是由植物基因组计划建立的关于马铃薯的信息库,包括目前已知的马铃薯的各个方面的生物信息数据,并通过BLAST对其基因进行了注释。
http://genome.ukm.my/nrestdb/
橡胶树EST数据库,该数据库介绍了相关的cDNA文库,分析渠道KOG分类,GO注释等。
http://foresttree.org/ftdb
ForestTreeDB搜集了大规模测定数个树木品种的EST序列的数据,并开发和采用已有的软件对各序列进行基因注释,希望为该领域的研究人员提供帮助。同时还对相关数据库作了链接,并为设计微阵列进行基因表达谱研究创造条件。
(十一)调控专题
1、SNP2TFBS – a database of regulatory SNPs affecting predicted transcription factor binding site affinity
snp2tfbs是一个研究人类基因组调控原件变异引起相关分子调控机制改变的数据库。
数据库网址:http://ccg.vital-it.ch/snp2tfbs/.
2、TFBSTools: an R/bioconductor package for transcription factor binding site analysis
TFBSTools 是一个全基因组水平鉴定转录结合位点及可视化的工具。
下载网址:http://bioconductor.org/packages/TFBSTools/
3、TcoF-DB v2: update of the database of human and mouse transcription co-factors and transcription factor interactions
TcoF-DB v2 是一个收录人和小鼠的调控转录因子的 co-factors 数据库。
网址:http://tcofdb.org/.
4、PEDLA: predicting enhancers with a deep learning-based algorithmic framework
PEDLA 是一个基于深度学习预测增强子的软件。
下载地址:https://github.com/wenjiegroup/PEDLA
5、PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants
PlantTFDB 是一个收集植物转录因子及对应的靶基因数据库
网址:http://planttfdb.cbi.pku.edu.cn/
6、JASPAR 2016: a major expansion and update of the open-access database of transcription factor binding profiles
JASPAR 是一个收集经过注释的非冗余的转录因子数据库
网址:http://jaspar.genereg.net
7.PlantPAN 2.0
The Plant Promoter Analysis Navigator
网址:http://plantpan2.itps.ncku.edu.tw/
8.AtPan
AtPAN( A rabidopsis t haliana P romoter A nalysis N et) is a database
网址:http://atpan.itps.ncku.edu.tw/
9.PlantCare
植物启动子
网址:http://bioinformatics.psb.ugent.be/webtools/plantcare/html/
10.EPDnew
is a collection of databases of experimentally validated promoters for selected model organisms. Evidence comes from TSS-mapping from high-throughput expreriments such as CAGE and Oligocapping.
网址:http://epd.vital-it.ch/EPDnew_database.php
11.更多启动子数据库
Eukaryotic promoter database
http://www.epd.isb-sib.ch http://www.genome.ad.jp/dbget/dbget2.html
http://bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases
http://www.fruitfly.org/seq_tools/promoter.html
http://sdmc.lit.org.sg/promoter/CGrich1_0/CGRICH.htm
http://www.gene-regulation.com/pub/programs.html#pmatch
http://ihome.cuhk.edu.hk/~b400559/arraysoft_pathway.html#Promoter
http://www.dna.affrc.go.jp/PLACE/signalup.html
http://www.cbs.dtu.dk/services/Promoter/
http://bimas.dcrt.nih.gov/molbio/proscan/
http://thr.cit.nih.gov/molbio/signal/
12.转录因子 PlantTFDB 4.0
PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants. Nucleic Acids Research, 45(D1):D1040-D1045.
网址:http://planttfdb.cbi.pku.edu.cn/index.php
(十三)绘图工具专题
在线热图
Matrix2png是进行微阵列数据和许多其他数据类型的可视化。一个简单但功能强大的程序它可以从文本文件的数据生成PNG格式的图像。它快速,易于使用和合理灵活。它可以用于生成可发布图片,或作为图像发生器为web应用程序。使用于各种数组型数据
网址:http://www.chibi.ubc.ca/matrix2png/bin/matrix2png.cgi
用法:在线绘制热图
绘制Venn图
网址:http://bioinformatics.psb.ugent.be/cgi-bin/liste/Venn/calculate_venn.htpl
绘制GO注释结果图
网址:http://wego.genomics.org.cn/cgi-bin/wego/index.pl
CIRCOS
功能:绘制圈图
网址:http://mkweb.bcgsc.ca/tableviewer/visualize/
IBS
功能:进行序列结构示意图绘制
网址:http://ibs.biocuckoo.org/online.php
6. GSDS
功能:基因外显子内含子,UTR,domain等区域特征展示
网址:http://gsds.cbi.pku.edu.cn/
欢迎关注生信人