遗传资源数据库专题-ESP6500
ESP6500是什么
ESP全称是NHLBI GO Exome Sequencing Project(国家心肺和血液研究所外显子组测序计划),包含了SNP和InDel变异(如果对这两个概念不了解绕道http://mp.weixin.qq.com/s/YeIIYJaJIiJSr-JtUYsV1w),通过注释可以找到突变在ESP6500中的变异频率。该项目的目标是利用二代外显子测序技术发现与心、肺和血液疾病相关基因和机制,通过共享这些数据和发现来拓展丰富对心肺血液疾病的诊断管理和治疗。目前有6503个样本:
ESP6500共包含了7个项目,分别由不同的机构承担:
Seattle GO - University of Washington, Seattle, WA
BroadGO - Broad Institute of MIT and Harvard, Cambridge, MA
WHISP - Ohio State University Medical Center, Columbus, OH
Lung GO - University of Washington, Seattle, WA
WashU GO - Washington University, St. Louis, MO
Heart GO - University of Virginia Health System, Charlottesville, VA
ChargeS GO - University of Texas Health Sciences Center at Houston
如何使用ESP6500数据库
1.首先进入ESP官网,网址:http://evs.gs.washington.edu/EVS/,可以看到它包含主页在内的七个版块
2.Data Browser查找感兴趣的基因,比如我最熟悉的tp53基因
然后点击Search:
勾选其中的European American,African American数据集或者全选,点击display:
1.表示tp53基因的ID,Chr位置,选择的数据集,以及基因的kegg通路等信息
2.用不同的颜色表示不同变异类型
3.选择下载的数据格式,包括text和vcf
4.搜索的结果,可以看到关于tp53这里有超过1000条的信息
也可以选择覆盖度的结果
可以链接到UCSC上查看tp53基因的各种信息,或者下载查看所有位点的覆盖信息
有人说UCSC就像一艘航母,里面的功能实在太多了,大家可以去了解一下UCSC这个数据库。
还有更多文章,请移步公众号阅读。
如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师
如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。