HaploReg非编码区SNP功能注释
基于post-stage GWAS时代非编码区信号的解读需求,Broad Institute开发了HaploReg工具,旨在帮助研究者解读GWAS信号,预测致病变异及致病变异发挥作用的细胞类型,同时通过系统的数据挖掘来预测致病变异的靶基因及可能的作用机制。
HaploReg工具自2011年公布以来,目前已经更新至第四版,整合了包括GWAS结果在内的数个大的项目的结果,可对SNP进行一系列功能注释。
Catalog of variants 变异目录
核心变异集有52054804 variants, 并计算了其全基因组水平的连锁位点,可分别给出四大主要人群(AFR Afrian,AMR Ad Mixed American,ASN Asian,EUR European)的连锁位点
Genome-wide association studies GWAS结果
GWAS结果来自EBI-NHGRI GWAS Catalog,下载时间是2015年10月15日(如果你想用最新的数据,可以自行到GWAS Catalog下载,详情参见公众号往期文章)
Sequence conservation 序列保守性
哺乳动物进化保守性元件,SiPhy elements 和 GERP elements
Regulatory protein binding 调节蛋白的绑定位点
来自ENCODE计划的ChIP-seq数据,包含不同的细胞系中的结果,由narrowPeak 算法处理
Reference epigenomes参考表观组
来自Roadmap Epigenomics项目,包括:
ChromHMM states
histone modifcation ChIP-seq peaks
DNase hypersensitivity
Expression quantitative trait loci表达数量性状位点
表达数量性状位点数据来自GTEx项目V6版本,GEUVADIS项目和GRASP数据库及其他一些研究
Regulatory motifs调控motifs
来自ENCODE数据库及文献中的调控的motifs,使用position weight matrices表示。
1
打开网站:http://archive.broadinstitute.org/mammals/haploreg/haploreg.php
长这个样子↓ 【有点不符合网站构建审美原则,但是保护眼睛orz】
2
在build query界面,可输入你关心的SNP(rsIDs形式) 或输入染色体上的位置,也可以选择网站内的GWAS信号,在第二个下拉框中选择一个GWAS的结果,还可以上传文件。
这里以选择GWAS信号,选择“Schizophrenia(Yue WH, 2011, 2 SNPs)”是北大六院的岳伟华老师课题组发现的中国人群的2个精分位点~
3
点击 “set option” 标签,设置参数如下:
2
点击提交按钮,结果如下:
红色标注的为GWAS研究中显著的SNP,其他的为与该SNP连锁的SNP,然后每一列列出了SNP的不同注释结果。
参考文献:
Lucas D. Ward and Manolis Kellis. Nucleic Acids Research (2016). HaploReg: a resource for exploring chromatin states, conservation, and regulatory motif alterations within sets of genetically linked variants. (PMID:22064851).
作者:夏梦馨
封面图片:SuperChen
文章图片:截图自网站