查看原文
其他

遗传数据库专题-hapmap

冰糖 生信菜鸟团 2020-02-03

hapmap是什么hapmap已经停止服务了缺少hapmap守护的SNP研究怎么办

hapmap是什么

hapmap(国际人类基因组单体型图计划)计划是通过对亚、非、欧裔共269个个体进行全基因组中的SNP(单核苷酸多态性)进行筛查和分析,构建出整合了人类遗传多态性信息的”单体型图“。直白来讲hapmap就是一个多人种的SNP数据库,是我们区分彼此差异的参考图。

什么是单体型?

人与人之间的DNA序列存在存在大约个1000万个SNP位点,这些SNP位点影响着个体的患病几率。而在遗传上,并不是所有的SNP位点都是自由交换,由于相近的SNP相距太近,它们会成一个“区块”一同遗传。而这种SNP“区块”组成的图谱就叫做单体型。

一个SNP区块包含多个很多个SNP位点,但是只需要知道“区块”中的少数的SNP位点才能区分一个单体型中的“区块”,这些特征SNP位点又叫做tag SNP。人类基因组大约存在50万个tag SNP。

hapmap的采样人共有269人, 根据来源的区域分为11种,其中CHB为代表中国北京汉族。

hapmap已经停止服务了

什么,已经停止服务了?!这么好用的数据库,难道不应该广为受众赏识,为生物学研究发光发热吗?

是的,hapmap数据库已经无法在NCBI上打开了,浏览器键入hapmap.org,显示的是NCBI撤销hapmap数据库的通知,连带的还讲述了如此做的原因:长江后浪推前浪,hapmap死摊上。

因为hapmap有了一个很优秀的继任者:1,000 genomes(1KG),并且NCBI还拿出来数据来佐证,从13-16年,访问HapMap与访问1KG的人数比值正在逐年下降。

注:数据访问量仅来源于NCBI,1KG也可以通过EBI访问,因此虽然图中比值是均是大于2的,但是不代表访问hapmap的人数是访问1KG的2倍以上。

缺少hapmap守护的SNP研究怎么办

其实由于hapmap已经被抛弃了,因此并不建议再继续使用hapmap数据库,它已经有了很好的继任者1KG,比如下文:HAPMAP退休了,tagSNP(标签SNP)怎么挑?(http://t.cn/RjwCYDv),就是使用1KG数据库和Haploview实现的tagSNP挑选。

而如果只是要查看SNP位点,仍然有其他很好的工具数据库可用(SNP详细信息参看上周推文变异形式专题-SNP多态性),比如NCBI SNP数据库https://www.ncbi.nlm.nih.gov/snp/,就可以获取一个基因区域上全部的SNP位点。

以p53基因为例,在NCBI SNP数据库检索栏中键入p53,任意点击一个人源p53基因SNP位点,如rs1042522,然后在Gene View栏目下,选择 in gene region即可获得p53基因上全部的SNP位点,操作如图所示:

此外,hapmap.org已经无法打开了,但是hapmap的数据其实一直还在,只是由于缺乏基因浏览器,无法直接在网页上获得SNP、tag SNP等信息了。hapmap数据可以通过FTP站点获得ftp://ftp.ncbi.nlm.nih.gov/hapmap/。例如菜鸟团团长Jimmy使用用R包SNPRelate对自己的基因组测序数据可hapmap数据进行了比较,详细操作参见【直播】我的基因组58:用R包SNPRelate来对我的基因型跟hapmap计划数据比较 http://t.cn/RjwjHRC。

参考资料

  1. HAPMAP退休了,tagSNP(标签SNP)怎么挑 http://t.cn/RjwCYDv或者http://dwz.cn/6QGR76

  2. 【直播】我的基因组58:用R包SNPRelate来对我的基因型跟hapmap计划数据比较 http://t.cn/RjwjHRC或者http://dwz.cn/6QGS09


还有更多文章,请移步公众号阅读


如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存