古语有云:君子性非异也,善假于物也。特别是在当今各种测序手段不断改进,大数据逐步来临的时代,借助别人测序获得的结果或许会对我们的研究起到事半功倍的效果。今天笔者给大家推荐一个非常好用的人类全基因组鉴定癌症剪接数据库——CancerSplicingQTL,希望大家能喜欢。
在癌症的发生、发展、预后和治疗过程中经常观察到异常选择性剪接(AS)模式。这种异常选择性剪接往往会受到基因变异的调节。剪接数量性状基因座(sQTLs)就是一种能够影响异常选择性剪接的遗传变异,鉴定剪接数量性状基因座对于全面理解遗传变异体在疾病发生发展中作用至关重要。在介绍 CancerSplicingQTL 数据库使用方法之前,我们首先来看看该网站的来源。研究人员从33种癌症类型的9026个TCGA肿瘤样本中发现了4516897个SNP和34942个选择性剪切。随后对其剪接数量性状基因座进行分析,总共鉴定出所有癌症类型的4599598个 sQTLs。结合TCGA数据库生存分析,发现有17072个sQTLs与患者总生存时间密切相关。此外,使用全基因组关联研究( GWAS )目录数据,作者发现了1180132个sQTLs与已知GWAS连锁不平衡区域重叠。经过整合上述数据,研究者成功构建了一个用户友好的数据库——CancerSplicingQTL。
构建 CancerSplicingQTL 数据库相关论文于2019年1月8日发表在Nucleic Acids Research杂志上,影响因子为11.147,由此可见,该网站还是相当可靠的。本文的通讯作者是华中科技大学缪小平教授,使用该数据库时记得引用额。
进入CancerSplicingQTL数据库官网,网址为http://www.cancersplicingqtl-hust.com/.
该数据库提供了一个信息丰富的sQTL资源,充分描述了人类癌症转录异构体SNPs的潜在功能。使用该数据库,用户能够方便地浏览、搜索和下载感兴趣的数据,并且能够查询不同癌症中sQTL与生存率之间的关系。该数据库总共包含5个重要的栏目,分别为“Home”、“sQTLs”、“Survival-sQTLs”、“GWAS-sQTLs”和“Downlod”,下面我将一一为大家介绍。
主页中提供了一个相当简洁的搜索界面,有单基因查询和多基因批量查询两种方式。这里我们以单基因ERAP2为例,查询其在STAD中的SNP突变情况。
按图示填写查询信息后,点击“search”,可以看到会将STAD中ERAP2所有SNP显示出来,包括SNP位置,突变类型以及异常选择性剪接的ID。
点击“display”栏目下方的“Box Plot”还可以查看具体的突变情况,该图可以直接下载PDF版本用于文章中。
但是这个搜索框中,可以查找特定癌症类型中变化最为明显的基因和SNP位点。具体方法是选择癌症类型,比如“STAD”,随后点击“searech”。
可以看到,排在首位的是TMEM216,点击后方的“box plot”,就可以看到其SNP位点变化相当明显。
在该搜索栏中,可以查询特定SNP的生存率,这个输入查询就可以用了。这里我要讲的是可以通过这个搜索栏目找到大批课题,比如选择癌症类型“STAD”,然后点击“search”就可以查看哪个基因的SNP突变与胃癌病人的生存率密切相关。
这里可以看到SNP rs4405153变化最为明显,点击后方“KM Plot”还可以查看具体的突变情况和生存率之间的关系,可谓相当好用。
在该搜索栏目中可以选择癌症类型和r2值,也可以输入表型和SNP ID。这里以胃癌中治疗为例,可以查询到具体的基因名称和SNP位点信息。
其实个人觉得该网站最好用的地方是提供所有sQTLs数据下载。
点击任意想要的癌症数据,就可以轻松完成下载,下载后的数据格式如下图所示。
总体来说,这个数据库是研究SNP中至关重要的一个网站,能够为各位同行提供想要的数据,大家可以试试看。
封面图来自网络
关注后获取《科研修炼手册》1、2、3、4、5、6、7、8、9