查看原文
其他

这是一门好生意

王通 基因学苑 2023-08-18

毫无疑问,不到五年之内,人类全基因组的价格将会降到1000人民币,到那个时候,我们每个人都可以分析自己的自己基因组了。分析基因组很难吗?怎么说呢,其实说来也并不难,主要就是与参考基因组序列比对,然后找突变位点,在对这些突变位点进行注释,着其中有两个问题比较重要,第一,突变位点找的一定要准确;第二,数据库注释信息比较全;满足这条件你就可以分析自己的全基因组了。

前面我们的推文中有一篇,已经介绍过如何通过中找人全基因组的突变,那么得到的将近400多万的突变位点之后该如何处理呢,下面我们介绍一下promethease这个网站,与之类似的还有一个GEDmatch.com

一个人全基因组完整数据分析脚本

Promethease

Promethease是SNPedia提供的一项收费服务,SNPedia 是一个开放的SNP位点维基百科,里面提供了人全基因组每个突变位点的注释信息,例如这个突变位点在数据库中的rs号,坐标位置,突变频率,基因型以及对应的表型信息等,里面包含的信息非常多,单独查看几个位点比较方便,如果有几百万位点需要检索就不容易了。这个时候就需要使用Promethease了。通过注册Promethease,用户可以上传自己的全基因组突变数据,当然全外显子或者目标区域数据也同样适用。Promethease会将提交的数据与SNPedia进行检索,然后就可以得到注释信息了,例如分析用户的基因特征,如疾病风险等,最终会给出一个报告内容,类似各种基因检测机构提供的报告,每次收费最低12美元,这样就可以完成自己的全基因组分析了。

使用说明

由于人全基因组数据涉及到每个人的隐私问题,因此在访问网站之后,首先需要接受许可信息。许可信息大概就是说这个报告 紧用于学习与科研用途,不能作为临床诊断结果,诊断还是得相信医生,这个报告的结果你也不能全信,最终,报告会保留45天。

接受之后就可以登录提交自己数据了,网站提供了目前一些基因检测公司也是用这项服务,如果好奇,可以打开每个报告看一下。

提交的数据支持多种格式,例如最常用的记录突变的vcf格式,其实不管是哪一种格式,至少都需要这个突变位点的坐标位置,例如染色体号,具体位置,然后就是基因型的信息,有了这些就可以与SNPedia数据库进行检索,同时留一个邮箱,注释完成就可以收到邮件提醒。注释其实很快,不到10分钟就可以完成了。

我没有自己的全基因组数据,也没去测试,感兴趣的可以自己试试,如果以后能有人开发一个这样的中文工具就好了。而且真佩服作者开发这个工具,可以躺着赚钱的,这是我一直以来的梦想。



---------- END ----------

(更多精彩内容,欢迎关注公众号)



您可能还会感兴趣的

基因学苑2018年文章目录
生物信息零基础班(北京站)开课啦
手把手教你生信分析平台搭建专栏合集
生物信息重要资源站点合集
不会编程,如何进行批量操作
一个人全基因组完整数据分析脚本
一个细菌基因组完整分析脚本
如何在Linux下优雅的装X
2019,送给大家一份新年礼物
生物学才是终极学科



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存