查看原文
其他

跟着岳大师学ENCODE和RoadMap

2016-08-15 郭大侠 实验万事屋

温馨提示:请点击标题下方蓝色“实验万事屋”,或者点击下面的指纹,添加关注后,发“嗯”可以查看我们之前的文章。


郭大侠这几天和骨头一起在复旦大学蹭表观课程,遇到了一位岳大师,此岳大师不是华山派的掌门岳不群,而是美国宾夕法尼亚州的岳峰教授。岳教授是一位非常传奇的人物,本科就读于北京大学外语系,毕业后在美国拿到了计算机硕士学位,之后拜入表观遗传大牛、ChIP-on-Chip技术的发明人任兵教授山墙,几年时间习的一身好本领,让我佩服不已。岳教授的实验室主页如下:http://yuelab.org/,感兴趣的小伙伴可以前去围观;此外我下了岳教授近几年的代表作,真是发CNS如探囊取物,链接如下http://pan.baidu.com/s/1pL2EfJ9。郭大侠和骨头这几日跟着岳大师get不少新技能,现学现卖也分享给大家,希望能对大家有所帮助。


ENCODE(encyclopedia of DNA elements)计划,中文名为“DNA元件百科全书计划”,是继"人类基因组计划"后又一大型国际合作项目。来自世界各国32个研究机构的442名科学家历时5年,解读生命体的功能元件,发现人类基因组看似多余的"垃圾序列"至少80%是有功能的,其中包括了大量的非编码RNA和转座子。而由美国NIH资助的表观组学线图计划 (Roadmap Epigenomics Mapping Consortium,简称Roadmap),致力于绘制人类表观组学图谱,深度探究DNA甲基化修饰在遗传、发育、疾病中的作用。学会两个数据库的使用,对于研究生课题中发现科研线索、寻找分子机制具有重要作用;其中的数据完全来自于世界上几个顶级实验室,data极其可靠,因此也是印证自己实验结论,回答reviewer问题的神兵利器。


第一篇我们通过实例,看ENCODE数据库中的组蛋白ChIP-Seq数据如何助攻分子表达变化机制研究:PTEN作为关键的抑癌基因,在肝癌中的表达出现下调。而这种下调是否与PTEN基因启动子区域表观修饰相关,今天通过实例展示给大家。


首先进入ENCODE主页(https://www.encodeproject.org/),在图1-1处输入H3K4me3空格liver (组蛋白H3第4位赖氨酸三甲基化修饰)。这里多说两句,这几年组蛋白修饰密码被一一鉴定,H3K4me3修饰在基因组上广泛存在于Promoter区域,该修饰上调可以激活基因转录,感兴趣的可以看这篇文章——PMID-25083876。

 

图1


回车后,出来这样一堆数据,我们要对ChIP-Seq数据进行分析,点击图2-1处的Experiment,进入下一步。

 

图2


接下来对数据进行筛选,图3-1中选择ChIP-Seq数据,图3-2中选择所使用的参考基因组。熟悉基因组学的小伙伴们可能了解,基因组数据并非一次性全部完成,中间出现过几次重要的升级,如人基因组有hg19、hg38等版本,小鼠的有mm9、mm10等版本,这里我们使用GRCh38。

 

图3


全部选择完成后出现图4所示界面。点击图4-1处的Visualize按钮,跳入图形浏览界面(详见图6);点击图4-2处的标题,进入实验描述界面(图5)。图5-1是实验信息的Summary,信息显示该细胞来自于H9细胞系的体外诱导分化。图5-2是数据来源的实验团队。图5-3说明该Chip-Seq有两次重复,并提供了样本信息的summary和下载链接。图5-4提供了Raw-data(原始数据)和processed data(处理后数据)的下载和名称,点击+可以看到详细信息。图5-5提供了详细的实验路线,包含ChIP-Seq的步骤和诱导肝细胞分化的步骤。

 

图4

 

图5


接下来看图6,界面为UCSC浏览界面(图6),策到这里很多小伙伴可能晕了,都是些啥,别着急我们要慢慢调整格式。首先图6-1中所示的黑白相间的条即代表H3K4甲基化水平(dense模式,后面会策更容易看懂的full模式),白色代表低甲基化,黑色代表高甲基化;而红框中的一串文字代表了不同的processed data,包含Peaks和signals两种类型。图6-3可以输入基因名称“PTEN”,点击GO按钮即可进入PTEN基因所在DNA区域。接下来我们点击6-2所在的方格,进入图7所示界面,进行图形设置。 


图6


如下图所示,7-1处两个复选框都选择full模式。7-2处采用默认设置即可。7-3中列出的均为Processed data file,可与图5-4处列表文件一一对应。这里我们要看的是H3K4me3的信号值在两个Repeat中的情况,需要选择ENCFF035PPS文件和ENCFF847LBO文件。勾选后点击Submit按钮。

 

图7


之后得到我们的结果,如图8所示。我们可以看到在PTEN基因启动子区域有较高的H3K4me3的峰值,说明分化的肝细胞中PTEN基因的表达维持与其启动子区域的H3K4me3上调相关,推测肝癌中PTEN基因的下调可能是该基因启动子区域的H3K4me3下调介导了基因关闭。图8最后是可以放在paper中的,在加上一个PTEN启动子区域组蛋白H3K4me3的染色质免疫共沉淀实验,即可完美阐明PTEN为何在肝癌中下调。这种data非常solid,reviewer一般不会提出质疑。

 

图8


最后策两句,ENCODE分析十分多样化,该数据库也非常强大。郭大侠本人也是刚刚开始挖掘这一领域,如果帖子中有什么错误欢迎留言指出。此外该数据库连接众多,恕不能像以前一样一一说明每个连接的功能。大家有疑问可以去看指南,链接如下:。如果可以翻墙,该链接下还有很多视频课都在YouTube上。


…华丽丽的分割线…


李莫愁博士:ENCODE其实是一个非常有用的数据库,不过,不要以为什么神器就能帮你设计出一个什么课题来。有米有锅,也要自己认真想认真动手,才能把它变成锅里的饭。好了,今天就策到这里吧,请大家肆无忌惮地打赏郭大侠吧!


万事屋出售的课程及服务(点击下方即可查看,客服微信号阿可:zz76770309)


《meta简明教程》         《SCI写作教程》          《SCI制图》     标书写作教程        松哥统计教程  



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存