IGV和Adobe AI制作RIP-seq Peak图简易教程 | m6A专题
做完了RIP-seq、ATAC-seq、m6A-seq等项目,想对基因的某个区域高富集区域绘制peak calling的图,类似于下面展示的几种形式,你会用什么软件呢?当然这里的AI不是人工智能的意思,而是Adobe Illustrator的简称。
今天我们就来一起分享以上这种图是怎么画的?目前有两种方法可以得到——bedtools和IGV都可以做出类似的图,bedtools操作较为复杂且需要linux环境,而IGV有桌面版软件。下面我们就来看看如何实现论文级别的矢量图。
第一步,下载IGV软件,下载地址为:
http://software.broadinstitute.org/software/igv/download ,然后在文件夹IGV_Win_2.4.16/lib 下打开igv.jar(事先要安装JAVA8版本,JAVA9以上版本不能用),看到以下界面后,首先选择基因组信息,以本实验为例,我们选择hg38版的人基因组信息。
我们从网上已公布的m6A测序结果中,选取其中2个样本作为示例,挑选的基因为MT2A中某个转录本MT2A-201,这个转录本只有3个外显子,便于各位理解。我们输入chr16:56,608,199-56,609,497作为想要查看的染色体区域信息输入进去后,变成了该区域的情况。我们可以看到在最下方,还出现了MT2A的2个外显子的结构。
第二步,输入每个样本的reads的mapping文件,文件以tdf格式结尾。这种tdf文件格式可让公司专门生成,只需要把该基因在染色体上的区域如chr16:56,608,199-56,609,497告诉我们即可,我们会生成每个样本的tdf格式文件。拿到tdf格式后就打开tdf文件导入到IGV。
如果自己有linux运行环境或者正在学习的生信的朋友们,你们也可以从整个庞大的bam文件中导出自己想要的结果。具体来说,每个样本包括IP样本和input样本的RNA测序数据在和基因组比对后,会生成bam文件(sam的纯文本格式进行二进制压缩后的格式)或sam文件(纯文本格式)。有linux运行环境可先对bam文件进行去冗余,输入指令为~samtoolsrmdup–S(PE模式大写)/-s(SE模式小写) sample_A.bam > sample_A_rmdup.bam。然后建立index,具体指令为~ samtools index sample_A_rmdup.bam。最后我们可以从这个已经处理过的bam文件中,提取基因组特定位置的reads覆盖情况,指令为~ samtools view sample_A_rmdup.bam chr16:56608199-56609497> sample_A_MT2A.sam。
需要注意的是,这个生成的sam格式,可以被IGV直接识别。如上图所示,2个样本的input和IP各4个文库在MT2A基因所覆盖的16号染色体区域各自生成了4个sam文件。
我们在IGV软件菜单栏Tools处,点击Run igvtools,把sam文件转换成tdf格式。
如上图所示,这就是4个文库在chr16上特定区域里 reads的覆盖情况,我们可以发现某些区域reads覆盖度特别高,而有些区域几乎为0。但是这个颜色实在是太丑了!我们要对颜色进行替换。
单击右键的Change Track Color一栏,点开后我们把蓝色换成少女心爆棚的粉红色。我们会看到背景色从蓝色变成了粉红色。
最后我们要从IGV导出图片,可不能直接用QQ截图Ctrl+Alt+A那种,而是要导出矢量图。什么叫矢量图,就是无限放大后图片依然有很高的清晰度。所以我们选择了SVG格式。
即使SVG是矢量图,也无法得到我们想要的编辑格式。这时候我们需要先安装一个软件Adobe Acrobat。安装好Acrobat之后,我们用360网页浏览器打开SVG格式的文件作为示范。
从上图可以得知,在网页任意出点击右键,选择“打印”一栏。我们选择打印并非是真正要从打印机上打印,而是用PDF格式将文件存起来。而输出的PDF格式文件里的各种元素,就是我们所说的矢量图必备。
需要注意的是在左侧需要对打印PDF文件的一些参数和细节做一些调整。如本次例子所示,我们选择了A2纸大小,彩色等选项,并且可以在右侧预览打印效果。如果纸张过小很有可能会导致打印内容不全。最后我们就能愉快地输出PDF文档了。
打开PDF文档,推荐使用Adobe Acrobat,因为这款软件是在Adobe Reader的基础上可以修改PDF文档里的各种元素。如上面第一张图所示,刚才IGV内所显示的内容全部呈现在面前。请注意,这个图如果按住快捷键Ctrl+鼠标滚轮,可以无限放大和缩小,并且几乎不存在低像素的问题,都是高清的元素,这就是我们前面讲到的矢量图。所以上面第二张图我们放大到400%后,里面的元素依旧很清晰!
这时候我们需要请出Adobe家族的另一款软件Adobe Illustrator,简称AI。在用AI打开这个PDF文件后,我们开始对多余元素进行删除。这里介绍几个Adobe AI软件的常用快捷键,Ctrl+鼠标滚轮就是左右移动画布,Alt+鼠标滚轮就是画布放大缩小,鼠标滚轮就是画布上下移动。
在打开PDF文档后,我们单独保存了一个.ai文件。不同的修改方案,建议同时保存几套.ai文件以备不时之需。由于打开的图形如上图所示,是竖着的。
下一步就是要按住ctrl+A选中所有元素后,单击右键变换→旋转,选择270°即可。
调整好方向后,我就要对多余的元素进行删除,在这之前我们还要调整下画布的大小,在左侧工具栏点
上图就是各种元素删除后剩下的。这里添加一些自己感兴趣的元素,或者给已有的元素修改下颜色,或修改透明度。
这里推荐大家一本书,叫《生命科学插图从入门到精通——Adobe Illustrator使用技巧》,里面会告诉大家如何做出精美的无损的论文插图。
我们继续在里面添加了一些文字和元素,当然这里只用了复制元素、添加文字和修改颜色等极少部分功能,更强大的功能还是请老师阅读《生命科学插图从入门到精通——Adobe Illustrator使用技巧》。
最后我们要输出矢量图的格式(PDF),可以在最上面的菜单栏单击文件→存储副本,保存为PDF格式即可。那么有老师会问了,我把这些图片导入到PPT里可不可以。我们的答案是可以,但是PPT再导出的图片就不是矢量图了,如果无限放大我们会发现图片的像素会越来越模糊。
另外有一个小技巧就是Nature和Cell杂志大部分图都为矢量图,我们可以用AI或者Acrobat软件把里面好的元素抠出来,做一些颜色的调整和形状转换,也可以放入自己的论文中增加亮点。
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格联川云平台,让科研更自由