查看原文
其他

转录组入门(2):读文章并拿到测序数据

2017-07-10 生信菜鸟团
  • 转录组入门的第二周,你学的怎么样了?

下面进入正题:阅读文献,下载数据! 
本次入门系列阅读和使用的是这篇文献的数据“AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors.” Nat Commun 2016 Nov 8;7:13347. PMID: 27824034.很容易找到里面的RNA-seq数据GSE81916。

数据下载

1.mkdir data & cd data
2.for i in {54..62}; do  wget  ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR35899$i/SRR35899$i.sra
注意:我们只需要mRNA-seq的测序数据,RNA-immunoprecipitation (RIP)-seq本次入门不考虑。在这里我们也用到了循环,为方便大家理解,可以试一下下面这个简单的代码:
for i in {54..62}; do echo $i ; done

大家仔细看一下数据下载的链接,就可以找到GEO/SRA数据存放的规律

好了,这周的部分就到这里,下周我们会讲fastq数据相关内容,时间充裕的话建议大家做几件事情:

1.阅读上面的文章,对自己高要求,不能简单做一个只会分析数据的技术员,我们的目标还是科学家的嘛^_^ 嘻嘻…… 
2.大家尝试一下理解并自己写一个for循环,比如我想得到从54到58,60到62这么几个中间缺了59的数,那么这个循坏该怎么写呢?我们的公众号终于拿到原创评论,大家有了答案可以向我们扔代码,欢迎调戏哟~

往期链接:

PANDA姐的转录组入门(1):计算机资源的准备


扫下面微信二维码添加好友,拉你入群,请注明姓名+单位+研究方向。

投稿、合作等事宜请发送到邮箱:jmzeng1314@163.com





    欢迎添加入群   

(长按图片扫描二维码可添加微信)



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存