查看原文
其他

菜鸟团一周文献推荐(No.8)

生信菜鸟团 生信菜鸟团 2022-06-07

今后如果没有特殊情况,生信菜鸟团成员将每周为大家带来一期文献速递,推荐我们过去一周看到的好文献。所有的推荐完全不独立公正第三方,只是根据个人喜好推荐,希望对你有所帮助。(因为假期本周的文献推荐就是一次特殊情况)

欢迎大家阅读完毕之后在文章最后选出你认为最感兴趣的文章,就可能在下一周看到这篇文章更详细的解读和测评哈,赶紧动手转发推荐给你的朋友一起投票参与,笔芯



推荐人: kaopubear

Benchmarking of alignment-free sequence comparison methods

DOI(url): 

https://doi.org/10.1101/611137

发表日期:April 16, 2019.

关键点

有哪些 alignment-free (AF) 相关的工具,以及如何评价。

参考意义

AF 类的工具,在转录组分析层面使用最多的是定量分析。例如 salmon 和 kallisto,主要原理就是基于对kmer的各种操作。其实除了转录组的快速定量

这篇文章比较详细的介绍了目前主要 AF 相关工具的原理和工具。同时,作者使用了24个相关软件的74种方法,测试了五种应用场景,分别是:

  • protein sequence classification

  • gene tree inference

  • regulatory element detection

  • genome-based phylogenetic inference

  • reconstruction of species trees under horizontal gene transfer and recombination events

作者还提供了一个在线工具,用来展示这些结果。




推荐人: kaopubear

Bazam: a rapid method for read extraction and realignment of high-throughput sequencing data

DOI(url): 

https://doi.org/10.1186/s13059-019-1688-1

发表日期:18 April 2019

关键点

bam 文件似乎可以方便的回滚了

参考意义

随着参考基因组的更新和比对方法的更新,很多之前的bam文件似乎就变得过时了。除了找出原始的fastq文件再重新来过一次,现在有了另一个选择。

bazam 首先可以从bam或者cram文件直接找到pair reads 在比对回其它参考基因组而不需要中间步骤; 也可以按需要提取过滤后的reads,例如与特定基因位置有overlap的reads。结果可以直接传到下游工具,或以fastq格式存储以供进一步处理。另外还从read 这个input层面提供了多线程比对的思路。加快了比对速度。

整体而言,和目前已有的一些可以转换bam文件的工具相比,其在内存和存储占用,已经方便程度上都有优势。

目前我的问题是很多时候会对原始bam文件进行一波过滤,这个时候已经丢掉了很多fastq的reads。

相关内容

其它几个已有工具的比较

Sort-Extract-Realign

282 GB

20 GB

16

13 h, 15 min

Picard SamToFastq

148 GB

78 GB

16

16 h, 14 min

Biobambam bamtofastq

149 GB

30 GB

16

15 h 30 min

Bazam (no sharding)

68 GB

28 GB

16

14 h, 55 min

Bazam 10-way sharding

102 GB

20 GB

160

1 h, 11 min



推荐人:kaopubear

Antisense lncRNA Transcription Mediates DNA Demethylation to Drive Stochastic Protocadherin α Promoter Choice

DOI(url): 

https://doi.org/10.1016/j.cell.2019.03.008

发表日期:4 April 2019

关键点

反义 lncRNA 转录可以影响DNA甲基化,进而改变染色体结构促进增强子与启动子结合,调控基因表达。

参考意义

Pcdhα基因有13个可以随机启动的可变外显子,每个启动子都可以由自身的启动子驱动,还有3个c型外显子以及稳定表达的编码pcdh结构域的外显子,同时,还有一个enhancer调控。

研究者发现,反义lncRNA的转录,会造成该位点DNA去甲基化的发生,从而使远端增强子靠近该外显子的启动子,促进它的表达。如图2所示,Pcdhα基因座位均带有抑制表达的DNA甲基化修饰,而当反义lncRNA表达时,该外显子附近的DNA被DNA去甲基化酶TET3识别,去除了甲基化修饰,cohesin蛋白重塑了染色体的结构,HS5-1增强子与该基因座位的启动子结合,启动相应Pcdhα变体的表达。

相关内容

关于反义lncRNA影响正义链基因表达的作用机制,主要有3类

  1. 反义lncRNA的转录过程,抑制正义链基因的转录,该机制认为反义链转录事件本身,而不是反义lncRNA,调控了基因的表达。

  2. 反义lncRNA结合DNA或组蛋白修饰酶,调控所在基因座位的表观遗传学,从而影响正义链基因的表达。

  3. 反义lncRNA与正义链mRNA通过碱基互补配对结合,影响mRNA的可变剪接等。




推荐人:kaopubaer

exceRpt: A Comprehensive Analytic Platform for Extracellular RNA Profiling

DOI(url): 

https://doi.org/10.1016/j.cels.2019.03.004

发表日期:April 4, 2019

关键点

一套分析 exRNA 的完整方案

参考意义

exRNA 就是细胞外RNA,也就是在细胞内转录但是在细胞外发挥功能。最近cell 有一个专刊介绍了很多exRNA的文章,我扫了一眼,感觉主要内容是小RNA居多。所以这个分类和lncRNA类似,一个从长度一个从位置来进行区分。既然是这样,exRNA 的处理方法应该就和小RNA以及一般的 RNAseq 分析类似。看看这个流程里面有哪些不一样的地方。这里提供的分析方法从内容来看主要针对小RNA,但是官方说也可以很方便的移植到其它RNA,在GitHub的代码里也有针对 longRNA 的脚本。主要流程如下图,质控后会同时比对到多个数据库,具体内容可以参考 GitHub。






醒醒,假期结束了胖友,投票


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存