查看原文
其他

Bioconductor包chimeraviz嵌合RNA可视化

Jimmy 生信技能树 2022-06-07

高通量RNA测序已经能够更高效地检测融合转录本,但是融合检测的技术和相关软件通常产生高错误发现率。而一个自动整合RNA数据和已知基因组特征的可视化框架对于结果的检验是有帮助的。2017年发布的一个bioconductor包,chimeraviz就可以做到自动创建嵌合RNA可视化。

支持来自9种不同融合发现工具(deFuse、EricScript、InFusion、JAFFA、FusionCatcher、FusionMap、PRADA、SOAPfuse和STAR-FUSION)的输入。

官网教程

直接在bioconductor可以看到详细说明:https://bioconductor.org/packages/release/bioc/html/chimeraviz.html | HTML | R Script |

下载安装好该R包后,自带一系列的融合基因可视化的测试数据,文件如下:

  1.  1.1K Oct 16 22:36 5267readsAligned.bam

  2.   96B Oct 16 22:36 5267readsAligned.bam.bai

  3.   22K Oct 16 22:36 FusionMap_01_TestDataset_InputFastq.FusionReport.txt

  4.   37K Oct 16 22:36 Homo_sapiens.GRCh37.74.sqlite

  5.   68K Oct 16 22:36 Homo_sapiens.GRCh37.74_subset.gtf

  6.  1.9K Oct 16 22:36 PRADA.acc.fusion.fq.TAF.tsv

  7.   32K Oct 16 22:36 UCSC.HG19.Human.CytoBandIdeogram.txt

  8.   32K Oct 16 22:36 UCSC.HG38.Human.CytoBandIdeogram.txt

  9.   16K Oct 16 22:36 defuse_833ke_results.filtered.tsv

  10.  4.6K Oct 16 22:36 ericscript_SRR1657556.results.total.tsv

  11.  1.7M Oct 16 22:36 fusion5267and11759reads.bam

  12.   57K Oct 16 22:36 fusion5267and11759reads.bam.bai

  13.  4.1K Oct 16 22:36 fusioncatcher_833ke_final-list-candidate-fusion-genes.txt

  14.  2.1K Oct 16 22:36 infusion_fusions.txt

  15.  4.3K Oct 16 22:36 jaffa_results.csv

  16.  2.6K Oct 16 22:36 reads.1.fq

  17.  2.6K Oct 16 22:36 reads.2.fq

  18.  1.0K Oct 16 22:36 reads_supporting_defuse_fusion_5267.1.fq

  19.  1.0K Oct 16 22:36 reads_supporting_defuse_fusion_5267.2.fq

  20.  3.3K Oct 16 22:36 soapfuse_833ke_final.Fusion.specific.for.genes

  21.  2.0K Oct 16 22:36 star-fusion.fusion_candidates.final.abridged.txt

可以看到,所支持的9种融合基因检测工具的示例结果都在这里了,比如我最喜欢的star-fusion的结果节选如下:

  1. #FusionName    JunctionReadCount   SpanningFragCount   SpliceType  LeftGene    LeftBreakpoint  RightGene   RightBreakpoint

  2. THRA--AC090627.1    27  93  ONLY_REF_SPLICE THRA^ENSG00000126351.8  chr17:38243106:+    AC090627.1^ENSG00000235300.3    chr17:46371709:+

  3. THRA--AC090627.1    5   93  ONLY_REF_SPLICE THRA^ENSG00000126351.8  chr17:38243106:+    AC090627.1^ENSG00000235300.3    chr17:46384693:+

  4. ACACA--STAC2    12  51  ONLY_REF_SPLICE ACACA^ENSG00000132142.15    chr17:35479453:-    STAC2^ENSG00000141750.6 chr17:37374426:-

  5. RPS6KB1--SNF8    10  43  ONLY_REF_SPLICE RPS6KB1^ENSG00000108443.9   chr17:57970686:+    SNF8^ENSG00000159210.5  chr17:47021337:-

  6. TOB1--SYNRG    8   30  ONLY_REF_SPLICE TOB1^ENSG00000141232.4  chr17:48943419:-    SYNRG^ENSG00000006114.11    chr17:35880751:-

  7. VAPB--IKZF3    4   46  ONLY_REF_SPLICE VAPB^ENSG00000124164.11 chr20:56964573:+    IKZF3^ENSG00000161405.12    chr17:37934020:-

  8. ZMYND8--CEP250    2   44  ONLY_REF_SPLICE ZMYND8^ENSG00000101040.15   chr20:45852970:-    CEP250^ENSG00000126001.11   chr20:34078463:+

  9. AHCTF1--NAAA    3   38  ONLY_REF_SPLICE AHCTF1^ENSG00000153207.10   chr1:247094880:-    NAAA^ENSG00000138744.10 chr4:76846964:-

  10. VAPB--IKZF3    1   46  ONLY_REF_SPLICE VAPB^ENSG00000124164.11 chr20:56964573:+    IKZF3^ENSG00000161405.12    chr17:37944627:-

  11. VAPB--IKZF3    1   46  ONLY_REF_SPLICE VAPB^ENSG00000124164.11 chr20:56964573:+    IKZF3^ENSG00000161405.12    chr17:37922746:-

  12. STX16--RAE1    4   33  ONLY_REF_SPLICE STX16^ENSG00000124222.17    chr20:57227143:+    RAE1^ENSG00000101146.8  chr20:55929088:+

这些结果文件导入R里面统一用import系列函数,比如:

  1. library(chimeraviz)

  2. # Get reference to results file from deFuse

  3. defuse833ke <- system.file(

  4.  "extdata",

  5.  "defuse_833ke_results.filtered.tsv",

  6.  package="chimeraviz")

  7. # Load the results file into a list of fusion objects

  8. fusions <- importDefuse(defuse833ke, "hg19")

  9. ## ---- message = FALSE------------------------------------------------------

  10. length(fusions)

基因组全局可视化


  1. soapfuse833ke <- system.file(

  2.  "extdata",

  3.  "soapfuse_833ke_final.Fusion.specific.for.genes",

  4.  package = "chimeraviz")

  5. fusions <- importSoapfuse(soapfuse833ke, "hg38", 10)

  6. # Plot!

  7. plotCircle(fusions)

主要是一个环形图,如下:

融合基因全基因组可视化

红色条带-染色体内融合,蓝色条带-染色体间融合。

单独可视化某个融合事件


  1. if(!exists("defuse833ke"))

  2.  defuse833ke <- system.file(

  3.    "extdata",

  4.    "defuse_833ke_results.filtered.tsv",

  5.    package = "chimeraviz")

  6. fusions <- importDefuse(defuse833ke, "hg19", 1)

  7. # Choose a fusion object

  8. fusion <- getFusionById(fusions, 5267)

  9. # Load edb

  10. if(!exists("edbSqliteFile"))

  11.  edbSqliteFile <- system.file(

  12.    "extdata",

  13.    "Homo_sapiens.GRCh37.74.sqlite",

  14.    package="chimeraviz")

  15. edb <- ensembldb::EnsDb(edbSqliteFile)

  16. # bamfile with reads in the regions of this fusion event

  17. if(!exists("fusion5267and11759reads"))

  18.  fusion5267and11759reads <- system.file(

  19.    "extdata",

  20.    "fusion5267and11759reads.bam",

  21.    package = "chimeraviz")

  22. # Plot!

  23. plotFusion(

  24.  fusion = fusion,

  25.  bamfile = fusion5267and11759reads,

  26.  edb = edb,

  27.  nonUCSC = TRUE)

  28. ## ---- echo = FALSE, message = FALSE, fig.height = 5, fig.width = 10, dev='png'----

  29. # Plot!

  30. plotFusion(

  31.  fusion = fusion,

  32.  bamfile = bamfile5267,

  33.  edb = edb,

  34.  nonUCSC = TRUE,

  35.  reduceTranscripts = TRUE)

这个可视化比较复杂一点,需要融合基因的事件详情,包含两个融合基因的bam片段文件,以及参考基因组的数据库信息。

然后有两种展现方式,一种是基于转录本的融合情况,一种是基于基因的。

RCC1-HENMT1融合例子

顶部:显示融合的染色体位置。

支持断裂点(红色曲线)的discordant reads数10(其中split的6,spanning的4),注释的转录本及read数图。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存