查看原文
其他

CUT&Tag 数据处理与分析教程 六:数据可视化

工具人~ 狮山生信 2022-08-15

CUT&Tag 数据处理与分析教程 一(官方手把手教学)

CUT&Tag 数据处理与分析教程 二:质控(不需要修剪 reads!不需要修剪 reads!不需要修剪reads!)和数据比对

CUT&Tag 数据处理与分析教程 三:BAM 文件统计(CUT&Tag 不建议去重不去重不去重)

CUT&Tag 数据处理与分析教程 四:Spike-in 对 CUT&Tag 数据的校正 对数据的校正

CUT&Tag 数据处理与分析教程 五:Peak  calling

VII. 可视化


通常,我们感兴趣的是使用基因组浏览器在区域中可视化染色质图谱。IGV ( Integrative Genomic Viewer ) 提供了网页版和本地版进行操作。UCSC Genome Browser 提供了全面的补充基因组信息。

展示标准化后的 bedgraph 文件



图 5:IGV 网页版展示了区间 chr7:131,000,000-134,000,000 上的 修饰情况

特定区域热图可视化

我们也对在注释位点列表中观察感兴趣的染色质特征,例如在基因启动子中的组蛋白修饰信号。我们将使用来自 deepTools 的 computeMatrix 和 plotHeatmap 函数来生成热图。

##== linux 命令 ==##
cores=8
computeMatrix scale-regions -S $projPath/alignment/bigwig/K27me3_rep1_raw.bw \
                               $projPath/alignment/bigwig/K27me3_rep2_raw.bw \
                               $projPath/alignment/bigwig/K4me3_rep1_raw.bw \
                               $projPath/alignment/bigwig/K4me3_rep2_raw.bw \
                              -R $projPath/data/hg38_gene/hg38_gene.tsv \
                              --beforeRegionStartLength 3000 \
                              --regionBodyLength 5000 \
                              --afterRegionStartLength 3000 \
                              --skipZeros -o $projPath/data/hg38_gene/matrix_gene.mat.gz -p $cores
plotHeatmap -m $projPath/data/hg38_gene/matrix_gene.mat.gz -out $projPath/data/hg38_gene/Histone_gene.png --sortUsing sum



图 6:基因附近的组蛋白富集热图

CUT&Tag peaks 区域热图

我们使用从 SEACR 返回的 信号区域的中点来对齐热图中的信号。 SEACR 输出的 第六列是 chr:start-end 形式的条目,表示该区域信号最大的区域的开始和结尾位置。我们首先生成一个 包含 6 列中的中点信息的新 bed 文件,并使用 deeptools 来实现热图可视化。

##== linux 命令==##
awk '{split($6, summit, ":"); split(summit[2], region, "-"); print summit[1]"\t"region[1]"\t"region[2]}' $projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.pe\
aks.stringent.bed >$projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.peaks.summitRegion.bed
computeMatrix reference-point -S $projPath/alignment/bigwig/${histName}_${repName}_raw.bw \
              -R $projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.peaks.summitRegion.bed \
              --skipZeros -o $projPath/peakCalling/SEACR/${histName}_${repName}_SEACR.mat.gz -p $cores -a 3000 -b 3000 --referencePoint center
plotHeatmap -m $projPath/peakCalling/SEACR/${histName}_SEACR.mat.gz \
    -out $projPath/peakCalling/SEACR/${histName}_SEACR_heatmap.png \
    --sortUsing sum --startLabel "Peak Start" \
    --endLabel "Peak End" --xAxisLabel "" \
    --regionsLabel "Peaks" \
    --samplesLabel "${histName} ${repName}"



图 7:Peak 区域中组蛋白富集热图



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存