circos图在单细胞数据分析中的应用

Original 新格元苏州新格元生物科技有限公司 2022-08-16

收录于合集 #单细胞数据科学 25个

以新格元数据科学，访单细胞缤纷世界，欢迎来到单细胞数据科学。

在数据科学中，我们主要目标是描述元素的对象和属性及其之间的关系。在单细胞数据科学中，上游是在描述元素，如细胞的特性或基因的表达量，下游往往是描述细胞之间或基因之间的关系，如，配受体。关系型数据，即两个或以上变量之间的关系，其可视化是一门技术与艺术的科学。之前我们介绍的网络图，桑基图，热图其实也都是关系型数据可视化的例子，今天，我们再介绍一种常用的关系型数据可视化的工具：圈图，或circos图。

在这之前，我们先来思考一个相对宏观的问题：如何选择可视化工具呢？首先需要对我们的数据进行分类，不同的数据结构可以选择不同的可视化工具，以达成自己想说明的具体问题。

不要被这个导图吓到，它至少告诉我们数据类型是有限的，可视化的方法也是有限的，而不是无限的。好处是，避免了拿到数据手足无措的尴尬。关系型数据的可视化主要的技术有，和弦图，网络图，桑基图，以及它们的变形，如下：

当我们需要对"关系"进一步细化的时候，可以用颜色，面积，粗细等属性来映射不同的数据意义。下面来讲我们今天的圈图，请注意，这里的圈图是广义的，是包含了和弦图（Chord diagram）的，和弦图往往往往出现在圈图的中心，如下图的ABC：

图D当然是圈图，而其中没有和弦图，在这个意义上，圈图是一种用来描述复杂关系的组合图。由于圈层可以有多个，每个圈层都可以按分类安排一种简图，如柱形图，折线图，环形图等。来说说圈图中的和弦图先。

和弦图用于探索实体组之间的关系，实体之间的连接用于显示它们共享某些共同点，这使和弦图非常适合比较数据集内或不同数据组之间的相似性。下图很好地反映出，如何将一个二维表映射成一个和弦图：

细胞来源

那么，我们首先想到的应用是多样本聚类后，看每个群中不同细胞的样本来源，我们在曾经用桑基图实现过这个功能，几乎，所有的桑基图都可以绘制成和弦图：

如果这里每个亚群都注释好细胞类型，又是不同部位的PMBC的话，是不是可以反映出细胞的去向与募集情况呢？

受配图对

然后，不同细胞类型之间的特异的受体和配体对关系，如NicheNet所绘制的那样：

外在的六种颜色是六个细胞类型，不同细胞类型之间的受配体对用相同的颜色映射。

V-J基因关系

我们知道，在单细胞免疫组库的数据分析中，V基因和J基因也有着对应关系，这时候可以用和弦图来反映V-J 之间的关系：

metadata 圈图

在圈图中关键是定义每一圈层的意义，在我们熟悉的Seurat对象中，metadata里的信息每一列都是一个独立的属性，所以我们可以把metadata信息绘制在圈图之中。


#install.packages('circlize')

library(circlize)

library(Seurat)

library(ggraph,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')

library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')       

.libPaths()

library(tidyverse)

library(cowplot)

library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')

unclass("Seurat")

class("Seurat")





 head(pbmc3k.final@meta.data)

               orig.ident nCount_RNA nFeature_RNA seurat_annotations percent.mt RNA_snn_res.0.5 seurat_clusters

AAACATACAACCAC     pbmc3k       2419          779       Memory CD4 T  3.0177759               1               1

AAACATTGAGCTAC     pbmc3k       4903         1352                  B  3.7935958               3               3

AAACATTGATCAGC     pbmc3k       3147         1129       Memory CD4 T  0.8897363               1               1

AAACCGTGCTTCCG     pbmc3k       2639          960         CD14+ Mono  1.7430845               2               2

AAACCGTGTATGCG     pbmc3k        980          521                 NK  1.2244898               6               6

AAACGCACTGGTAC     pbmc3k       2163          781       Memory CD4 T  1.6643551               1               1

绘制圈图：


pbmc3k.final@meta.data -> df

circos.par("track.height" = 0.1)

circos.initialize(df$seurat_annotations, x = df$nFeature_RNA)

circos.track(df$seurat_annotations, y = df$nCount_RNA,

             panel.fun = function(x, y) {

                 circos.text(CELL_META$xcenter, 

                             CELL_META$cell.ylim[1.3] + mm_y(2), 

                             CELL_META$sector.index)

                 circos.axis(labels.cex = 0.6)

             })





col = rep(c("#FF0000"), length(levels(Idents(pbmc3k.final))))

circos.trackPoints(df$seurat_annotations, df$nFeature_RNA, df$nCount_RNA, col=col,pch = 16, cex = 0.5)

circos.text(1200, 1600, "lab", sector.index = "NK")





bgcol = rep(c( "#CCCCCC"), length(levels(Idents(pbmc3k.final))))

circos.trackHist(df$seurat_annotations, df$nFeature_RNA, bin.size = 20, bg.col = bgcol, col = NA)





circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$nCount_RNA,

             panel.fun = function(x, y) {

                 ind = sample(length(x), 10)

                 x2 = x[ind]

                 y2 = y[ind]

                 od = order(x2)

                 circos.lines(x2[od], y2[od])

             })

circos.track(df$seurat_annotations, x = df$nFeature_RNA, y = df$percent.mt,

             panel.fun = function(x, y) {

                 ind = sample(length(x), 10)

                 x2 = x[ind]

                 y2 = y[ind]

                 od = order(x2)

                 circos.lines(x2[od], y2[od])

             })





circos.track(ylim = c(0, 1), panel.fun = function(x, y) {

    xlim = CELL_META$xlim

    ylim = CELL_META$ylim

    breaks = seq(xlim[1], xlim[2], by = 100)

    n_breaks = length(breaks)

    circos.rect(breaks[-n_breaks], rep(ylim[1], n_breaks - 1),

                breaks[-1], rep(ylim[2], n_breaks - 1),

                col = rand_color(n_breaks), border = NA)

})





circos.link("B", c(400, 800), "NK", c(800,1000), col = "red",

            border = "blue", h = 0.2)

circos.link("CD14+ Mono", 400, "FCGR3A+ Mono", c(400,1200), col = "green", border = "black", lwd = 2, lty = 2)





##################

circos.clear()

dev.off()

通过以上的例子，我们可以感受到，圈图也好，和弦图也好，其实都是一个框架，有了这个框架我们就可以在这个上面填充信息。如果说通过数据类型来寻找绘图结构是买毛坯房，那么，给每个绘图元素映射生物学意义就是在装修这个房屋。

不知道，这篇文章有没有启发到你呢？

封面：纽约时报的基因组圈图

https://jokergoo.github.io/circlize_book/book/circos-heatmap.htmlhttps://xgaoo.github.io/ClusterMap/ClusterMap.htmlhttps://yimingyu.shinyapps.io/shinycircos/https://www.data-to-viz.com/graph/chord.htmlhttp://circos.ca/https://www.bioconductor.org/packages/release/BiocViews.html#___SingleCellhttps://www.r-graph-gallery.com/310-custom-hierarchical-edge-bundling.htmlhttps://davemcg.github.io/post/lets-plot-scrna-dotplots/https://pxy.shatterspikeneopets.online/dotplot-seurat.htmlhttps://jokergoo.github.io/circlize_book/book/introduction.html#principle-of-designhttps://divingintogeneticsandgenomics.rbind.io/post/enhancement-of-scrnaseq-heatmap-using-complexheatmap/https://gdevailly.netlify.app/post/plotting-big-matrices-in-r/https://www.jianshu.com/p/0dbdd6733b34

-THE END-

新格元秉持“格物致知，识微通元”的创新性理念，致力于发展简便可靠的单细胞组学技术，使之成为新一代细胞病理及血液检测手段，让单细胞组学以传统方法无法比拟的精确度、灵敏度和分辨率服务于精准医疗和健康管理等领域。

格物致知，识微通元

公司电话：0512-67215102

技术联系电话：18151629767

合作邮箱：marketing@singleronbio.com

官网：www.singleronbio.com

地址：南京市江北新区药谷大道11号加速器二期6栋4-5

地址：苏州市工业园区星湖街218号生物纳米园B4楼401

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

circos图在单细胞数据分析中的应用

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

生成图片，分享到微信朋友圈

circos图在单细胞数据分析中的应用

您可能也对以下帖子感兴趣