spotBinning 在空间数据中的应用
作者 | 周运来
男,
一个长大了才会遇到的帅哥,
稳健,潇洒,大方,靠谱。
一段生信缘,一棵技能树。
生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。
我们知道,空间分析中常见的是解析每个spot中的细胞数,这是往细了做。而临近的细胞放到一个bin中获得概览,不仅是在可视化方面,在数据集大了之后,这种分箱的操作可以减少维度。这种分析方法或可叫做spotbinning抑或是pseudospot。之所以产生这个联想是因为之前做宏基因组的时候做过Contigbinning。今天我们就来看看spotBinning 在空间数据中的应用,主角是:同属于Seurat生态的schex ,起初,schex 拟解决单细胞转录组图谱(tsne/umap)中细胞重叠的问题。如:
library(schex)
library(Seurat)
library(SeuratData)
data("pbmc_small")
pbmc3k.final <- make_hexbin(pbmc3k.final, 10, dimension_reduction = "PCA")
p1 <- DimPlot(pbmc3k.final,reduction = 'pca')
p2 <- plot_hexbin_density(pbmc3k.final)
p1+p2
可以看到schex在pca空间中将细胞点划分为不同的区域,并计算了该区域的细胞数。当然,如果我们把pca空间换成空间位置信息,自然也是可以做类似的操作的。而空间位置的点,往往是均匀分布的,所以每个bin(箱子)可以看作是重采样的过程。下面我们就来做一下这个演示:
载入空间数据并作标准计算:
SeuratData::AvailableData()
stxBrain.SeuratData::anterior1 -> Brain
Brain <- FindVariableFeatures(Brain)
Brain %>% NormalizeData() %>%
ScaleData() %>%
RunPCA() ->Brain
Brain %>% FindNeighbors(dims=1:20) %>%
FindClusters() ->Brain
坐标替换:
Brain@reductions$sptial <- Brain@reductions$pca
# head(Brain@reductions$sptial@cell.embeddings)
Brain@reductions$sptial@cell.embeddings <- as.matrix(Brain@images$anterior1@coordinates[2:3])
Brain <- make_hexbin(Brain, 20, dimension_reduction = "sptial")
Brain
An object of class Seurat
31053 features across 2696 samples within 1 assay
Active assay: Spatial (31053 features, 2000 variable features)
2 dimensional reductions calculated: pca, sptial
下面就可以调用schex了
plot_hexbin_density(Brain) + theme_bw()
可以看到明显的边际差异:处在边界上的bin中的spot更少。
绘制分群信息:
plot_hexbin_meta(Brain, col="Spatial_snn_res.0.8", action="majority") + theme_bw()
当然不止于此,我们可以在上面画基因啊。如,bin中的基因平均表达量:
VariableFeatures(Brain)
plot_hexbin_feature(Brain, mod="Spatial", type="scale.data", feature="Ttr",
action="mean", xlab="row", ylab="col",
title=paste0("Mean of expression of Ttr")) + theme_bw()
还记得Seurat空间变异基因如何计算的吗?
Brain <- FindSpatiallyVariableFeatures(Brain, assay = "Spatial", features = VariableFeatures(Brain)[1:100],
selection.method = "markvariogram")
grep("Cc",SpatiallyVariableFeatures(Brain, selection.method = "markvariogram"),value = T)
[1] "Cck" "Ccl5"
用Seurat画两个基因:
SpatialFeaturePlot(Brain,features = c("Cck", "Ttr"))
第二种方式:
FeaturePlot(Brain, features = c("Cck", "Ttr"), blend = TRUE)
schex 提供三种方式,这里看一下在空间中绘制差异基因:
plot_hexbin_interact(Brain, type=c("scale.data", "scale.data"),
mod=c("Spatial", "Spatial"), feature=c("Cck","Ttr"), interact="fc",
ylab="row", xlab="col",
title="Interaction ") +
scale_fill_gradient2(midpoint=0, low="blue", mid="white",
high="red", space ="Lab") + theme_bw()
看到指定差异的interact="fc"
了吗?
两基因在bin中的相关性:
plot_hexbin_interact(Brain, type=c("scale.data", "scale.data"),
mod=c("Spatial", "Spatial"), feature=c("Cck","Ttr"), interact="corr_spearman",
ylab="row", xlab="col",
title="Interaction ") +
scale_fill_gradient2(midpoint=0, low="blue", mid="white",
high="red", space ="Lab") + theme_bw()
除了简单的绘图 schex还可以调用shiny更灵活地调节
plot_hexbin_feature_shiny(Brain, type="counts", feature="Cck",
action="prop_0", min_nbins=10, max_nbins=50, dimension_reduction="sptial",
mod="Spatial")
如果分群好的话,还可以用plus版的,加上分群信息:
plot_hexbin_feature_plus(Brain,
col="Spatial_snn_res.0.8", type="counts",
feature="Cck", action="mean")+theme_bw()
本文提出的问题其实是在空间数据中如何重采样? 在单细胞转录组中重采样的话,随机抽取就可以了,但是在空间中如果随机抽取的话,势必把好不容易得到的空间信息采的稀烂。如:
Brain2 <- subset(Brain,cells=WhichCells(Brain,downsample = 50))
p1<- SpatialDimPlot(Brain2)
p2<- SpatialDimPlot(Brain)
p1+ p2
其实空间数据的获得本身就是空间位置分箱采样的过程,不信请看:
Binning 在空间数据中的应用:
References
[1]
High-definition spatial transcriptomics for in situ tissue profiling:
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
看完记得顺手点个“在看”哦!
长按扫码可关注