H&E染色图像分割与空间转录组共定位揭示肿瘤组织异质性
这几天开始做单细胞相关图像的研究,打算开启单细胞色彩主题的新系列。目前为止有些有趣的发现,简单的记录一下。
摘要
背景:
空间转录组可以反映细胞类型的空间分布,但目前的分辨率不够,而对应的H&E染色切片图像没有很好的应用到分析中。
方法:
以公开的乳腺癌单细胞转录组和空间转录组数据为测试数据,根据RGB数值对H&E染色图片进行分割,kmean聚类。将图片聚类的结果应用到空间转录组分群的细分。用单细胞转录组分解每个spot的细胞比例。最后,比较每个空间转录组分群中,图片分割的亚类之间细胞比例的差异。
结果:
在被Seurat clusters鉴定为肿瘤细胞的空间区域,H&E染色图像的分类能反映其他细胞类型比例的显著差异,如基质细胞,T细胞分别富集于不同的图像分类。
结论:
在空间转录组聚类的基础上,H&E染色的深浅可以进一步反映分群的异质性,揭示肿瘤区域的其他细胞类型的分布。
正文
肿瘤靶向治疗耐受是当前临床治疗的一大挑战,而不少结合免疫治疗的方案可以达到显著的治疗效果。只用HER2抗体和帕博西尼(Palbociclib)治疗HER2阳性乳腺癌会产生适应性耐受,有研究发现耐受的样本有非成熟髓系细胞(IMC)的浸润,通过抑制IMC可以提高靶向治疗的疗效[1]。因此,研究乳腺癌组织的细胞组成和空间分布,有利于耐药机理和新治疗靶点的发现。
H&E染色原理。分别用两种染色剂:苏木精和伊红。苏木精可以把嗜碱性的物质染成紫蓝色,如核酸;伊红可以把嗜酸性的物质染成粉红色,如蛋白质。颜色的深浅可以反映细胞的状态,如分裂活跃度,通透性等。
RGB图像数据存储原理。R:red红色;G:green绿色;B:blue蓝色。RGB图像显示是显示屏广泛应用的方案,用这三种颜色不同亮度的混合,组成每一个像素,可以展示多彩颜色。
Seurat3.2处理空间转录组的H&E图像以RGB的格式存储,包括R,G和B三个矩阵,一般压缩成600x600的尺寸。
用RGB矩阵展示图像可以用以下R代码:
library(grid)
grid.raster(Seurat_object@images$slice1@image)
乳腺癌空间转录组聚类
乳腺癌空间转录组数据来自10X官网空间转录组数据集[2],聚类用Seurat3.2。结果分为17个分群。
空间转录组H&E图像分割
我采用kmean的聚类方法对RGB矩阵进行聚类。兴许其他聚类方法更加合适,如fuzzy-kmean等,视数据情况而定。最终我定5个亚类可以得到最优化的结果。其中,cluster1是背景色,cluster2是切片中偏“白色”的部位。
代码实现:
img <- BRCA2@images$slice1@image
imgDm <- dim(img)
# Assign RGB channels to data frame
imgRGB <- data.frame(
x = rep(1:imgDm[2], each = imgDm[1]),
y = rep(imgDm[1]:1, imgDm[2]),
R = as.vector(img[,,1]),
G = as.vector(img[,,2]),
B = as.vector(img[,,3])
)
#kmean
kClusters <- 5
kMeans <- kmeans(imgRGB[, c("R", "G", "B")], centers = kClusters)
kColours <- rgb(kMeans$centers[kMeans$cluster,])
unicolor <- unique(kColours)
print(unicolor)
# plot cluster result
for (i in 1:length(unicolor)){
binary_col <- kColours
#set other clusters as background color.
binary_col[kColours %in% unicolor[-i]] <- "#FAF9F9"
p5 <- ggplot(data = imgRGB, aes(x = x, y = y)) +
geom_point(colour = binary_col) +
labs(title = paste("k-Means Clustering: ",i,'; Color: ',unicolor[i])) +
xlab("x") +
ylab("y") +
plotTheme()
print(p5)
}
空间转录组与单细胞转录组整合
乳腺癌单细胞数据来自GSE113197[3]. 用Seurat的anchor方法整合,最终得到每个spot的细胞类型预测结果。可以看出染色较深的部位大多数是肿瘤细胞。
Giotto解析spot细胞比例
首先从单细胞转录组获取每个细胞类型的差异基因作为类型signature,这里我用top100。Giotto用富集的方法对每个spot进行细胞类型打分[4]。
空间聚类的细胞类型比例
分群6/5/9/11/10/13中,肿瘤细胞的比例较大。
图像聚类的细胞类型比例
分群1/2的肿瘤细胞比例较大。图像聚类的不同分群之间展示出不同细胞类型比例,说明H&E染色的色彩跟细胞类型的比例有关系。
空间聚类cluster7的图像分割
首先需要对应spot和H&E图像像素点的坐标。
获取spot坐标:
coordinates <- GetTissueCoordinates(object = BRCA2[[images[[1]]]])
coordinates$imagerow <- 600 - coordinates$imagerow
ggplot(coordinates,aes(imagecol,imagerow)) + geom_point()
然后用spot坐标筛选像素坐标。像素坐标不是整数,用四舍五入法近似表示。
imgRGB$kmean5 <- kMeans$cluster
posr <- round(coordinates,0)
colnames(posr) <- c('y','x')
posr$spot <- rownames(posr)
image_meta <- inner_join(imgRGB, posr, by = c('x','y'))
rownames(image_meta) <- image_meta$spot
image_meta <- image_meta[names(Idents(BRCA2)),]
image_meta$seurat_clusters <- as.vector(Idents(BRCA2))
BRCA2@meta.data <- cbind(BRCA2@meta.data, image_meta)
SpatialDimPlot(BRCA2, label = TRUE, group.by = 'kmean5', label.size = 5)
最后比较空间分群的内部细胞类型差异:
可以看出,H&E图像分割的第5群有显著的髓系细胞富集,第2群有显著的肿瘤细胞富集。
总的来说,H&E图像可以辅助细胞聚类。更加可靠的图像数据如mRNA探针做亚细胞定位的seqFISH+等。
参考文献:
[1]. Wang, Qingfei, et al. "Single-cell profiling guided combinatorial immunotherapy for fast-evolving CDK4/6 inhibitor-resistant HER2-positive breast cancer." Nature communications 10.1 (2019): 1-12.
[2]. https://support.10xgenomics.com/spatial-gene-expression/datasets/1.1.0/V1_Breast_Cancer_Block_A_Section_2
[3]. Nguyen, Quy H., et al. "Profiling human breast epithelial cells using single cell RNA sequencing identifies cell diversity." Nature communications 9.1 (2018): 1-12.
[4]. Dries R, Zhu Q, Eng C H L, et al. Giotto, a pipeline for integrative analysis and visualization of single-cell spatial transcriptomic data[J]. BioRxiv, 2019: 701680.