查看原文
其他

Nat Commun︱刘瑾团队发布整合空间转录组数据方法

廖栩,刘伟,刘瑾 岚翰学术快讯
2024-08-26




撰文︱廖  栩,刘  伟,刘  瑾责编︱王思珍,方以一编辑︱杨彬薇

一张图片里有几个梨和一个苹果,一个幼童或许难以体会出梨和苹果的区别(图1左部)。但是,当幼童看了一个视频,视频里梨和苹果的个数、形态、位置发生了一些改变,幼童便可以从更多的变化信息中学习到梨和苹果两类水果的区别(图1右部)。从一张图片的像素点分辨梨和苹果是简单的聚类学习,而通过视频的几帧图像分辨,是进行了整合分析的对齐聚类


图1 幼童通过图片和视频的几帧图像分辨梨和苹果
(图源:刘瑾实验室)

类似地,该问题也出现在空间转录组数据spatially resolved transcriptomics, SRT)的分析中,将一个组织切片每个测序位置的空间区域或细胞类型聚类准确是一项具有挑战性的工作。更不必说对多个具有批次效应的组织切片同时进行细胞聚类clustering)、低维特征提取embedding)和对齐alignment),这更是难上加难。空间转录组学涉及了能够根据基因表达的物理位置对组织进行转录组测序的新兴技术。尽管已经有不少关于转录组测序数据的数据整合分析方法,但大多数方法都是针对单细胞测序single-cell RNA sequencingscRNA-seq)数据集,而没有同时考虑空间和多个切片的信息[1-5]因此,设计对多个组织切片的空间转录组数据进行整合分析的方法是迫切需要的,其中这些切片甚至可能来自不同的个体[6-8]


近日,杜克-新加坡国立大学医学院刘瑾老师团队在《自然-通讯Nature Communications)上发表了题为“Probabilistic embedding, clustering, and alignment for integrating spatial transcriptomics data with PRECAST”的研究。该研究通过建立以概率模型为基础的方法PRECAST,创造性地解决了空间转录组中十分具有挑战性的整合分析问题。该方法对多个组织切片的空间转录组数据进行了聚类、低维特征提取和对齐,此外,其提取和整合的低维数据和标注信息有助于下游分析。PRECAST的开源R包和R代码可在https://cran.r-project.org/package=PRECASThttps://github.com/feiyoung/PRECAST获取,用于复现文章里所有数值模拟结果的代码可在https://github.com/feiyoung/PRECAST_Analysis中获取。



以概率模型为基础的方法PRECAST,可以用于分析各种复杂的空间转录组数据集,其中这些数据集的切片之间可能具有复杂的批次效应和异质的生物效应PRECAST统一了空间因素的分析,同时进行空间特征提取、空间聚类和低维对齐(图2)因此,PRECAST可以得到对齐的低维表示,提供出色的可视化效果,并实现整合多个组织切片的更高的空间聚类精度。


图 2 PRECAST的流程图
(图源:Liu W, et al., Nat Commun, 2023)


PRECAST处理后的低维对齐特征和标注信息可以有利于下游分析,如去除批处理效应、多个切片整合的聚类分析差异基因表达分析基因空间变异分析轨迹推断(图3)。此外,PRECAST可以得到捕捉邻近细胞或位置点间的空间依赖关系的低维特征,为了解各种微环境在空间上对细胞的影响提供了机会。


图3  PRECAST的下游分析
(图源:Liu W, et al., Nat Commun, 2023)


为了研究肿瘤及肿瘤相邻组织中肿瘤发生的动态过程,PRECAST分析了由10x Visium平台测序得到的肝细胞癌hepatocellular carcinomaHCC)病人的四块组织切片,其中两块来自肿瘤(HCC1HCC2),另两块来自肿瘤相邻组织 (HCC3HCC4)。病理学家将这些切片的每个位置标注为肿瘤/正常上皮区域基质区域(图4a)


图4 图a顶部:来自四片组织切片的 H&E 图像;底部:病理学家对这些切片的手动注释。图b顶部:四片组织切片的 PRECAST UMAP RGB图;底部:PRECAST的聚类标注热图
(图源:Liu W, et al., Nat Commun, 2023)


PRECAST提取并对齐后的特征生成的RGB彩图对组织切片的划分与病理学家的标注一致(图4b顶部),表明这些特征能够很好的捕获四块切片的空间结构或细胞类型。PRECAST对四片组织切片的聚类标注空间热图类似于相应的RGB图,而且更为清晰地将这些位置分成9(图4b底部),其中第1-5类与肿瘤/正常上皮区域相符,第6-9类与基质区域相符,表明PRECAST能够利用多块组织切片的共同生物效应并同时区分异质的生物效应。


图5 图a: 空间热图显示了恶性细胞、免疫细胞和HPC-like细胞的解卷积细胞比例。图b: PRECAST检测到的每个类中不同细胞类型的百分比
(图源:Liu W, et al., Nat Commun, 2023)


接着,为了检查PRECAST检测出的每个空间区域的细胞组成(图5),作者使用scRNA-seq数据作为参考面板对所有四个组织切片数据进行了细胞类型解卷积分析。参考面板的细胞类型由恶性细胞和肿瘤微环境细胞构成,具体包括癌症相关的成纤维细胞cancer-associated fibro-blasts, CAFs)、肿瘤相关巨噬细胞tumor-associated macrophages, TAMs)、肿瘤相关内皮细胞tumor-associated endothelial cells, TECs),未知实体但表达肝源标记细胞cells of an unknown entity but expressing hepatic progenitor cell markers, HPC-like)和免疫细胞immune  cells[9]恶性细胞的比例在第1-5类中明显高于其他类,而HPC-like细胞的比例在第7类中较高。在第6类中,研究者观察到TAMs和免疫细胞的比例增加;第6类的特异性基因包括TGFB1和MMP2,它们已用于TAMs的分类[10,11]


图6 图a: RNA速度估计的主成分图。图b: 潜在时间表达变化基因的热力图
(图源:Liu W, et al., Nat Commun, 2023)


进一步,他们进行了RNA速度的分析(图6)发现了HCC1中位于第2类的TNE区域可能在肿瘤发生中起关键作用,第4类(TNE)在四个切片中共享,第5类(TNE)在肿瘤相邻组织中。更多的,第12类中的TNE在转录活跃状态,而第4类和5类中的TNE在被抑制状态。此外,与细胞状态最相关的基因包括SPINK1RPL30IL32[12-14]


文章结论与讨论,启发与展望
PRECAST可以为研究者指明全新而重要的研究方向。首先,当单细胞分辨率的SRT数据集可用时,它的使用可以扩展到多模态单细胞数据的整合。例如,整合单细胞ATAC-seq将使研究者能够在组织空间背景下检查细胞类型特定的调控机制。其次,将单细胞分辨率的SRT数据集与CITE-seq数据整合也是非常重要的,它可以将空间转录组与免疫表型整合起来,并使得探索SRT数据集中未被测量的表面蛋白成为可能。

链接:https://www.nature.com/articles/s41467-023-35947-w


新加坡国立大学刘伟博士和廖栩为该文的共同第一作者,新加坡国立大学刘瑾博士为该文的通讯作者。参与该工作的研究者还包括中国人民大学罗子烨博士、新加坡国立大学杨屹博士、新加坡A*STAR研究所Mai Chan Lau 博士、武汉大学焦雨领博士、华东师范大学史兴杰博士、中国科学院动物研究所翟巍巍博士、约翰·霍普金斯大学Hongkai Ji博士和新加坡中央医院Jeo Yeong博士。该工作在所有合作者的共同努力下完成。





欢迎加入岚翰生命科学群:文献学习2

扫码添加微信,并群备注:姓名-单位-研究领域-学位/职称


往期文章精选【1】CRPS︱周建华/陈寅团队合作基于人工智能辅助的高通量可寻址双嵌套微孔阵列分析单细胞迁移和增殖行为【2】STAR Protocols︱李海星团队发表基于腕表PCR基因组步移获取未知侧翼DNA的实验方案【3】Nat Commun︱黄朋/Karin Lindkvist团队通过冷冻电镜揭示甘油通道蛋白的新功能【4】Mater Today Bio 综述丨孙达团队评述大肠杆菌Nissle 1917作为一种可定制的药物递送系统用于疾病诊疗研究进展【5】Cell Death Discov丨骨钙素通过减少β淀粉样蛋白沉积和上调神经胶质细胞糖酵解来改善阿尔茨海默病的认知功能障碍【6】PLOS Pathog︱傅湘辉/田艳团队报道新冠防治潜在药物:拓扑替康和小檗胺靶向RG4,抑制新冠病毒感染【7】eLife︱逯杨/苏畅团队揭示白念珠菌半乳糖代谢信号通路分子机制【8】STAR Protocols︱刘新奇课题组利用慢病毒建立THP-1悬浮细胞系进行免疫染色和激光扫描共聚焦显微镜观察的实验方案【9】Deve Cell︱白晓春/邹志鹏团队揭示RanGAP1表达缺失是染色体不稳定和骨肉瘤快速发生的元凶【10】Cell Metab︱质肽生物团队揭示治疗肥胖的新型双靶点长效融合蛋白优质科研学习课程推荐【1】多组学联合网络药理学及分子对接与实验验证研讨会( 2月25-26日,腾讯在线会议)【2】肿瘤免疫与新型细胞死亡课题设计及生信分析研讨会( 2023年2月25-26日,腾讯在线会议)【3】全国循证医学Meta分析与网状Meta研讨会(2023年3月4-5日,腾讯在线会议)【4】多组学联合网络药理学及分子对接与实验验证研讨会(2023年2月25-26日,腾讯在线会议)【5】高分SCI文章与标书作图(暨AI软件作图)研讨会(2023年2月25-26日,腾讯在线会议)(延期至:3月24-26日)【6】宏基因组与代谢组/脂质组学R软件数据可视化研讨会(2023年2月18-19日,腾讯在线会议)欢迎加入“岚翰生命科学” ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)
参考文献(上下滑动阅读)

[1] Haghverdi, L., Lun, A. T., Morgan, M. D. & Marioni, J. C. Batch effects in single-cell RNA-sequencing data are corrected by matching mutual nearest neighbors. Nat. Biotechnol. 36, 421–427 (2018).

[2] Hie, B., Bryson, B. & Berger, B. Efficient integration of heterogeneous single-cell transcriptomes using scanorama. Nat. Bio- technol. 37, 685–691 (2019).

[3] Stuart, T. et al. Comprehensive integration of single-cell data. Cell 177, 1888–1902 (2019).

[4] Lopez, R., Regier, J., Cole, M. B., Jordan, M. I. & Yosef, N. Deep generative modeling for single-cell transcriptomics. Nat. Methods 15, 1053–1058 (2018).

[5] Lotfollahi, M., Wolf, F. A. & Theis, F. J. scGen predicts single-cell perturbation responses. Nat. Methods 16, 715–721 (2019).

[6] Zhao, E. et al. Spatial transcriptomics at subspot resolution with BayesSpace. Nat. Biotechnol. 39, 1375–1384 (2021).

[7] Hu, J. et al. SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network. Nat. Methods 18, 1342–1351 (2021).

[8] Yang, Y. et al. SC-MEB: spatial clustering with hidden Markov random field using empirical Bayes. Brief. Bioinform. 23,bbab466 (2022).

[9] Ma, L. et al. Tumor cell biodiversity drives microenvironmental reprogramming in liver cancer. Cancer Cell 36, 418–430 (2019).

[10] Ma, L. et al. Tumor cell biodiversity drives microenvironmental reprogramming in liver cancer. Cancer Cell 36, 418–430 (2019).

[11] Sawa-Wejksza, K. & Kandefer-Szerszeń, M. Tumor-associated macrophages as target for antitumor therapy. Arch. Immunol. Ther. Exp. 66, 97–111 (2018).

[12] Kang, Y. H. et al. Dysregulation of overexpressed IL-32α in hepatocellular carcinoma suppresses cell growth and induces apoptosis through inactivation of NF-κB and Bcl-2. Cancer Lett. 318, 226–233 (2012).

[13] Birgani, M. T. et al. Long non-coding RNA SNHG6 as a potential biomarker for hepatocellular carcinoma. Pathol. Oncol. Res. 24, 329–337 (2018).

[14] Huang, K. et al. High SPINK1 expression predicts poor prognosis and promotes cell proliferation and metastasis of hepatocellular carcinoma. J. Invest. Surg. 34, 1011–1020 (2021).


本文完

继续滑动看下一个
岚翰学术快讯
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存