查看原文
其他

Nat Methods︱王涛/王莉团队合作开发空间转录组数据降噪的新方法

王涛等 岚翰生命科学 2023-03-10

撰文︱王涛,王允冠,宋冰

责编︱王思珍,方以一

编辑︱方以一


空间转录组(spatial transcriptomics)是近年来越来越热门的高通量测序技术。空间转录组能够在提供类似于单细胞测序数据的基因表达谱数据的同时,提供测序的位置信息甚至对应的病理学图像数据[1-5]然而,空间转录组技术(特别是最新的高分辨率空间转录组技术)的基因表达谱数据中含有大量的噪音。这些噪音来自于每个测序位点上摊薄的低通量测序深度以及为了保留测序位置所执行的额外实验步骤。这些噪音包括但是不限于单细胞测序数据中的drop-out现象这些噪音给研究者们从宝贵的空间转录组数据提取出有价值的信息制造了巨大的障碍。


2022年8月4日,来自美国德州大学西南医学中心(UT Southwestern Medical Center)定量生物学研究中心(Quantitative Biomedical Research Center)的王涛博士团队和德州大学阿灵顿分校(UT Arlington)的王莉教授在Nature Methods《自然-方法》)杂志上发表了一篇题为Sprod for De-noising Spatial Transcriptomics Data Based on Position and Image Information” 的文章。该团队报告了他们发明的Sprod方法,其使用空间转录组数据特有的空间位置和病理学图像的信息,来修正空间转录组基因表达谱数据中的噪音。



Sprod的降噪过程中,测序的每个位点会向附近的位点借用基因表达信息。在病理学图像上(有图像的空间转录组技术,如Visium)或者总体转录谱上(Overall transcriptomics profile,针对没有图像的空间转录组技术,如Slide-Seq)更相似且测序位置相邻的位点,会互相借用更多的信息。基于这个原理,Sprod构建了一个隐图模型(Latent Graph Model)(图1),通过分析不同测序位点的空间距离和基因表达谱特征,将测序位点放入这个隐图中。空间转录组的表达谱信息根据这个隐图流动,从而实现表达谱数据的降噪。Sprod可以应用于各种空间转录组技术,如Visium、Slide-Seq、HDST、Seq-Scope等。分辨率越高的技术类型,噪音越大,Sprod的作用也越大。

 

图1 Sprod软件内部数学模型的工作原理

(图源:Wang Y,  et al., Nat Methods. 2022)


王涛课题组接下来在不同的空间转录组技术数据集上,验证了Sprod降噪的可靠程度。比如,在图2中,王涛课题组展示了在一个卵巢癌的Visium数据集上使用Sprod降噪前后的效果。这个数据集提供了与空间转录组对应的免疫荧光染色(IF)图像,其中包括CD45。如图2左所示,CD45 IF和Visium数据中的基因PTPRC PTPRC的翻译产物为CD45)的RNA表达数据吻合度非常差,但在使用了Sprod之后(出于独立验证的目的,IF图像的CD45 channel在Sprod的计算过程中被剔除了),PTPRC的基因表达量和CD45的染色强度有了很好的重合。此外,王涛课题组还将Sprod与scRNA-seq数据分析中常用的drop-out矫正方法(scImpute和SAVER)做了比较,并显示出Sprod在降噪效果上优于scImpute和SAVER。

 

图2 PTPRC的基因表达量和CD45的免疫荧光染色的吻合度。左:原始Visium数据;右:Sprod降噪之后的数据。

(图源:Wang Y,  et al., Nat Methods. 2022)


王涛课题组进而将Sprod应用到了一系列的Visium、Slide-Seq、Seq-Scope等其他空间转录组数据集上,验证了Sprod能够给各种数据有效降噪。降噪后的数据在差异表达分析(differential expression)、信号通路富集(pathway enrichment)、细胞间通讯(cell-to-cell communications)等各方面的下游分析中,都有了生物学上更合理(biologically relevant)的结果。单细胞测序数据的drop-out矫正方法单纯地利用表达谱本身来矫正表达谱数据中的问题[6,7],这会造成一种类似于过拟合(overfitting)或者过平滑(oversmoothing)的现象,因此在学界受到了一些批评。与之不同的是,Sprod利用的是空间转录组数据中独有的测序位置和病例图像的信息。通过这样的独立的信息,Sprod得以更精确的执行降噪操作。


文章结论与讨论,启发与展望

总而言之,空间转录组技术给生物医学研究提供了一个强大的工具。空间转录组数据的分析随着技术的发展,变得越来越有挑战性。Sprod巧妙的利用了空间转录组数据中特有的测序位置和病理图像信息,使得数据降噪的精确性有了很大的提高。王涛课题组认为,严谨的数据预处理,是正确分析和理解空间转录组数据的关键,而Sprod降噪正是预处理中重要且有力的一环。在这个工作中,一个尚未完善的部分是Sprod中每个测序位置上病例图像特征的抽取功能。在目前的Sprod中, 病例图像的分析是使用了比较简单的算法,没有考虑近年来非常热门和非常强大的基于深度学习的方法。未来的改进中,王涛课题组将探索加入基于深度学习的图像分析方法,并测试是否能够进一步提高Sprod算法的精确性。


原文链接:https://www.nature.com/articles/s41592-022-01560-w


该论文的共同第一作者为王允冠博士与宋冰博士。论文的其他主要作者包括西南医学中心的谢阳教授、肖光华教授,王诗丹助理教授。定量生物学研究中心有多个博士后招聘职位(qbrc.swmed.edu/labs/wanglab,qbrc.swmed.edu/labs/xielab,qbrc.swmed.edu/labs/xiaolab)。我们欢迎各个专业的生物信息学人才加盟我们。


人才招聘

 ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)

往期文章精选

【1】小鼠云课堂︱Omentin-1基因敲除小鼠与慢性炎症性疾病

【2】eClinicalMedicine︱荟萃分析:重复经颅磁刺激对帕金森病的疗效

【3】Nat Commun︱Pol II转录暂停因子NELF促进抗肿瘤免疫

【4】PNAS︱许琪团队发现重度抑郁症DNA甲基化生物标志物BICD2并揭示其作用机制

【5】Nat Commun︱范骁辉/徐骁/陈华钧团队合作开发基于空间转录组的细胞间通讯推断新方法SpaTalk

【6】Cell Chem Bio︱杨财广课题组发现线粒体ClpP激动剂抗胰腺癌

【7】Trends Genet 综述︱周育斌/黄韵/何涟团队评述光遗传学在基因工程和转录程序设计中的应用及研究进展

【8】Genome Biol︱都仁扎那团队开发单细胞多组学数据整合新方法

【9】Cell DeathDis|黄智慧/汪伟团队发现SARM1蛋白在自闭症谱系障碍发病中的新机制

【10】 Nat Commun︱高脂饮食如何诱导肥胖?华人团队发现新的信号轴

优质科研培训课程推荐【1】宏基因组与代谢组学R语言分析及可视化实操研讨会(8月27日 腾讯会议)


参考文献

1. Stickels, R. R. et al. Highly sensitive spatial transcriptomics at near-cellular resolution with Slide-seqV2. Nat. Biotechnol. 39, 313–319 (2021).

2. Rodriques, S. G. et al. Slide-seq: a scalable technology for measuring genome-wide expression at high spatial resolution. Science 363, 1463–1467 (2019).

3. Vickovic, S. et al. High-definition spatial transcriptomics for in situ tissue profiling. Nat. Methods 16, 987–990 (2019).

4. Cho, C.-S. et al. Microscopic examination of spatial transcriptome using Seq-Scope. Cell 184, 3559–3572.e22 (2021).

5. Lee, Y. et al. XYZeq: spatially resolved single-cell RNA sequencing reveals expression heterogeneity in the tumor microenvironment. Sci. Adv. 7, eabg4755 (2021). 

6. Zhang, R., Atwal, G. S. & Lim, W. K. Noise regularization removes correlation artifacts in single-cell RNA-seq data preprocessing. Patterns (N. Y.) 2, 100211 (2021). 

7.Andrews, T. S. & Hemberg, M. False signals induced by single-cell imputation. [version 2; peer review: 4 approved]. F1000Res. 7, 1740 (2018). 



本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存