查看原文
其他

张泽民老师系列文章解读(二)

Immugent 生信宝库 2022-08-29

说在前面

我们在上一期推文:张泽民老师系列文章解读(一)中,解读了张老师2021年以后的研究成果,所涉及的领域可以说是横跨 “海陆空” 了。那么本期推文,我们将继续上一期来解读一下张老师2019和2020年的重大研究。

前方持续高能,大家阅后请不要只是羡慕,宜抱着虔诚的态度并且根据自己需要下载原文积极学习!对于本期介绍的张老师开发的两个单细胞注释工具,我们会在后续推文中使用示例数据进行演示。



2020年重大研究

2020年也是张老师科研产出较高的一年,其中包括1篇Cell,1篇Nature,1篇Cell research和2篇Nature Communications

首先我们先来一起学习一下这篇名为“Single-Cell Analyses Inform Mechanisms of Myeloid-Targeted Therapies in Colon Cancer”发表在Cell上的研究论文。

我们都知道肿瘤具有复杂的生态系统。癌细胞通过与多种其他类型的细胞(如免疫细胞)相互作用形成复杂的细胞调控网络。除淋巴细胞外,髓系细胞也是肿瘤浸润免疫细胞的重要组成成分之一,它在调节肿瘤炎症反应以及血管生成等方面发挥着重要作用,因而成为临床研究中癌症治疗的又一热门靶细胞。尽管单细胞转录组测序技术已经被广泛应用于刻画肿瘤浸润免疫细胞特征,并在特定癌种内鉴定出新的髓系细胞类群,但是这些新鉴定的髓系细胞类群是否广泛存在于各类肿瘤内部目前仍不可知。

因此,这项研究作者通过整合实验室自己产出的单细胞转录组测序数据及已发表的公共数据,构建了15个癌种内的髓系细胞图谱,并系统性地比较了各髓系细胞类群在不同癌种间组成、发育及功能上的异同。此外,本项研究首次通过泛癌分析刻画了肿瘤浸润髓系细胞在不同癌种内的特征图谱,并系统性地对比了各类髓系细胞类群在不同癌种内组成和功能上的差异。

另一项是篇名为“Genomic basis for RNA alterations in cancer”的研究论文,也在这一年发表在Nature杂志上。在文章中研究者们提出了一个跨越27种不同的肿瘤类型的全面的RNA水平变化目录,在基因组背景下,这种RNA改变为鉴定与癌症相关的功能基因和机制提供了丰富的资源。

这项分析里研究人员们分析了1188个转录组的数据,发现拷贝数变异仍然是癌细胞中驱动基因表达变化的主要因素,但数百个单核苷酸突变也会影响到周围基因的表达。此外,癌细胞里的一些突变还会引起转录信息的变化,如产生新的蛋白编码序列等。本项研究结果也深刻证明,将RNA和DNA测序分析整合在一起,将在癌症研究中发挥强大作用。

发表在Cell research 上的这篇名为“Reconstruction of cell spatial organization from single-cell RNA sequencing data based on ligand-receptor mediated self-assembly”的文章是scRNA-seq结合空间转录组的应用,用来研究组织/器官的空间组织结构及胞间相互作用。

这项研究中,研究人员将深度学习算法与空间转录组和组织学影像结合起来,在乳腺癌样本中捕获高分辨率的基因表达异质性。这个工具叫做细胞空间组织作图器(Cellular Spatial Organization mapper, CSOmap),旨在利用scRNA-seq的信息来重建组织的空间结构。在经过验证步骤后,CSOmap可用于重构人和小鼠多个器官中的空间细胞组织结构。这种重要方法在临床转化中具有巨大的潜力,可以快速分析靶点相关的转录谱中空间和局部的改变、基因和蛋白质的表达,并提高临床分子病理学的质量和水平。

另外两篇发表在Nature communications上的研究均是针对单细胞数据开发的算法。

第一篇是“SciBet as a portable and fast single cell type identifier”,是一款单细胞细胞类型注释软件。

由于SciBet算法采用了简洁的参数模型,除了速度优势及可解释性强之外,其训练后的模型在存储上也非常高效,并且仅依赖细胞类型个数。如一个普通的拥有数十种细胞类型的数据集的SciBet模型大小不足1MB。基于这一”便携“特性,本项目还发布了近一百个高质量数据集的SciBet预训练模型,这些模型均可以直接导入SciBet的R软件包中。除此之外,本课题还提供了基于JavaScript实现的在线版SciBet(http://scibet.cancer-pku.cn/)。这使得用户无需上传自己的数据到服务器,而仅需在线加载预训练模型或本地加载自定义训练集即可在浏览器中快速完成测试集中的细胞类型鉴定,并得到可视化分类结果。任仙文副研究员表示:“作为面向未来超大规模数据集的单细胞快速注释方法,SciBet将会对单细胞测序领域产生重要积极影响。”

另一篇是“An entropy-based metric for assessing the purity of single cell populations”,这项研究作者提出了一种单细胞类群纯度评估新方法。

研究者拓展了之前开发的E-test方法,使用微分熵(differential entropy)来描述单细胞数据的基因表达分布,进而建立表达熵模型(S-E model)以刻画微分熵与基因表达量均值之间的联系。在无监督聚类、交叉验证等一系列评估中,表达熵模型均显著优于之前发表的无监督基因选择方法,可以准确有效地鉴定出高变异基因(highly variable genes)。他们进而基于该模型设计了ROGUE这一统计量以评估给定细胞类群的纯度。

在实际应用中,ROGUE能稳健准确地定量细胞类型的纯度并指导聚类,而且不受测序深度等因素的影响。本课题还使用ROGUE对一些已发表文章中鉴定的细胞类型进行了纯度评估,发现一些异质性比较高的细胞类群可以进一步分为更精细的亚群,从而发现更精确的生物学信号。



2019年重大研究

相比起2020和2021年,2019年可能是张老师过渡的一年,虽然说是过渡,也还是有一篇Cell见刊的。就是会有一些论文挤到一年发表,2020年初和2019年底可能并没有什么本质区别。

这项研究的篇名为“Landscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma”,Immugent觉得这是一篇做肿瘤免疫的模板文章,特别是对使用单细胞技术揭示肿瘤微环境的研究提供了很多的借鉴。

本研究结合了SMART-seq2和10x Genomics Chromium 3’两种单细胞测序技术,并整合这两种平台的数据进行生物信息学分析,充分发挥不同数据类型的优势,获得高分辨率的肝癌免疫图谱。

癌旁组织和外周血是肿瘤相关研究中常用的对照组织,而其他相关的免疫器官或病理组织则较少受到关注。因此,本研究收集肝癌病人的癌组织、癌旁组织、淋巴结、外周血和腹水五种组织的CD45+免疫细胞进行实验,并分析肝癌免疫微环境中的细胞类型、表达特征,以及不同组织之间细胞的动态变化与联系。



小结

本期推文我们解读了张老师在2019年和2020年发表的重大研究论文,和上一期类似,也是以肿瘤免疫相关的重大研究为主,配套的有几篇算法类/生信工具的研究成果。不同于其它只做生信工具开发的团队,张老师团队开发的算法更注重解决具体实际的生物学问题。

好啦,第二期Immugent就先解读这么多文章啦,后续还会有一期推文来解读张老师早期的重大研究,敬请期待!




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存