这些顶流单细胞多组学分析工具,值得一试 !| 时空简讯第11期
时空简讯第11期。
单细胞和空间组学潜藏着海量信息,如何进行生物学挖掘分析呢?这也是时空组学发展的重要挑战之一。本期简讯着重遴选了单细胞和空间转录组数据整合分析、细胞类型鉴定和谱系溯源分析的综述和生信工具介绍文章,也推介了多篇单细胞转录组预测空间信息和代谢通量的高级分析工具;还有一篇全面介绍空间组学发展历史和相关分析工具的综述,供大家了解。
综述
Reviews
Nature Reviews Genetics 综述:scRNAseq与空间转录组整合的计算方法和展望
Nature Reviews Genetics [IF: 53.242]
① scRNAseq和空间转录组数据整合分析可应用于组织稳态、组织发育、疾病微环境、肿瘤微环境和空间上细胞间互作等方面的研究;
② 比较了原位RNA测序(high-plex RNA imaging)和空间条形码(spatial barcoding)两类技术的特点和作用机制;
③ 列举了scRNAseq和空间转录组数据整合中实现去卷积(Deconvolution)和映射(Mapping)的多种算法,以及这些算法的输入和输出数据;
④ 探讨对空间数据进行细胞间通讯分析,结合scRNAseq数据和相应数据库预测细胞间通讯的配受体对。(阿多)
scRNAseq与空间转录组整合应用图
Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics.
2021.06.18, DOI: 10.1038/s41576-021-00370-8.
综述,生信工具;单细胞转录组,空间转录组;Sophia K. Longo, Paul A. Khavari; Stanford University; USA.
单细胞多组学整合分析指南
Nature Reviews Nephrology [IF: 28.314]
① 引言论述了单细胞多组学数据整合的价值、挑战和应用现状;
② 介绍了定量因果模型(Quantitative causal modelling)、统计模型(Statistical modelling)、潜在空间模型(Latent space modelling)和后期整合(Consensus of individual inferences, or late integration)等4种数据整合策略的原理;列出了所有多组学整合分析可用程序、工具,并给出一个判断、选择策略;
③ 针对匹配多组学数据(即从同一个细胞获得),依照上述4种策略,区分综述了相关可用的程序、使用方法,并评价了其优缺点;
④ 针对非匹配多组学数据,从通过细胞类型/分组整合、共有特性集整合、抽象出来的共有因子整合等三个角度,综述了可用程序、使用方法和优缺点;
⑤ 从无偏差展示(尽量展示数据所有维度)和知识驱动展示等两个类别,综述了已有多组学可视化工具,并展望了未来的发展方向;
⑥ 最后,从理解数据特性、数据类型/细胞构成兼容性、规模计算、组学间映射、解读验证能力等详细综述了单细胞多组学数据整合分析的挑战。(LQ/李臻)
单细胞多组学数据整合的4种算法策略示意图
Multi- omics integration in the age of million single- cell data.
2021.11.17, DOI: 10.1038/s41581-021-00463-x.
综述文章,生信工具;单细胞,多组学,可视化,软件,数据整合;Zhen Miao, Junhyong Kim; University of Pennsylvania; USA.
Briefings in Bioinformatics 综述:空间组学分析的平台、应用和分析工具
Briefings in Bioinformatics [IF: 11.622]
① 空间组学技术克服了传统的基因组和蛋白质组等因组织解离导致组织形态和空间信息的丢失等缺点;空间表达数据,连同细胞和组织成像数据,为研究组织异质性和细胞空间组织提供了思路;
② 综述了近年来空间表达谱分析技术的发展、原理以及分析这些数据的相应计算方法;
③ 介绍了已有的两种主流的空间分子表征技术:基于成像和基于测序,并回顾了它们的技术发展和优势;
④ 介绍了空间数据的分析方法和应用,如空间上的差异基因表达分析、表达模式鉴定、细胞互作和邻居分析以及整合分析和预测;并且提出了一些潜在分析点,比如添加空间信息增强对单细胞数据的分析。(Imm F)
空间转录组的应用组成
Spatial molecular profiling: platforms, applications and analysis tools.
2020.08.06, DOI: 10.1093/bib/bbaa145.
综述文章,生信工具;空间转录组,技术原理,生物信息;Minzhe Zhang, Guanghua Xiao; University of Texas Southwestern Medical Center; USA.
Cell Stem cell 综述:当单细胞转录组学遇上谱系追踪
Cell Stem cell [IF: 24.633]
① 基于具有相似表达谱的细胞来源于相同的谱系,综述了利用scRNAseq数据进行谱系轨迹预测的算法和软件:细胞分化轨迹重建算法、基于降维的算法、基于邻近图算法等三种主要算法,及其他算法;
② 综述了遗传标记的单细胞正向谱系追踪技术(Prospective lineage tracing),包括利用病毒条形码标签、利用荧光蛋白标记定位谱系的位置、基于CRISPR-Cas9基因编辑谱系追踪等3种主要技术;
③ 综述了包括基于CNVs、SNV/Indels/Repeat Regions、表观遗传特征等自然变异比较分析的反向谱系追踪 (Retrospective Lineage Tracing)技术;
④ 详述了单细胞转录学结合谱系追踪在细胞状态转换、斑马鱼发育的研究应用,展望了在干细胞和癌症的应用前景。(毛学彬)
Single-Cell Transcriptomics Meets Lineage Tracing.
2018.05.10, DOI: 10.1016/j.stem.2018.04.014.
综述,生信工具,技术原理;单细胞转录组,谱系追踪,斑马鱼;Lennart Kester, Alexander van Oudenaarden; Royal Netherlands Academy of Arts and Sciences (KNAW), University Medical Center Utrecht; Netherlands.
生信工具
Analysis tools
LIGER:从多个单细胞数据集联合定义细胞类型
Nature protocols [IF: 13.491]
① 开发了一种多组学数据整合分析开源工具LIGER (linked inference of genomic experimental relationships),它使用综合非负矩阵分解算法(integrative nonnegative matrix factorization),广泛适用于包括单细胞转录组、表观组、跨物种分析、单核DNA甲基化和空间转录组学等多种场景和数据类型,根据数据集的大小,分析过程可在1-4小时内完成;
② 不适用于非生物学相关的数据集间的整合分析,不适用于超过21 亿非零数据的超大规模数据分析;
③ 提供了从多个单细胞数据集进行细胞类型鉴定的详细操作步骤,主要包括数据预处理和归一化、联合因子分解、分位数归一化、联合聚类以及可视化等;
④ LIGER和Harmony、Seurat性能相当,优于其他程序;且与Seurat数据兼容性相当,可整合数据类型多;
⑤ 说明和代码示例描述了从从scRNAseq和snATAC-seq数据中联合定义细胞类型,示例了预期结果、常见的问题;
⑥ 提供R Markdown教程,显示每个单独的代码段的输出。(LQ/Jing Liu)
Jointly defining cell types from multiple single-cell datasets using LIGER.
2020.10.12, DOI: 10.1038/s41596-020-0391-8.
研究文章,生信工具;LIGER,数据整合,多组学,单细胞;Jialin Liu, Chao Gao, Joshua D. Welch; University of Michigan; USA.
一种基于域对抗和可变近似值、通用且扩展的单细胞数据整合算法
Brief in Bioinformatics [IF: 11.622]
① 开发了一种域对抗和变分近似的单细胞整合开源算法DAVAE,可以处理跨样本、技术和模态的多个单细胞数据集的批量效应去除、转移学习和细胞类型预测等,还可以整合来自同一样本配对的 scATACseq和scRNAseq的数据;
② DAVAE可在pypi存储库中的工具包“scbean”中实现(https://github.com/jhu99/scbean);
③ DAVAE使用小批量随机梯度下降策略,对于大规模数据具有可扩展性,且可通过GPU加速;
④ 使用5组真实数据整合应用的结果证明了DAVAE的有效性和可扩展性,且优于RAW、Scanorama、DESC和Seurat 3.0等4种算法。 (万顺)
A versatile and scalable single-cell data integration algorithm based on domain-adversarial and variational approximation.
2021.09.28, DOI: 10.1093/bib/bbab400.
研究文章,生信工具;单细胞数据整合,scATACseq,scRNAseq,批次效应,DAVAE,细胞类型;Jialu Hu,呼加璐, Yuanke Zhong, Xuequn Shang;西北工业大学计算机学院;中国
北京大学张泽民团队: CSOmap基于配体-受体关系重构单细胞转录组空间信息
Cell Research [IF:25.617]
① 基于配体-受体相互作用,开发了一种针对单细胞转录组数据“从头重构”细胞空间关系的生信算法CSOmap;
② 有效性在5种单细胞测序平台,人和小鼠2个物种超过16种器官类型、多种肿瘤及微环境等单细胞转录组数据集上都得到了证实;
③ 首次实现了计算机干扰实验(in silico perturbation)检验特定基因或细胞群对细胞空间关系的影响;
④ 该方法对于从单细胞转录组挖掘细胞组织信息、发现新的生物学现象具有重要意义。(魏博)
CSOmap重构单细胞空间结构的流程示意图
Reconstruction of cell spatial organization from single-cell RNA sequencing data based on ligand-receptor mediated self-assembly.
2020.06.15, DOI: 10.1038/s41422-020-0353-2.
研究文章,生信工具;人,鼠,癌症,受体,配体,空间信息,scRNAseq, CSOmap; Xianwen Ren, Guojie Zhong, Zemin Zhang;北京大学;中国
SpaOTsc:从单细胞转录组推断细胞间的空间和信号传导关系
Nature communications [IF: 14.919]
① 开发了一种从单细胞转录数据推断细胞间空间和信号传导关系的生信分析工具SpaOTsc (https:// github.com/zcang/SpaOTsc),利用少量基因的空间位置信息、通过结构化最优运输算法恢复scRNAseq数据的空间信息;
② SpaOTsc由SpaOTsc-integration和SpaOTsc-communications两个部分组成,前者构建细胞的空间位置信息,后者重建胞间的通信关系及其相应基因调节关系;
③ 对4个scRNAseq数据集(2组斑马鱼胚胎、1组果蝇胚胎、1组小鼠视觉皮层),与其他3种方法对比,交叉验证了SpaOTsc的准确性,且优于DistMap、Achim和Seurat (v1);
④ 对2组来自小鼠嗅球的空间转录组数据进行分析,验证了SpaOTsc同样适用于空间转录组的细胞通讯研究,为scRNAseq与空间转录组的整合提供了一个有用的工具。(吴维建)
SpaOTsc算法流程示意图
Inferring spatial and signaling relationships between cells from single cell transcriptomic data.
2020.04.29, DOI: 10.1038/s41467-020-15968-5.
研究文章,生信工具;斑马鱼,果蝇,胚胎,脑,空间转录组,空间信息,SpaOTsc, scRNAseq, FISH; Zixuan Cang, Qing Nie; University of California; USA.
DREAM challenge挑战赛冠军SCTCwhatateam:预测果蝇胚胎单细胞空间位置
Briefings in Bioinformatics [IF: 11.622]
① 开发了使用果蝇胚胎scRNAseq数据预测细胞位置的生信工具SCTCwhatateam (R 包),包括数据预处理(2种算法)、基因选择(11种算法)和位置预测(3种算法,Matthews correlation coefficient score (MCC),local outlier factor (LOF),MCC和LOF)等3个环节;
② 建立一个基于Shiny框架的web应用,用户可上传数据,定制参数、方法进行交互式操作,预测结果可下载;
③ SCTCwhatateam 是DREAM challenge单细胞转录组挑战赛的总冠军:sub-challenge 1第二名、sub-challenge 2的第一名和sub-challenge 3的第三名。(夏老师)
*P.S. DREAM challenge是一个以组织进行开源算法竞赛、解决生物医学研究难点问题为目标的社团组织。
The winning methods for predicting cellular position in the DREAM single-cell transcriptomics challenge.
2021.08.25, DOI: 10.1093/bib/bbaa181.
研究文章,生信工具;果蝇,胚胎,scRNAseq,空间信息;Vu V H Pham, Xiaomei Li, Buu Truong, Thuc D Le; DREAM challenge, University of South Australia; Australia.
scFEA:图神经网络模型从scRNAseq预测细胞代谢通量
Genome Research [IF: 9.043]
① 首个可从scRNAseq数据以单细胞分辨率预测代谢通量的生信工具scFEA (single-cell flux estimation analysis);
② scFEA包括代谢网络还原与重构、细胞代谢通量的估计和下游分析等3个部分,其中下游分析包括代谢应激的估计、代谢基因扰动分析以及不同代谢状态细胞的聚类分析;
③ 测试应用于5组scRNAseq和空间转录组学公共数据;
④ 运用在4种扰动氧水平和代谢调节剂条件下的患者来源的胰腺癌细胞scRNAseq数据,以及匹配的组织水平代谢组学数据和关键代谢基因的qRT-PCR表达谱,验证了scFEA预测数据与不同条件下观察到的代谢组学变化高度一致。(LR)
scFEA的分析流程示意图
A graph neural network model to estimate cell-wise metabolic flux using single-cell RNA-seq data.
2021.07.22, DOI: 10.1101/gr.271205.120.
研究文章,生信工具;细胞代谢通量,空间转录组,scRNAseq; Norah Alghamdi, Wennan Chang, Melissa Fishel, Sha Cao, Chi Zhang; Indiana University School of Medicine, Purdue University; USA.
编辑/力强
推荐阅读
2021关键词 | 可提笔著文章,可下五洋捉鳖,致敬奋斗者!
联系我们
对时空组学或单细胞组学整体解决方案感兴趣的老师,可选择以下方式和我们联系,我们将及时为您进行详细的介绍:
1. 在公众号留言;
2. 发送信息至邮箱:
collaboration@stereomics.com;
3. 点击页面左下方“阅读原文”登记信息。
点
“阅读原文”联系我们