查看原文
其他

Nat Commun︱scMoMaT: 基于矩阵分解的单细胞数据融合与生物特征提取方法

张子琪,张秀苇 逻辑神经科学 2023-03-10


来源︱“逻辑神经科学”姊妹号“岚翰生命科学撰文︱张子琪,张秀苇责编︱王思珍,方以一编辑︱杨彬薇

单细胞测序可用于测量细胞的多种特征模态(multi-modality),包括基因表达(mRNA/gene expression),染色质可访问性(chromatin accessibility),以及蛋白质含量(protein abundance)[1]。对于同一生物组织的不同组单细胞测序实验,其结果往往会受到不同实验环境以及操作的影响,进而呈现出不同的表达特征[2]。另一方面,不同的实验往往也会有不同的侧重点,进而测量不同的生物特征。单细胞数据融合方法其目的在于融合不同实验对同一生物组织的多模态测量,消除不同实验间因环境差异造成的测量偏差。目前的单细胞数据融合方法往往只能处理特定的数据结构,其泛用性受到较大影响。


2023年1月24日,美国佐治亚理工学院张秀苇团队的张子琪等作者在nature communication上发表了题为“scMoMaT jointly performs single cell mosaic integration and multi-modal bio-marker detection”的研究。该研究设计了用于单细胞数据融合的新型矩阵分解算法。该算法进一步拓宽了单细胞数据融合的适用场景,同时该方法可以在融合数据的同时从不同模态提取出标定细胞种类的关键特征信息。张秀苇团队将该算法应用于多种已知单细胞数据,并成功融合了多种多特征人体外周血单个核细胞数据,小鼠大脑皮质数据,人体骨髓数据,以及人体脾脏数据。同时张秀苇团队运用计算生成的模拟数据系统性分析了该方法在不同融合场景下的表现效果。实现结果表明了该方法相比于其他方法在应用场景和融合精度上的优越性。



scMoMaT将单个单细胞数据测量矩阵分解成细胞成分矩阵,特征成分矩阵(mRNA, protein, chromatin accessibility),以及关联矩阵。其中细胞成分矩阵可以被2D可视化并用于分离不同细胞种类,特征成分矩阵可用于提取不同种类细胞的不同种特征成分,最终完成细胞种类的标定。对于多个细胞数据测量矩阵,scMoMaT可挖掘出不同矩阵之间细胞或者特征的关联信息,从而完成对于实验误差的校准。


图1. scMoMaT的系统框图。a. 对于输入的多个单细胞测量矩阵,scMoMaT可分离出细胞组成信息以及特征信息。b. 对于每个个单细胞矩阵,scMoMaT都将其分解成不同的成分矩阵。

(图源:Zhang, Z. et al., Nat. Commun., 2023)


张秀苇团队将该方法应用于人体外周血单个核细胞数据集,该数据组包含3种模态信息 (mRNA/gene, protein, chromatin accessibility/region),以及4组实验测量(图2a)。scMoMaT分离出的细胞成分矩阵被用于可视化展示以及细胞种类分离(图2b,c,f),同时scMoMaT提取的特征信息被用于标定细胞种类(图2e)。与其他方法的横向比较展示出scMoMaT在细胞成分分离以及实验误差校准方面达到或优于现有的最佳方法(图2d)。


图2. scMoMaT在人体外周血单个细胞数据组上的表现结果。a.数据组的数据构成。b, c, e, f. 细胞成分矩阵的可视化结果。d.与其他方法横向比较的精度分数展示。g, h, i. scMoMaT提取出的特征成分信息成功反映了真实细胞组成。

(图源:Zhang, Z. et al., Nat. Commun., 2023)


同时张秀苇团队还在多个数据集上检验了scMoMaT方法的性能。具体结果参考原文:https://www.nature.com/articles/s41467-023-36066-2。

文章结论与讨论,启发与展望

该研究拓展了已知单细胞数据融合算法的适用场景,提升了已知算法的融合精度,并实现了特征提取与细胞数据融合的同步进行。在多种已知单细胞数据集和模拟数据集上的测试验证了方法的优越性。同时该方法也初步探索了在数据融合的过程中学习不同种特征的关联,进一步的研究将着重于更精确的提取出不同种特征的关联网络,以便于进一步分析不同细胞组成的内在调节机制。


文链接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9873790/

佐治亚理工大学博士学生张子琪为论文的第一作者,佐治亚理工大学张秀苇教授为论文通讯作者。同时新加坡国立大学的Vaibhav Rajan教授团队,英国 Wellcome Sanger Institute的Sarah Teichmann教授团队,中国南方科技大学的陈曦教授团队共同参与了此项研究。该研究成果由美国NSF 与NIH基金,英国Wellcome Sanger core 基金,新加坡Ministry of Education Academic Research基金,Gates Cambridge Scholarship,以及深圳科技创新委员会基金共同支持。

第一作者:张子琪(右);通讯作者:张秀苇(右)
(照片提供自:张秀苇团队)


欢迎扫码加入逻辑神经科学 文献学习2

群备注格式:姓名-单位-研究领域-学位/职称/称号/职位



往期文章精选

【1】Cell Discov︱徐敏/张思宇团队合作揭示研星形胶质细胞调控睡眠-觉醒的新机制

【2】BMJ︱宣武医院贾建平团队找到留住老年记忆、恢复大脑活力的方法

【3】Genome Biol︱何川团队解析YTHDF家族蛋白功能的“不同”与“同”

【4】J Alzheimers Dis︱重磅!贾建平团队报道世界第一例19岁阿尔茨海默病患者

【5】J Neurosci︱梅峰/叶剑课题组揭示老化过程中少突胶质细胞更替不足是导致视神经轴突退化和视功能下降的重要原因

【6】Cell Biosci 综述︱唐铁山团队评述染色质重塑在神经发育和神经退行中的作用、机制及小分子调控

【7】CNS Neurosci Ther︱西北大学赵新锋课题组建立NMDA-2A受体活性配体筛选新方法,助力阿尔茨海默病的新药研发

【8】Microbiome︱陈耀星课题组揭示肠道菌群及其代谢物介导褪黑激素在睡眠剥夺诱导认知障碍中的神经保护作用

【9】Ageing Res Rev 综述︱庆宏课题组聚焦阿尔茨海默病早期海马体相关GABA能神经网络损伤

【10】JNC︱空间模拟条件下抑郁大鼠海马和皮质中的miR-455-3p差异表达在NR2B-PSD-95-nNOS复合体中的调控作用

新刊启航,欢迎投稿

【1】Brain-X交叉脑科学:新刊正式启动!

科研学习课程精选

【1】宏基因组与代谢组/脂质组学R软件数据可视化研讨会(2月18-19日,腾讯在线会议)

【2】单细胞测序与空间转录组学数据分析研讨会(3月11-12日 腾讯在线会议)

【3】高分SCI文章与标书作图(暨AI软件作图)研讨会(2月25-26日  ,腾讯在线会议)(延期至3月25-26日)

学术会议预告

【1】会议通知︱小胶质细胞生理与病理功能专题国际研讨会


参考文献(上下滑动查看)  

[1] Ziegenhain C, Vieth B, Parekh S, et al. Comparative Analysis of Single-Cell RNA Sequencing Methods.Mol Cell. 2017;65(4):631-643.e4. doi:10.1016/j.molcel.2017.01.023

[2] Gao S. Data Analysis in Single-Cell Transcriptome Sequencing.Methods Mol Biol. 2018;1754:311-326. doi:10.1007/978-1-4939-7717-8_18


本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存