单细胞相互作用分析原理和应用
The following article is from 单细胞组学 Author Zhihao
内容概要:
分析策略
相互作用工具分析原理及应用案例
cellphoneDB;
CellChat;
CSOmap;
其他个性化相互作用方法
为什么要研究单细胞相互作用?
许多生物进程和细胞通讯息息相关:如胚胎发育,器官形成,癌症发生发展,炎症反应,药物作用和耐药研究等[1].
单细胞相互作用研究的一般步骤
一般可以分为四大部分:细胞采集建库,单细胞表达矩阵计算和细胞类型鉴定,相互作用网络构建和最后的实验验证。
相互作用工具分析原理及应用案例
cellphoneDB
目前大多数单细胞转录组研究只有单细胞转录组数据。很多人会选择用cellphoneDB分析单细胞相互作用。cellphoneDB总共有978个蛋白,其中501是外泌蛋白,585个是膜蛋白。1396对相互作用基因对。[2]
以细胞群为相互作用的对象,计算受配体在每个细胞群的平均表达量,然后计算两个细胞群之间受配体的平均表达量作为相互作用的指标。
不同于之前的其他相互作用分析方法,cellphoneDB考虑蛋白复合体的情况,例如受体如果有两个亚基Sub.1和Sub.2,取表达量较低的亚基作为受体的表达量。
cellphoneDB分析原理
以细胞群为相互作用的对象,计算受配体在每个细胞群的平均表达量,然后计算两个细胞群之间受配体的平均表达量作为相互作用的指标。
不同于之前的其他相互作用分析方法,cellphoneDB考虑蛋白复合体的情况,例如受体如果有两个亚基Sub.1和Sub.2,取表达量较低的亚基作为受体的表达量。
cellphoneDB的统计方法
cellphoneDB用置换检验计算某一对相互作用的P值。随机打乱细胞类型标签,计算相互作用平均表达量;重复1000次,得到平均表达量的分布;如果用鉴定细胞类型计算的平均表达量较高,大于分布的top50,那么我们可以认为这一对相互作用的P值小于50/1000=0.05。
cellphoneDB分析结果展示
CXCL10-CXCR3 在C1QC+TAMs中显著富集, 暗示C1QC+ TAMs扮演招募和激活T 细胞的角色。
SPP1+ TAMs 高表达SDC2, 可以和CAF和内皮细胞表达的 MMP2结合[3].
整合bulk转录组数据的相互作用方法
基于全局考虑,整合组织样本的表达谱,寻找与单细胞特征基因相关性高的基因集,重新构建相互作用网络。[3]
1.提取细胞类型特征基因;
2.用特征基因对组织来源的样本进行细胞类型打分;
3.计算打分矩阵和表达矩阵的皮尔森相关系数;
4.将相关系数矩阵中的本底基因的系数设置为0;
5.对每一列进行排序,得到每个细胞类型的前13相关系数的基因;
6.计算这top13基因在单细胞类型平均表达量,我们认为大于1.96的细胞类型之间有比较强的联系。
CellChat
Cellchat是一个R包,7月22日刚发表在bioRxiv上。[4]
CellChat整合相互作用数据库,包括229 个信号通路。CellChat可以分成三大部分:
1. 鉴定细胞群差异基因;
2. 基因pairs统计;
3. 分类与画图。
CellChat鉴定相互作用基因对的核心算法:
希尔方程(Hillfunction):
在生物化学中,若已经有配体分子结合在一个高分子上,那么新的配体分子与这个高分子的结合作用就常常会被增强(亦被称作协同结合)[5]。
theta - 占用位点的分数,在占用位点处配体可以结合到受体蛋白的活性位点。
KA - 产生半数占用时的配体浓度(配体浓度足以占用结合位点的一半数目),亦为微观的解离常数。
n - 希尔系数,描述了协同性。
n > 1 正协同反应:一旦一个配体分子结合到受体上,受体对其他配体的亲和力就会增加。(S曲线)
n < 1 负协同反应:一旦一个配体分子结合到受体上,受体对其他配体的亲和力就会减小。
n = 1 非协同反应:受体对于一个配体分子的亲和力并不取决于是否有配体分子已结合到其上。
主要步骤:
1. 计算基因在细胞类型中的加权平均表达量:(弱化极值)
Q1,2,3是一个基因在一个细胞群中表达分布的四分位点;
2. 计算相互作用基因pairs:
i:细胞群ID;LA:共激活配体;LI:共抑制配体;
Li,1 … Li,m1 : 配体亚基。如果有一个亚基的表达量等于0,那么配体Li 的表达量等于0,这跟cellphoneDB的思想类似;
Li 的表达量跟LA正相关,LI负相关;
Rj的计算方法跟L一样。
希尔方程的微观解离常数Kh默认取0.5;AG(agonist,促进剂);AN(antagonist,拮抗剂);
ni/nj/n(分别是细胞群i/j的细胞数和样本总细胞数);
两个细胞群i, j之间的基因对k的相互作用强度P,综合考虑了受配体(LR)/拮抗蛋白/促进蛋白的相互作用位点的饱和度,还有细胞比例。这里的希尔方程系数为1(非协同反应).
3. 检验。Permutation test (L= 100 by default)
CellChat应用案例:小鼠胚胎发育毛囊单细胞相互作用分析
不足之处:
cellphoneDB和CellChat的前提假设:以group为研究单位;
实际情况,蓝色A和蓝色B与黄色细胞相互作用可能不同。
而接下来要介绍的CSOmap 就是以单个细胞为相互作用对象的工具。
CSOmap:根据单细胞转录组揭示空间结构
研究背景:
有研究表明,细胞组织的空间构造与组织内细胞的相互作用有关;•空间转录组可以直接反映不同细胞类型的组织空间分布,但是绝大多数单细胞转录组数据没有配套的空间转录组数据。
科学问题:
只有单细胞转录组的条件下,可不可以根据细胞间相互作用的信息构建单细胞的空间结构?
CSOmap算法原理概述:
CSOmap在非线性降维方法tSNE的框架上做改进,降至3个维度模拟单细胞群的空间位置。
与tSNE相似的步骤和主要的改进:
相似的步骤:
1. 低维空间用t分布量化;
2. 用KL散度表示高维空间和低维空间的差异,然后用梯度下降法优化。
主要的改进:
1.输入数据。CSOmap用细胞间相互作用的强度作为输入数据,而tSNE用高纬度的欧氏距离;
2.低维空间位置约束。为了模拟细胞在组织中的真实分布,设置细胞距离上下限,避免细胞过度重叠,或者相隔太远,超出组织块的范围。
3.用PCA找一个合适的观察角度。降到3维后,做PCA,查找差异最大的角度。
数据输入差异:不同的高维空间亲和度
tSNE的高维空间亲和度。欧氏距离经过高斯分布量化后,再转为概率分布,然后对称化。细胞i和细胞j之间的欧氏距离考虑了多个维度的特征,所以降维后不同细胞类型区分度明显。
CSOmap先计算细胞i和细胞j之间每一对受配体LR的表达量,受体L和配体R的表达量相乘,加上相反方向的受配体,作为这一对受配体相互作用的强度。最后将细胞i和细胞j之间所有受配体强度相加,作为高维空间亲和度。不同于tSNE考虑大多数基因的特征,CSOmap只考虑受配体,这也是CSOmap降维后分群不明显的主要原因。
数据输出差异
CSOmap在t分布的基础上加细胞间的距离限制:
1.细胞点之间的三维空间距离大于r;
2.细胞点之间任何一个坐标维度上距离不超过R。
CSOmap验证头颈癌p-EMT细胞群空间分布[7]
CSOmap不足的地方
1. CSOmap只基于单细胞转录组数据,而单细胞转录组存在dropout和批次效应等问题。
2. 受配体调控只是组织细胞空间位置的特征之一。其他因素如物理化学因素,营养因素等都会影响组织的细胞构成。
CSOmap根据单细胞转录组的受配体表达量构建细胞空间分布的精度是远远不足的,空间转录组使得局部相互作用分析成为可能。
下期预告:前沿科学技术介绍之10X Visium 空间转录组应用。
参考文献:
[1]. Shao, Xin, et al. "New avenues forsystematically inferring cell-cell communication: through single-celltranscriptomics data." Protein & Cell (2020): 1-15.https://doi.org/10.1007/s13238-020-00727-5
[2]. Efremova M, Vento-Tormo M, Teichmann S A, et al. CellPhoneDB:inferring cell–cell communication from combined expression of multi-subunitligand–receptor complexes[J]. Nature protocols, 2020, 15(4): 1484-1506.
[3]. Zhang L, Li Z, Skrzypczynska K M,et al. Single-cell analyses inform mechanisms of myeloid-targeted therapies incolon cancer[J]. Cell, 2020, 181(2): 442-459. e29.
[4]. Suoqin Jin, Christian F. Guerrero-Juarez, Lihua Zhang, Ivan Chang, Peggy Myung, Maksim V. Plikus, Qing Nie. Inference and analysis of cell-cell communication using CellChat. bioRxiv 2020.07.21.214387; doi: https://doi.org/10.1101/2020.07.21.214387
[5]. https://zh.wikipedia.org/wiki/希尔方程
[6]. Ren,Xianwen, et al. "Reconstruction ofcell spatial organization from single-cell RNA sequencing data based onligand-receptor mediated self-assembly." CellResearch (2020): 1-16.
[7]. PuramS V, Tirosh I, Parikh A S, et al. Single-cell transcriptomic analysis ofprimary and metastatic tumor ecosystems in head and neck cancer[J]. Cell, 2017,171(7): 1611-1624. e24.
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
生信爆款入门-第7期(线上直播4周,马拉松式陪伴,带你入门)你的生物信息入门课
数据挖掘学习班第5期(线上直播3周,马拉松式陪伴,带你入门) 医学生/医生首选技能提高课
生信技能树的2019年终总结 你的生物信息成长宝藏
看完记得顺手点个“在看”哦!
长按扫码可关注