查看原文
其他

Nature Review Genetics | 从基因表达解读细胞之间的相互作用和交流

The following article is from AraShare Author AraShare

撰文:Lemma
原创不易,感谢转发

2020年11月9日,Erick Armingol等在 Nature Reviews Genetics上发表了一篇综述,介绍了通过转录组数据分析细胞间相互作用的方法,回顾了目前检测基因/蛋白互作领域使用的方法和工具,并指出目前所面临的挑战以及未来发展的方向。

文章思维导图

研究背景
在生物体中,不同细胞类型和组织中的细胞之间相互作用(CCI)可以协调生物的发育。因此,对细胞功能的研究越来越需要考虑每个细胞的所处环境。CCI通过各种分子包括离子、代谢物、整联蛋白、受体、连接蛋白、结构蛋白、配体和细胞外基质的分泌蛋白来实现的。一些分子如激素、生长因子、趋化因子、细胞因子和神经递质等配体介导细胞之间的信息交流(CCC;图1a)。
图 1a 分别展示了自分泌,旁分泌,近分泌和内分泌的通路简图。自分泌信号转导是指细胞内通讯细胞分泌配体,这些配体用于通过同源受体诱导同一细胞上表达的那些分子的细胞应答。旁分泌细胞间的通讯不需要细胞间的接触,而是取决于信号分子在分泌后从一个细胞扩散到另一个细胞。近分泌,即依赖于接触的细胞间通讯依赖于间隙连接或膜纳米管等其他结构,使信号分子直接在细胞之间传递,而不会分泌到细胞外。内分泌细胞间的通讯代表细胞间的通讯,信号分子被分泌并通过诸如血浆的细胞外液传播很长一段距离。

CCC背后的信号转导通常是由各种类型的蛋白质相互作用介导的,包括配体-受体,受体-受体和细胞外基质-受体的相互作用。受体细胞通过同源受体触发下游信号传导,通常最终导致转录因子活性和基因表达发生改变,从而使这些表达发生改变的细胞进一步与其微环境相互作用。要了解每个细胞在所处环境中的作用,必须确定在细胞之间传递的蛋白质信息。
随着对细胞领域研究以及科技技术的发展,人们可以从基因表达中推断出CCI和CCC,以及所采用的多种研究方法揭露了细胞在其环境中的基本作用以及它们如何塑造细胞功能,这在未来的应用中具有巨大潜力,尤其是在生物医学和生物治疗学中。但是,每种推断CCI和CCC的方法都有其自己的假设和考虑的局限性;当使用某种方法时,要意识到这些方法的优缺点,并选择适当的参数进行分析。在此研究领域,方法和技术的挑战仍然存在,但是还有许多的可能性来提高人们对细胞间相互作用的理解。因此,作者对此进行了综述。

要点解读
一、基于RNA的CCI分析与展望
随着转录组学,特别是大量和单细胞RNA-seq的普及,细胞间相互作用的研究已大大加快。这些方法使用转录谱分析在任何发育阶段和任何多细胞群落中解密CCC。许多研究发现了CCI驱动细胞分化和器官发育、组织和器官稳态中的CCI、疾病中的免疫CCI的机制(图1b)。

 图 1b 细胞-细胞互相作用的主要应用概述

二、CCC的
有多种策略和方法可以对细胞之间的通讯进行推测,尤其是在单细胞转录组测序之后,以RNA为代表的细胞信息之间的相互作用更能够对其进行解析。如下图显示的工作流程:


   图 2 通过转录组学分析细胞间通讯方式的工作流程
步骤1:通过转录组学分析样品或细胞,以测量基因的表达;
步骤2:然后对生成的数据进行预处理以构建基因表达矩阵,其中包含跨不同样品或细胞的每个基因的转录水平;
步骤3:从其他来源生成或获得参与细胞间通讯的相互作用蛋白列表,通常包括分泌蛋白和膜结合蛋白(分别为配体和受体)之间的相互作用;
步骤4:在基因表达矩阵中仅保留与相互作用蛋白相关的基因。
步骤5:它们的表达水平用作输入,使用评分函数[函数f (L,R)],其中L和R分别是配体和受体的表达值来计算每个配体-受体对的交流得分。可以使用聚合函数[函数(Cell 1,Cell 2)],其中Cell 1和Cell 2都是这些细胞或相应样本的所有通讯得分,可以汇总这些通信得分以计算各个样本或细胞之间的总体交互状态;
步骤6:最后,可以通过Circos图和网络可视化来表示交流和汇总分数,以方便对结果进行分析解释。

1. 从蛋白-蛋白的相互作用(PPI)建立理解
大多数研究都依赖于文献记载的相互作用蛋白列表(图 2a,步骤3)。虽然一些研究具有任何类细胞表面蛋白和分泌蛋白之间使用相互作用,但是用于研究CCC的主要相互作用类别是已知的配体及其同源受体。
许多研究列举了使用不同方法的已知配体-受体对。为了便于进一步使用和比较,作者将可公开获得的列表整理到单个配体-受体对存储库中。然而,整合多种数据来源具有挑战性,需要协调评估配体-受体对置信度或确定直向同源物的不同方式。此外,很少有人对数据库中预测的PPI进行过验证。尽管如此,PPI,尤其是配体-受体对,在各种策略方法中对于解析CCC都是至关重要的。

2. 细胞交流途径
为了探寻相互作用细胞使用哪些生物学过程进行交流,通常使用它们的同源基因的表达作为评估每对相互作用蛋白的方式,以及对每对相互作用蛋白进行评分。重要的是,这种方式建立在主要的两个推测上(基因表达反映了蛋白质的丰度;蛋白质的丰度足以推断PPI强度),然而其忽略了它们结合的必要因素,例如翻译后的修饰或多亚基复合物修饰。因此,作者专注于配体-受体对作为PPI(图 2a,步骤3);以及确定了核心的评分功能方法,源于二进制评分与连续评分——分别为“表达阈值”和“差异组合”函数方法;“表达乘积”和“表达相关”函数方法,由图3展示。

 图 3 使用核心函数计算通信分数的示例。

3. 判断哪对细胞更可能相互作用
评估每对相互作用蛋白交流得分的方法有助于研究CCC,从而揭示特定信号传导机制的作用;然而,它不能揭示细胞之间的整个相互作用状态。因此,作者提出使用聚合分数(aggregate score)来定义成对细胞之间的相互作用。从将交流分数汇总为总体分数的少数研究中(图 2a,步骤5),最常见的方法是量化细胞之间活性配体-受体对的数量但是,不同的CCI可能产生相似的计数,但信号通路完全不同,导致不准确。量化CCC的替代方法包括类似Euclidian或Jaccard的距离度量,该距离度量表示相互作用细胞中活性配体-受体对相对于所有配体-受体的数量。

尽管有很多方法,但仍不清楚哪种指标最能捕获其生物学作用。此外,任何依赖基因表达的策略都将仅限于在配体-受体列表中捕获的信号,这可能会遗漏细胞进行交流的方式。因此,仍然需要确定总体CCC潜力和细胞功能空间关系的策略。

4. 不断发展的CCC分析工具
除了核心评分功能(图 2b)之外,许多工具还使用高级统计方法来识别细胞间通讯。根据用于识别配体-受体相互作用的数学模型,现有的计算工具可以分为以下4类
(1)基于差异组合的工具中,可以识别单细胞RNA-seq数据中细胞簇之间显着差异表达的基因,并对这些列表进行配体-受体对分析。
(2)基于网络方法的多种工具使用,该方法通过基因之间的连接特性建立网络,来达到评估配体-受体共表达对受体细胞中下游信号基因的影响的目标,并因此获得了基于这种作用对配体和受体进行排名的连续评分。
(3)基于表达排列的工具是本评论中列出的工具中使用最广泛的工具。这些方法计算每个配体-受体对的通讯评分,并通过聚类标签排列,非参数测试以评估与空模型的差异或通过经验方法来评估其重要性。
(4)基于张量的工具是数学上最复杂的工具组。尽管网络计算可以表述为矩阵运算,但是其能运用张量明确地建模配体-受体相互作用。
此外,所描述的工具还包括强大的可视化功能,图4概述了几种较常见的可视化方法, 并通过直接绘制配体-受体共表达模式和交流得分(图4a-c)来显示数据, 并提供了有关总体CCI水平和CCI方向性的更高层次的直觉。细胞类型之间的这些影响(图4d-f)。因此,有几种工具不仅可以量化CCI和CCC,还可以方便地对其进行分析和解释。

 图 4 用于CCI和CCC的常见可视化技术

三、验证预期的CCC机制
CCC推论应被视为生成假设的数据驱动过程,根据所采用的策略,这可能导致不同的结果(图 3)。因此,验证推断的机制对于确认与细胞群的表型和行为的关联至关重要。作者着重介绍两种计算方法以最大程度地减少错误发现和用于验证结果的实验。
1. 计算策略 —— 探索以及减少错误数据
可靠的推断对于最小化假阳性和假阴性错误是至关重要的,并有助于减少要执行的验证数量,这在实验成本高昂时尤其有用。众多的方法可以使数据更加可靠,如基于排列的分析可以通过优先处理富含细胞类型的配体-受体对来帮助消除随机干扰产生的结果;二次抽样分析已用于评估CCC结果的稳健性;浓缩分析还有助于减少错误数据;以及用其他技术(例如蛋白质组学)生成的数据已经影响了CCC方法及其潜在性能。
因此,计算策略可以帮助减少错误,并有助于选择重要的结果以进行进一步的研究或实验验证。尽管我们重点介绍了这些方法有助于推动新假设的情况,但可以使用许多其他策略,例如Wilcoxon检验,数据集的随机生成,交叉验证和Welch检验。

2. 实验验证
许多研究使用实验方法来验证通过计算推断出的CCC机制,这些涵盖了三个级别的实验测试:
(1)确认被认为参与CCC的蛋白质表达(例如,通过蛋白质组学,酶联免疫吸附测定,蛋白质印迹或免疫组化);
(2)可视化在相邻细胞中表达的基因产物之间的相互作用(例如,通过显微镜结合免疫染色,单分子荧光原位杂交或通过流式细胞术测量共存);
(3)通过使用相互作用分子的激活剂或抑制剂或细胞的遗传操作进行体内或体外实验,评估CCC介体的功能作用,以观察与预测的信息相一致的效应。

四、展望:挑战和未来方向
1. 多组学集合的运用
尽管mRNA和蛋白质水平进行定性相关,转录可能不代表细胞间通讯的完全准确的视图,因此借用其它组学技术的信息可以改善结果的可信度,尤其是对于新兴技术。因此,诸如单细胞蛋白质组学等新兴技术将成为分析CCC方法的重要输入,并补充单细胞RNA-seq以改善CCI预测。此外,哺乳动物细胞被厚厚的糖萼覆盖着,大多数激素和受体都是糖蛋白。因此,糖类数据可以将上下文信息添加到CCI分析中。此外,聚糖参与种间相互作用,有助于CCC的特异性。因此,其他蛋白质组学和糖组学等组学技术的整合将有助于遗漏的其他CCI。

2.空间尺寸和时间维度方法的添加
配体mRNA的表达和配体丰度不是交流所需的唯一因素,为了提高计算的CCI的可靠性,关重要的是要考虑介体和相互作用细胞的空间位置。随着越来越多的方式出现用于基于空间的转录和蛋白质组学,未来的研究和算法应包括该信息。此外,基于时间维度的研究是CCC的另一个重要因素,它可以帮助阐明CCC的发展方式,并检测动态过程中的重要变化,例如细胞分化和免疫反应。因此,基于时间变化的分析可以改善CCC的发现,但是应该整合其他数据类型以区分表型是源于CCC还是基因表达的其他动态。

3.种间CCI研究的拓展
配体-受体对或相互作用的表面分泌蛋白的完整列表对于研究种内CCI的算法至关重要。考虑到在微生物领域中产生的数据雪崩,和近来的方案对微生物群落建模,可以通过CCI分析所得到的相互作用蛋白或跨物种配体-受体对的列表,来为人体-病毒蛋白质相互作用进行验证,从这些研究结果将对生物医学和微生物领域的一个相当大的影响。

4.表型的预测和调控
随着更多预测表型的模型的开发以及其预测能力的提高,它们将能够通过通过细胞工程(基因组编码和细胞工程技术)鉴定药物靶标并调控表型,这种方法将对许多领域产生重大影响,以及其中CCI对细胞分化成特定谱系的研究是至关重要的。

END



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存