查看原文
其他

科研(IF: 69.504)|Nature:人类丝氨酸/苏氨酸激酶组的底物特异性图谱

蛋白质组 2023-06-07

 点击蓝字“蛋白质组”,轻松关注不迷路

生科云网址:https://www.bioincloud.tech/


编译:微科盟Wicro,编辑:微科盟Emma、江舜尧。

微科盟原创微文,欢迎转发转载。

导读

蛋白质磷酸化是生物学中最普遍的翻译后修饰之一。随着基于质谱分析磷酸化蛋白质组学(phosphoproteomics)的进步,迄今已确定了90,000个丝氨酸和苏氨酸磷酸化位点,其中数千个位点与人类疾病和生物过程相关。对于绝大多数磷酸化事件,尚不清楚人类基因组中编码的300多种蛋白质丝氨酸/苏氨酸 (Ser/Thr)激酶中的哪一种负责。在这里,我们使用合成肽库来分析Ser/Thr激酶的底物序列特异性,其中超过84%的预测在人类中具有活性。从整体上看,激酶组的底物特异性比预期的要多样化得多,并且在很大程度上由负选择性驱动。我们使用我们的全激酶组数据集来计算注释和识别能够磷酸化人类Ser/Thr磷酸化蛋白质组中每个报告的磷酸化位点的激酶。对于先前已报道的假定蛋白激酶所涉及的少数磷酸化位点,与我们的预测的非常一致。当这种方法被用于检查组织和细胞系对激素、生长因子、靶向抑制剂和环境或遗传扰动的信号反应时,它揭示了对通路复杂性和补偿的意想不到的见解。总的来说,这些研究揭示了人类Ser/Thr激酶组的内在底物特异性,阐明了细胞信号反应并提供了将磷酸化事件与生物途径联系起来的资源。


论文ID


原名:An atlas of substrate specificities for the human serine/threonine kinome译名:人类丝氨酸/苏氨酸激酶组的底物特异性图谱期刊:NatureIF:69.504发表时间:2023.01通讯作者:Lewis C Cantley,Michael B Yaffe,Benjamin E Turk通讯作者单位:威尔康奈尔医学院,哈佛医学院,麻省理工学院


实验设计



实验结果


蛋白质在丝氨酸、苏氨酸、酪氨酸和组氨酸残基上的磷酸化几乎控制着真核细胞功能的各个方面。蛋白激酶信号的失调通常会导致人类疾病。破译任何蛋白激酶的细胞作用需要阐明其下游效应底物。然而,迄今为止已发表的大多数激酶-底物关系涉及相对较少的经过充分研究的蛋白激酶,而对于大约300种人类蛋白Ser/Thr激酶中的大多数,只有少数的底物在人类激酶组中鉴定出。缺乏对激酶-底物关系的了解,限制了我们对基于质谱分析磷酸化蛋白质组学(phosphoproteomics)数据集的解释,迄今为止,这些数据集总共报告了人类蛋白质上超过200,000个Ser和Thr磷酸化位点。据报道,负责这些磷酸化事件的特定激酶不到这些位点的4%,这大大限制了我们对细胞磷酸化网络的理解。

众所周知,经过充分研究的Ser/Thr激酶可以识别磷酸化位点周围多个位置的特定氨基酸残基。这种短线性基序(motifs)是给定蛋白激酶的特征,可确保信号通路在给定Ser或Thr残基处调节磷酸化的保真度。了解激酶识别基序可以促进新底物的发现,例如,通过扫描磷酸化蛋白质组学数据寻找匹配序列。然而,迄今为止,已知磷酸化位点序列基序仅用于人类蛋白质Ser/Thr激酶组的一个子集。我们之前已经描述了组合肽库筛选方法,这些方法能够根据肽底物的磷酸化快速确定单个激酶的特异性。在这里,我们应用这些方法通过实验确定大多数人类Ser/Thr激酶组的最佳底物特异性,根据它们的基序表征激酶之间的关系,并在计算上使用这些数据来识别可能磷酸化使用MS或其他技术识别的任何位点。最后,我们展示了如何应用这些信息来捕捉遗传、药理学、代谢和环境扰动后细胞和组织中信号通路的复杂变化。


1. 分析激酶底物特异性


通过执行位置扫描肽阵列 (PSPA)分析来确定跨人类Ser/Thr激酶组的底物识别基序。我们使用了一个先前报道的组合多肽库,该多肽库系统地取代了围绕中央磷酸受体位置两边九个位置的22个氨基酸中的每一个,其中包含等量的Ser和Thr,而这22个氨基酸,即20个天然氨基酸加上磷酸化Thr和磷酸化Tyr(图 1a)。使用纯化的重组激酶制剂,我们成功获得了303个Ser/Thr激酶的磷酸化位点基序,涵盖了人类Ser/Thr激酶家族树的每个分支以及非典型蛋白激酶的集合(图1b,补充图1)和补充表 1和2)。之前的工作缺乏对这些激酶中的绝大多数的分析,包括83种未被充分研究的“暗”激酶(‘dark’ kinases)。

图1 分析人丝氨酸/苏氨酸激酶组的底物特异性a, PSPA分析和代表性结果的实验工作流程。Z表示包含20种天然氨基酸之一或磷酸Thr (pThr)或磷酸化Tyr (pTyr)的固定位置。X表示包含除Ser、Thr和Cys之外的所有天然氨基酸的随机混合物的不固定位置。深色斑点表示首选残基。 b,人类蛋白质激酶组的树状图,突出显示了本研究中分析的Ser/Thr激酶。

位置特异性评分矩阵 (PSSM)来源于量化了的PSPA数据,通过层次聚类分析,以比较激酶组中的激酶底物基序(图 2和补充表2)。正如预期的那样,共享大量序列同一性的激酶在其最佳底物基序中显示出高度相似性。然而,我们发现许多情况下,PSSM聚类分析并不能严格概括,从其一级序列推断的激酶之间的进化系统发育关系(图 2)。相反,大多数主要激酶组的成员分布在整个树状图中,反映出许多示例,其中具有低整体序列同一性的激酶已经聚合到磷酸化相似的最佳序列基序。例如,我们发现许多远缘相关的激酶(在YANK、CK1和2、GRK和TGFβ受体家族中)聚集在一起磷酸化相似的序列基序,尽管它们在激酶组树上的位置不同(图 2(簇 3))。

Ser/Thr激酶组的磷酸化位点基序树基于氨基酸基序选择性(PSSM)303 Ser/Thr激酶的分层聚类。激酶名称根据它们的系统发育关系(右上)用颜色标记。

对与基于基序的树状图的各个分支相关的序列基序的全面检查表明,大约 60%的Ser/Thr激酶组可以通过简单分配给先前观察到的三个基序类别之一来表示:对磷酸化N末端碱性残基的选择性站点(集群 1;图 2);由+1位置的脯氨酸残基引导(簇 2);或对多个位置带负电荷(酸性和磷酸化)残基的普遍偏好(第 3 组)。值得注意的是,MS观察到的所有报告的磷酸化位点中有一半以上可以分配给这三个特征之一(扩展数据图 1)。然而,这些基序类别中的每一个都可以根据对其他位置的不同残基集的选择性进一步细分,反映出这些簇内的相当大的多样性(扩展数据图 2-4)。其余大约40%的Ser/Thr激酶组由许多较小的组组成,这些组显示出独特的序列决定子(图 2;簇4-17)。例如,PIKK家族激酶(ATM、ATR、DNA-PK和SMG1)的基序聚集成一组,主要选择+1位置的Gln残基(簇5),这与之前的研究一致。值得注意的是,几个簇显示了以前未被很好识别的共享共识基序,例如包括IRAK、IRE、WNK、SNRK和RIP激酶在内的组(簇13),其中底物基序包含N和C末端的碱性残基到磷酸化位点,在+3位置上主要选择芳香族残基。作为另一个例子,激酶LKB1、CAMKK、PINK1和PBK(簇14)主要识别磷酸化位点N末端的疏水残基,并结合选择+1位置的转角促进残基(Gly或Asn)。激酶-肽复合物的结构模型揭示了激酶催化裂隙内的互补特征,这些特征可能负责识别这些基序(扩展数据图 5a、b)。

主导聚类的一个重要且不太普遍认可的特征是针对基序内不同位置的带正电荷或带负电荷的残基的强烈负选择,这表明静电过滤强烈影响整个激酶组的激酶底物选择。我们确定了其他类别的氨基酸,例如疏水性残基,它们会被各种激酶选择。这些趋势表明,底物回避在决定正确的激酶-底物相互作用方面具有基础性作用。

出乎意料的是,我们观察到许多激酶(303种中的129种)选择磷酸化Thr 或磷酸化Tyr作为基序中至少一个位置的首选氨基酸(补充图 1;其中磷酸化 Ser的选择性被假定为相当于磷酸化Thr)。除了先前已知依赖于磷酸化引发的激酶(GSK3、CK1和CK2家族;簇3)之外,这种现象对于GRK和YANK家族激酶尤为明显(扩展数据图4),两者其中的催化结构域内具有互补的碱性残基(扩展数据图 5c、d)。值得注意的是,个别GRK家族成员对其底物肽中磷酸化 Thr或磷酸化Tyr残基的位置表现出独特和特定的选择。GRK因其在G蛋白偶联受体 (GPCR)脱敏中的作用而广为人知,由此多位点磷酸化诱导抑制蛋白结合以抑制信号传导。我们的研究结果表明,仅七个GRK差异调节800个不同GPCR的能力可能涉及其他Ser/Thr和Tyr激酶对GPCR的初始序列特异性磷酸化引发之间复杂的相互作用,随后是GRK产生的第二级特异性-依赖性磷酸化和随后被少量β-抑制蛋白识别。

整个激酶组的底物识别基序特征可以根据激酶催化结构域内特定位置存在的特异性决定残基进行结构合理化,从而导致预期和意外的发现。例如,我们发现一半的激酶对Ser或Thr作为磷酸受体残基显示出一定程度的选择性(扩展数据图6和7)。与我们之前发表的研究结果一致,Ser或Thr磷酸受体位点偏好与“DFG+1”残基(即激酶激活环内典型Asp-Phe-Gly基序后紧接的残基)的身份密切相关,在Ser选择性蛋白激酶的这个位置有大量残基(Phe、Trp、Tyr),在Thr选择性激酶的这个位置有β分支残基(Val、Ile、Thr)。然而,对于某些DFG+1 残基,Ser与Thr的选择性出乎意料地依赖于前后残基。例如,在Ser选择性和双特异性激酶中观察到DFG+1位置的Leu残基,而DFG+1 Ala残基导致在某些激酶(例如,丝裂原活化蛋白激酶激酶激酶 (MAP3Ks)),但在其他(IκB激酶)中偏好Ser特异性。这些观察结果仅在完整的Ser/Thr激酶组的背景下值得注意,表明先前建立的DFG+1位置之外的其他残基可以以前后残基相关的方式影响Ser/Thr特异性。


2. 人类磷酸化蛋白质组的注释


对人类Ser/Thr激酶特异性的全面了解有可能使大量报告的磷酸化位点与激酶无关。为此,我们生成了人类Ser/Thr磷酸化蛋白质组的全激酶组注释,包括先前精选的82,735个位点集,这些位点使用高通量磷酸化蛋白质质谱(MS)检测,另外还有7,017个位点仅使用低通量方法识别。使用改编自先前发表的研究的方法,我们根据计算对每个Ser/Thr激酶基序,这89,752个位点进行排名(图 3a和补充表 3)。值得注意的是,大约99%的这些磷酸化位点对我们分析的至少一种激酶排名有利(即,该位点在该激酶的人类磷酸化蛋白质组的所有位点中得分排名前10%)。这些注释与先前已确定的涉及蛋白激酶的位点非常一致。对于上游激酶先前已被至少三份独立报告证实的磷酸化位点,包括969个位点和超过三分之一的激酶组,我们基于基序的方法产生的中位数百分位数为 95%(即,报告的位点收到其已建立激酶的磷酸化蛋白质组中所有假定磷酸化位点的得分高于95%)(扩展数据图 8a)。此外,当我们将所有 303 个异形激酶的基序反向映射到文献报道的磷酸化位点时,我们的方法产生了 92%的中值报道激酶百分位数(即,报告的激酶在我们的图谱中因其已建立的底物而得分高于我们图谱中所有异形激酶的 92%)(扩展数据图9a)。当我们考虑具有更多先前报告的激酶-底物对时,这些排名进一步提高(扩展数据图8和9),表明在大多数情况下,磷酸化位点的线性序列背景对激酶-底物有很大贡献关系。

图3 人类Ser/Thr激酶组的磷酸化基序可以对人类磷酸化蛋白质组进行全面评分和注释a,底物评分过程示意图4。 b,糖原磷酸化酶上Ser15与PSSM及其已建立激酶糖原磷酸化酶激酶的底物基序标志的结果。 c,p53的Ser15及其已建立的激酶ATM的结果。 d,通过303 种Ser/Thr激酶的百分位分数对人Ser和Thr磷酸化蛋白质组的注释,如a所示。使用高通量方法和/或低通量方法 鉴定的总共89,752个磷酸化位点沿x轴按百分位分数高于90的激酶数量排序。在y轴上,激酶百分位分数为每个站点分别按排名排序并显示在热图中。突出显示了经过充分研究的激酶-底物关系的示例(黄色方块)。插图:图左端的磷酸化位点对许多激酶有利,而右端的位点对较少的激酶有利。

值得注意的是,仅基序预测就成功地识别出许多被重点研究的激酶-底物关系。例如,磷酸化酶激酶PHKG1和PHKG2磷酸化糖原磷酸化酶的Ser15位点,在303个激酶中,成为排名前两位的关键激酶(图 3b)。这个磷酸化调节事件是第一个被发现的,它开辟了磷酸化依赖性信号转导的整个领域。迄今为止报道的引用最多的激酶-底物相互作用是DNA损伤激活激酶ATM对肿瘤抑制因子p53在Ser15位点的磷酸化,它在与该位点相关的排名靠前的激酶中得分(图 3c)。值得注意的是,据报道磷酸化相同位点的其他激酶—ATR、SMG1和DNAAPK—在预测的前四种激酶中得分。

我们的方法还可以正确识别由底物共定位或非催化对接相互作用驱动的磷酸化事件的激酶,为此我们预计对其激酶磷酸化位点基序的依赖性较小。例如,我们正确地鉴定了丙酮酸脱氢酶激酶对丙酮酸脱氢酶的线粒体定位磷酸化(扩展数据图10a)和MEK对MAP激酶ERK的对接驱动磷酸化(扩展数据图10b)。值得注意的是,除MEK外,我们分析的几乎所有人类蛋白激酶都选择了ERK上的磷酸化位点,这解释了ERK如何完全由MEK调节,同时避免被激酶组整体磷酸化。最后,我们的方法可以梳理出具有相似基序的激酶亚家族,并将它们正确分配给它们已建立的底物。例如,我们可以区分在细胞周期进程中扮演经典角色的CDK家族激酶(即CDK1、CDK2、CDK3、CDK4和CDK6)和控制基因转录的CDK子集(即CDK7、CDK8、CDK9、CDK12、CDK13和CDK19)(扩展数据图11)。

人类磷酸化蛋白质组的功能注释使我们能够检查激酶-底物相互作用的全球趋势。我们发现大多数磷酸化位点可以分配给少量假定的激酶(即BRAF-MEK1、ATM-p53和CDK4-Rb;图3d和补充表3)。虽然大约三分之一的位点缺乏独特的负序列鉴别特征,但是与更多激酶的最佳磷酸化基序匹配良好(即CREB 的Ser119,GSK3B的Ser9和LATS1的Thr1079;图3d)。这可能表明其他激酶决定因素(支架、定位等)对于正确的激酶底物识别的重要性,或者可能表明这些特定的磷酸化位点是多个信号通路的汇聚点。例如,cAMP反应元件结合蛋白(CREB)在Ser119位点被cAMP依赖性蛋白激酶 (PKA)规范磷酸化;然而,许多先前的报告表明,广泛的细胞刺激和药物扰动通过不少于十种不同的激酶影响该位点的磷酸化。综上所述,这些发现表明,假定磷酸化位点侧翼的负选择性元件的存在可用于将底物与数十种相关激酶的不适当磷酸化隔离开来,而这种负选择性的缺失可使不同途径中的蛋白激酶能够汇聚在同一个目标上。


3.基序富集分析


细胞信号网络是复杂和动态的。通过基因操作、生长因子和配体治疗、环境压力或小分子抑制剂对激酶信号通路的扰动通过直接和间接影响重塑磷酸化蛋白质组,这是实验治疗的次级信号反应/脱靶效应的结果。由于磷酸化网络的相互关联和动态特性,区分初始信号事件和随后激活其他信号通路的信号事件是一个常见且具有挑战性的问题。我们推断,初级和次级磷酸化事件背后的激酶可能会通过对相应磷酸化蛋白质组变化的全局基序分析来揭示。为了验证这个想法,我们使用了公开可用的MS数据集,这些数据集来自在不存在或存在各种扰动的情况下收集的细胞,并使用我们的Ser/Thr激酶基序图谱对所有磷酸化位点进行评分。然后将实验处理后显着富集或耗尽的激酶基序表示为基序频率和调整后P值的火山图(图 4a)。

图4 全局基序分析揭示了激酶扰动和通路重新布线如何重塑磷酸化蛋白质组a,磷酸化蛋白质组学数据的基序富集分析的工作流程。b–g,已发布数据集的结果。 b,FAM20C44基因缺失后HepG2细胞的条件培养基。 c,用 2μM异丙肾上腺素处理30分钟后培养的肌管。 d,用0.1μM PLK1抑制剂BI 2536处理45min有丝分裂停滞后的HeLa细胞。 e,A549细胞暴露于6 Gy电离辐射后2 h。 f,血清饥饿后3T3-L1脂肪细胞,然后用100nM胰岛素处理 1分钟和60分钟。 g,C57BL/6J小鼠骨髓来源的树突状细胞在用100 ng ml−1脂多糖 (LPS)处理30分钟和4小时后。 b–g中的富集使用单侧精确Fisher检验确定,并使用Benjamini–Hochberg方法针对多个假设进行校正。这些图的完整注释版本显示在补充图2中。

使用这种方法,我们发现对应于遗传或化学扰动的最直接目标的序列基序是最显着调节的基序之一,例如,对于分泌的原始酪蛋白激酶FAM20C的遗传缺失(图 4b)。当使用我们的全激酶组数据集分析来自缺乏FAM20C的HepG2细胞的定量磷酸化蛋白质组学数据时,下调最多的激酶识别基序对应于FAM20C的基序。类似地,当用异丙肾上腺素刺激骨骼肌样肌管细胞30分钟时,上调最多的磷酸化基序对应于cAMP依赖性蛋白激酶 (PKA)的多种亚型—β1和β2肾上腺素能受体下游的经典效应激酶(图4c)。值得注意的是,PKA基序与其他几种嗜碱性激酶的基序高度相似,但我们可以在这种情况下识别它们的富集。此外,我们全面的Ser/Thr激酶组基序集合阐明了使用PLK1抑制剂BI 2536在有丝分裂中停滞的HeLa细胞数据集中的次级信号事件(图 4d);在这里,除了观察到含有最佳PLK1基序的底物显着下调外,我们还注意到ATM和AT 磷酸化底物的上调。这一发现与之前的报道非常一致,即PLK1可以抑制有丝分裂细胞中的DNA损伤信号传导。

我们基于主题的分析也可用于揭示更复杂干预导致的关键信号事件。例如,我们检查了来自用6 Gy电离辐射处理的A549细胞的磷酸化蛋白质组学数据(图 4e)。我们的分析揭示了许多信号通路的上调和下调,包括参与DNA损伤反应的典型激酶(ATM、ATR、DNA-PK)的上调和参与细胞周期进程的典型激酶(CDK1、CDK2、CDK4和CDK6)的下调,与G1/S和G2/M停滞一致。此外,我们发现了不太被重视的DNA损伤反应激酶(MAPKAPK2、PLK3和LRRK2)的上调和下调。

Ser/Thr激酶组基序的完整集合还使信号的时间动态能够从时间分辨的磷酸化蛋白质组数据集中得到解决。例如,对来自胰岛素处理的3T3-L1脂肪细胞的磷酸化蛋白质组学数据进行基于基序的分析显示,胰岛素刺激后1分钟内磷酸肌醇3-激酶信号通路迅速激活,随后激活MAPK通路,同时在60分钟内下调AMP 活化蛋白激酶(图 4f)。同样,来自脂多糖刺激的树突状细胞的磷酸化蛋白质组学数据分析表明,在30分钟时,一组应激激活激酶(包括IKK、JNK和p38 MAPK)以及p38效应激酶的MAPKAPK家族显着上调。随后在小时内,PIM激酶的上调和MAPK的抑制与其上游 MAPK3K(MEKK1、MEKK2和ZAK)的下调并行,表明存在负反馈回路(图 4g)。因此,当应用于时间分辨磷酸化蛋白质组学实验时,综合的基于基序的方法可以破译不同激酶组的不同时间动态。


讨论


在这里,我们展示了人类丝氨酸/苏氨酸激酶组的全部底物基序,并提供了一个公正的综合框架来进一步探索它们的细胞功能。在全球范围内,这些基序比预期的要多样化得多,表明激酶组的底物库更广泛。该数据集的分层聚类将激酶组重组为至少38个基序类,并引入了几个共享的基序特征(图 2和扩展数据图2-4)。

我们分析的Ser/Thr激酶几乎无一例外地对特定基序特征具有很强的鉴别特征。这些发现表明,激酶信号通路的保真度主要是通过对底物的选择性压力来避免被大多数不相关的激酶磷酸化来实现的,这可能是通过调整磷酸化位点周围的氨基酸序列使其不受非同源激酶的青睐来实现的。由于这种负选择对正确的底物识别有很大贡献,因此准确识别激酶-底物关系需要对激酶磷酸化基序有全面的了解——不仅对于感兴趣的单个激酶,而且对于人类激酶组中可能竞争的所有其他激酶相同的底物池。

当这个激酶组范围的数据集被用于仅根据磷酸化位点周围的氨基酸序列来预测负责底物磷酸化的特定激酶时,结果在识别正确的激酶-底物关系方面非常准确,即使不知道组织特异性,脚手架效应或亚细胞定位。包括此类额外信息可能会进一步改进这些预测方法。在这些实验中使用一阶肽阵列的一个局限性是它们不直接测量底物肽内插入接触的贡献,我们之前已经证明这会影响某些酪氨酸激酶的底物选择,尽管对Ser/Thr影响较小激酶。此外,我们无法区分Ser或Thr残基的位置选择和相邻残基的直接磷酸化(例如,含有一个以上磷酸受体的肽)。由激酶底物基序数据指导的结构建模方法可能会破译这些额外信息,以进一步改进预测。

使用这种全面基序集合对MS磷酸化蛋白质组学数据集进行的检查产生了潜在的生物学见解和推定的激酶底物(图 4)。例如,在暴露于电离辐射的细胞中(图 4e),预计ATM会靶向上调的37个磷酸化位点,其中大部分从未与ATM的底物相关联(补充表 4)。随着磷酸化蛋白质组学在人类临床样本和疾病模型系统中的应用不断推进,我们基于基序的综合方法将具有独特的能力来揭示构成人类疾病进展、癌症耐药机制、饮食干预和其他重要生理学基础的复杂信号传导过程。总之,我们预见这些结果将为研究人类生物学和疾病信号通路的研究人员提供宝贵的资源。


原文链接:  

https://pubmed.ncbi.nlm.nih.gov/36631611/


----------微科盟更多推荐---------- 


综述(IF:19.328)|Mol Cell:通过mRNA翻译实现癌症蛋白质组的多样化


科研(IF:19.568) |中科大:慢性HIV-1感染期间与T细胞免疫恢复相关的炎症相关蛋白(国人佳作)

      

如果需要原文pdf,请扫描文末二维码领取


获取此文献原文PDF、申请加入学术群,联系您所添加的任一微科盟组学老师即可,如未添加过微科盟组学老师,请联系多组学老师46,无需重复添加。


请关注下方公众号

了解更多蛋白质组知识

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存