查看原文
其他

科研 (IF: 68.164)|Nat. Biotechnol.:药物作用机制的蛋白质组全图谱

微科盟 蛋白质组 2023-06-14

 点击蓝字“蛋白质组”,轻松关注不迷路

生科云网址:https://www.bioincloud.tech/


编译:微科盟Wicro,编辑:微科盟Emma、江舜尧。

微科盟原创微文,欢迎转发转载。

导读

义细胞对药物的反应对于理解小分子扰动剂的作用机制至关重要。在这里,我们开发了一个基于96孔板的高通量筛选基础设施,用于定量蛋白质组学,并分析了人类癌细胞系中的875种化合物,几乎覆盖了全面的蛋白质组。通过检查24小时蛋白质组变化,揭示了配体诱导的蛋白质表达变化,和化合物调节其蛋白质靶标的规则,同时鉴定了推定的二氢叶酸还原酶和端锚聚合酶抑制剂。我们使用蛋白质-蛋白质和化合物-化合物相关网络来揭示几种化合物的作用机制,包括肾上腺素能受体拮抗剂JP1302,我们证明它会破坏促染色质转录复合物(FACT)复合物并降解组蛋白H1。通过分析许多具有覆盖广泛化学空间的重叠靶点的化合物,我们将化合物结构与作用机制联系起来,并突出了库中分子的脱靶多药理学。


论文ID


原名:A proteome-wide atlas of drug mechanism of action译名:药物作用机制的蛋白质组全图谱期刊:Nature BiotechnologyIF:68.164发表时间:2022.01通讯作者:Steven P. Gygi通讯作者单位:哈佛大学医学院

实验设计



实验结果


小分子调节剂通过多种机制影响其靶蛋白。对这些生物活性分子的作用机制 (MOA)进行反卷积可以带来更好的治疗干预。虽然有针对性的方法可以评估特定化合物对选定信号通路和细胞过程的影响,但需要系统级分析来定义药物和工具化合物的MOA。迄今为止,药物MOA的大规模表征主要通过相对高通量、低成本的测序技术进行RNA定量。例如,Connectivity Map (CMAP)项目开发了L1000 RNA测序平台来量化978个最具描述性的转录本。 CMAP数据库包含大约30,000种小分子扰动剂,这些扰动剂分布在多个细胞系中,为发现复合MOA提供了丰富的资源。然而,大多数美国食品和药物管理局(FDA)批准的药物靶向蛋白质,RNA和蛋白质水平之间的稳态相关性充其量是有限的,这表明蛋白质水平的变化将提供最接近的和相关的复合作用的读出。

在这里,我们量化描述875种小分子扰动剂的全蛋白质组效应的“蛋白质组指纹”,作为MOA反卷积和化合物再利用的资源,包括用于数据探索的配套网站(gygi.med.harvard.edu/DeepCoverMOA)。此处筛选的875种化合物包括一半可靶向蛋白质组的调节剂,从而揭示了HCT116蛋白质组中对化学扰动剂最敏感的那些部分。这一资源跨越了一个比以前实现的小分子库大十倍的库,强调了深度蛋白质组分析是如何揭示蛋白质组如何对药理学试剂做出反应的以前未被重视的细微差别。我们提供了最大的资源来评估配体诱导的靶蛋白调节变化的频率和特异性,证明15%的化合物调节其靶蛋白的丰度。我们使用深度筛选策略来了解美国FDA批准的聚二磷酸腺苷核糖聚合酶(PARP)抑制剂他拉唑帕尼(Talazoparib)的多重药理学性,以高度可信的方式揭示脱靶蛋白。我们表明,许多广泛使用的工具化合物和临床相关的小分子抑制剂具有无数意想不到的蛋白质组水平效应。对这些意想不到的活性化合物的分析揭示了一个结构相关的小分子家族,包括目前处于临床试验阶段的PAC-1,其活性是由铁螯合驱动的。最后,我们重点介绍了JP1302的活性——一种肾上腺素能受体拮抗剂,可通过多种机制抑制转录,包括接头组蛋白 H1的降解。该资源将为药物发现提供信息,并揭示药理学扰动后蛋白质共表达的基本、反复出现的模式。


1. 药物MOA综合蛋白质组分析平台


我们的首要目标是了解不同类别蛋白质的调节剂如何影响蛋白质组重塑,得出关于不同化学支架活动的结论,并了解未充分研究的化合物的作用。实现这些目标需要使用涵盖广泛化学空间并在注释目标中包含冗余的大型筛选库。虽然蛋白质组学传统上不适合大规模工作,但最近的研究发展,包括样本多重分析,已经开始使更高通量的蛋白质组学成为可能。基于之前的细胞系工作,我们将我们的串联质量标签 (TMT) 工作流程小型化,以允许与基于96孔板的小分子筛选基础设施集成。将小分子(875)一式三份转移至在96孔板中以低于50%汇合度生长的HCT116细胞。将细胞与筛选化合物(10µM)、二甲基亚砜(DMSO)或阳性对照化合物一起孵育24h,然后进行裂解、胰蛋白酶消化和使用TMT11-plex样品多路复用试剂进行标记。一个复制板用于筛选有毒化合物,这些化合物被移除并替换为阳性对照化合物的额外复制品(扩展数据图 1)。有毒化合物在较低浓度下重新筛选,并包含在单独的11重实验中。在875个分子库成员中,754个(86%)在生物重复中进行了筛选,全部使用实时搜索介导的同步前体选择-MS3(SPS–MS3)定量以最大限度地提高准确性,同时保持蛋白质组覆盖深度。在172个独立的11重实验中——总计2,176次LC-MS运行和大约4,400小时的仪器时间——获得了超过1100万个高质量的肽定量事件。通过一式两份获得800多个蛋白质组图谱,这是迄今为止最大的同量异位标记研究,据我们所知,这是在基于96孔板的细胞筛选背景下首次部署同量异位标记启用的蛋白质组分析。

最终为这项工作选择的筛选文库由875个小分子组成,当所有已知靶标都包括在内时,这些小分子靶向914种蛋白质,这些蛋白质构成大约一半的可靶向蛋白质组(图1和扩展数据图1b)。该库包括临床开发所有阶段的化合物,从高度引用的FDA批准药物到大部分未描述的化学工具(图1b和扩展数据图1a)。将近700种化合物与其他库成员共享主要或次要目标,从而可以解释目标诱导的蛋白质组指纹和脱靶多药理学(扩展数据图1c)。对这些初步考虑的进一步讨论包含在补充说明1中。

图1 基于96孔板的药物MOA综合蛋白质组分析平台a,筛选方案概述,从在96孔板中生长的HCT116细胞开始。在24小时处理后,使用TMT样本多路复用进行一式两份的深度蛋白质组分析。 b,注释时来自MOA库的化合物的临床阶段。 c,数据集中875种化合物中每一种化合物的蛋白质组深度。 d,分子胶泊马度胺的代表性蛋白质组指纹显示下调蛋白质的重复测量——显示为log2(FC)(泊马度胺与DMSO)。

通过这个工作流程,我们实现了深度蛋白质组覆盖,在9,960种观察到的蛋白质中量化了每种化合物8,863种蛋白质的中位数(每种化合物的覆盖率为89%;图1c)。数据完整性非常好,在至少一半的库中量化了大约8,900种蛋白质(438种化合物;扩展数据图 1j)。跨生物复制的蛋白质定量是可重现的,在550万个复制蛋白质-化合物测量对中,只有1%的差异超过log2(倍数变化 (FC))0.5(化合物与DMSO)(扩展数据图1f)。显着重新连接蛋白质组的对照化合物在整个数据集中出现了55次,或者大约每三个TMT组出现一次。在对照化合物的所有55个重复中,蛋白质测量的变异系数中位数 (%CV) 为8.8%,合并两个生物学重复后6.8%(扩展数据图 1i)。对照化合物的生物复制的Pearson 相关性(r)中位数为0.87,在对两次复制进行平均后没有明显的异常值。这些结果突出了这些测量的可重复性以及包括和平均来自生物复制的蛋白质测量的好处(扩展数据图1g-i)。

每个蛋白质组图谱编码特定的蛋白质水平变化,这些变化在每种化合物处理后发生。对于沙利度胺衍生的免疫调节药物(IMiD)泊马度胺,我们看到了其已知作用机制的直接证据,其中它通过与CRBN21形成三元复合物来降解多种蛋白质。虽然介导IMiD在多发性骨髓瘤中的治疗作用的转录因子IKZF1和IKZF3未在HCT116细胞中表达,但其他几种已知的新底物,包括几种转录因子,被下调,重复之间的差异很小(图1d)。


2. 蛋白质组由小分子动态调节


每种化合物与一个或多个蛋白质靶标相互作用,并通过反映其MOA的细胞过程的常见和扰动剂特异性调节来诱导蛋白质组水平的变化。这些扰动剂引起的丰度变化因蛋白质而异。因此,调节事件由两个标准定义:(1)与DMSO相比的两倍变化或 (2) 蛋白质表达相对于所有化合物中该蛋白质的平均变化的五个标准差变化。利用筛选出的大量化合物,我们可以了解具有不同响应幅度的蛋白质,并确定小型FC值得注意的情况。我们发现即使是低幅度的调节事件也是可重复的,来自同一类的小分子诱导几乎相同的FC幅度(扩展数据图2a、b)。

使用这些标准,我们确定超过一半的可量化蛋白质组因一种或多种化合物而变化至少两倍,而98%的量化蛋白质显示一种或多种化合物的丰度变化为五个标准差(图2a)。此外,超过4,000种蛋白质被至少一种化合物高度(超过两倍)下调,揭示了许多潜在的配体诱导的降解事件。总体而言,我们发现了141,786个调节事件,不到数据集中763万个蛋白质测量值的2%(图 2b)。

大多数蛋白质组都可以通过小分子进行调节a,使用两个显着性阈值进行蛋白质水平调节的统计数据:5SD和双重变化(化合物与DMSO)。受调节的蛋白质受到数据集中的一种或多种化合物的干扰。 b,按5SD变化、双重变化或两者对所有受监管事件进行细分。在所有 760 万个蛋白质测量中,约有 1.9% 是受监管的事件。 c,蛋白质增加两倍 (n = 97) 与减少 (n = 213) 两倍的比率。仅显示在至少一半化合物中量化的蛋白质 (n = 8,860)。通过将影响表达的化合物数量乘以两倍并除以蛋白质被量化的化合物数量来计算变化率。 d,来自cKEGG通路富集分析。 e,化合物级瀑布图突出显示了每种化合物的受调节蛋白质的数量(通过5SD /两倍变化)。 f,通过处理后5SD 24h减少(x轴)和增加(y轴)的蛋白质数量测量的每种化合物的活性。

然后,我们确定了对扰动剂治疗有异常频率反应的蛋白质,并且通常与常见的耐药性或压力应对途径有关。我们发现频繁响应的蛋白质有一种惊人的倾向,即只在一个方向上发生变化(图2c和扩展数据图2d)。优先上调的蛋白质富含类固醇生物合成、细胞因子-细胞因子受体相互作用、线粒体自噬和铁死亡途径的成员,表明HCT116细胞通过自噬和甾醇代谢的上调来克服外源性应激源。同样,下调的蛋白质富含来自几种细胞周期相关途径的蛋白质,包括p53信号转导,表明这些细胞通常通过细胞周期停滞对扰动剂诱导的应激做出反应(图2d)。

我们接下来根据每个调节的蛋白质数量对化合物进行排名,发现中位化合物改变了15种蛋白质的表达。最活跃的化合物调节高达25%的可观察蛋白质组,包括蛋白酶体降解、转录和组蛋白乙酰化等重要细胞过程的抑制剂。许多化合物诱导上调和下调蛋白质的平衡,意外地包括蛋白酶体抑制剂MG132、ONX0914 和epoxomicin。然而,根据具有较大(大于两倍)变化的蛋白质数量对化合物活性进行排名,揭示了蛋白质组反应更符合预期,其中蛋白酶体抑制剂主要诱导蛋白质上调,而转录抑制剂诱导蛋白质下调(扩展数据图2d)。尽管它们的数量和方向性有时超出预期,但小幅度的蛋白质调节事件在生物复制之间和同类化合物之间仍然是一致的,支持它们用于解释化合物活性(扩展数据图2b)。


3. 靶蛋白的调节通知复合MOA


随着分子胶和PROTAC降解剂作为有前途的治疗类别的出现,配体诱导的蛋白质表达变化已成为药物发现的前沿。相反,靶蛋白的药理学上调可能通过缓解或抑制负反馈环和正反馈环来驱动耐药性。尽管小分子诱导的靶蛋白表达变化具有治疗重要性,但人们对这种现象仍然知之甚少,尽管一些研究试图通过挖掘RNA表达数据集来解决这个问题。最近一项蛋白质组范围内的药物扰动研究表明,大约25%的药物和工具化合物调节其靶蛋白的表达,尽管所研究的文库偏向于针对常见扰动通路中的蛋白质的高活性化合物。

我们确定了我们数据集中875种化合物的大约一半的注释主要目标,并且90%的目标蛋白质在包含目标化合物的11重物中被量化(图3a和扩展数据图3b)。此项分析中,对于每个化合物我们还包含了的一个次要目标,如果次要目标适用,将产生541对化合物-目标蛋白质  。我们发现15的化合物调节其靶蛋白的表达(图3b 和扩展数据图3a),中位数约为1.56倍,上调发生的频率高于下调(扩展数据图3e)。即使是小幅度的调节事件(FC小于两倍,大于五个标准偏差 (5SD))也可以在重叠的化合物类别中重现(扩展数据图3f)。

图3 小分子对靶蛋白的调节为复合MOA提供信息a,该数据集中确定的主要目标的比例。 b,如果适用,受5SD或双重调节的靶标的比例,n = 541。c,与DMSO 相比,通过双重调节其靶蛋白(主要和一个次要靶标)的化合物的直方图。注释是“TargetGene_CmpdName”。 d,所有875种化合物的DHFR表达。那些增加DHFR表达的被突出显示。 e,d中突出显示的化合物的所有定量蛋白质的蛋白质表达。 f,所有化合物的TNKS/TNKS2表达,按抑制剂类别着色。 g、CLK1、CLK2、CLK3和CLK4在整个数据集中的表达。报告的P值来自未配对的双侧Wilcoxon检验。对于CLK1n = 875;CLK2, n = 857; CLK3, n= 875; CLK4n=808,中线代表中位数,方框上下界代表四分位距(IQR,第25到第75个百分位数之间的范围),晶须延伸到1.5倍以内的最高值和最低值IQR

配体诱导的蛋白质表达变化经常观察到高活性化合物,除了它们的靶标外,还调节许多其他蛋白质(图3c和扩展数据图3d)。这表明许多调节事件是扰乱重要细胞过程的间接结果,不一定直接由配体-靶点参与引起。当几种化合物靶向相同的蛋白质时,通常会观察到目标蛋白质丰度的类似变化。例如,BRD4抑制剂JQ-1、CPI-203和比拉瑞塞(Birabresib),HSP90抑制剂根赤壳菌素(Radicicol)和NVP-BEP800,以及基于nutlin的MDM2抑制剂将它们的靶标调节到接近相同的水平,表明机制特异性调节阈值(图3c和补充图.3g,j)。在用PLK1抑制剂BI-2536和volasertib治疗后,BRD4丰度也增加,可能反映了共享的PLK1和BRD4抑制剂驱动的表型。

虽然靶蛋白表达通常由诱导广泛蛋白质组重塑的化合物调节,但一些靶蛋白由具有较窄蛋白质组水平效应的化合物调节,表明特定配体诱导调节或局部反馈。这些靶蛋白丰度的特定变化发生在BIRC2、DHFR、VDR、PDE9A和TNKS抑制剂等中(图3c)。这些蛋白质的调节主要限于直接靶向它们的化合物,将这些蛋白质确定为未来MOA反卷积的有希望的主题(扩展数据图3j)。

利用可重复的化合物诱导的上调,我们确定了三种上调DHFR的化合物,其强度和特异性相当于艾克拉普林(Iclaprim)和乙胺嘧啶(Pyrimethamine)——这两种已知的临床使用的DHFR抑制剂(图3d、e)。这些假定的DHFR抑制剂——基于咪唑喹啉的TLR7激活剂咪喹莫特、R848(雷西莫特,Resiquimod)和HCN通道阻滞剂ZD7288——在结构上类似于含有二氨基嘧啶的DHFR抑制剂。已知甲氨蝶呤和诺拉曲塞等抗叶酸药可上调DHFR7并用作阳性对照(扩展数据图3h)。

TNKS1/2抑制剂可重复诱导PARP tankyrase-1/2(TNKS和TNKS2)的大FC,这两种相关的ADP核糖基酶影响包括WNT信号传导在内的多种途径。这些蛋白质也被蛋白酶体和组蛋白脱乙酰酶(HDAC)抑制剂以及PARP抑制剂他拉唑帕尼上调(图 3f)。虽然由于核糖基化结构域之间的同源性,细胞对PARP和TNKS抑制反应的实质性交叉并不令人惊讶,但数据集中的另一种PARP抑制剂奥拉帕尼不调节TNKS或TNKS2。此外,血管动蛋白家族蛋白(AMOT、AMOTL1和AMOTL2)受TNKS通过直接相互作用和信号TNKS抑制调节,在用三种TNKS抑制剂和他拉唑帕尼处理的细胞中显示表达增加,但在奥拉帕尼处理时没有。这些发现表明,在10μM时,他拉唑帕尼(而非奥拉帕尼)对TNKS/TNKS2具有脱靶活性,支持先前报道的这些化合物对一组ADP核糖基酶的体外半数最大抑制浓度 (IC50) 值。

最后,我们注意到双特异性激酶CLK1的频繁上调(图2c和扩展数据图 2d)。整个CLK激酶家族通常在用激酶抑制剂处理的细胞中上调,包括有效的CLK抑制剂KH-CB-19和mL167(图3g)。在CLK激酶中,尽管半衰期相对较长,但CLK1和CLK4最容易上调。激酶富集珠、热稳定性测定、亲和力下拉和交联测定等实验将有助于了解这些化合物与CLK激酶家族的直接结合和间接结合。


4. MOA推动化合物群体的组织


我们接下来使用整个蛋白质组指纹数据库通过关联所有可能的化合物对的蛋白质组配置文件来生成MOA相似性网络。在过滤网络以仅包括连接其蛋白质组水平效应以0.1%错误发现率(FDR)相关的化合物的边后,我们形成了一个化合物-化合物相关网络,其中包含382,375个可能边中的2,543个(图4a)。在875种化合物中,295种与另一种化合物至少有一个显着相关性,其中相关性是根据每对化合物之间的8,315种常见蛋白质的中位数计算的(扩展数据图4a)。从这个网络中,我们确定了相互关联的化合物群体,这些群体由具有重叠目标的化合物组成,其关联反映了共享生物学(图4b-h和扩展数据图4b)。例如,一个化合物群体将MDM2和CDK4/6抑制剂归为一组(图4b),可能是因为这两类都会诱导G1停滞36,37,38。CDK4/6抑制剂哌柏西利(Palbociclib)和瑞博西利(Ribociclib)存在于该群落中,但更混杂的阿贝西利(Abemaciclib)不存在,它与哌柏西利的相关性很差(扩展数据图4c,d)。成对相关图突出显示基于nutlin的MDM2抑制剂依达奴林(Idasanutlin)和nutlin3a(或瑞贝马林Rebemadlin)受p53转录程序的影响(图4c)。

图4 作用机制驱动化合物群体组织a,由化合物-化合物相关矩阵构建的群体图。 b,MDM2和CDK4/6抑制剂的亚群。过滤所有子群体以仅包含r >0.6的边。 c,MDM2抑制剂Idasanutlin和Nutlin3a的成对相关图。 d,BRD4和PLK1抑制剂的亚群。 e,PLK1抑制剂BI-2536和volasertib的成对相关图。 f,与含有许多MAP激酶家族抑制剂的RAF抑制剂L-779450相关的化合物亚群。 g,MAP激酶通路抑制剂MEK126和AZ628的成对相关图。 h,蛋白酶体抑制剂亚群。 i,MG132和ONX0914的成对相关图——两种强相关的蛋白酶体抑制剂。对于所有成对相关图(c、d、g、i),所有x和y轴均表示为log2(FC)(化合物与DMSO),并报告Pearson (r)

我们还发现用PLK1抑制剂volasertib和BI-2536(图4e)以及溴结构域和末端外(BET)抑制剂birabresib、CPI-203和JQ-1处理的细胞蛋白质组之间存在重叠,后者通过与两者的相互作用抑制BRD4溴结构域(BD1和BD2)(图 4d)。与该化合物群体密切相关的是RVX-208——一种BD2选择性BET 抑制剂,目前正在进行心血管疾病治疗的临床试验。虽然这个群体反映了PLK1和BRD4抑制剂处理的蛋白质组之间的强烈重叠(扩展数据图4f),但RVX-208 MOA的细微差异是显而易见的。几种MAPK抑制剂形成了一个紧密的化合物群体,其中MEK抑制剂MEK162和RAF抑制剂AZ628在该组中相关性最高(图4f,g)。最后,我们注意到文库中的三种蛋白酶体抑制剂簇(图4h);成对相关图表明这些抑制剂等效地抑制蛋白酶体降解(图4i)。这些发现支持复合MOA反卷积的复合-复合相关性的网络级分析。


5. 蛋白质-蛋白质相关性揭示药物反应途径


我们接下来生成了一个蛋白质-蛋白质相关网络,假设具有共同功能的蛋白质将被具有重叠靶标的化合物共同调节。因此,我们将所有可能的蛋白质对的相对表达谱相关联,并将生成的Pearson相关矩阵过滤为1% FDR。最终网络(图 5a)包含2,388个节点(所有量化蛋白质的24%)和35,936条边(49,500,000个可能的蛋白质对的0.07%)。

图5 蛋白质-蛋白质相关性突出了药物反应途径之间的关系a,蛋白质-蛋白质相关性的群体网络。此网络中仅包含正相关和大于五个成员的群体。空心蓝色圆圈表示圆圈内蛋白质的丰富GO分子功能GO类别。实心圆是根据圆内蛋白质的组成手动注释的。 b–d,成对相关图:b,着丝粒蛋白NUF2和NDC80,c,溶酶体蛋白LAPTM4A和自噬调节因子TMEM59,d,乙酰辅酶A羧化酶1 (ACACA)和2 (ACACB),突出显示影响表达的选择化合物每对蛋白质。所有x和y轴均表示 log2(FC)(化合物与DMSO)。每个点代表一种化合物。 e,相关蛋白的亚群,包括几种NAD和琥珀酸脱氢酶。 f,对于通过大于0.5或小于-0.5的中值 log2(FC)增加或减少其表达的所有化合物,e 中每种蛋白质的蛋白质表达热图。

这种蛋白质-蛋白质相关网络的聚类揭示了按细胞功能组织的蛋白质群落,因为大的簇富含来自细胞周期、RNA加工、代谢和胆固醇生物合成分子功能本体的蛋白质。在这些群落中提取更强的蛋白质相关性揭示了蛋白质组织成已知复合物,包括着丝粒,其亚基NDC80-NUF2在数据集中具有最高的蛋白质水平相关性(图5b)。另一个化合物群体包括许多胆固醇生物合成蛋白以及几种高度相关的自噬蛋白,包括TMEM59,它通过与ATG16L1的相互作用促进LC3激活。 TMEM59表达与溶酶体蛋白LAPTM4A的表达密切相关——一种由已知的自噬调节剂巴弗洛霉素A1、逆转素(Reversine)、gedatolisib、拉帕替尼、安吖啶(Amsacrine)和pictilisib等驱动的关联。这些发现表明需要进一步研究LAPTM4A在自噬中的作用。

在更大的网络中,我们确定了富含p53信号蛋白、NAD脱氢酶 (NDUF)、tRNA合成酶和氨基酸转运蛋白以及氧化应激蛋白的群落。核糖体蛋白细分为两个不同的群落,对应于80S和线粒体核糖体,表明这些复合物由小分子独立调节。最后,相关网络分析揭示了功能关联,即使对于相对于DMSO具有小FC值的蛋白质也是如此。例如,乙酰辅酶A羧化酶1和2(ACACA和ACACB)具有很强的相关性,尽管这两种蛋白质都不能与任何化合物实现双重调节(图5d)。

相关蛋白质的成对图可以突出显示驱动两种高度相关蛋白质调节的化合物。然而,我们也可以定义共同调节不同蛋白质群落的化合物家族。例如,几种 NDUF和琥珀酸脱氢酶 (SDHA)蛋白的相关调节由大约20种化合物驱动(图5e、f)。类似地,由于包括4-硝基吡硫醇和PD-160170在内的几种含硝基化合物的影响,包括血红素加氧酶1 (HMOX1)和硫氧还蛋白还原酶1 (TXNRD1)在内的氧化感应蛋白群落与细胞色素p450单加氧酶CYP4F11相关(扩展数据图.5c,d)。这些分析突出了该资源定义已知生物过程的新成员以及识别驱动感兴趣的途径和过程的药物和工具化合物的能力。


6. 扰动剂诱导的蛋白质组指纹揭示药物机制


大多数药物和工具化合物不存在全面的蛋白质组指纹,这使得该数据集成为寻找库化合物新机制和脱靶机制的丰富资源。因此,我们为包含具有不相关目标的分子的群体挖掘了化合物-化合物相关网络。我们观察到三种没有已知重叠靶点的相关化合物:SP2506、PAC-1和KH7,它们分别被标注为LSD1、CASP7和ADCY10的抑制剂。尽管针对不同的酶类别,这三种化合物在主筛选(扩展数据图6a)和回购化合物(扩展数据图6b)中都显示出高度相关的蛋白质组指纹。作为芳酰腙,这三种化合物具有已知的可以螯合Fe(II)等金属阳离子的基序。事实上,来自铁硫结合分子功能本体的蛋白质在被这些化学相似化合物下调的蛋白质中得到了丰富。我们观察到的对每种结构相似的扰动剂的强烈相关的蛋白质组反应表明了一种由铁螯合驱动的共同机制,影响铁结合蛋白和酶的功能。这补充了先前的研究结果,这些研究结果质疑PAC-1的目标和可接受的MOA,该研究正在进行III期临床试验。

虽然具有重叠靶标和MOA的化合物通常会引起相似的蛋白质水平反应,因此显示出高度相关性(图4),但我们也发现尽管表面上靶向相同的蛋白质,但其蛋白质组水平效应不一致的化合物。我们通过研究两种BTK抑制剂来关注脱靶生物学的一个明确例子:FDA批准的依鲁替尼和一种有效的临床前化合物 RN486。由于HCT116细胞不表达BTK,依鲁替尼诱导的蛋白质组变化很少,正如预期的那样。然而,RN486引起了显着的蛋白质组重塑,表明非BTK脱靶(扩展数据图6d)。被RN486处理上调的蛋白质丰富了线粒体自噬、类固醇生物合成和细胞因子信号转导京都基因和基因组百科全书 (KEGG)通路53,而溶酶体在下调蛋白质中的比例过高(扩展数据图 6e)。自噬标记物的上调加上溶酶体蛋白的减少表明自噬失调是RN486处理细胞的主要表型,这是许多激酶抑制剂的常见机制(扩展数据图 7c)。

使用与MS偶联的激酶亲和珠进行的实验未能发现RN486靶向的任何激酶,这些激酶可以解释这种意外的活动(扩展数据图6f),这表明非激酶脱靶介导了 RN486的作用。然后,我们使用了细胞内蛋白质组整体溶解度改变测定 (PISA),它使用配体诱导的蛋白质热稳定性变化来推断感兴趣的化合物的蛋白质结合。虽然依鲁替尼治疗改变了几种激酶的热稳定性,但RN486的推定靶标包括许多内质网(ER)和线粒体蛋白,包括TEX264,一种介导ER-自噬的受体(扩展数据图6g)。需要对这些目标进行进一步分析,以确定RN486影响蛋白质组的机制。


7. JP1302抑制转录


为了测试该数据集对MOA反卷积的效用,我们通过目标表达分离化合物,并鉴定了几种高活性化合物,这些化合物靶向 HCT116细胞中未检测到的蛋白质(图6a)。其中包括JP1302,这是一种基于9-氨基吖啶支架的化合物,其特征不明确,被注释为α-肾上腺素能受体拮抗剂。虽然在HCT116细胞中检测不到ADRA2C,但JP1302处理诱导了与几种RNA转录抑制剂相关的蛋白质组指纹(图6b)。这些相关化合物包括ATP竞争性CDK9抑制剂flavopiridol、AZD5438和PHA767491,它们部分通过下调RNA聚合酶II (Pol II)磷酸化来抑制转录延伸。在这个化合物群体中,与JP1302相关性最强的化合物是咔唑衍生的 CBL0137,它抑制FACT复合物——SSRP1和SUPT16H的异二聚体,调节RNA转录相关的核小体DNA解螺旋和恢复。相反,在筛选的化合物中与JP1302最接近的结构类似物是另一种9-氨基吖啶,即拓扑异构酶毒安吖啶,它与JP1302几乎没有相关性。

图6 JP1302通过破坏FACT复合物和组蛋白H1来阻断转录a,该数据集中每个化合物的受监管事件数,基于是否识别了目标。使用了所有2,485个带注释的目标。 P值来自未配对的Wilcoxon检验 (n = 875)。中心线代表中位数,框的上下边界表示IQR(范围在第25和第75个百分位数之间),晶须延伸到IQR的1.5倍以内的最高值和最低值。 b,JP1302的化合物-化合物群落图和结构。边缘厚度表示相关程度(r=0.6至0.8)。 c,数据集中所有化合物的p53和p21的蛋白质水平回归。回归线的阴影表示95%的置信区间。 d,使用回购化合物的JP1302处理(10µM,24h)细胞的火山图。 e,JP1302处理的 (10µM)细胞与THZ531处理的(1µM)细胞的蛋白质组指纹的相关性。 f,整个MOA数据集中在e中突出显示的蛋白质表达。 g,用JP1302(10μM,4h)处理的HCT116细胞的蛋白质表达火山图。 h,CBL0137和JP1302处理的HCT116细胞的配体诱导的蛋白质组热稳定性变化的相关性。 i,用指定化合物处理20小时的HCT116细胞中各种RNA pol II和DNA损伤标志物的蛋白质印迹。除非另有说明,否则处理浓度为10 µM或1µM(THZ531)。 j,表格显示了用指定浓度的JP1302处理的细胞中上调和下调蛋白质的数量(与DMSO相比是两倍)。每个浓度都显示了从两倍上调的蛋白质列表中富集的KEGG通路。使用enrich KEGG R包计算富集途径及其调整后的(使用Benjamini–HochbergP值 (PAdj.)。 k,在包含JP1302剂量依赖性蛋白质组指纹(红色节点)后,从更大的MOA数据集生成的化合物-化合物群落图。显示了所有JP1302节点和高于 0.5 (Pearson r) 的所有网络边缘。d和g中的P值按照方法中的描述进行计算。 Q > 0.05的测量值是浅灰色。

我们接下来应用蛋白质-蛋白质相关性分析来进一步确定这组抑制剂的机制。我们假设,在TP53野生型细胞系(如HCT116)中,p53蛋白水平应与已知靶标(如CDKN1A (p21)和MDM2)呈正相关。虽然这个假设通常成立,但我们发现了几种导致p53表达增加而MDM2/p21表达减少或保持不变的化合物(图 6c和扩展数据图 8a)。大多数打破预期趋势的化合物都是转录抑制剂,包括那些与JP1302高度相关的化合物。该分析进一步表明JP1302可能抑制RNA转录。

为了进一步表征该化合物的MOA,我们比较了回购的JP1302与THZ513(一种转录激酶CDK12和CDK13的特异性抑制剂)诱导的蛋白质组变化。 THZ513处理立即阻止RNA转录,普遍降低蛋白质表达。尽管这两种化合物同样下调了蛋白质表达(图6d和扩展数据图8b),但几种下调的蛋白质是JP1302处理所独有的(图 6e)。其中三个,即组蛋白亚基H2AZ1、HP1BP3和H1FX,对药理学扰动有抵抗力,虽然它们被JP1302和CBL0137独特地下调(图6f)。假设这两种化合物都抑制与接头组蛋白相关以介导核小体组装的FACT复合物,我们试图评估JP1302治疗在短期治疗中对组蛋白的影响。实际上,对JP1302处理的细胞中蛋白质组变化的时间分辨分析显示H1接头组蛋白快速降解(图 6g和扩展数据图8c)。

为了辨别JP1302如何下调蛋白质表达和降解组蛋白H1,我们再次使用细胞内PISA,并包括一个匹配的全蛋白质组实验,以解释30分钟孵育期间蛋白质表达的任何变化。虽然我们观察到用CDK9/12/13抑制剂黄酮吡啶治疗后没有效果,但JP1302和CBL0137都会改变许多RNA转录蛋白的热稳定性,其中FACT复合物亚基SUPT16H受影响最大(图6h和扩展数据图8d)。尽管热稳定性发生了很大变化,但这些蛋白质的表达在30分钟后没有变化(扩展数据图8e)。这些发现表明JP1302可作为研究FACT复合物抑制和接头组蛋白降解的新化学工具。

最后,我们通过评估几种浓度下的PolII磷酸化和p21表达来评估JP1302作为FACT复合物抑制剂的效力。用10µM JP1302处理可抑制PolII磷酸化和p21表达,与CBL0137、THZ531和其他三种CDK9抑制剂相当(图6i 和扩展数据图8f)。然而,较低浓度的JP1302对PolII磷酸化没有影响,并诱导p21表达和H2AX磷酸化增加——DNA损伤的标志物。为了进一步阐明JP1302跨浓度的MOA,我们检查了剂量依赖性蛋白质组重塑,发现随着JP1302浓度降低,处理后上调和下调的蛋白质的相对数量不同,表明通路激活存在浓度依赖性差异。 (图6j和扩展数据图8g)。实际上,在1µM JP1302处理后,p53信号转导KEGG通路在上调蛋白中富集,这解释了观察到的p21增加。

然后,我们将从每个浓度获得的蛋白质组指纹插入到化合物-化合物相关网络中(图6k)。与KEGG通路预测一致,用1µM JP1302处理的细胞与激活p53的基于nutlin的MDM2抑制剂最接近,而更高浓度与先前观察到的相同化合物聚集在一起。然而,尽管浓度之间存在这种差异,但p53敲除仅轻微影响JP1302抑制细胞增殖的能力,同时使MDM2抑制剂MI773几乎失活,证实了该化合物的p53独立机制(扩展数据图8h)。因此,JP1302动态影响细胞信号,DNA损伤在低浓度下驱动p53活性,而较高浓度导致FACT复合物破坏和RNA转录抑制。

对化合物剂量依赖性的进一步分析显示不同浓度的不同MOA发生率较低(扩展数据图9和补充说明3)。总之,这些数据突出了我们的蛋白质组指纹资源可用于查明未知化合物的不同MOA的多种方式。


讨论


细胞暴露于药物和工具化合物通常会诱导蛋白质组重塑,其中具有相似 MOA的化合物具有相似的蛋白质组变化。使用综合分析方法对这些变化进行小分子库规模的表征,为未来药物发现工作中使用的化合物作用提供了机械注释。尽管蛋白质组学方法对MOA反卷积和目标识别至关重要,但复合作用的蛋白质组规模注释并不是常规执行的。在这里,我们为如何在药物发现中使用小分子指纹的小分子库规模注释定义了路线图。

首先,我们演示了该数据集如何揭示化学扰动剂诱导蛋白质组重塑的机制。我们描述了几种化合物的MOA,包括临床使用的几种药物,表明该数据集可能有助于MOA阐明和药物再利用。该资源还可以通过与离散化合物类别相对应的特定蛋白质表达生物标志物揭示脱靶蛋白质参与,从而揭示多药理学。我们的研究结果表明,由有希望的筛选命中和临床前候选药物引起的蛋白质组水平变化的常规量化将通过在开发的早期阶段揭示化合物的MOA来提高药物发现的效率。这种效率的提高,加上重新利用具有已知安全性的药物的潜力,将对将药物推向市场的成本不断增加产生积极影响。

其次,我们确定了调节HCT116细胞中超过9,000种蛋白质表达的化合物。进一步检查这些调节事件可能会发现新的配体诱导的降解事件并揭示未表征的反馈回路。此外,“标签外”工具化合物的使用途径变得可用,其中这些小分子可用于调节特定蛋白质/过程/感兴趣途径的表达,有时与它们的原始目的相矛盾。

最后,我们的化学诱导蛋白质指纹数据库揭示了响应扰动而发生的蛋白质共表达的基本和重复模式。通过“关联内疚”,我们的蛋白质协同调节网络可以将特征不明确的蛋白质与特定的生物过程联系起来。此外,这些蛋白质共调节事件可以与BioPlex网络中确定的蛋白质相互作用进行比较,其中包括在同一HCT116细胞系中对超过5,500种蛋白质进AP-MS实验。对“破坏”协同调节蛋白之间相关性的化合物的额外分析将进一步揭示小分子对通路水平的调节。

我们为业界和学界提供了一个配套网站来探索数据集,包括查询用户数据的选项和包含先前发布的数据的测试用例(gygi.med.harvard.edu/DeepCoverMOA和补充说明4)。



原文链接:

https://pubmed.ncbi.nlm.nih.gov/36593396/


----------微科盟更多推荐---------- 


科研 |浙江中医药:补阳还五汤抗脑缺血再灌注机制的多组学分析(国人佳作)


科研(IF: 16.988)| Cell Rep.:蛋白质组学在代谢亚组中分离成人型弥漫性高级别胶质瘤


获取此文献原文PDF、申请加入学术群,联系您所添加的任一微科盟组学老师即可,如未添加过微科盟组学老师,请联系组学老师46,无需重复添加。


请关注下方公众号

了解更多蛋白质组知识

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存