查看原文
其他

蛋白质组与转录组研究思路 | 蛋白专题

市场部-QW 联川生物 2024-03-27


一、介绍
在一个有机生物体中,基因表达的主要环节包括转录和蛋白质合成,mRNA是基因表达的中间体,蛋白质是基因功能的执行体。要了解具体的基因表达调控过程,需要对mRNA和蛋白进行关联分析,通过比较蛋白质组学和转录组学的数据,在转录水平和蛋白水平上整合分析,将两者联系起来。理论上讲,从生长条件和状态相同的细胞、组织或器官获得的转录组与蛋白质组数据之间应该具有较高的相关性,然而大量文献报道了转录组和蛋白质组的表达趋势并不相关甚至负相关的情况。蛋白质是生物体最终的功能执行着,其含量随着生物体的生长、环境应激反应、疾病发生发展的过程不断变化,因此,对蛋白质的解析意义重大。转录组是连接基因组和蛋白质组的中间模块,从DNA转录成mRNA,再翻译成蛋白质的过程中,涉及到一整套精细的表达调控机制,如转录调控,转录后调控,翻译调控,翻译后调控等。研究表明转录组和蛋白质组的相关系数并不高,表明在这个过程中,翻译和翻译后调控对蛋白质的表达具有非常重要的调控作用。由于转录后调控以及翻译后调控的存在,所以mRNA的表达水平并不能代表蛋白质的水平,这也是我们实验中常常会遇到的PCR结果和WB结果不符的原因。当前的研究表明,mRNA和蛋白的相关性约在0.3-0.5之间,因此单独只研究mRNA的表达是不充分的。而蛋白质作为细胞功能的主要执行者,它是最终参与细胞生物学过程的主要效应分子。因此,蛋白表达水平才是真实的基因表达情况的反应。
mRNA与对应蛋白表达水平相关性低的原因是当细胞适应了转录、转录后(如mRNA的剪接)、翻译后(蛋白降解和输出)的精细调控机制后,mRNA和蛋白质的表达丰度很可能会不一致。正如mRNA和蛋白质之间的一致性可以验证测序数据的可信度一样,两者之间的差异也能暗示我们更多的生物学意义和调控机制。总结上述研究中对mRNA与其蛋白水平表达趋势不一致的分析,其原因包括以下点 :1.转录和翻译后调节机制

基因的表达一般受到转录和翻译两个层面的调控,mRNA与其对应的蛋白质之间表达量的相关性取决于很多调控因子和代谢过程。从RNA到蛋白再到表型是一个复杂且精细的过程,在mRNA形成之后,很可能发生如转录后调控、表观遗传修饰(如DNA甲基化等)和翻译后调控等调节活动。由于存在转录后,翻译和翻译后的调节机制,还存在降解、酸化、糖基化等导致蛋白质的异构和数量改变的过程,而这些修饰作用往往对于细胞信号的转导、生物的生长、发育、衰老等过程起重要调节作用,也就是说仅关注蛋白组和转录组的比较研究是不全面的,更值得注意的是将两者联系到一起的桥梁,即转录后调控作用,它直接决定了mRNA和蛋白质的水平,除此以外,RNA的可变剪切、小RNA(miRNA、lncRNA 等)、转录因子等都有可能参与改变mRNA或蛋白的表达和功能。
2.检测时间点不同

因为检测的时间点不同,可能在蛋白达到峰值的时候mRNA已经降解或者在mRNA达到峰值的时候蛋白含量还在变化中,同时还存在降解、酸化、糖基化等导致蛋白质的异构和数量改变的过程。3.测序外界噪音干扰

测序外界噪音一般由系统误差和非目片段的测序信号造成。信噪比,即为有效信号/背景噪音,是测序结果中一个重要参数。高噪音影响就是低信噪比,信噪比越低结果越不可靠。因此,测序背景噪音也是造成 mRNA-蛋白相关性低的原因之一。4.非生物学因素

两组学之间的差异性也可能由试验技术的局限性、实验系统和数据类型等非生物学因素的差异导致。此外,测序样本的来源不同或状态不同也会造成差异,因此需要坦然接受转录组与蛋白组相关性不高的事实。因此,将转录组数据和蛋白质组数据结合起来分析,才可能更加全面且深入地了解各个生物过程的分子机理。



二、蛋白质组与转录组联合分析的优势
虽然转录组测序和蛋白质组测序在实验方法上差异很大,但这两种方法的根本目的都是获取基因的表达情况,两者之间存在一定的共通之处。从生物学角度出发,mRNA水平可以体现基因表达的中间状态,然而蛋白质是直接的功能执行体,因此对蛋白水平表达的检测有着不可取代的作用。将转录组和蛋白质组联合起来分析,其优点可以表示为3点:首先,两组学的联合分析可以获得基因的转录组与蛋白组学表达水平,实现两者的互补,对特定状态下生物体中mRNA和蛋白质表达水平进行全方位分析。其次,将转录组和蛋白组联合分析可以获得对差异表达的深层分析,挖掘受转录后调控的差异基因或差异蛋白,寻找并验证某些重要的调控通路。另外,对于那些蛋白数据库缺乏或注释不全的物种,通过转录组数据构建蛋白质搜索库,可大幅度提高蛋白质鉴定数。蛋白质是细胞行使功能的载体,在转录和蛋白水平,如果只能通过严格的转录调控去控制蛋白质的合成,细胞是不太可能选择精细调节机制的。通过比较蛋白质组学和转录组学的数据将两者联系起来,可以更加准确的掌握功能基因或蛋白的作用,找到基因相互作用网络,进而提供单个基因的生物学功能。蛋白质组学与转录组学联合分析,就是通过对转录组数据和蛋白质组数据进行联合分析,挖掘mRNA与蛋白的表达水平,充分利用转录组和蛋白质组研究的差异性和互补性,对基因的表达水平进行全方位的分析,以探究从基因到蛋白的全景图,发掘常规单个组学未能发现的新结果。全面探究生物体疾病机理,生长发育机制等。近些年,随着基于质谱技术的蛋白组学的发展,为疾病病理机制研究和治疗靶点的发现提供新的路径,当前已经发表了大量的从蛋白组学开始的文章。鉴于转录组和蛋白组是关系非常紧密且处于上下游的两个组学,所以这两个组学的联合研究尤其受到了研究者的青睐。我们在各类生物学研究领域里可以搜到大量转录组和蛋白组联合研究的文献,且数量逐年增加,这也是多组学联合研究趋势的一种体现。



三、蛋白质组与转录组联合分析的应用

案例一 :Transcriptomic and Proteomic Profiling of Human Stable and Unstable Carotid Atherosclerotic Plaques

发表期刊:Frontiers in Genetics(IF=4.6)

发表时间:2021.11

技术手段:转录组、蛋白质组

研究内容:

动脉硬化是一种发病率和死亡率都很高的慢性炎症性疾病。动脉硬化斑块破裂是引起动脉硬化临床事件的主要原因。明确稳定斑块和不稳定动脉样硬化斑块之间的转录组学和蛋白质组学特征对于预防临床表现至关重要。在本研究中,通过颈动脉内膜切除术获得了5个稳定和5个不稳定的人颈动脉样硬化斑块。样品用于通过使用Illumina HiSeq测序进行全转录组测序 (RNA-Seq),并通过HPLC-MS/MS进行蛋白质组分析。通过分析它们的位置和序列,确定了lncRNA靶向基因和circRNA起源基因。进行GO和KEGG富集分析差异表达的RNA和蛋白质的功能。蛋白质-蛋白质相互作用(PPI)网络由在线工具STRING构建。分析转录组和蛋白质组的一致性,并预测lncRNA/circRNA-miRNA-mRNA相互作用。结果,鉴定出202种mRNA、488种lncRNA、91种circRNA和293种蛋白质在稳定和不稳定动脉粥样硬化斑块之间差异表达。488个lncRNA可能通过顺式作用机制靶向381个蛋白质编码基因。序列分析表明,91个差异表达的circRNA来自97个蛋白质编码基因。这些差异表达的RNA和蛋白质主要在细胞对应激或刺激的反应、基因转录的调节、免疫反应、神经系统功能、血液学活动和内分泌系统方面富集。这些结果与数据集GSE41571中先前报告的数据一致。进一步分析发现CD5L、S100A12、CKB(lncRNA MSTRG.11455.17的靶基因)、CEMIP(lncRNA MSTRG.12845的靶基因)和SH3GLB1(hsacirc_000411的起源基因)是调节动脉样硬化斑块稳定性的关键基因。作者的研究结果提供了关于动脉样硬化斑块稳定性的全面转录组学和蛋白质组学知识。


案例二:Proteomic and transcriptomic profiling reveal different aspects of aging in the kidney

发表期刊:eLife(IF=7.08)    

发表时间:2021.03

技术手段:转录组、蛋白质组

研究内容:

衰老的特点是所有器官的生理功能下降,发病率和死亡率上升。肾功能在衰老过程的早期受到影响,并随着年龄的增长而逐渐下降。肾脏体积的减少和功能性滤过单元的丧失导致35岁后人类肾小球滤过率每十年下降5-10% 。在血液和尿液中测量肾脏的功能变化相对容易且无创伤。此外,肾功能显著影响其他器官的年龄相关疾病,包括认知障碍。这些因素使肾脏成为研究器官特异性衰老的优秀模型。而以前的研究没有将转录变异与蛋白质水平的变化联系起来,但蛋白质水平的变化可能与生理衰老更相关。为了更好地理解这些变化,研究人员测量了不同年龄的基因多样性小鼠的mRNA和蛋白质水平。观察到不同年龄层面小鼠的mRNA和蛋白质水平显著变化。mRNA和蛋白的变化与免疫浸润增加和线粒体功能下降有关。蛋白质显示了更大程度的变化,并揭示了一系列广泛的生物过程的变化,包括独特的肾脏器官特定的老化。最重要的是,研究人员观察到在mRNA没有相应变化的情况下,蛋白质发生了功能上重要的年龄相关变化。作者的发现表明,mRNA图谱单独提供了肾脏中分子衰老的不完整的图像,并且检测蛋白质的变化对于理解没有转录调控的衰老过程是必要的。



案例三:The susceptibility ofLymantria disparlarvae toBeauveria bassiana

under Cd stress: A multi-omics study

发表期刊:Environmental Pollution(IF=8.071)

发表时间:2021.02

技术手段:转录组、蛋白质组

研究内容:

重金属胁迫下昆虫对昆虫病原微生物的敏感性及其调控机制尚不清楚。本研究旨在研究在3.248或44.473 mg Cd/kg镉胁迫下舞毒蛾幼虫对球孢白僵菌(beauveria bassianavia)的敏感性,并结合转录组和蛋白质组分析揭示Cd对球孢白僵菌敏感性的潜在分子机制。结果表明,镉胁迫前暴露增加了舞毒蛾幼虫对球孢白僵菌的敏感性。Cd暴露与球孢白僵菌之间存在显著的叠加效应对球孢白僵菌感染对幼虫死亡率有影响。在低浓度和高浓度Cd胁迫下,分别鉴定出138个和899个差异表达基因(DEGs), 514个和840个差异表达蛋白(DEPs)。Cd在转录水平上诱导的免疫毒性效应呈负剂量-反应方式增加,低Cd浓度下无免疫相关DEGs产生,高Cd浓度下有大量免疫相关DEGs下调。与此相反,在低浓度或高浓度Cd处理下,Toll和Imd信号通路在蛋白水平上可能受到抑制或刺激。在转录和翻译水平上对外源生物降解相关通路的分析表明,舞毒蛾幼虫对低水平Cd胁迫具有有效的内稳态调控机制,但在高水平Cd胁迫下,其外源生物降解能力降低。总之,这些发现表明,Cd污染促进了基于微生物的生物防治效果,并揭示了重金属暴露影响昆虫对致病性疾病易感性的分子调控网络。



案例四:Apoptosis-inducing activity of synthetic hydrocarbon-stapled peptides in H358 cancer cells expressing KRAS G12C

发表期刊:Acta Pharmaceutica Sinica B(IF=11.413)

发表时间:2021.06

技术手段:转录组、蛋白质组

研究内容:

肺癌是全球癌症死亡的主要原因,对人类生命和健康构成严重威胁。非小细胞肺癌(NSCLC)是最常见的恶性肿瘤,占所有肺癌亚型的80%。除了其他突变(如KRASG12V/D),这些突变也对NSCLC的发生至关重要外,KRASG12Cgene突变是NSCLC发生的重要驱动力,约占NSCLC患者的14%。然而,目前针对krasg12c突变的治疗药物还很少。作者合成了更短、更稳定的烃类固定肽3,具有较低的KRASG12C binding亲和力,并具有相同的抗肿瘤作用,基于螺旋肽模拟SAH-SOS1A。通过阻断kras介导的RAF/MEK/ERK信号通路,有效诱导G2/M阻滞和凋亡,抑制了kras突变肺癌细胞的生长,从基因组学和蛋白质组学角度得到了验证。peptide3还表现出较强的抗胰蛋白酶和胰凝乳蛋白酶的能力,以及良好的血浆稳定性和人肝脏微粒体代谢稳定性。总的来说,peptide3保留了与SAH-SOS1A相当的抗肿瘤活性,并提高了稳定性和亲和力,优于SAH-SOS1A。为KRASG12Cpeptide inhibitors的抗癌治疗提供了一种结构优化的方法。




案例五:Integrated nuclear proteomics and transcriptomics identifies S100A4

as a therapeutic target in acute myeloid leukemia

发表期刊:Leukemia(IF=11.528)

发表时间:2019.09

技术手段:转录组、蛋白质组

研究内容:

蛋白质的不适当定位会干扰正常的细胞功能并推动肿瘤的发展。为了了解这如何导致急性髓性白血病(AML)的发展,研究者将AML母细胞的核蛋白质组和转录组与正常人CD34(+) 细胞进行了比较。蛋白质组分析确定了显著影响转录调控的网络和过程,包括11种转录因子的错误表达,其中7种蛋白质以前与AML无关。转录组分析确定了40个转录因子的变化,但这些都不能预测蛋白质水平的变化。与正常 CD34(+) 细胞核(以前未涉及 AML)相比,AML细胞核中差异表达最高的蛋白质是 S100A4。在一个扩展队列中,我们发现核 S100A4 的过度表达在 AML 中非常普遍(83%;20/24 AML患者)。在AML细胞系中敲除S100A4强烈影响它们的存活,而正常的造血干祖细胞不受影响。这些数据是对AML中核蛋白质组的首次分析,并确定了转录因子表达或转录调控的变化,这些变化在mRNA水平上是看不到的。这些数据还表明S100A4对 AML的存活至关重要,可能是AML的治疗靶点。


 

结语
转录组学和蛋白组学都是系统研究有机体生理状态的常用工具。当然,没有一种工具可以提供完全的覆盖和绝对的精确度。研究的核心不单是找出mRNA和蛋白质之间一对一的关系,更是要通过转录组和蛋白组的整合分析区别出mRNA和蛋白质的一致性或不一致性。转录组学或蛋白组学数据通常只能体现调节系统和分解作用平衡态的净效应,实际上两者的不一致性只是合成与降解两种过程交替的一种反映。mRNA和蛋白质之间的一致性一定程度上可以验证测序数据的可信度,而两者之间的差异往往透露出转录后干涉情况,暗示更多的生物学意义和调控机制。

 

相关阅读5000字让你了解外泌体蛋白质组 | 蛋白专题
建议收藏!25个常用蛋白质组学数据库都在这了!| 蛋白专题
干货收藏!蛋白质组学投哪些期刊?| 蛋白专题
基于质谱的单细胞蛋白质组研究进展|蛋白质组学

点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存