Sci Adv︱刘延盛团队发现哺乳动物中蛋白质组的跨物种共进化与多样性
撰文︱徐玮
责编︱王思珍,方以一
编辑︱方以一
大规模测序组学技术的进步极大地推动了进化生物学研究,可以从遗传和基因表达的角度发掘生物多样性的分子驱动因素。然而,这仅能提供物种进化驱动分子的上游影响,前人在人与小鼠中发现的转录后修饰规律是否普遍适用于其他物种尚不清晰。作为基因功能的终端执行者,蛋白质水平和蛋白质修饰水平,在生物多样性和系统发生过程中发挥着重要作用。目前蛋白质组层面的针对个体内和个体间基因组变异的缓冲效应 (buffering effect) 已被报道[1],但缓冲效应是否作用于物种间的表型变异尚缺乏证据。2020年的一篇Nature文章利用Ribo-Seq技术分析了5种哺乳动物mRNA转录组和翻译组的共进化[2],但关于共进化的相关研究仍缺乏定量蛋白质组学的数据支持。另外,我们对物种间沿进化轴的转录组与蛋白质组多样性之间关系的理解仍然支离破碎,这也极大限制了对物种进化分子驱动拼图的完善。
2022年9月9号,耶鲁大学医学院刘延盛团队在Science Advances杂志发表了题为“Proteotype coevolution and quantitative diversity across 11 mammalian species”的研究。这项工作利用最新的基于质谱的蛋白质组DIA定量技术,首次比较分析11 种哺乳动物皮肤成纤维细胞中蛋白质组和磷酸化修饰组,在多组学层面(转录组、蛋白质组、磷酸化蛋白质组)系统评估其分子共进化过程,为了解生物多样性的分子驱动因素以其进化方向提供了重要线索。
这项研究选择11种常见哺乳动物物种,包含属于两个主要系统发育分支(EAOG、LAUT)的10个物种和1个外群物种,分离每个物种的原代皮肤成纤维细胞。选择相同细胞类型的策略可以避免不同组织来源产生的种内差异[3-5],有助于集中资源探索物种间蛋白质组学差异。作者通过RNA测序技术检测了11个物种皮肤成纤维细胞的转录组,通过 DIA-MS技术[6,7]检测了来自各物种的蛋白质组和磷酸化蛋白质组(图1A)。结果发现,与匹配的转录组数据相比,蛋白质组数据在EAOG和LAUT两个分支间的分离程度较小(图1B),说明蛋白质型(proteotype)变异程度大。组学虽然种内mRNA和蛋白的相关性较高,但跨物种相关性则较低(图1C-E),表明进化过程中存在广泛的蛋白质水平重塑。
图1 11种哺乳动物的转录组、蛋白质组和磷酸化蛋白质组的总体情况
(图源:Ba Q et al., Sci Adv, 2022)
为了消除系统发育历史的影响以分析mRNA和蛋白质在进化过程中的关联,作者进行了系统发育独立对比 (PIC) 分析[8],确认沿系统发育方向存在明显的转录组和蛋白质组的协同进化(图2A),而这种与mRNA的共进化在具有较少互作关系的蛋白质中更加明显(图2B)。mRNA和蛋白质水平的表达变异度分析结果表明,在进化过程中,必需基因和单倍体不足基因[9,10]及其蛋白产物的表达差异相对更小,而进化中新出现的基因产物、分泌蛋白、细胞表面蛋白和癌症生物标志物等蛋白类群[11-14]在物种间的稳定性则低得多(图2C)。总之,mRNA和蛋白质丰度的种间变异度为理解基因功能多样性提供了一个很有意思的进化角度。
图2 mRNA-蛋白质共进化和表达变异度相关的生物学特征
(图源:Ba Q et al., Sci Adv, 2022)
接下来,作者针对蛋白质表达的变异度进行了无偏差功能富集分析,发现虽然转录组和蛋白质组在不同物种之间总体上具有明显的共进化关系,但是对于某些生物学过程如与蛋白翻译相关的蛋白质来说,其mRNA水平在进化过程中经历较大变化而蛋白水平差异较小(图3A)。作者还进行了物种间和个体间差异的比较,发现大多数蛋白质的变化水平在个体之间和物种之间具有一致性,其他蛋白的变异水平则与功能有关,例如,与细胞分裂和RNA加工代谢相关的蛋白质在物种之间比在人类个体之间的变化更大(图3B),表明这些功能在哺乳动物进化中发挥着特别重要的作用。
图3 蛋白质表达变异度的无偏差功能富集分析
(图源:Ba Q et al., Sci Adv, 2022)
由于蛋白酶体水平在个体之间和物种之间都存在显著的保守性,作者接下来探究了两种主要的蛋白质清除机制(泛素-蛋白酶体系统、溶酶体介导的蛋白质降解系统)的种间稳定性,发现细胞内两种蛋白质清除机制之间的进化保守性存在显著差异:虽然泛素-蛋白酶体系统在哺乳动物中极为保守,但在哺乳动物进化过程中,溶酶体介导的蛋白质降解在谱系之间表现出明显差异(图4A-C)。与此结果一致,与蛋白酶体识别相关的K48连接的泛素化链水平具有更小的跨物种变异性,而与信号传导作用相关的K63泛素化链则变异性较大(图4D)。
图4 蛋白清除系统种间多样性分析
(图源:Ba Q et al., Sci Adv, 2022)
最后,作者在多种哺乳动物中进行了首次定量磷酸化蛋白质组学分析(图5A-E),构建了一个独立于蛋白质水平的共进化相关的磷酸化网络(图5F),发现了在去除蛋白质表达水平的影响后,众多蛋白质磷酸化位点表达变异度仍然很大,并显著倾向于协同进化。作者还评估了哺乳动物中的磷酸化位点基序(motif)和激酶(图5C,D)。发现进化保守的磷酸化修饰位点两端存在较多的精氨酸和较少的谷氨酸(图5E),结合该课题组的前期成果(Dev Cell,2021)[15],提示进化保守位点的磷酸化倾向于加速蛋白的更新速率(turnover)。
图5 哺乳动物物种间磷酸化蛋白质组分析
(图源:Ba Q et al., Sci Adv, 2022)
第一作者:巴乾(左)、通讯作者:刘延盛(右)
(照片提供自:巴乾/刘延盛团队)
作者简介(上下滑动阅读)
刘延盛,博士,耶鲁大学助理教授,研究组长,博士生导师。课题组主要从事新型蛋白质组学的技术研发、蛋白质翻译后修饰与更新、以及遗传疾病与癌症等方面的研究。其在耶鲁的研究组已在Nat Biotech、Dev Cell、Sci Adv、Nucleic Acids Res、Mol Syst Biol等杂志发表多篇研究论文,目前急招蛋白质组学数据分析与建模领域的相关优秀人才分析总结本课题组已有高质量数据集并撰写论文(联系方式:yansheng.liu@yale.edu,课题组网站https://www.yslproteomics.org/)。
巴乾,博士,研究员,研究组长,博士生导师,获上海市浦江人才、上海市卫生系统优青、上海市中医药高层次人才引领计划学科交叉人才、上海市医苑新星公共卫生领导者、上海市人才发展资金等支持。以通讯/第一作者在Sci Adv、Dev Cell、J Immunother Cancer、Clin Cancer Res、Oncogene等国际主流期刊发表论文30余篇,主持国家重点研发计划、基金委面上项目等4项国家级课题和多项上海市课题。拟任上海市中医医院实验中心主任。课题组长期从事中药资源的药理毒理学研究,聚焦采用系统多组学手段深度发掘药食资源的健康效应、作用机制与开发应用,长期招收生物医药和大数据分析领域的博士后、副研究员、技术员等人才(联系方式:qba@shsmu.edu.cn),欢迎志同道合者报名!【1】Curr Biol︱汪雪峰团队揭秘细胞丝状伪足贴附力为非连续节点状
【2】Cell Biosci︱邓新团队揭示多种病原菌三型分泌系统蛋白翻译延伸速率的统一规律
【3】PNAS︱王明伟/Vogt/杨德华/水雯箐团队深度解析重要药物靶标磷脂酰肌醇3激酶α的结构与功能
【4】Cell Rep Med︱石虎兵团队发现三阴性乳腺癌MEK靶向治疗的耐药机制
【5】Cell Reports︱叶升/严汉池/张小康/陈立功合作团队“单羧酸协同转运机制”研究取得突破性进展
【6】GUT︱纪泛扑/杨毅辉/Mindie H. Nguyen团队合作报道COVID-19大流行对肝硬化相关潜在寿命损失年的影响
【7】Small Methods︱来自鲨鱼的纳米抗体可有效中和多个新冠变异株
【8】NAR|王海龙团队发现组蛋白H2AK119位点赖氨酸巴豆酰化到泛素化的动态转换减弱复制压力诱导的转录-复制冲突
【9】J Cell Biochem︱陈柳莹/侯晓华/杨玲团队发现HSP90抑制剂阻止胆管细胞坏死性凋亡减轻原发性胆汁性胆管炎
参考文献(上下滑动阅读)
[1] Liu, Y. et al, On the Dependency of Cellular Protein Levels on mRNA Abundance. Cell 165, 535-550 (2016).
[2] Wang, Z. Y. et al, Transcriptome and translatome co-evolution in mammals. Nature 588, 642-647 (2020).
[3] C. Ding, et al, A cell-type-resolved liver proteome. Mol. Cell. Proteomics 15, 3190–3202 (2016).
[4] D. P. Nusinow, et al, Quantitative proteomics of the cancer cell line encyclopedia. Cell 180, 387–402.e16 (2020).
[5] S. Kim-Hellmuth, et al, Cell type-specific genetic regulation of gene expression across human tissues. Science 369, eaaz8528 (2020).
[6] J. D. Venable, et al, Automated approach for quantitative analysis of complex peptide mixtures from tandem mass spectra. Nat. Methods 1, 39–45 (2004).
[7] L. C. Gillet, et al, Targeted data extraction of the MS/MS spectra generated by data-independent acquisition: A new concept for consistent and accurate proteome analysis. Mol. Cell. Proteomics 11, O111.016717 (2012).
[8] T. Garland Jr., et al, Using the past to predict the present: Confidence intervals for regression equations in phylogenetic comparative methods. Am. Nat. 155, 346–364 (2000).
[9] W. H. Chen, et al, OGEE v2: An update of the online gene essentiality database with special focus on differentially essential genes in human cancer cell lines. Nucleic Acids Res. 45, D940–D944 (2017).
[10] H. A. Shihab, et al, HIPred: An integrative approach to predicting haploinsufficient genes. Bioinformatics 33, 1751–1757 (2017).
[11] B. J. Liebeskind, et al, Towards consensus gene ages. Genome Biol. Evol. 8, 1812–1823 (2016).
[12] M. Uhlén, et al, The human secretome. Science Signal. 12, eaaz0274 (2019).
[13] D. Bausch-Fluck, et al, The in silico human surfaceome. Proc. Natl. Acad. Sci. U.S.A. 115, E10988–E10997 (2018).
[14] M. Uhlén, et al, Proteomics. Tissue-based map of the human proteome. Science 347, 1260419 (2015).
[15] Wu, C. et al, Global and Site-Specific Effect of Phosphorylation on Protein Turnover. Developmental Cell 56, 111-124 (2021).
本文完