科研 | Microbiome：一种以半肽为中心的宏蛋白质组学挖掘方法及其在捕获肠道微生物蛋白质水解特征的潜在应用

微科盟大陈子代谢组metabolome 2022-09-23

点击蓝字↑↑↑“微科享”，轻松关注不迷路

编译：微科盟大陈子，编辑：微科盟Tracy、江舜尧。

微科盟原创微文，欢迎转发转载。

导读蛋白酶解调控能通过快速降解错误折叠蛋白和激活调节蛋白，使肠道微生物快速响应肠道环境的动态变化，但在炎症性肠病( IBD，包括克罗恩病(CD)和溃疡性结肠炎(UC))等复杂疾病状态下肠道微生物蛋白水解酶标志的改变尚未研究。宏蛋白质组学具有研究肠道微生物蛋白质水解的潜力，因为半胰蛋白酶肽主要来源于内源性蛋白质水解。我们开发了一种以半胰蛋白酶肽为中心的蛋白质组学方法，以获得人类肠道微生物的蛋白质水解特征。该方法采用了综合的宏数据库、两步多引擎数据库搜索和高分辨率质谱数据集提高了半肽识别的置信度，并通过分析人肠道菌群的蛋白酶解特征验证了该方法的有效性。我们利用两个已发表的大范围宏蛋白质组学数据集，包含623个宏蛋白质组学分别来自447个IBD患者和健康个体的粪便和176个粘膜管腔界面(MLI)样本，我们在分类、功能和裂解位点基序水平上获得了肠道微生物蛋白水解改变的潜在特征。功能改变主要涉及微生物碳水化合物的运输代谢、氧化应激、细胞运动、蛋白质合成和成熟等。CD和UC的变异微生物蛋白水解特征主要发生在回肠末端和降结肠。微生物蛋白水解模式与β多样性的相关性较低，与微生物蛋白酶和伴侣水平的相关性中等。人类蛋白酶抑制剂和免疫球蛋白主要与肠道微生物蛋白水解模式负相关，可能是由于这些宿主因子对肠道微生物蛋白水解事件的抑制作用。这种以半胰蛋白酶肽为中心的挖掘策略提供了一种无标记的方法来发现人肠道菌群的蛋白酶解特征。它也可以捕获体外蛋白水解的特征，以促进评价和优化实验条件。我们的发现在微生物种类和蛋白质丰度之外提供了IBD菌群变化的另一个层面的信息。

论文ID

原名：A semi-tryptic peptide centric metaproteomic mining approach and its potential utility in capturing signatures of gut microbial proteolysis译名：一种以半肽为中心的宏蛋白质组学挖掘方法及其在捕获肠道微生物蛋白质水解特征方面的潜在应用
期刊：Microbiome
IF：11.607发表时间：2021.01通讯作者：严志祥、李啸峰、单鸿、燕茹
通讯作者单位：中山大学附属第五医院，澳门大学

实验设计

实验结果

1. 宏蛋白质组半胰蛋白酶肽表征
1.1半胰蛋白酶肽的高可信鉴定
利用两个已发表的大范围宏蛋白质组学数据集，包括447个粪便(PXD008675)和176个粘膜管腔界面(MLI)样本(PXD007819)，我们已经开发了一套高效和高可信度的一种以半胰蛋白酶解肽为核心的宏蛋白质组挖掘方法(图1a)，这些半胰蛋白酶肽代表了肠道微生物组潜在的蛋白水解特征。这两个数据库的信息都是利用高分辨率的MS/MS生成的，具有一个较大的序列空间与低FDR值，可更好地鉴定半胰蛋白酶肽。宏蛋白质组挖掘的第一个关键步骤是数据库构建。部分宏蛋白质组学研究通过每个样品进行宏基因组测序，使用了昂贵和耗时的样品特异性蛋白数据库。宏基因组匹配数据库也可能受到DNA提取和生物信息学问题等问题的限制。此外，由于样本的异质性，宏基因组测序中使用的样本分配量可能与宏蛋白质组学中使用的不完全相同。因此，我们从公共信息库(包括UniProtKB、NCBI、CGR和IGC等不依赖培养的信息源)中收集微生物序列，以增加微生物分类覆盖率，促进交叉研究比较。我们将微生物序列与人类序列以及最常见膳食生物的全面食品数据库结合起来，总共得到130975891条非冗余序列。利用MLI数据集，我们在多个36核心服务器(安装了192G RAM)中，比较了不同的商业软件( Proteome Discoverer，PEAKS，Protein Pilot，Byonic )和开源软件包( MaxQuant，MSFragger，pFind)的大型数据库对半胰蛋白酶搜索情况。Proteome Discoverer、Byonic、MaxQuant、pFind和ProteinPilot (卡在Progroup步骤上2周以上)在1个月内没有完成搜索，MSFragger以失忆错误崩溃。只有PEAKS在1个月内完成了分析，并选择使用一个在2周内完成数据库搜索的156核集群进行下一步的高吞吐量分析。其他超快的宏蛋白质组学搜索引擎，如ComPIL和ProteoStorm也可以用于第一步大型数据库搜索。我们对粪便、升结肠( AsC )、降结肠( DeC )和回肠末端( TI ) MLI宏蛋白质组进行搜索，分别得到12828005、3133023、2948562和2757990个MS/MS谱图信息；在第一步大数据库检索中，我们使用PEAKS (1% FDR)确定肽谱匹配(PSMs)有3804903个(29.66%)、2035847个(64.98%)、1917761个(65.04%)和1808732个(65.58%)。为了提高大序列空间宏蛋白质组学分析的灵敏度，我们采用了两步多引擎数据库策略，通过将数据库的大小减少到传统蛋白质组学分析的大小(粪便宏蛋白质组99011个序列，AsC宏蛋白质组136746个序列，DeC宏蛋白质组146198个序列，TI MLI宏蛋白质组157403个序列)，这有助于半胰蛋白的宏蛋白质组学搜索。此外，我们采用严格的标准来增加肽识别的置信度，结合三个常用软件包。在第一步中与至少一种肽确定的蛋白质保留到使用MaxQuant、PEAKS和pFind进行第二轮搜索。我们只考虑了同时被MaxQuant (5% local FDR)、PEAKS DB (1% global FDR)和pFind (1% global FDR)鉴定的肽段。这些软件包使用不同的算法进行峰值检测、共片段肽识别和FDR计算( MaxQuant和pFind采用目标-诱饵策略，PEASK-DB采用诱饵融合方式)，从而显著增加肽识别的置信度。具体来说，我们选择了PEAKS、pFind和MaxQuant来增加半肽识别的置信度，因为这些引擎分别具有de novo排序、open-search和match-between-runs功能。由于序列数据库中缺失的肽段可能被误分配到数据库中存在的序列，因此采用de novo测序来减少假阳性鉴定。open-search用于减少假阳性鉴定，因为在传统数据库搜索中不考虑修饰时，修饰肽可能被分配到错误的序列。最后，采用交叉指派程序(在MaxQuant称为“match between runs”)用于恢复MS/MS丢失的MS1信号。我们仅保留3种软件鉴定的肽段进行下一步分析，结果在粪便、AsC、DeC和TI宏蛋白组中分别鉴定出125494、103170、106243和92784个肽段(附录1：表S1 - S16 )，其中108784 ( 86.68 % )、76325 ( 73.97 % )、77341 ( 72.79 % )和65002 ( 70.06 % )肽段被归属为微生物特有肽段(未被人类或食品序列共享，图1a)。我们使用UniPept，在粪便、AsC、DeC和TI 宏蛋白质组中分别得到分类和/或功能注释的微生物肽851.26 ( 78.25 %)、672.88 ( 88.16 %)、704.92 ( 91.14 %)和579.55 ( 89.16 %)。尽管前期宏蛋白质组学研究中频繁使用的IGC具有全面性，但在粪便、AsC、DeC和TI宏蛋白质组学中仅有11540 (10.61%)、9025 (11.82%)、9129 (11.80%)和7308 (11.24% TI)微生物肽被UniProt / NCBI / CGR捕获，这可能是因为UniProt / NCBI / CGR数据库在很大程度上是基于完整测序的单个微生物基因组的翻译，与肠道微生物宏基因组相比，其深度和质量显著提高。在所有鉴定的微生物肽中，粪便、AsC、DeC和TI宏蛋白组中有28525 (26.22%)、10650 (13.95%)、9357 (12.10%)和10614 (16.33%)肽分别为半胰蛋白酶 (附录1：表S1和S3-S5)。虽然我们采用MaxQaunt“match between runs”来增加LC - MS各选项间的传递识别，但超过75 %的样品中半胰蛋白酶肽的识别率小于0.05 %。我们没有考虑非胰蛋白酶肽，因为它们通常只占总识别肽的不到0.2%。然而，与在MaxQuant搜索半胰蛋白酶相比，非胰蛋白酶肽显著增加了数倍的搜索时间。我们在粪便、AsC、DeC和TI中分别鉴定出7969(6.35%)、14869(19.48%)、15128(14.24%)和15360(16.55%)人特异性肽，其中5104(64.05%)、5724(38.50%)、5254(34.73%)和6825(44.43%)为半胰蛋白酶肽(附加文件1:表S2和S6-S8)。基因本体(GO)分析表明，84.13%、79.97%、81.74%和80.18%的人半胰蛋白酶肽来自潜在的细胞外蛋白，而微生物半胰蛋白酶多肽分别只有1.16%、0.80%、0.73%和0.76%来自粪便、AsC、DeC和TI的细胞外蛋白。细胞外蛋白百分比越高，对肠管腔和黏膜蛋白酶越敏感，这就促成了人类蛋白质半胰蛋白肽比例越高。由于猪、牛等哺乳动物的食物资源与人类共享大量的序列，食物特有的半胰蛋白酶肽的数量可忽略不计，剔除人类共享的肽后，一般低于50个样品(因此不考虑进一步分析)。此外，食物蛋白在到达大肠(结肠)之前，可被胃蛋白酶、胰蛋白酶和小肠外肽酶广泛水解，因此食物衍生的半胰蛋白酶肽代表了整个消化系统的复杂蛋白水解事件。

图1 半肽中心宏蛋白质组学挖掘方法的工作流程和验证。将该方法应用于粪便和ML宏蛋白质组学的分析，并利用大肠杆菌热休克诱导的蛋白质组( a )对其进行验证，发现大肠杆菌蛋白质组中热应激诱导的不同生物学过程的蛋白水解特征( b，调整P < 0.05 )。
1.2 半胰蛋白酶肽的相对丰度和分布
我们首先通过归一化半肽基相对丰度来计算不同微生物和功能基团的半肽基(NRASP)的归一化为完全肽基相对丰度，来确定蛋白水解的相对程度。这个归一化步骤很重要，因为如果半胰蛋白酶肽和全胰蛋白酶肽的丰度按比例变化，一般表示蛋白水解程度没有变化。但在这种情况下，如果只对半胰蛋白酶肽进行比较，就会出现组间差异。图2显示了至少75%的447个粪便宏蛋白质组中所鉴定的20个主要分类亚群、35个主要生物过程和32个酶亚类的NRASP的总体分布（附加文件1：表S17-S19)。这里有两个主要门Firmicutes和Bacteroidetes、两个主要种Bacteroidia和Clostridia、两个主要目Bacteroidaceae和Bacteroides的NRASP中位数均在1左右和个体差异很小，表明相应的半胰蛋白肽相对丰度与全胰蛋白肽相当(图2a)。而NRASP中位数在Lachnospiraceae和Ruminococcaceae约为1.25，在罗氏菌属Roseburia、Prevotella以及两个种类丰富的Faecalibacterium prausnitzii和Prevotella copri分别为1.5。相比之下，Actinobacteria门和Bifidobacteriales(包括Bifidobacteriaceae)的NRASP中位数降低到约0.5。大多数生物过程NRASP的中位数也在1上下波动(图2b)。然而，异亮氨酸生物合成过程、缬氨酸生物合成过程、细菌鞭毛依赖性细胞运动、蛋白质转运、羧酸代谢、岩藻糖代谢和葡萄糖代谢的这些数值增加到1.75-2，脂肪酸代谢和L-苏氨酸代谢增加到2.5，而多糖代谢、碳水化合物转运和跨膜转运则降低到0.75左右，跨膜转运和代谢进一步减少到0.3。在酶水平上，参与丁酸代谢的3 -羟基丁酰-CoA脱氢酶NRASP最高(中位值> 3 )，其次是3-羟基酰基-CoA脱氢酶参与脂肪酸β氧化，甘氨酸C-乙酰转移酶参与L-苏氨酸降解，磷酸烯醇式丙酮酸羧激酶( ATP )参与糖异生，酮酸还原异构酶( NADP ( + ) )参与支链氨基酸( BCAA )生物合成，超氧化物歧化酶参与抗氧化胁迫耐受( NRASP中位数2-3，图2c )。

图2 447个粪样宏蛋白质组学中主要微生物类群和生物过程的半胰蛋白酶肽(NRASP、半胰蛋白酶肽丰度/全胰蛋白酶肽丰度)归一化相对丰度。不同种类的细菌(a)、生物过程(b)和酶(c)的特征按上升顺序排列。箱形图表示中位数(盒子中间的线)、第25和第75百分位数，须表示四分位数范围(IQR)的1.5倍，异常值以点表示。
1.3蛋白酶裂解基序
基于447个粪便蛋白组的半胰蛋白酶肽段，通过计算P6-P6＇位氨基酸的频率，我们进一步研究了微生物蛋白裂解位点基序(图3 )。总的来说，丙氨酸和缬氨酸是不同样品中P1位含量最高的氨基酸(图3a )。丙氨酸、缬氨酸、异亮氨酸和半胱氨酸在P1显著富集，丝氨酸在P1＇显著富集，亮氨酸在P2和P2＇显著富集。甘氨酸在P1显著降低，脯氨酸在P1、P3、P1＇和P2＇显著降低(图3b )。在P3＇-P6＇中富集的2种酸性氨基酸(天冬氨酸和谷氨酸)在P6 - P6＇中呈现相似的分布格局。两种碱性氨基酸(赖氨酸和精氨酸)的模式也相似，在P5和P6出现频率较高。

图3 447个粪样宏蛋白质组学中裂解微生物蛋白P6-P6＇位点的氨基酸保存和频率。（a）粪便宏蛋白质组中微生物蛋白裂解基序(P6-P6＇)的代表性网络标志。栈内符号的高度表示每个氨基酸在该位置的相对频率。（b）氨基酸频率在P6-P6＇位置。
2. 通过分析大肠杆菌热休克反应中的蛋白水解特征来验证该方法
我们利用已发表的大肠杆菌K12蛋白质组学数据集，通过分析热激诱导的蛋白质水解特征来验证我们的方法。结合三个搜索引擎，利用大型数据库和UniProt 大肠杆菌K12参考数据库分别鉴定了9937个肽段和14111个肽段(附加文件1：表S20和S21 )。两种方法鉴定的肽段减少29.6%反映了预期的灵敏度损失，因为大型数据库产生的序列比常规参考序列多10,000倍以上。在仅通过大肠杆菌参考数据库鉴定的4783个肽段中，60.3%的PEP值低于0.01,39.5%的PEP值低于0.001。与此相反，在大肠杆菌参考数据库中鉴定的14111个肽段中，83.7 %的多肽的PEP值小于0.01，61.6 %的多肽的PEP值小于0.001。仅由大肠杆菌参考数据库鉴定的多肽具有较高的PEP值，说明较低质量的PSMs更容易受到大数据库搜索的影响而降低敏感性。同时，需要指出的是，单个微生物蛋白质组与肠道宏蛋白质组存在显著差异。最近的一项研究表明，大型公共数据库和样本匹配的参考数据库为肠道宏蛋白质组研究提供了可比性的结果。所以我们的方法在肠道宏蛋白质组分析中不应有高敏感性的损失，且两种方法均鉴定出9328条(93.4 % )肽段(图1a )。我们对仅由大型数据库鉴定的609个肽段进行人工检查发现，大多数被识别的肽段具有高可信度(例如，注释良好的MS/MS光谱具有高肽序列覆盖)。这些肽段可归属于与大肠杆菌亲缘关系较近的细菌种类，如Escherichia albertii 或NCBI中保存的大肠杆菌序列( UniProt中没有)。由于细菌具有较高的突变频率和遗传多态性，UniProt 大肠杆菌K12参考数据库中并不包含所有样本的蛋白质序列。以上结果表明我们的方法具有较高的多肽识别精度。为了验证本方法的生物学结果，我们比较了185个生物过程的NRASP (作为蛋白水解调控的指标)，发现20个(10.8%)生物过程的NRASP在对照组和热应激组之间存在显著差异(FDR调整P < 0.05，图1b和附录1：表S22 )。由于热应激干扰蛋白质折叠，导致错误折叠的蛋白质堆积，需要重新折叠到正确的构象中。因此，我们发现在热胁迫下，蛋白质复性的NRASP升高，而蛋白质折叠的NRASP降低。我们观察到NRASP的甲基化水平随着热应激的增加而增加，这与最近发现的热休克条件下新转录mRNA-5-UTR内某些腺苷优先甲基化的结果相一致。此外，热应激组谷氨酰胺、蛋氨酸和赖氨酸生物合成过程的NRASP也增加。已有研究表明，谷氨酰胺合成可使Kc细胞热休克蛋白表达最大化。有趣的是，在热胁迫下，乙酰辅酶A生物合成过程的NRASP增加，而L-赖氨酸分解代谢过程的NRASP增加。总的来说，我们的方法证实了先前的发现，并可以为微生物蛋白水解调控提供新的见解。 3. 半胰蛋白酶肽与微生物组成、蛋白酶和伴侣分子相关
为了探讨肠道微生物群落结构与半胰蛋白酶肽的潜在相关性，我们将粪便微生物半胰蛋白酶肽LFQ强度的前3个主坐标(PCo1-PCo3)与使用Bray- Curtis距离计算的前3个微生物群落β-多样性主坐标进行关联(PCo1-PCo3，图4a)。在不同分类水平上，半胰蛋白酶肽LFQ强度(PCo1)与β-多样性( PCo2和PCo3 )的相关性较低(-0.40 <Spearman秩相关系数(R) < 0.42，P < 5.6e^-9，n= 272，图4c)。为了研究其与微生物蛋白酶的关系，我们利用了微生物蛋白酶/肽酶的转录丰度(图4b )，因为目前宏蛋白质组学方法的灵敏度有限，无法获得蛋白质水平丰度。微生物蛋白酶/肽酶转录组特征(PCo3)、种(PCo1)、属(PCo2)和科(PCo2)水平与半胰蛋白酶肽LFQ强度(PCo1)呈中度相关性，强于β-多样性(图4d，-0.55 < R < 0.54，P < 2.6e^-11，n =184)。但是，在较高的分类学水平上(阶、类和门)只有较低的相关性。在调节细胞过程中，伴侣蛋白和蛋白酶都对蛋白质错误折叠作出反应，并在蛋白质稳态中发挥重要作用。宏蛋白质组学蛋白含量高，可直接测定其蛋白水平。我们观察到，Bacteroides的DnaK、GroEL、ClpB和HtpG以及Faecalibacterium的DnaK和GroEL的LFQ强度与半胰蛋白酶肽LFQ模式的PCo1中度相关(0.58<R <0.69，P < 5.0e^-10，n = 447 )。

图4 肠道微生物蛋白水解模式、组成与蛋白酶表达的相关性分析。基于Bray - Curtis距离对宏基因组(a)和微生物蛋白酶/肽酶转录组(b)进行主坐标分析(PCoA)。采用基于宏基因组和转录组PCo1 - PCo3的Spearman s秩相关分别计算微生物蛋白水解酶特征(半肽LFQ的PCo1 - PCo3 )、微生物素组成( n = 272，c )和蛋白酶/肽酶表达( n = 184，d )之间的相关性。
4. 半胰蛋白酶肽与宿主蛋白酶抑制剂和免疫球蛋白的关联
除了微生物变量，我们还调查了宿主因子的参与。人类内源性蛋白酶抑制剂特异性存在于肠道中，我们在粪便宏蛋白质组中鉴定了4种人类蛋白酶抑制剂(serpin A1、A3、B1和B6)。Serpin A1、A3和B6与半胰蛋白酶肽LFQ强度( PCo1和PCo2 )呈负相关( 0.41 < R< 0.25，P < 7.9e^-8，n = 447 )。为了进一步研究宿主因素对肠道微生物蛋白水解的影响，我们还分析了肠道微生物蛋白水解模式与宿主免疫球蛋白的相关性。IgG1、IgG4、IgM与PCo1呈负相关(0.44 <R<0.25，P <8.4e^-8，n =447)，IgA与PCo2呈正相关( R = 0.33，P < 8.4e^-13，n = 447)。 5. 半胰蛋白酶肽分析揭示了改变微生物水解的潜在特征
使用NRASP作为蛋白质水解的相对程度指标，我们发现在粪便(图5)和MLI(图6和7)的宏蛋白质组在分类和功能分布以及切割基序方面存在显著的组间差异。在447个粪便宏蛋白质组中(包括204个CD、123个UC和120个对照样本)，20个主要分类亚组中有4个组间差异显著( Kruskal- Wallis和Dunn-Bonferroni检验，P < 0.05 ) (附文1：表S17 )：与对照组相比，CD中的Ruminococcaceae科和人Prevotella copri种的NRASP升高，UC中Faecalibacterium属和Faecalibacterium prausnitzii种的NRASP降低(图5a )。35个主要生物过程中有6个表现出显著的组间差异( P < 0.05 )(附件文件1：表S18 )：与对照组相比，CD组细菌鞭毛依赖性细胞运动、多糖分解代谢过程、厌氧核苷生物合成过程、果糖1，6 -二磷酸代谢过程NRASP升高，UC组翻译和糖酵解过程NRASP降低(图5b )。32个主要酶亚类中有4个表现出组间差异(附加文件1：表S19 )：与对照组相比，UC中超氧化物歧化酶、CD中蛋白合成GTPase、CD和UC中短链酰基辅酶A脱氢酶NRASP升高 (图5c )。相比之下，基于全胰蛋白酶肽的相对丰度，我们鉴定出81个主要的分类亚组、153个主要的生物学过程和195个主要的酶类(至少75 %的样品中存在)，是半胰蛋白酶肽的4 - 6倍。这表明由于目前宏蛋白质组学的分析平台和生物信息学工作流程的灵敏度有限，大量的蛋白质水解特征被掩盖了。利用全胰蛋白酶肽分析，34个分类组、63个生物过程和87个酶组表现出显著的组间差异( Kruskal- Wallis和Dunn-Bonferroni检验，P < 0.05 ) (附表1：S23 - S25 )。在大多数情况下，由全胰蛋白酶肽揭示的分类和功能改变与NRASP计算的不重叠。例如，在IBD中Firmicutes门、Ruminococcus属和Alistipes属的相对丰度显著降低，但其NRASP在组间没有差异(附图1：图S1a )。IBD中参与葡萄糖醛酸代谢过程和谷氨酸代谢过程的蛋白质相对丰度增加，而参与氮化合物代谢过程和无氧呼吸的蛋白质相对丰度降低(附图1：图S1b )。然而，这些生物过程在NRASP中没有表现出明显的组间差异。超氧化物歧化酶的NRASP在UC中显著升高(图5c )，但该酶的相对丰度在组间没有差异(附加文件1：图S1c )。我们还观察到，NRASP和全肽类比较均发现了一些分类学和功能上的改变，如Ruminococcaceae和Prevotella copri种的分类学类群，细菌型鞭毛依赖性细胞运动和多糖分解代谢过程的生物学过程，以及酶短链酰基辅酶A脱氢酶(图5ac和附件 1：图S1 )。综上所述，以半胰蛋白酶肽为中心的挖掘方法捕获了传统宏蛋白质组学工作流程中隐藏的不同层次的信息。粪便宏蛋白质组还揭示了微生物蛋白水解基序的全局性改变(图5d和附加文件1：表S26 )。在无监督的层次聚类中，CD和UC聚在一起(与对照分离)，有许多变化，如亮氨酸( P5和P5′)和色氨酸( P3和P4′)的频率增加，丙氨酸( P1′)、蛋氨酸( P1′和P2′)、天冬氨酸( P3 )和丝氨酸( P4 )的频率减少。然而，由于个体间的差异较大，在偏最小二乘判别分析(PLS-DA，图5e)中，组间的差异并不明显。我们还利用Bray- Curtis距离或基于Jaccard的相异性对半胰蛋白酶肽LFQ丰度进行主坐标分析( PCoA )，但也没有导致明显的群体分离(附图1：图S2 )。此外，我们还观察到人类蛋白质的酶切基序发生了变化(附文件1：图S3和表S27 )。类似于微生物酶切基序，CD和UC聚集在一起，并从人类蛋白酶切基序的控制中分离出来。在IBD的裂解位点周围，微生物蛋白和人类蛋白在某些基序位置可表现出相似或反向的改变趋势(附加文件1：图S4 )。例如，无论是微生物还是人类蛋白，IBD中的P5′中谷氨酸、组氨酸和三种芳香氨基酸(苯丙氨酸、色氨酸和酪氨酸)的频率都有所增加。在AsC、DeC和TI MLI 宏蛋白质组中，至少75 %的样本中共鉴定出57个、58个和51个生物学过程，其中7个( 12.28 % )、10个( 17.86 % )和10个( 19.61 % )生物学过程在NRASP (附件文件1：表S28-S30 )上显著组间差异。在AsC宏蛋白质组中，CD和/或UC调节翻译、碳水化合物转运、DNA修复、蛋白质分泌、前体代谢物和能量的生成以及羧酸代谢过程的NRASP显著增加(图6a )；在DeC宏蛋白组中，大多数的变化发生在UC，包括核糖体生物合成NRASP增加，萜类生物合成过程，de novo UMP生物合成过程，细胞分裂和翻译终止，以及糖异生NRASP减少(图6b )；相反，在TI宏蛋白组中，大部分改变发生在CD组，包括碳水化合物转运的NRASP增加、L-岩藻糖分解代谢过程、翻译终止和ATP合成偶联的质子转运以及转录、翻译、蛋白质折叠和碳水化合物代谢过程的NRASP减少(图6c )。微生物酶切基序也显示了MLI宏蛋白组的显著位置特异性改变(图7a-c )。与NRASP相似，DeC和TI中微生物酶切基序的差异大于AsC，其中41、57和32个氨基酸在特定位点上的频率具有显著的组间差异( P < 0.05，附表1：S31 - S33 )。在无监督的层次聚类中，CD组和UC组在升结肠聚在一起，与对照分离(图7a )；UC和对照在回肠末端聚在一起，与CD组分离(图7c )。有监督的PLS-DA还显示，在PC1轴上，UC组在降结肠部分与CD组和对照组分离，CD组在回肠末端与其他两组明显分离(图7df )，在MLI宏蛋白质组中也观察到了人类蛋白的变异酶切基序(附加文件1：图S5和表S34 - S36 )。与微生物蛋白的酶切基序类似，CD中人蛋白的酶切基序与回肠末端其他两组分离。微生物蛋白和人类蛋白在IBD中某些基序位置可表现出相似或反向的改变趋势(附录1：图S6 )。例如，在不同位置的MLI宏蛋白质组中，细菌和人的缬氨酸和亮氨酸( P1 )频率升高，芳香族氨基酸苯丙氨酸和酪氨酸( P1 )频率降低。

图5 IBDIBD粪便宏蛋白质组中不同水平微生物蛋白水解改变的特征。半胰蛋白酶肽( NRASP )的标准化相对丰度揭示了不同分类学水平(a)、不同生物学过程(b)和不同酶亚类(c)的微生物蛋白水解作用的变化。d IBD中微生物蛋白裂解位点周围氨基酸频率变化的层次聚类分析。E 采用偏最小二乘判别法(PLS-DA)分析裂解位点周围氨基酸频率。采用Kruskal-Wallis检验后的Dunn-Bonferroni事后分析检测三组(CD、Ctrl和UC)之间的显著差异。

图6 基于标准化半胰蛋白酶肽相对丰度(NRASP)的IBD黏膜-肠管界面元蛋白质组中不同肠道位置的微生物蛋白水解改变的特征。a升结肠，b降结肠，c回肠末端。采用Kruskal-Wallis检验后的Dunn-Bonferroni事后分析检测三组(CD、Ctrl和UC)之间的显著差异。

图7 IBD MLI蛋白组中肠道微生物蛋白水解基序的位置特异性改变。a和d升结肠，b和e降结肠，c和f回肠末端。采用聚类分析(a-c)和偏最小二乘判别分析(PLS-DA, d-f)对IBD裂解位点周围的氨基酸频率变化进行分析。热图中显示了组平均值。采用Kruskal-Wallis检验后的Dunn-Bonferroni事后分析检测三组(CD、Ctrl和UC)之间的显著差异。

讨论

我们的方法包括两步搜索、de novo测序、open-search和match between runs，以进行大规模的以半肽为中心的宏蛋白质组学挖掘。这些策略可以减少由于数据库不完整和肽段修改而产生的假阳性鉴定。首先我们利用低分辨率质谱/质谱生成的数据集对几个宏蛋白质组学样本进行了半胰蛋白酶搜索，这不可避免地增加了搜索空间，降低了识别置信度。在他们的研究中，在大型数据库中检索P.furiosus蛋白组时(包含6162582个序列)，仅80.2%的肽段注释为Pyrococcus furiosus序列。相比之下，我们的研究结合了多引擎数据库搜索高分辨率碎裂光谱的结果。在大肠杆菌蛋白质组分析中，经130975891条序列的数据库鉴定出的93.4%的肽段与传统参考数据库鉴定的肽段匹配。我们的研究是首次从公共数据集中发现肠道微生物蛋白水解特征，提供了分类和蛋白质丰度以外的另一层信息。这一分析的假设是基于相似的蛋白质水解程度导致相似的半胰蛋白酶肽相对丰度。以NRASP为指标，我们观察到447个粪便蛋白组中微生物半胰蛋白酶肽富集在脂肪酸、羧酸、葡萄糖和岩藻糖代谢过程，BCAA生物合成过程，蛋白质转运和细菌鞭毛依赖性细胞运动等多个生物学过程中，暗示它们经历了更广泛的蛋白水解调控。BCAAs (异亮氨酸、亮氨酸和缬氨酸)是细菌生理过程中的重要营养物质，BCAA的生物合成途径对许多细菌的最佳生长至关重要。在本研究中，我们发现粪便宏蛋白质组中BCAA生物合成过程的NRASP(1.75)高于非BCAA(~ 1)。较高的NRASP可能通过蛋白水解调控为细菌在BCAA生物合成中提供更大的适应性。粪便微生物群可作为肠道内微生物群的代表，但不能完全代表病变部位的黏膜相关微生物群。通过系统地表征来自不同位点的MLI宏蛋白质组，可以获得重要的互补知识，揭示了显著的位置特异性的微生物蛋白水解特征改变。有趣的是，我们的发现与胃肠道内IBD的临床症状一致，其中CD主要发生在回肠末端，UC主要发生在降结肠和直肠。在回肠末端，CD中转录、翻译和蛋白质折叠的NRASP降低，而翻译终止的NRASP升高。同样，在降结肠UC中，翻译的NRASP下降，翻译终止的NRASP升高。这些结果可能表明IBD中微生物蛋白合成和成熟的失调。目前，基于LC-MS宏蛋白质组学的分析深度与宏基因组学相比仍然很低。利用在线或离线分离的超深层宏蛋白质组学图谱可以更深入地了解肠道微生物的蛋白质水解，并可能提供结合分类和功能分析蛋白质水解特征的机会。在宿主因子方面，我们专注于人类蛋白酶抑制剂和免疫球蛋白。肠道蛋白酶活性在炎症性肠病中普遍升高，蛋白酶抑制被认为是治疗炎症性肠病的新策略。在我们的分析中，我们发现人类内源性蛋白酶抑制剂如Serpins A1在IBD(特别是CD)粪便和MLI样本中显著增加(附加文件1，图S7a)，这可能是因为蛋白酶活性的增加触发了更高水平的蛋白酶抑制剂的产生，以控制蛋白酶的破坏性质。有许多宿主机制通过进化来调节宿主微生物间的相互作用，其中研究最广泛的是免疫球蛋白A (IgA)。此外，最近的一项研究报道，IgG有选择性地识别小儿IBD中的病原体。改变的微生物组成和代谢产物可以触发介导IBD的黏膜免疫反应。在我们的研究中，我们确实观察到IBD中不同的免疫球蛋白显著增加(附加文件1:图S7b)。有趣的是，微生物蛋白水解与IgG和IgM呈负相关，而与IgA呈正相关。在大多数情况下，我们发现人类免疫球蛋白和蛋白酶抑制剂与微生物蛋白水解信号呈负相关，这表明这些宿主因子对肠道微生物蛋白水解事件的抑制作用。虽然我们在单独比较主要分类或功能组的蛋白质水解特征时观察到了几个组间的差异，但我们不能结合特定的分类和功能(宏基因组学研究中可以做到的)来进行蛋白质水解特征的差异分析。这是由于半胰蛋白酶肽的比例相对较低(占总鉴定肽的15 - 20%)，而且不同样本中半胰蛋白酶肽的缺失值较高(附加文件1:表S1和表S3)。虽然对已发表的宏基因组数据集的大规模数据挖掘已经揭示了许多新的生物学见解，但这种模式落后于宏蛋白质组学研究。如果实验条件得到很好的控制(例如快速样本存储和酶失活)，我们的半胰肽中心挖掘策略提供了一种无标记的方法来发现体内微生物蛋白水解事件的特征。虽然单个研究的结果可能不一致，但使用这种方法对多个发表的数据集进行宏分析可以增加结果的可信度。另一方面，异常高比例的半胰蛋白酶肽可能表明样品制备过程中存在体外蛋白水解。因此，该方法可用于评价和控制实验条件(例如通过微分离心富集微生物细胞)。除了肠道微生物蛋白水解特征，如果有合适的公共或样本匹配序列数据库，该方法还应探索植物和环境微生物组的蛋白水解调控。

结论

蛋白质水解调控是肠道微生物适应变化的肠道环境的重要策略。肠道微生物蛋白水解酶在炎症性肠病中的改变具有高度多样性和差异性，因此我们需要更广泛的研究来阐明其功能。我们的数据也支持宏蛋白质组学作为一种有价值的方法来更深层次研究肠道微生物区系和宿主微生物相互作用的调控规律。

原文链接：

https://pubmed.ncbi.nlm.nih.gov/33436102/

----------微科盟更多推荐----------

免费生信作图平台——生科云

长按左侧二维码

进入生科云

生科云所有分析工具可以免费使用，不收取任何直接或间接费用；您还可以在微信上联系微生态老师，随时获取免费的指导，帮助您解决分析时遇到的问题；专业的生信分析团队，持续添加、更新、优化生信云上的分析工具，集成多种生信分析流程，一键批量生成主流科研图，帮您节省时间，有更多的时间探究生物学意义。

----------微科盟精彩文章----------

科研 | Redox Biol：单克隆丙种球蛋白病发展为Waldenstrom巨球蛋白血症与脂质代谢的改变有关

科研 | 首都医科大学：研究者发现ASPP2基因敲除通过NF-κB途径促进DEN诱发小鼠肝癌的发生（国人佳作）

如果需要原文pdf，请扫描以下二维码，加助理获取

蛋白组科研学术群期待与您交流更多蛋白组学科研问题

（联系蛋白组学老师即可申请入群）。

了解更多蛋白组学知识，请关注下列二维码。

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

科研 | Microbiome：一种以半肽为中心的宏蛋白质组学挖掘方法及其在捕获肠道微生物蛋白质水解特征的潜在应用

科研 | Redox Biol：单克隆丙种球蛋白病发展为Waldenstrom巨球蛋白血症与脂质代谢的改变有关

科研 | 首都医科大学：研究者发现ASPP2基因敲除通过NF-κB途径促进DEN诱发小鼠肝癌的发生（国人佳作）

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

生成图片，分享到微信朋友圈

科研 | Microbiome：一种以半肽为中心的宏蛋白质组学挖掘方法及其在捕获肠道微生物蛋白质水解特征的潜在应用

科研 | Redox Biol：单克隆丙种球蛋白病发展为Waldenstrom巨球蛋白血症与脂质代谢的改变有关

科研 | 首都医科大学：研究者发现ASPP2基因敲除通过NF-κB途径促进DEN诱发小鼠肝癌的发生（国人佳作）

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡