药物开发和蛋白靶点的效应“虚拟试验”大热 — MR+QTL共定位点亮生信分析黑科技
全基因组关联性研究(GWAS)找到显著信号位点后,可以利用共定位分析解释显著信号位点如何影响表型。共定位的类型包括:1)GWAS和eQTL共定位;2)GWAS和sQTL共定位;3)GWAS和mQTL共定位;4)GWAS和pQTL共定位;如果使用孟德尔随机化(MR)+共定位分析,结果表明基因变异和蛋白表达水平都能与表型稳健相关,则能验证该蛋白与疾病有因果关系。这是因为,蛋白质表达可能会因为疾病而发生改变,但基因变异却不能。
孟德尔随机化加共定位分析
扫码立即咨询
pQTL是一种研究基因型-蛋白质关联的方法。以pQTL发现为目标的多组学临床队列研究的四个方向:01 发现疾病的致病机制;02 发现新的药物靶点;03 发现药物的新治疗适应症;04 识别临床相关的生物标志物。因为大多数药物都针对的是蛋白质而非基因!虽然许多药物是基于基因组研究发现开发的,但这些药物通常在临床阶段失败,因为它们无法为成功的治疗提供预期的结果。已有药物开发项目的数据评估显示,具有MR分析和pQTL共定位支持的蛋白靶点适应症对更有可能获得批准!
今天分享的文章,就利用了pQTL这一特质,于2022/12/12发表在Genome Medicine( IF 15,中科院一区)题目为“ 孟德尔随机化和遗传共定位推断了多组织蛋白质组对211种复杂疾病相关表型的影响(Mendelian randomization and genetic colocalization infer the efects of the multi-tissue proteome on 211 complex disease-related phenotypes)”。作者没有做任何的随机对照临床试验,却鉴定出了和200多个复杂疾病相关人类表型的蛋白。
当然,范围广,创新性的结果多就意味着原作者很难针对某一个或者某一种系统的疾病做详细的探讨!小编已经将文中具有创新价值和临床意义的结果标出,小编认为完全可以在这些结论的基础上,结合自己的研究方向和临床问题,推陈出新,做进一步的验证和研究~
也可以结合获批的首类药物的靶点,目前处于临床开发后期的药物靶点,在ChEMBL数据库中报告的具有蛋白结合测定的临床前阶段小分子的信息以及编码分泌或质膜蛋白的基因,这些蛋白形成单克隆抗体和其他生物治疗药物的潜在靶点,在具体的某一个研究领域做深入探讨!有了MR分析+pQTL共定位支持,蛋白靶点适应症对更有可能获得批准!非常具有临床价值!
文章末尾,小编给出了几个可以深入研究的方向,帮助大家打开思路!不要错过哦~
以下是原文,一起来学习吧~
一
背景
二
方法
三
结果
MR和共定位分析显示有33种脑脊液蛋白与37种表型相关(图2A和3A,FDR < 0.05)和强共定位证据(PP > 80%);13个血浆蛋白与18个表型相关(图2B和3B);5个脑蛋白与8种表型相关(图2C和3C);
在脑脊液(图2A),有两个蛋白与来自同一类别的多种表型相关:(1)MSP为与四种一般疾病[原发性硬化性胆管炎、克罗恩病、炎症性肠病(IBD)、溃疡性结肠炎(UC)]和三种生物学特征[受教育年限、用力肺活量(FVC)、第一1秒用力呼气量(FEV1)]呈负相关;(2)TNFSF15与克罗恩病、IBD和UC呈负相关。
在血浆中(图2B),6个蛋白质与同一类别的多个表型相关: (1) ADAMTS-5与两个生物性状(身高和FEV1)呈正相关,(2)凝血因子XI与两种疾病[深静脉血栓形成(DVT)和静脉栓塞± DVT]; (3) CREL1与两个生物性状(身高和体重)呈负相关; (4) KYMU与两个生物性状(FVC和FEV1)呈负相关; (5)溶菌酶与两种血液性状(高血压和高胆固醇)呈正相关;(6)WFKN2与两个生物学性状[身体质量指数(BMI)和体重]呈负相关。
在大脑中(图2C),蛋白CPNE1与多种生物学特性相关:它与绝经期年龄呈正相关,与海马体积呈负相关。
与先前的研究相比,本研究在脑脊液、血浆和大脑中的复制率分别为64%、91%和86% [研究结果没有重复之前在蛋白质和表型重叠后的三个大脑功能:智力的CPNE1,阿尔兹海默症(AD)的组织蛋白酶H和智力的ALT](表1);在脑脊液、血浆和大脑中分别发现了45%、4%和12%的新的蛋白-表型关联(表1)。
为了提高分析的检验效力,对脑脊液和血浆分别独立的进行了双样本的基于汇总数据的MR荟萃分析(图1B)鉴定了31个的脑脊液和215个血浆的额外pQTL,这导致了额外10个的脑脊液蛋白与13个人类表型关联(图 S3A),这些关联具有显著的MR结果和很强的共定位证据。还鉴定了12种与14种表型相关的额外血浆蛋白(图S3B)。
在脑脊液中(图 S3A),蛋白质IL-1受体1型(IL-1 sRI)与多种人类表型相关:与三种一般疾病(IBD、克罗恩病、UC)呈负相关,与哮喘呈正相关。在血浆(图S3B),触珠蛋白与两种血液特征(低密度脂蛋白和总胆固醇)呈负相关,而与身高呈正相关。在meta分析前后,没有一个蛋白表型对的的影响和大小相反(脑脊液中36对,血浆中4对)。 成功复制的医学理论:脑脊液IL-1 sRI增加哮喘风险,这一结果在初步分析中没有发现(因为meta分析将IL-1sRI pQTLp值的统计效力从1.09×10−18增加到了2.32 × 10−25)。IL-1受体拮抗剂已经在试验中被用于减轻动物模型中的哮喘症状;复制了血浆触珠蛋白与低密度脂蛋白和总胆固醇水平的降低有关的理论。此外,作者强调了血浆B7-H2(或ICOS配体)是类风湿性关节炎(RA)的危险因子,因为该结论已经在RA小鼠模型中得到验证,抗ICOS配体结构域有助于减轻疾病症状。
为了揭示更多的信号,提高MR分析的能力,作者使用了更宽松的阈值,扩展了MR分析,包括潜在的非多效性顺式和反式pQTL作为通过全基因组阈值的工具变量(p <5 × 10−8,F≥10,且与少于5种的蛋白相关)。通过新的阈值,在脑脊液、血浆和大脑中分别有169 、116、50个顺式和反式pQTL,用于WashU队列分析的MR和共定位分析(图4,表2)。 共鉴定出了58个与表型相关的58个脑脊液蛋白(图4A),44个表型上的32个血浆蛋白(图4B)和16种表型上的9个脑蛋白(图4C)具有显著的MR结果(FDR < 0.05)和很强的共定位证据(PP > 80%)。与之前的顺式pQTL分析类似,作者成功的复制了之前从血浆和大脑的研究中得到的结论(表2)。在这些新的分析中,总共分别有37、37和10对脑脊液、血浆和脑蛋白-表型对。然而,与之前的研究相比,由于工具变量较弱,一些蛋白质表型关联没有被复制(表2)。在包括顺式和反式全基因组显著pQTL后,还发现了额外的蛋白-表型对(分别为48个在脑脊液、12个在血浆和2个在大脑)(表2)。
对两个脑脊液和三个血浆队列进行了meta分析,得到了额外的313个脑脊液和711个血浆pQTL作为IVs。荟萃分析鉴定了额外的21个与17个表型相关的脑脊液蛋白(图S4A);15个与15个表型相关的血浆蛋白(图S4B)。在meta分析前后,没有一个蛋白表型对的影响和大小是相反的(脑脊液为70对,血浆3对)。 为了确定在初步的包括顺式pQTL的分析中缺少什么,作者比较了来自全研究和全基因组p值阈值的两个结果(图5)。鉴定了额外的45个脑脊液蛋白与42个表型的其他关联(图5A),28个血浆蛋白与35种表型关联(图5C)。 在脑脊液中(图5A),有三种蛋白质(DcR3, IL-1 sRII, prekkallikrein)与每个类别中的两种以上表型相关:(1) DcR3与4个生物学性状(FVC、FEV1、舒张压(DBP)、收缩压(SBP)、高血压)和高血压呈负相关,与BMI呈正相关。(2) IL-1 sRII与三种疾病(克罗恩病、IBD、UC)呈正相关,与哮喘呈负相关。(3)激肽前蛋白与三种疾病(静脉炎和血栓性静脉炎、深静脉血栓和肺栓塞±深静脉血栓)呈正相关。 在血浆中(图5B),两种蛋白质(b-内啡肽,GRN)与每一类中的多表型相关:(1)b-内啡肽与四种血液性状(HDL,总胆固醇,高胆固醇,甘油三酯)呈负相关,而与ER阴性乳腺癌呈正关;(2)前颗粒蛋白(GRN)与四种血液性状(血清肌酐,LDL,总胆固醇,高胆固醇)呈正相关,与HDL胆固醇呈负相关。GRN还与三种心血管疾病(冠心病、心肌梗死和心绞痛)呈正相关,与两种生物学性状(足跟骨密度和身高)呈负相关。 在大脑中(图5C),两个蛋白(PSP和OAS1)与两种以上的表型一致相关:(1)PSP与两种一般疾病(心绞痛和哮喘)和一种生物学性状(DBP)呈负相关;(2)OAS1与一种生物学性状(BMI)和一种神经系统疾病(AD)呈负相关。特别是,一些其他研究所报报道的一样,结果提示大脑OAS1对AD风险具有保护作用,OAS1是限制人诱导多能干细胞源性小胶质细胞促炎反应所必需的。
为了研究在相同的蛋白-表型对下,效应的方向是否在不同组织间一致,作者比较了显著的MR结果(FDR<0.05),利用荟萃分析的具有强共定位证据的全基因组显著的顺式和反式pQTL(PP <80%)。在多个组织中确定了15对配对,其中13对的MR值一致(图6)。两对配对显示了不一致的MR效应大小(图6A, B):(i)较高的CSF ART(或AGRP,刺鼠相关蛋白)与较高的尿钠水平相关,而较高的血浆ART与较低的相同性状水平相关;(ii)较高的脑脊液TXD12与ER阳性乳腺癌的较高风险相关,而较高的血浆TXD12水平与较低的相同表型风险相关。总体而言,发现一小部分组织依赖性蛋白对某些表型产生影响。
为了估计不同组织中表型的富集,比较了每个组织的MR分析的表型-类别比例(图7)。即使血浆蛋白MR结果显示了更高比例的血液性状,脑蛋白MR结果显示了更高比例的神经系统疾病,总体结果仍然提示在不同组织中表型类别的比例没有统计学显著性(图7A, C)。pQTL可能具有组织特异性,因此作者将每个组织的MR分析的疾病类别进一步分为仅顺式和附加反式的结果,以确定是否存在任何组织特异性表型富集(图7B, C)。结果提示,使用仅顺式分析的IV对疾病类别的比例进行的大脑组织两两比较,其p值大于来自比例检验的附加反式分析的p值。这一观察可能效力不足,但可以部分解释为先前的发现,即反式pQTL比顺式pQTL更具有组织特异性。
为了确定表型富集是否因样本量和蛋白质的差异而受到组织间统计功效的影响,作者首先计算了每个组织中pQTL鉴定的统计功效,然后通过只保留相同的蛋白质集来进行敏感性分析,以估计疾病富集情况。鉴于所有组织中都有相同的蛋白质,当前的研究对于基于顺式pQTL的MR分析具有良好的效力(图S1)。然而,对于基于反式pQTL的MR分析,CSF和脑的统计功效低于0.8(图S1),这表明在假设蛋白质在所有组织中都应该有至少一个反式pQTL的情况下,研究的统计功效不足以检测反式pQTL。此外,这一假设过于严格,因为不能确保由同一平台测量的来自不同组织的蛋白质具有相同的遗传结构。使用基于转录pQTL的MR结果进行的表型富集分析可能不足以提供可靠的估计。 即使在所有三种组织中使用相同的面板(SOMAscan 1305面板),但在每种组织中通过QC的不同蛋白质亚群可能会对下游疾病富集分析造成偏倚。为了纠正这一偏倚,作者仅使用所有三种组织中通过指控的411种蛋白质进行了富集分析(图S5)。即使神经系统疾病在脑中的比例也高于在血浆中的比例(脑:10%;血浆:3.3%),且血液性状在血浆中的比例高于其他两种组织(血浆:23%;CSF: 7.8%;脑:10%),然而,这些差异无统计学意义(脑脊液vs血浆p值= 0.2;血浆与脑p值= 0.952;脑脊液vs脑p值= 0.780)。这与目前的MR结果一致,包括所有组织中通过QC的蛋白,表明表型富集不受不同蛋白集的影响。
作者发现具有MR分析和共定位证据的蛋白质与其他研究中报道的可用于药物治疗的基因组重叠。为了评估MR分析中鉴定出的蛋白质的重叠,并且基于可用药的基因组层,作者进行了富集分析。在与研究表型相关的蛋白质中,CSF(图S6A)、血浆(图S6B)和脑(图S6C)中的蛋白质分别有86.3%(69/80)、82.7%(43/52)和66.7%(6/9)与前三个可用药基因组层相交。这些重叠蛋白与7个、6个和4个独特的表型分类有关。
最后,使用荟萃分析的全基因组显著的顺式和反式pQTL将推断结果与两个药物数据库连接起来,以使已知的药物用于表型。利用DrugBank数据库用药物确定蛋白质靶点(由UniProt和ChEMBL数据库管理,以进一步从适应证信息中保留最大临床试验阶段为“4”,并且无副作用),在CSF、血浆和脑中分别确定了两种、三种和一种蛋白质,它们与一种疾病相关表型的至少一种药物相关(图8,图S7、S8)。 对于CSF蛋白作为靶点(图8A),根据MR分析的阳性估计值,两种药物可作为抑制剂。对于来自血浆(图8B)和大脑(图8C)的蛋白质,分别有两种和两种药物被预测为激活剂,而分别有两种和一种被推断为抑制剂。例如,卡维地洛可靶向血浆N端的前BNP以降低SBP。脑脊液TSG-6可作为乙酰水杨酸治疗视网膜脱离的靶点。脑CPNE1被发现是一种名为茶碱的小分子药物的靶点,并可能调节海马体积的大小和绝经年龄。
四
讨论与小结
五
思路扩展
CSF中的蛋白质水平与几种自身免疫性疾病(如克罗恩病、UC、IBD)相关。脑脊液蛋白可能在某些自身免疫性疾病的发病机制中发挥作用。(1)克罗恩病对神经系统有多种影响,包括脊髓病、可逆性后部脑病综合征和慢性炎性脱髓鞘性多发性神经病。(2)溃疡性结肠炎(UC),在周围神经障碍和脑血管障碍患者中更多见。 血浆的蛋白质与多种非血液性状相关(例如癌症:D12结肠直肠肛门和肛管良性肿瘤或ER -乳腺癌或ER+乳腺癌或肺癌;神经学特征:抑郁症状/焦虑;个性:儿童期智力)。 脑蛋白可能在一些非中枢神经系统(CNS)疾病的发病机制中发挥作用。例如乳腺癌;乳糜泻,心绞痛。
END
不想错过每天的热点和技术欢迎大家添加生信人为星标推荐最新思路推荐