查看原文
其他

Post-GWAS时代药物靶标孟德尔随机 — 藏在基因的随机双盲试验两次登顶Nature

MNR 生信人 2023-06-05

前期已经给大家介绍了全基因组关联性分析(GWAS),孟德尔随机化分析(MR),没想到2023年才过去一个月,MR分析就已经两次登顶Nature

18 January 2023, https://doi.org/10.1038/s41586-022-05420-7


18 January 2023, https://doi.org/10.1038/s41586-022-05473-8


作为一个GWAS研究资深爱好者,本着大力出奇迹的原则,小编详尽的研究了近期的高分文章,毕竟一个可以通过挖掘数据就能蹭上的大热点,谁能不爱!终于,小编从中归纳总结出了“高分秘籍”,迫不及待地和大家分享~


另外,作为Post-GWAS的一项重要工作,共定位分析的详细介绍,收录在今天的第三篇推文,感兴趣的小伙伴可以去一探究竟。


今天分享的文章,于2023/1 发表在Society of Biological Psychiatry(IF 12.8/Q1),题目为“循环蛋白影响精神疾病:孟德尔随机化研究(Circulating Proteins Influencing Psychiatric Disease: A Mendelian Randomization Study )”。


药靶标孟德尔联合共定位分析

立即扫码上车


大多数药物会通过改变人体内蛋白质的水平来调节疾病性状,蛋白质是其直接靶点。因此,构建蛋白质和人类疾病之间的因果关系,是药物研发的核心问题之一。随机对照试验是构建药物(蛋白质靶点)和疾病之间关系的黄金法则。但是其成本昂贵,耗时费力,然而,药物研发的成功率却不断下降,超过50%的药物没有药效,25%的药物副作用过大;然而这些药物却都已经投入了昂贵的第三和第四期的随机对照试验。因此,有效的早期药物靶点的筛选系统对降低药物研发成本非常重要。


MR的核心是运用遗传学数据作为桥梁,来探索暴露和结局之间的因果关系,一直被称为“大自然创造的随机双盲试验”。通过MR分析,可以很好的预测药物随机对照试验的结果,进行药物靶点的早期系统性筛选。并且,有孟德尔随机化筛查证据支持的药物靶点,其最终转化为上市药物的成功率有非常显著的提高。


今天分享的文章中,作者利用已有的大规模蛋白质组学研究和GWAS荟萃数据,揭示了10种复杂精神疾病中的7种可能的蛋白质与疾病的关联。作者确定了可能影响几种疾病(如TIMP4和ESAM)风险的强候选靶点。此外,作者发现ERLEC1对精神分裂症的潜在因果效应可能是通过选择性剪接获得的。这些发现将促进对循环蛋白在精神疾病中的作用的探索,并指导疾病相关生物标志物的鉴定和新型药物的开发。


以下是原文~


背景

据估计,精神疾病者占全球残疾疾病负担的7%。目前对大多数精神疾病的治疗是有限的,因此,迫切需要新的治疗方式。循环蛋白可以在外周血中获取并测量,提供了治疗的早期参考,可能是影响这些疾病的风险的因素和有利的干预靶点。

关于精神疾病循环蛋白的随机对照试验难以实施,而观察性研究可能存在偏差和反向因果关系。通过孟德尔随机化分析(MR)研究精神疾病中的循环蛋白作用,可以减少由于混淆和反向因果关系造成的偏倚。

最近在基于大样本的与循环蛋白水平相关的遗传变异,即蛋白质数量性状位点(pQTLs)的研究,为识别与疾病结果有因果关系的靶蛋白提供了机会。MR已被用于评估循环生物标志物对一系列复杂疾病的因果影响,包括冠状动脉疾病、缺血性中风和COVID-19结局等。

在这项研究中,作者使用了6项大规模的蛋白质组学研究和针对10种精神疾病的最大的全基因组关联研究生物精神病学(GWASs)进行了两个样本MR,以确定影响这些精神疾病风险的循环蛋白。然后,通过系统筛选水平多向效应,进行共定位分析,并通过蛋白质改变变体检查其他因果途径,验证了MR假设研究结果强调了循环蛋白质可能在精神疾病风险中起因果作用。

方法

1.蛋白组学研究数据
来自6项大规模评估了循环蛋白水平与遗传变异之间的关系全基因组蛋白质组学研究的GWAS荟萃分析数据。

2.精神疾病数据
来自精神基因组学联盟(PGC)进行的大规模GWASs荟萃分析数据。确定了与10种复杂精神疾病的遗传关联:注意力缺陷/多动障碍,神经性厌食症,焦虑症,自闭症谱系障碍,双相情感障碍,重度抑郁症,强迫症,创伤后应激障碍,精神分裂症,图雷特综合征。

3.双样本的MR分析
双样本MR以分析蛋白质组学研究中所有循环蛋白对这10种精神疾病的潜在因果影响。在所分析的蛋白质的cis-pQTL (s)中鉴定了遗传变异或其连锁不平衡(LD)代理作为工具变量(IVs)。这些工具变量是位于相应蛋白质编码基因转录起始位点1 Mb内的遗传变异,并与测量的蛋白质水平表现出全基因组显著相关性(p< 5*10-8)。

对于每种蛋白质,FHS和IMPROVE、AGES和KORA F4研究提供了1个在所有相关单核苷酸多态性(SNPs)中p值最先导cis-pQTL。同一蛋白质的cis-pQTL可能不同,或者可能具有不一致的关联量。因此,作者在每个蛋白质组学研究中分别对每个SOMAmer/抗体结合蛋白进行MR,并对结果进行比较。对于精神疾病的每一种GWAS,当汇总统计中不存在先导cis-pQTL时,用LD( r 2 > 0.8)找到它的代理。

使用Two Sample MR R包进行了MR分析。每种蛋白质对每种精神疾病的潜在因果影响通过Wald比值检验和逆方差加权比值检验进行评估,对p值进行了Benjamini-Hochberg校正。对于至少有3种工具变量的蛋白质,使用加权中位数、惩罚加权中位数和加权模式方法进行敏感性分析。F统计量来评估MR结果是否存在弱工具变量,并采用MR Steiger法来评估结果是否存在反向因果关系。

  • MR假设的验证
评估MR是否满足以下3个主要假设:1)工具变量应与暴露相关,即循环蛋白水平,据此,使用F统计量排除若工具变量;2)工具变量应仅通过其对循环蛋白水平的效应作用于结果,即精神疾病(无水平多效性)。据此,作者检查了目标蛋白所选择的cis-pQTL (s)是否同时是另一种疾病风险影响基因的顺式或反式pQTL、剪接QTL(sQTL)或表达QTL(eQTL),还搜索了PhenoScanner数据库中记录的显著SNP -性状关联以排除水平多效性;3)工具变量不与是与暴露-结果关联的任何混杂因素相关。据此,作者研究了与cis-pQTL显著相关的特征是否与相应的精神障碍已知相关。此外,使用至少3种工具变量对蛋白质进行MR-Egger回归。

  • 共定位分析
使用PWCoCo包进行了共定位分析,以评估与蛋白质水平和疾病结局的遗传关联是否由相同的SNP驱动,即在同一位点上的SNP可以通过单独的生物学机制影响蛋白质和结果,并且通过LD相互联系。

在具有显著性的蛋白质与疾病的关联中,将蛋白质分为3个目标组(图1)。一级靶标蛋白:后验概率PPH4>0.80,且不受任何已知水平多效性影响的具有强烈共定位证据的蛋白质。三级靶标蛋白:有证据表明不存在共定位或受潜在水平多效性影响的蛋白质。二级靶标蛋白:其余的蛋白质,包括那些没有评估共定位或水平多效性的蛋白质。

图1

4.SOMAmer/抗体结合效应的评估
由于SOMAmer或抗体在不同的蛋白质组学研究中可能针对不同的肽序列或蛋白质异构体,作者研究了这种潜在的SOMAmer/抗体结合效应。对于每个研究特异性的cis-pQTL,作者检查了它是否也是变异的蛋白质变体(无义变体、错义变体、外显子跳过替代剪接变体等)或与变异的蛋白质变体具有高度的连锁不平衡效应(r 2>0.8),并在不同的蛋白质组学研究中比较MR推断的蛋白质与疾病的相关性。cis- pQTL (s)与同一基因转录本的选择性剪接之间的显著关联可能指向剪接变异所赋予的因果效应。对于这些靶标,作者分别利用GTEx数据库中确定的先导全血cis-eQTLs和先导全血cis-sQTLs重复了MR和共定位分析,因为信使RNA (mRNA)丰度的测量对肽序列的变化不敏感。

结果

1.估计循环蛋白水平对精神疾病的潜在因果影响
MR分析确定了9种蛋白质与疾病的关联,且有强烈的共定位证据,不太可能受到水平多效性的影响(图2);确定了58个二级靶标和40个三级靶标,这些靶点需要额外的证据来验证(图1);通过基于抗体的蛋白质图谱在所有10个大脑区域检测到所有一级靶标蛋白质,但DrugBank中没有记录到针对这些蛋白质的药物或开发药物的计划,尽管已知与相应的疾病结局相关。

图2

2.一级靶标蛋白质和SOMAmer/抗体结合效应的评估
在一级靶标蛋白中,循环TIMP4和ESAM在3项蛋白质组学研究中复制了关联(图2),共定位分析证实了在每种蛋白质-疾病关系中存在单一共享因果(图3)。

循环ESAM也在与TIMP4相同的3个蛋白质组学研究中被描述。基因预测的循环ESAM水平每增加1个SD与精神分裂症的估计相关性在INTERVAL和AGES研究之间是一致的(图2),并显示了共定位的有力证据(图3)。然而,基于Fenland研究的MR得出了一个显著减弱的效应量(图2)。

FOLH1与双相情感障碍、OLA1与双相情感障碍、TMEM106B与重度抑郁症、NPTXR与精神分裂症之间的关联可以在两项蛋白质组学研究中得到复制(图2)。
FOLH1 cis-pQTL周围的遗传结构很复杂(图3),因为只有在PWCoCo进行条件和联合分析后,FOLH1共定位的证据才很强。

DNPH1与双相情感障碍和ACADVL与精神分裂症之间的关系在Fenland研究中被确定(图2),并得到了强有力的共定位证据的支持(图3),但这2种循环蛋白在其他蛋白质组学研究中没有被描述。

图3

3.ERLEC1蛋白异构体的潜在因果效应
循环的ERLEC1仅在INTERVAL研究中被描述,是精神分裂症的第2级靶标蛋白,被认为不太可能受到水平多效性的影响(图4A)。

利用ERLEC1基因的先导cis eQTL工具变量(rs143112696),作者发现ERLEC1的总体mRNA丰度与精神分裂症风险无关(图4A),没有证据表明ERLEC1 mRNA丰度和精神分裂症存在共定位(图4B)。相比之下,利用先导cis- sQTL工具变量(rs62137566),选择性剪接的比例与疾病结果显著相关(图4A),这种cis- sQTL与精神分裂症的遗传关联存在共定位证据(图4C),降低ERLEC1- 201与ERLEC1-202的比例可能对精神分裂症具有保护作用(图4D)。

图4

讨论

在本研究中,作者进行了MR研究,系统地筛选可能在此类疾病病因学中发挥作用的循环蛋白,从而为治疗开发提供了潜在可干预的靶点。作者确定了9种蛋白质与疾病的关联,涉及8种不太可能受到混杂效应或水平多效性影响的循环蛋白质。两种循环蛋白,TIMP4和ESAM,在3项蛋白质组学研究中被复制。

TIMP4和其他TIMP蛋白是基质金属蛋白酶抑制剂的重要抑制剂,后者负责维持突触功能和血脑屏障的通畅。基质金属蛋白酶抑制剂过表达或TIMP蛋白不足已广泛涉及各种复杂疾病,包括神经精神障碍。正如预期的那样,作者的结果提供了强有力的证据,表明增加循环TIMP4可以预防神经性厌食症、躁郁症和重度抑郁症,并提示它可以预防精神分裂症。这些结果支持TIMP4和其他基质金属蛋白酶抑制剂作为治疗开发的候选药物。

内皮细胞粘附分子ESAM促进血脑屏障的通透性,介导中性粒细胞外渗,并在内皮紧密连接和血小板上特异性表达。有人提出ESAM相关的早期免疫反应异常参与了精神分裂症的发病机制。作者发现循环ESAM水平的降低与精神分裂症风险的降低有关。然而,它已经在小鼠中被证明了,只有内皮紧密连接处的ESAM而不是血小板上的ESAM与中性粒细胞外渗有关。因此,有必要确定循环中ESAM水平的降低是否代表内皮紧密连接处功能ESAM数量的减少或增加,因为后者可能导致更有效的药物靶点。

内质网凝集素ERLEC1通过选择性结合不正确折叠的腔蛋白参与内质网质量控制,并参与转移细胞对缺氧和内质网应激的反应。作者发现降低ERLEC1-201与erlec1 -202的比例可以预防精神分裂症,而改变总体mRNA丰度似乎与疾病风险无关。虽然这两种剪接变体在大小和构象上有所不同,但基于Ensembl数据库,预测的甘露糖6-磷酸受体结构域和预测的蛋白质OS9样结构域可以在ERLEC1-202中被截断。考虑到ERLEC1的共定位证据弱于一级靶标蛋白,需要更多的研究来阐明这些剪接变异在精神分裂症发病机制中的作用,并探索干预方案。

脑靶向药物的另一个主要挑战是有效地穿过血脑屏障。在这里,TIMP4和ESAM都在血脑屏障中起着至关重要的调节作用,ERLEC1的年龄依赖差异基因表达也与血脑屏障有关。综上所述,这些循环蛋白可能指向有希望的药物靶点或作为预测性生物标志物。

思路借鉴

1.本篇文章是MR分析+pQTL共定位为核心,以pQTL发现为目标的多组学临床队列研究的主要有以下四个方向,通过挖掘公共数据库以及借鉴已经发表的研究的数据,就可以轻松借鉴啦!

  • 发现疾病的致病机制
①骨质疏松症和类风湿关节炎的复杂遗传结构:发现因果效应的途径。文章于2022/5 发表在Human Molecular Genetics(IF 5.1 /Q2)上。类风湿关节炎(RA)和骨质疏松症(OP)是两种复杂炎性疾病,但可能具有共同的遗传背景,作者旨在阐明RA和各种OP表型背后的遗传结构,GWAS统计数据,使用MR分析来检测因果关系,共定位分析以确定CRP和OP表型之间共享的遗传变异。共定位在CRP和OP之间建立了共享的基因组区域,包括GCKR和SERPINA1基因。富集分析发现这些基因具有相同分子功能,进一步的研究两者的共享分子途径,并为潜在治疗方法的提供见解。

https://doi.org/10.1093/hmg/ddac061

  • 发现新的药物靶点
①可用于药物治疗的全基因组孟德尔随机化确定了新冠肺炎的新机会,于2021年发表在Nature Medicine (IF 87.2 /Q1)。为了确定与COVID-19相关的治疗靶点,作者进行了MR分析,利用公共数据库数据,基于已批准或药物开发临床阶段药靶蛋白的转录组学和蛋白质组学数据,以顺式eQTL和QTL作为工具变量,联合共定位分析,发现与COVID-19住院共定位的药靶蛋白IL10RB和IFNAR2。全现象关联扫描(PWAS)和通路富集分析,进一步提示IFNAR2更有可能在COVID-19住院治疗中发挥作用。以IFNAR2和ACE2作为优先蛋白,进行药物试验,可能可以用于COVID-19的早期管理。


  • 发现药物的新治疗适应症
①血管紧张素转换酶对阿尔茨海默病而不是其他神经退行性疾病的保护作用的遗传证据,于 2022/8发表于Neurol Genet。血管紧张素转换酶(ACE)抑制剂是一种常用的处方药,用于治疗心力衰竭,高血压和慢性肾脏疾病。然而,遗传证据支持大脑ACE对阿尔茨海默病(AD)的保护作用。作者进行了MR联合共定位分析,分析ACE表达对欧洲血统人群AD风险的影响以及其是否是通过血压变化介导。结果提示遗传证据支持大脑ACE表达对AD的保护作用,但不支持欧洲血统人群的其他神经退行性结果。

Neurol Genet 2022;8:e200014. doi:10.1212/NXG.0000000000200014

  • 识别临床相关的生物标志物
①整合基因组策略确定sRAGE是肺功能的因果性和保护性生物标志物,于2022年发表在Chest(IF 11.3/Q1),作者将sRAGE pQTL变异与肺部特征的GWAS变异进行整合。将sRAGE pQTL变异体与肺特征GWAS变异体进行共定位,并使用sRAGE顺式-pQTL变异体进行孟德尔随机化,旨在分析sRAGE作为肺功能的因果性和保护性蛋白质生物标志物的效能。结果提示sRAGE对肺生理功能具有保护作用,AGER/sRAGE靶向干预轴可能对炎症相关肺部疾病的治疗和预防有益。

https://doi.org/10.1016/j.chest.2021.06.053

②除了MR分析+共定位这个核心思路以外,Post-GWAS还可以整合转录组、表观遗传等多组学数据对相关位点进行注释,筛选潜在功能位点并对候选位点做进一步的功能注释。如甲基化、组蛋白修饰、染色质开放程度等信息;预测遗传变异是否影响转录因子结合等;还可以加做体内外实验阐明风险位点的致病机制。如荧光素酶报告基因实验、ChIP-seq、染色体构象捕获技术、基因敲除等;此外,还可以联合自测数据,结合临床研究,影像学数据等。

总之,Post-GWAS绝对是数据挖掘爱好者的福音!小编非常看好MR联合共定位的思路,还苦于没有科研思路的小伙伴,请联系我们,一起捕获这颗“新秀”吧~

药靶标孟德尔联合共定位分析

立即扫码上车


END

不想错过每天的热点和技术

欢迎大家添加生信人为星标推荐 

撰稿  ▎MNR排版  ▎小北
最新思路推荐
肿瘤免疫

细胞死亡

单细胞

m6A专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存