查看原文
其他

Nat Commun︱刘瑾/陈琳团队合作发布既能处理复杂相关水平多效性又能探究共同遗传病因的孟德尔随机化方法

张 晓,成 青 岚翰生命科学 2023-03-10

撰文︱张   晓,成   青责编︱王思珍,方以一编辑︱杨彬薇

孟德尔随机化mendelian randomization, MR)利用遗传变异作为工具变量instrument variables, IVs),使用来自全基因关联研究genome-wide association study, GWAS)的汇总统计数据来研究风险因子对结局变量的因果影响,已被广泛应用于研究复杂性状和疾病之间的关系,并在因果推断以及提供疾病预防与治疗策略等领域做出重大贡献。经典MR的关键性假设在于IVs仅通过风险因子(exposure)影响结局变量(outcome)。若IVs违反该假定,则出现水平多效性horizontal pleiotropy),即此时遗传变异具有除风险因子以外的途径影响结局变量。水平多效性包含两类:(1不相关水平多效性uncorrelated horizontal pleiotropy, UHP):水平多效性与风险因素独立;(2相关水平多效性correlated horizontal pleiotropy, CHP):遗传变异通过混淆因子confounders)同时影响风险因子与结局变量。水平多效性的存在会违反经典MR假设,导致因果效应估计产生偏差进而混淆因果推断。然而,越来越多实证研究与遗传理论表明,水平多效性是普遍存在的[1,2]。因而,设计对复杂水平多效性稳健的MR方法对于深入理解疾病产生机制有重要作用。


20221030日,新加坡国立大学刘瑾教授团队与芝加哥大学陈琳教授团队合作在《自然-通讯Nature Communications)上发表了题为“Mendelian randomization accounting for complex correlated horizontal pleiotropy while elucidating shared genetic etiology”的研究。该研究提出了一种基于MR 进行因果推断的新统计方法MR-CUE。该方法基于复杂且现实的UHPCHP影响下,得到有效的因果推断结论,并考虑利用相关的IVs来提升检验功效(power)。除此之外,MR-CUE可以识别具有有效CHP的遗传变异,并进行富集分析(enrichment analysis),以探究风险因素与结局变量的共享基因或途径(pathway)。MR-CUE的开源R代码可在 https://github.com/QingCheng0218/MR.CUE获取,该网页还提供了复现文中所有数值模拟结果的代码。



MR-CUE允许所有IVs包含UHP效应,并将IVs划分为两个集合:不受CHP影响的IVs(图1b左)与受CHP影响的IVs(图1b右)不失一般性,MR-CUE将带CHP效应的IVs对混淆因子的效应固定为1。而混淆因子对结局变量的效应α_k被分解为δγ_k+α ̃_k,第一部分为带CHP效应的IVs的共享混杂效应,与混淆因子对风险因子的效应γ_k成正比,第二部分α ̃_k与第一部分正交,用于捕捉IV对混淆因子的特有扰动如何影响结局变量。作者通过MCMC估计参数,并通过参数后验分布推断每个IV所在集合以及识别因果效应。


图1 经典MR与MR-CUE模型的因果图以及一个说明性示例

(图源:Cheng Q, et al., Nat Commun, 2022)


作者通过大量数值模拟比较了MR-CUE与基准方法[3-11]在不同情况下的表现差异。在考虑单个混杂因子和多个混杂因子的模拟实验以及基于实际数据的阴性和阳性对照实验中,MR-CUE均可控制第一类错误概率,并且在能够控制第一类错误概率的方法中,MR-CUE具有最高的检验功效。此外,模拟结果显示MR-CUE可以有效利用相关的IVs来提高检验功效,准确区分因果关系与反因果关系。


白介素6Interleukin 6, IL-6)是一种关键的炎症细胞因子,具有促炎和抗炎特性,在免疫相关过程和途径中起着重要作用[12]。可溶性IL-6受体soluble IL-6 receptor, sIL6R)是IL-6信号的负调控因子,已被认为影响许多复杂的性状和疾病,包括脂质水平(如高密度脂蛋白胆固醇,HDL-c)、COVID-19的严重程度和易感性、心脏病(如心房颤动)、自身免疫疾病(如克罗恩病)和其他疾病[12-13]。作者应用MR-CUE研究IL-627种复杂性状和疾病的因果效应。图2右图展示了由MR-CUE估计的IVs27个结局变量的所有染色体上的CHP效应强度,IL-6因果效应的估计显示在最右侧的列中。由LDSC[14]估计的27个性状之间的遗传相关性热图(图2a左图)显示,具有高遗传相关性的性状往往具有与IL-6相似或相互依赖的估计因果效应,如,COVID-19的严重程度和易感性,中风(AS),缺血性中风(AIS)和心栓塞性中风(CES),这些性状也具有相似的CHP效应。


作者进一步识别了带有CHP效应的IVs(置信水平0.8),并检测了1MB距离内的顺式基因(cis-genes)中与这些IVs显著相关的基因(p<0.05),以揭示IL-6和复杂性状之间的共享途径。图2b展示了与至少一个在多个性状中受CHP影响的IVs相关联的顺式基因的热图,颜色代表了相对应的IVs的最显著CHP效应强度。结果显示,有许多基因参与了相同的途径,并被确定为多种性状的IVs相关共享因子。这些共享基因可以部分解释图3a左图中观察到的27种性状之间的遗传相关性。具体来说,MR-CUE识别出位于染色体1q21区域的13个编码S100蛋白的S100基因。S100蛋白属于钙结合胞质蛋白家族,具有广泛的胞内和胞外功能。细胞外S100蛋白在免疫稳态、创伤后损伤和炎症的调节中起着至关重要的作用[15]S100蛋白通过与RAGETLR430受体的相互作用引发炎症,S100A12已被证明以剂量依赖性和时间依赖性的方式诱导促炎细胞因子IL-6IL-8的产生[15]。此外,S100蛋白对慢性炎症和自身炎症性疾病的发展有重要作用。MR-CUE还鉴定了角化包络通路、SPRR家族和IVL中的部分基因。这些基因和S100基因一起构成了表皮分化复合体,对表皮分化至关重要,是抵御外界攻击和保护身体不脱水的第一线防线。ATPase 复合物中的基因也被鉴定为具有共享作用。已有文献报道KAT5基因的过表达增强了下游抗病毒基因包括IL-6的转录[16]。其他研究报道了组蛋白甲基转移酶ASH1L抑制TLR诱导的IL-6的产生[17]


上述分析还表明,具有不同CHP效应的IVs可能参与多种途径,这些途径由多种来源的IV相关混淆因子引起。混淆因子对结局变量的效应可能具有IV特异性。MR-CUE在估计共享CHP效应时考虑了IV特异性CHP效应,可以提高CHP效应估计精度。通过仔细检查具有CHP效应的IVs及其顺式基因,作者确定了高度关联的基因和基因集,作为IVs相关混淆因子的建议来源,并进一步告知所检查性状中潜在的共享遗传病因。


图2 MR-CUE关于IL-6对多种性状/疾病的分析结果

(图源:Cheng Q, et al., Nat Commun, 2022)


MR-CUE可对IVs是否具有CHP效应进行推断,并提供不同置信水平下的具有CHP的IVs集合,这为用户进一步分析它们的顺式基因和相关的影响途径提供了可能。这些基因和途径可能揭示受共同风险因子影响的性状和疾病的共同遗传病因,或者可能揭示复杂疾病结果的不同风险因子背后的相关机制。这些与疾病相关的共同变量和途径可以为跨人群和种族群体的协调机制和病因提供信息。


文章结论与讨论,启发与展望终上所述,MR-CUE可以在具有UHP与CHP的复杂情况下对因果效应给出无偏有效的估计。与专注于IVs共享的CHP效应的现有方法相比,MR-CUE考虑了IV特有的CHP效应。该方法在多种模拟数据集上进行了测试,并且在控制第一类错误概率、检验功效、识别因果效应方面表现出优良的性能,超越了以往的方法。此外,MR-CUE允许添加相关IVs来增加检验功效,对挑选IV的阀值不敏感,可以在不同置信水平下推断带CHP的IVs集合。MR-CUE在跨种群分析中表现较为稳健,这是源于该方法提供了双层推断,它既能利用不受混淆因子影响的IVs估计风险因子的因果效应,还可以进一步探究因混杂因素影响的IVs的潜在关联基因与途径。

原文链接https://doi.org/10.1038/s41467-022-34164-1


西南财经大学统计研究中心成青博士为该文的第一作者,新加坡国立大学刘瑾博士和芝加哥大学陈琳博士为该文的共同通讯作者。参与该工作的研究者还包括新加坡国立大学博士后张晓。该工作在所有合作者的共同努力下完成。


欢迎扫码加入岚翰生命科学:文献学习2

群备注格式:姓名-单位-研究领域-学位/职称/称号/职位

往期文章精选

【1】NAR︱蔡玲/王刚/金坚团队合作揭示和靶向前列腺癌中EZH2的双重功能

【2】J Cell Physiol︱华进联团队建立不同细胞来源的猪iPSCs诱导体系并探讨其差异

【3】Cancer Discov︱张翔团队报道NG2+基质细胞在骨重塑和转移起始中的特殊作用

【4】Redox Biol︱呼庆勋课题组发现半胱氨酸γ裂解酶硫巯基化Drp1改善心功能紊乱

【5】PLoS Biol︱谷杨楠团队揭示植物核孔复合体新组分GBPL3在核篮和核纤层之间发挥 “桥梁” 的新机制

【6】Nat Microbiol︱张恒/邓增钦团队合作解析细菌新型CRISPR抗病毒系统工作机制

【7】NAR︱左志向/任间/赵安团队合作发布首个RNA修饰相关调控蛋白靶基因综合数据库RM2Target

【8】Cell Prolif︱李成华团队揭示仿刺参肠再生的分子调控机制

【9】Nat Commun︱肖东/孙妍课题组合作揭秘RNA表观遗传修饰调控自噬的新机制

【10】Nat Commun︱尹文兵团队发现真菌合成黄酮柚皮素的新途径

优质科研培训课程推荐【1】全国循证医学 Meta 分析与网状Meta研讨会(2022年11月12-13日 )【2】宏基因组与代谢组/脂质组学R软件数据可视化研讨会(2022年11月26日 )欢迎加入“岚翰生命科学” ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)

参考文献(上下滑动阅读)

[1] Boyle, E. A., Li, Y. I., and Pritchard, J. K. An expanded view of complex traits: from polygenic to omnigenic. Cell, 169, 1177–1186 (2017).

[2] Liu, X., Li, Y. I., and Pritchard, J. K. Trans effects on gene expression can drive omnigenic inheritance. Cell, 177, 1022–1034 (2019).

[3] Morrison, J., Knoblauch, N., Marcus, J. H., Stephens, M. & He, X. Mendelian randomization accounting for correlated and uncorrelated pleiotropic effects using genome-wide summary statistics. Nat. Genet. 52, 740–747 (2020).

[4] Wang, J. et al. Causal inference for heritable phenotypic risk factors using heterogeneous genetic instruments. PLoS Genet. 17, e1009575 (2021).

[5] Xue, H., Shen, X. & Pan, W. Constrained maximum likelihood-based mendelian randomization robust to both correlated and uncorrelated pleiotropic effects. Am. J. Hum. Genet. 108, 1251–1269 (2021).

[6] Zhao, Q. et al. Statistical inference in two-sample summary-data mendelian randomization using robust adjusted profile score. Ann. Stat. 48, 1742–1769 (2020).

[7] Burgess, S., Butterworth, A. & Thompson, S. Mendelian randomization analysis with multiple genetic variants using summarized data. Genet Epidemiol. 37, 658–665 (2013).

[8] Bowden, J., Davey Smith, G. & Burgess, S. Mendelian randomization with invalid instruments: effect estimation and bias detection through egger regression. Int. J. Epidemiol. 44, 512–525 (2015).

[9] Qi, G. & Chatterjee, N. Mendelian randomization analysis using mixture models for robust and efficient estimation of causal effects. Nat. Commun. 10, 1–10 (2019).

[10] Foley, C. N., Mason, A. M., Kirk, P. D. & Burgess, S. MR-Clust: clustering of genetic variants in mendelian randomization with similar causal estimates. Bioinformatics 37, 531–541 (2021).

[11] Cheng, Q. et al. MR-LDP: a two-sample mendelian randomization for gwas summary statistics accounting for linkage disequilibrium and horizontal pleiotropy. NAR Genomics Bioinform. 2, lqaa028 (2020).

[12] Tanaka, T., Narazaki, M. & Kishimoto, T. IL-6 in inflammation, immunity, and disease. Cold Spring Harb. Perspect. Biol. 6, a016295 (2014).

[13] McElvaney, O. J., Curley, G. F., Rose-John, S. & McElvaney, N. G. Interleukin-6: obstacles to targeting a complex cytokine in critical illness. Lancet Respir. Med. 9, 643–654 (2021).

[14] Bulik-Sullivan, B. et al. An atlas of genetic correlations across human diseases and traits. Nat. Genet. 47, 1236–1241 (2015).

[15] Xia, C., Braunstein, Z., Toomey, A. C., Zhong, J. & Rao, X. S100 proteins as an important regulator of macrophage inflammation. Front. Immunol. 8, 1908 (2018).

[16] Kypriotou, M., Huber, M. & Hohl, D. The human epidermal differentiation complex: cornified envelope precursors, s100 proteins and the ‘fused genes’ family. Exp. Dermatol. 21, 643–649 (2012).

[17] Song, Z.-M. et al. KAT5 acetylates cgas to promote innate immune response to dna virus. Proc. Natl Acad. Sci. USA 117, 21568–21575 (2020).


本文完


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存