查看原文
其他

QB期刊|从孟德尔随机化的角度回顾全转录组关联研究分析方法

QB期刊 2022-10-01

全基因组关联研究(GWASs)已经确定了数千个与许多复杂性状相关的遗传变异。然而,它们的生物学机制在很大程度上仍然是未知的。随着转录组关联研究(TWAS)的发展,TWAS被认为是研究变异与性状关联的潜在基因调控机制的一个宝贵工具。目前已有不少方法可以对TWAS进行综合分析,不过每个方法都有不同的建模假设,许多方法最初是为了回答不同的生物学问题而开发的,现阶段一直缺乏从技术角度总结这些现有方法的优点和缺点的系统回顾。

近日,由美国密西根大学生物统计系Zhou Xiang教授课题组回顾了全转录组关联分析的研究进展,从孟德尔随机化(Mendelianrandomization)的角度出发系统归纳了现有近期的13种TWAS分析算法。从孟德尔随机化的角度来看待不同的TWAS分析方法,提供了一个独特的角度来理解这些方法优点和缺陷。本研究系统地介绍了孟德尔随机化分析框架,解释了GWAS和表达数据的特点如何影响孟德尔随机化框架对TWAS数据的适应性,并从孟德尔随机化角度重新解释了不同TWAS方法中的建模假设。相关研究结果“Transcriptome-wideassociation studies: a view from Mendelian randomization”(点击文末“阅读原文”下载PDF全文)发表在Quantitative Biology期刊上。

文章概要

本研究首先分析回顾了孟德尔随机化分析的框架,解释了如何在孟德尔随机化框架内看待不同的TWAS方法。孟德尔随机化是一种因果推断方法(如下图1 A所示),使用遗传变体作为辅助变量(instrumental variable),推断观测变量(exposurevariable)——比如基因表达——对观察研究中感兴趣的结果是否存在因果效应。

Figure1用于分析TWAS的孟德尔随机化框架。(A)标准孟德尔随机化模型对辅助变量有三个假设。(i)它必须与暴露变量相关,(ii)它必须不与混杂因素相关,以及(iii)它只通过暴露变量与结果相关。(B) 以两个暴露变量为例的多变量孟德尔随机化分析。(C) 两段式TWAS分析框架。(D) 基于最大似然的TWAS分析框架。

 

本研究揭示了现有最新的13种TWAS分析方法都能归纳在孟德尔随机化的框架之下,这些方法的特点总结在下表1中,其区别在于使用不同的统计和机器学习等方法建模效应大小(effect size)。建模方法包括弹性网络(PrediXcan),贝叶斯稀疏线性混合模型(BSLMM), 狄利克雷过程回归(DPR, TIGAR),线性混合回归(CoMM, CoMM-S2,PMR),贝叶斯变量选择回归(fQTL)等。

1. 13TWGS分析算法一览

在推断过程中,多数TWAS分析方法都是基于两段式推理算法,除此之外,也有一些最新的方法使用最大似然框架。具体来说,基于回归的两段式推断算法(如上图1C所示)试图利用辅助变量构建基因表达数据的预测器,然后在预测的基因表达水平和结果表型之间进行关联。他们估计参考转录组数据中的SNP效应大小,并将这些估计值传递给GWAS研究进行因果效应推断。换句话说,两段式推断算法方法将基因表达的"填充"和基因表达与结果表型之间的 "关联 "作为两个独立的步骤进行建模。相比之下,CoMM和PMR中使用的基于最大似然的推断算法(如上图1D所示)是联合同时建模,并最大化似然函数进行推断。孟德尔随机化中的两段式推理算法具有简单的优点,并能得到近似无偏的因果效应大小估计。然而,两段式推理算法也可能没有考虑到转录组研究中参数估计的不确定性,从而导致性能损失,特别是在存在弱的辅助变量时。事实上,与在孟德尔随机化框架中观察到的情况类似,最近的TWAS研究也表明,基于似然的推断算法可以大幅提高TWAS的性能。

最后,本研究列举了目前TWAS方法在多组织、多基因和汇总统计几个方面的发展,并解释了如何将这些扩展纳入孟德尔随机化框架中.。传统的TWAS方法是单变量的,主要是一次分析一个暴露变量(一个基因)。然而,许多最近开发的TWAS方法正逐渐从单变量TWAS分析扩展到多变量TWAS,使用多个暴露变量(多个基因),如上图1 B所示。多变量孟德尔随机化模型包括TisCoMM, fQTL, FOCUS等等。

综上,本研究从孟德尔随机化角度理解近期现有13个TWAS数据分析方法,为研究人员展示了TWAS分析方法的未来可能的发展方向。

 


Quantitative Biology期刊介绍

    Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。 

       为了促进本领域的学术交流,欢迎大家扫描下面二维码进入《定量生物学》期刊交流群。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存