查看原文
其他

中国科大马世嵩团队建立拟南芥普适性基因表达调控网络

BAP BioArt植物 2021-05-20

责编 | 王一


基因转录是细胞状态和功能的关键决定因素。细胞状态的改变或细胞类型之间的功能差异,很大程度上反映在基因转录的变化中,而转录调控主要取决于转录因子 (TFs)对靶基因的表达调控。基因表达调控网络 (Gene Regulatory Networks, GRNs) 是一种将转录因子和靶基因连接起来的生物网络,指明了转录因子和靶基因间的调控关系,是解锁细胞功能和调控机制的关键。除了通过实验方法构建外,比如ChIP-Seq,DaP-Seq,ATAC-Seq等,GRNs通常经由计算生物学的手段分析转录组数据推导得出,这方面的算法有Module Networks, LASSO,TIGRESS等。然而,目前已有的GRNs算法大多只适用于分析样本量有限的转录组数据,所得的网络往往只能应用于特定组织和生物途径,而且不具备定量预测靶基因表达水平的能力。迄今为止,无论是在植物还是动物中,都尚未建立能够基于转录因子定量预测靶基因表达水平的普适性调控网络。


近日,中国科学技术大学马世嵩团队在The Plant Journal上在线发表了题为 An Arabidopsis expression predictor enables inference of transcriptional regulators for gene modules 的研究论文。该研究建立了一个普适性的拟南芥基因表达调控网络 EXPLICIT,其可根据1678个转录因子基因的表达量精确预测出29182个非转录因子靶基因的表达量,并可用于分析拟南芥任意组织或生物过程内调控基因表达的上游转录因子。



在该文中,研究人员首先利用新开发的EXPLICIT算法,使用截至2019年10月的约25000份高质量RNA-Seq转录组数据,构建了一个基于线性回归模型的拟南芥基因表达预测子。研究结果表明,用于训练模型的样品数目越多,预测子的准确度越高。用25000份RNA-Seq转录组数据训练该模型后,得到准确度很高和泛化能力非常强的预测子。对于任意一个拟南芥RNA-Seq转录组样品,无论它来自于哪个组织,预测子都能根据其中1678个转录因子的表达量,准确预测出其余29182个非转录因子靶基因的表达量。为了检验预测子的准确度,研究人员测量了两份分别来自拟南芥 (Col-0) 叶片和根部的转录组,将其中转录因子的表达量输入到预测子中,预测了其余靶基因的表达量,发现预测值和真实值之间的相关系数达到0.99。对于其它植物组织的转录组,预测值和实际值的平均相关系数为0.987,表明该预测子适用于任意一个植物组织。同时,对于2019年10月以后上传到NCBI的RNA-Seq转录组数据,该模型也能准确预测出靶基因的表达量,平均相关系数达到0.986。这些结果表明,转录因子的表达水平和靶基因的表达水平间存在着一定的数量关系,该数量关系在不同的植物组织间保守,而预测子模型准确捕获了这些数量关系。

                                             

在基因表达预测子模型的基础上,该研究构建了一个普适性的拟南芥基因表达调控网络。首先,利用基因表达预测子,反推出最有可能调控每个调控靶基因表达的上游转录因子,将转录因子和靶基因相连后得到转录调控网络。同时,利用研究人员之前开发的算法,构建了基于图形化高斯网络的GGM基因共表达网络,从中挖掘出作用于不同生物过程的基因共表达模块。之后,利用表达调控网络,预测出共表达模块的上游转录因子。例如,模块#84参与木栓质的合成,其上游富集了31个转录调控因子,其中MYB41, MYB107, MYB9, MYB39, MYB49,及NAC038是已知的调控木栓质合成的因子。其它30多个模块的分析也得到类似结果,它们分别参与根,维管束,雄蕊,花粉管,种子等不同组织的发育,氮,磷,铁等不同营养元素的吸收利用,花青素,叶绿素,蜡质等不同物质的代谢,以及热击,干旱等不同胁迫的应答,因而该调控网络具有广泛的适用性。进一步的比较结果显示,该分析方法优于已有的TF2Network及AtRegNet等网络分析方法。值得注意的是,除了基因共表达模块,该算法也可用于分析其它任意基因模块或基因列表的上游转录因子。



综上所述,该研究构建了一个普适性的拟南芥基因表达调控网络,挖掘了作用于不同生物过程的基因模块,以及调控这些模块的上游转录因子;研究中开发的EXPLICIT算法为基因表达调控网络研究提供了新的工具和范式。该算法目前已上传到软件分享网站GitHub,以方便研究同行下载使用。


中国科学技术大学马世嵩教授为该论文的通讯作者,博士研究生耿海英、特任副研究员王萌、硕士研究生龚佳震为该论文的并列第一作者,硕士研究生徐玉璞也参与了该研究。该研究得到了国家自然科学基金及中国科学院相关项目的资助。


EXPLICIT:

https://github.com/mashisonglab/explicit

论文链接:

https://onlinelibrary.wiley.com/doi/10.1111/tpj.15315

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存