STAR Protocols | 孙小强团队发表从临床转录组数据中推断疾病进程和基因调控网络的分析方法
撰文︱孙小强, 董昭锐
责编︱王思珍
编辑︱杨 婵
基因调控网络(gene regulatory networks,GRNs)的推断是系统生物学和计算生物学中的基本问题之一。揭示疾病发展进程中的基因调控网络对于理解疾病的演化机制和研发新的靶向药物具有重要意义和价值[1]。现有的基因调控网络推断方法大多依赖于基因表达谱数据中的时序信息或者扰动实验数据。然而,生物医学中的典型组学数据(如横断面研究获得的临床转录组数据)往往缺乏足够的时间信息,这为以上问题带来了实质性的困难和挑战。因此,基于横截面数据重建时序信息并推断基因调控网络的方法学研究具有重要的理论意义和应用价值。
2022年6月,中山大学数学学院孙小强团队在Cell 旗下学术期刊STAR Protocols在线发表了题为“Inferring disease progression and gene regulatory networks from clinical transcriptomic data using PROB_R”的分析方案文章(Protocol)。该文基于PROB算法和R语言开发了一个针对临床转录组数据集的分析工具PROB_R,并以临床乳腺癌转录组数据集为例,展示了使用PROB_R推算疾病演化进程和基因调控网络的分析流程。
在该团队既往研究[2]的基础上,研究者在此文中详细阐述了使用PROB算法推断乳腺癌演化过程中的基因调控网络的流程。研究者首先利用病人基因表达谱相似性并结合临床分期信息构造图上的随机游走,基于谱图理论计算样本间的扩散距离[3],以此对样本排序从而将截面型数据转化为拟时间序列数据。根据重排后的样本,研究者使用趋势检验的方法(Mann-Kendall test)从所有基因中筛选出具有显著时序变化趋势的基因(temporal changing genes,TCGs)作为候选基因。
图1 使用PROB_R分析临床转录组数据的流程图
(图源:Dong Z, Sun X, STAR Protoc, 2022)
而后,该分析方法使用常微分方程组模型来描述基因调控的动态机制,并使用Bayesian Lasso[4]方法来推断模型中的调控系数,这些调控系数给出了基因调控网络的结构和权重。在进行网络推断时,研究者还通过使用Omnipath数据库[5]赋予网络一定的先验结构,以提高推断出的基因调控网络的准确性。图2展示了计算得到的乳腺癌演化过程中的基因调控网络。在网络的各调控边中,红色代表正调控关系,而蓝色代表负调控关系。
图2乳腺癌演化过程中的基因调控网络
(图源:Dong Z, Sun X, STAR Protoc, 2022)
从得到的基因调控网络中,以节点的重要性得分(hub score)为依据确定出乳腺癌疾病演化进程中的关键基因FOXM1,并使用基于临床生存期数据的Kaplan-Meier方法对FOXM1预后作用的统计显著性进行验证。结果表明,不同FOXM1表达水平的患者组的总存活期(overall survival)、无复发存活期(relapse-free survival)和无转移存活期(distant metastasis-free survival)均有显著差异。该结果为PROB算法在临床数据分析上的有效性与准确性提供了实例演示和验证。
原文链接:https://doi.org/10.1186/s13578-022-00827-1
孙小强副教授
(图源:中山大学数学学院孙小强个人网页)
通讯作者简介:
【1】EMBO Reports | 苏建国课题组揭示鲤科鱼类两种膜型TLR5感知dsRNA并产生拮抗作用
【2】Nat Commun︱王从义团队提出治疗肥胖和胰岛素抵抗的新策略
【3】Nat Commun︱刘彦梅/秦伟团队实现了无PAM限制的SpCas9变体SpG和SpRY在斑马鱼模型中的应用
【4】Front Cell Dev Biol | 郑红团队探讨间充质干细胞在髓系白血病中的重要作用
【5】Cell Reports︱时毅团队等合作揭示基于广谱抗病毒纳米抗体的免疫机制
【6】Nat Commun︱李依明等提出一种多通道全局拟合方法用于三维单分子定位
【7】Mol Ther Oncolytics︱李鹏/李扬秋团队发现增强CAR-T细胞靶向异质性肿瘤的新方法
【8】Cell Death Dis︱孙宇教授团队发现全身应用地塞米松可挽救Gjb2基因突变所致的内耳感觉细胞损伤并显著改善听力损失
参考文献(上下滑动阅读)
[1] Blüher, M. Metabolically healthy obesity. Endocr. Rev. 41, 405-420 (2020).
[2] Stefan, N. Causes, consequences, and treatment of metabolically unhealthy fat distribution. Lancet Diabetes Endocrinol. 8, 616-627 (2020).
[3] Jang, C. et al. The small intestine shields the liver from fructose-induced steatosis. Nat. Metab. 2, 586-593 (2020).
[4] Green, C. R. et al. Branched-chain amino acid catabolism fuels adipocyte differentiation and lipogenesis. Nat. Chem. Biol. 12, 15-21 (2016).
[5] Mangge, H. et al. Obesity-related dysregulation of the tryptophan-kynurenine metabolism: role of age and parameters of the metabolic syndrome. Obesity 22, 195-201 (2014).
[6] Solon-Biet, S. M. et al. Branched chain amino acids impact health and lifespan indirectly via amino acid balance and appetite control. Nat. Metab. 1, 532-545 (2019).
[7] Laurans, L. et al. Genetic deficiency of indoleamine 2,3-dioxygenase promotes gut microbiota-mediated metabolic health. Nat. Med. 24,1113-1120 (2018).
[8] Rojas, I. Y. et al. Kynurenine-induced aryl hydrocarbon receptor signaling in mice causes body mass gain, liver steatosis, and hyperglycemia. Obesity 29, 337-349 (2021).
[9] Favennec, M. et al. The kynurenine pathway is activated in human obesity and shifted toward kynurenine monooxygenase activation. Obesity 23, 2066-2074 (2015).
本文完