查看原文
其他

1+1>2,GWAS+转录组联合分析,你一定要知道!

王德芬 诺禾致源科服 2023-02-13

全基因组关联分析(GWAS)是以全基因组范围内的遗传标记为基础,通过基因分型,筛选出与复杂性状表型相关联的分子标记,进而挖掘与表型相关的候选基因。由于连锁不平衡的作用,GWAS分析中与目标性状关联的区域往往具有较大的宽度,可能会涉及多个高度连锁而非性状相关的基因,仅凭关联分析的结果来找到潜在的候选目标基因/目标突变十分具有挑战性。



大量研究表明 GWAS 发现的 SNP 往往能影响附近基因的表达量,并最终造成复杂性状差异。转录组与 GWAS 联合分析,不仅可以相互验证结果,还可以从因果层次缩小定位基因数量,锁定关键基因,实现从 SNP 到基因表达再到复杂性状的精准定位。接下来,就跟随小编一起从以下几篇案例来了解下 GWAS 和转录组联合分析吧~


01全基因组选择揭示绵羊驯化及表型性状遗传机制[1]

该研究对248个个体进行高深度的全基因组重测序,同时还收集了四种羊(短瘦尾、短脂尾、长脂尾和肥臀)12个个体的绵羊尾部脂肪组织进行 RNA-Seq 分析。通过全基因组选择分析和全基因组关联分析(GWAS),利用单核苷酸多态性(SNP)和拷贝数变异(CNV)分子标记,挖掘出 PDGFD 这个被共同选择的基因,进一步解析基因结构,发现该基因启动子区域的基因型分布,以及位于该基因的一个非同义突变位点(半胱氨酸/酪氨酸)的等位基因频率在肥尾/肥臀羊和瘦尾羊中差异显著。通过后续的转录组分析以及 RT-PCR、qPCR 和 western blot 实验验证发现该基因在瘦尾羊中的表达显著高于肥尾羊。通过探索脂肪生成通路,发现 PDGFD 基因表达的蛋白通过形成二聚体来激活 PDGFRβ 通路,而该通路在脂肪扩增的过程中起着抑制作用,也进一步证实了 PDGFD 基因在尾脂形成中起着负调控作用。

图1 绵羊 PDGFD 基因在尾脂沉积中的分子调控机制(诺禾项目文章)
02全基因组和转录组关联研究为甘蓝型油菜种子含油量的自然变异提供了遗传基础[2]

该研究收集505份甘蓝型油菜进行重测序分析,获得10,620,048个变异位点。结合种子含油量(SOC)性状进行 GWAS 分析,鉴定得到27个与含油量显著相关的 QTL 位点。同时该研究还选取部分材料,对两个发育阶段(20DAF,309份材料;40DAF,274份材料)的种子进行转录组测序,并鉴定了基因表达与 SOC 之间的关联性,分别在20DAF和40DAF材料中检测到605个和148个与 SOC 显著相关的候选基因。

由于作物的 LD 区间较大以及人工选择等因素的影响,根据 GWAS 分析结果,从 QTL 区间中定位致病基因往往比较困难。该研究基于多组学数据,整合 GWAS、TWAS 分析结果,对甘蓝型油菜 SOC 相关 QTL 区间的候选基因进行优先排序,在 qOC.A05.3 和 qOC.C05.3 区间发现了相同的致病基因 BnPMT6。实验验证表明 BnPMT6  负调控油菜含油量,与预测结果一致,基因表达分析暗示 BnPMT6  可能受到 LEC1 和 FUS3 两个油脂合成关键转录因子的调控。

图1 qOC.A05.3 和 qOC.C05.3 中候选基因的优先顺序  

图2 BnPMT6 的作用与功能验证


03

GWAS 和 eQTL 联合分析揭示棉花次生细胞壁发育启动的基因调控网络[3]


本研究通过对251份陆地棉材料进行 GWAS 分析,鉴定到28个与异源四倍体棉中纤维质量相关的遗传位点。为进一步解析这些位点调控纤维品质的机制,对这251份材料15DPA的纤维进行了转录组分析,鉴定得到了15,330个 eQTL 位点。利用近端 eQTL 和 GWAS 数据进行 TWAS 分析,优化得到13个可能的纤维品质因果基因。远端的 eQTL 分析发现棉花亚基因组之间存在特异的遗传调控模式,其中 Hot216 位点调控962个基因的表达。进一步分析发现,Hot216 位点的主要功能是调控与细胞壁合成相关基因的表达,从而介导纤维从快速伸长期到次生壁合成之间的转换,最终影响纤维长度。

图1 GWAS+TWAS 揭示棉花次生细胞壁发育启动的基因调控网络
04结合 GWAS 和 TWAS 分析预测影响水稻GI和质地的遗传区域[4]
该研究对305个籼稻品种进行重测序分析,共获得2,419,731个高质量 SNPs。与 GI 性状进行 GWAS 分析发现,在5号染色体的 LOC_Os05g03600 基因座的外显子2上有一个 T->C 的同义突变位点,该位点与中高 GI 表型变异显著相关。在6号染色体上发现一个~230kb的区域(GI6.1),包含26个重要的基因(包括 GBSSI、水解酶基因、信号转导基因、染色质修饰基因),连锁不平衡分析确定了19个连接块,该区域的变异占总的 GI 相关变异的88.7%。结合 TWAS 分析,鉴定了 GI6.1 区域内的顺式调控元件,并将关联候选基因缩小至13个。

图1  GWAS 和 TWAS 分析结果展示。a,染色体5和6中与 GI 显著相关信号;b,GI6.1 区域;c,TWAS 分析突出了 GBSSI 表达;d,eQTL 分析将 GI6.1 区域的关联候选基因缩小到13个
图2 联合分析研究流程图



        

诺禾致源拥有资深的数据分析团队,结合丰富的项目经验,专业的项目方案指导和分析流程,保证项目准确并且快速地进行,已协助客户在多家权威杂志发表多篇高水平文章。“科学的方案设计,严格的质控管理,专业的分析团队,丰富的项目经验,优质的项目服务”,确保每一个环节都能出色完成,助力科学研究。


参考文献[1] Li X, Yang J, Shen M, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits. Nat Commun. 2020 Jun 4;11(1):2815.[2] Tang S, Zhao H, Lu S, et al. Genome- and transcriptome-wide association studies provide insights into the genetic basis of natural variation of seed oil content in Brassica napus. Mol Plant. 2020 Dec 10:S1674-2052(20)30434-2.[3] Li Z, Wang P, You C, et al. Combined GWAS and eQTL analysis uncovers a genetic regulatory network orchestrating the initiation of secondary cell wall development in cotton. New Phytol. 2020 Jun;226(6):1738-1752.[4] Anacleto R, Badoni S, Parween S, et al. Integrating a genome-wide association study with a large-scale transcriptome analysis to predict genetic regions influencing the glycaemic index and texture in rice. Plant Biotechnol J. 2019 Jul;17(7):1261-1275.



动植物基因组板块  王德芬 | 文案

图片来源于网络,侵删



往期精彩推荐






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存