查看原文
其他

多策略GWAS分析,不只有SNP

杨阳 诺禾致源科服 2023-02-13
导语

常规的全基因组关联分析(GWAS)一般基于单核苷酸多态性(SNP)与表型数据关联,筛选出与性状变异相关联的功能基因。近几年来单一 SNP 的分析已无法满足日益增长的科研需求,下面介绍几种不同策略的 GWAS 分析,希望对各位科研学者有所助益。


01





Hap-GWAS单倍型( haplotype )是共存于单条染色体上的一系列遗传变异位点的组合,其在染色体上形成的连续的、稳定的、几乎不被重组所打断的单倍型区域,称为单倍型块( haplotype block )。以单倍型块为基础,进行性状与基因的关联分析也是十分有效的关联分析方法。2021年水稻[1]文章中,鉴于传统 SNP-GWAS 存在假阴性,且在识别全部关联基因的局限性,该研究增加了 Hap-GWAS 分析进行更精确定位。材料选择:259份水稻测序策略:Illumina PE150,12.16x主要结果:显著关联 SNP 的 LD 区域内定位到一个 NLR 基因簇,通过 Hap-GWAS 进一步定位到了 OsRSR1 基因与该性状显著相关。技术路线:
02





SV-GWAS结构变异(SV)包括缺失、插入、倒位、易位等,是基因组变异的主要来源,大量研究已证实 SV 广泛存在于物种基因组内,且对表型影响广泛[2-3]。2021年桃[4]研究中,进行了全面的 SV 图谱的绘制,并通过 SV-GWAS 发现重要关联基因,弥补了 SNP-GWAS 的不足。材料选择:149份桃测序策略:Illumina PE150,31.52x主要结果:SNP-GWAS 分析得到多个与果形相关的强 SNPs 信号存在于“S”基因座,而基于 SV-GWAS 分析,鉴定出最重要的关联是在“S”基因座位置从27,959,880 bp到29,634,101 bp的1.67 Mb 杂合倒位,且包含了显著关联的SNP。该变异导致其邻近基因 PpOFP2 上调,形成扁平果形。技术路线:
03





PAV-GWAS物种基因组中除存在大量 SNP 外,还存在大量的存在/缺失变异(presence/absence variation, PAV),PAV 变异最多可达基因组的六分之一,对物种基因功能存在一定影响,如防御反应、信号转导反应、应激反应等。如甘蓝型油菜[2]的研究中,PAV-GWAS 鉴定了与角果长度、种子重量和开花时间相关的结构变异,而 SNP-GWAS 未检测到这些结构变异,表明 PAV-GWAS 与 SNP-GWAS 在鉴定性状关联方面是互补的。材料选择:15个RIL家系样本,16个新建家系材料测序策略:Illumina + PacBio主要结果:同时使用 SNP-GWAS 和 PAV-GWAS 两种关联方法,发现 SNP-GWAS 的显著关联结果,并未落到靶基因 bnaa9.cyp78a9 的调控区域或编码序列中。而PAV-GWAS 直接检测到插入在 bna9.cyp78a9 启动子区上游的 3.9 kb 的 TE 元件,并确定为角果长度和种子重量性状相关变异。技术路线:
04





CNV-GWAS拷贝数变异(copy number variation ,CNV)是指基因组上某些大片段的拷贝数增加或减少,可分为缺失(deletion)和重复(duplication)两种类型。CNV 可通过改变基因剂量和转录结构等来调节有机体的可塑性,是个体表型多样性和群体适应性进化的主要遗传基础之一。绵羊[6]研究中,利用 SNP 和 CNV 分子标记相结合,挖掘了一系列与重要外形和农业性状相关的候选基因。材料选择:232个绵羊及16个野羊材料测序策略:Illumina PE150,25.7x主要结果:利用 SNP-GWAS 分析,获得多个与产仔数、乳头数性状显著关联基因,而 CNV-GWAS 分析又补充了新性状关联基因,如 GPC5。技术路线:
05





k-mer-GWAS常规 GWAS 分析方法是利用测序数据比对参考基因组来完成遗传变异的检测,在基因组组装效果不理想的情况下,可以通过相互比较来自不同样本的恒定长度k的序列(称为k-mers)集,来识别更广泛的遗传变异类型,如 SVs 等。Voichek[7] 等人基于 k-mer 的 GWAS (rfGWAS)方法,对拟南芥、番茄、玉米等2000个性状进行关联分析,建立 k-mer 与表型的直接关联,后再推断相关序列的基因组背景,进而发现更广泛的基因变异,甚至是组装缺失部位的变异信息。材料选择:1135份拟南芥数据,150份玉米数据,246份番茄数据测序策略:Illumina,6x 以上主要结果:如在拟南芥的 GWAS 分析结果中,显著关联 SNP 与 k-mer 处于同一 LD 中,比例为73%(LD≥ 0.5),说明了 k-mer-GWAS 的可行性。而幼苗萌发率的关联结果中,SNP-GWAS 无显著关联,而 k-mer-GWAS 发现显著关联 k-mer,该 k-mer 未比对到参考基因组中,通局部序列组装和同源比对发现一个位于 bZIP67 转录因子的3’UTR 区域的 SV。技术路线:

诺禾致源全基因组关联分析产品如下,欢迎各位老师感兴趣的老师垂询。

参考文献:

[1]. Aijun W,Xinyue S,Xin J, et al. Identification of rice (Oryza sativa L.) genes involved in sheath blight resistance via a genome-wide association study[J]. Plant Biotechnology Journal.2021.[2]. Z_mienkoA, SamelakA, KozłowskiP, etal. Copynumber polymorphism in plant genomes[J]. Theor Appl Genet. 2014.[3]. Gaut BS, Seymour DK, Liu Q, et al. Demography and its effects on genomic variation in crop domestication[J]. Nat Plants. 2018.[4]. Guan J, Xu Y, Yu Y, et al. Genome structure variation analyses of peach reveal population dynamics and a 1.67 Mb causal inversion for fruit shape[J]. Genome Biology, 2021.[5]. Jia-Ming S, Zhilin G, Jianlin H, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nat Plants. 2020.[6]. Li X, Yang J, Shen M, Xie XL, Liu GJ, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits[J]. Nat Commun. 2020.[7]. Yoav Voichek, Detlef Weigel. Identifying genetic variants underlying phenotypic variation in plants without complete genomes[J]. Nature Genetics.2020.

 



往期精彩推荐



重测序研究部   杨阳 | 文案

 




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存