查看原文
其他

连锁分析VS关联分析:相爱相杀?

2016-09-01 小萍 华大科技BGITech


图1 《史密斯夫妇》海报


昨天我们已经介绍了什么是GWAS以及5条影响GWAS定位结果的要素(☞☞☞戳这里复习:5条影响GWAS定位的要素 ☜☜☜),那么与之对应的连锁分析和它是怎样的关系呢?势如水火?相爱相杀?感觉是一部家庭时尚伦理大片打开的节奏(没错,科技君脑海里已经浮现出《史密斯夫妇》的经典情节),赶快走起!



1

连锁分析和关联分析比较


连锁分析

连锁分析一般是表型差异较大的两个纯系亲本杂交衍生的作图群体,只要存在连锁,在群体中就能观测到连锁不平衡,另外群体有明确的等位基因和等位基因频率,不存在群体结构。在这样的群体中不平衡和遗传连锁是互为因果关系。相较于GWAS,利用连锁分析检测罕见变异更有效。


连锁分析QTL定位的局限性

1.需要构建作图群体:耗时长,而且有些物种构建群体难度大。

2.检测QTL的个数有限:分离群体来自于双亲,连锁分析也只涉及到双亲间存在差异的位点,如果QTL在双亲间基因型一致,那么这个位点会被遗漏。同时也无法分辨检测到的QTL位点是否存在复等位基因。

3.QTL分辨率低:双亲构建的作图群体,只有有限代(几次到十几次)的重组事件发生,基因座位间发生重组的次数有限,即使标记密度再密,最终定位的区间也受重组的限制相对会大一些。

4.QTL有效性的限制性:一个群体中特定环境下定位的QTL在其他杂交组合中不一定存在或者效应值不同,因此双亲群体中特定环境检测到的QTL有待其他群体和环境的验证。


关联分析

关联分析研究一般是自然群体,无需构建群体,节约群体构建时间(利用作图群体或是多亲本衍生家系样本除外);可同时对同一个基因座的多个等位基因进行分析;利用自然群体长期进化过程中累积的重组信息,定位结果分辨率更高,甚至可以直接定位到基因本身。


关联分析局限性

1.随机交配掩盖基因座间连锁关系:样本来源比较复杂,在这样的群体中长期的随机交配会掩盖基因座位间的连锁关系,两个座位间存在遗传上的连锁,但不一定能够看到不平衡存在。

2.群体结构导致定位结果假阳性:如果个体是来自于不同遗传结构的亚群,由于群体结构的存在,导致独立遗传基因座位间检测到关联信号,但是两个基因座位间的连锁不平衡来源于群体结构。

3.关联分析中需要大量的分子标记,从中找到与性状基因紧密连锁的标记,期望这些标记与基因间的不平衡尚未被随机交配打破。



2

连锁分析结果展示


动植物基于家系进行连锁分析首先需要构建连锁图谱。连锁图谱是指基因或标记在染色体上的相对位置和遗传距离(利用重组率计算的遗传距离,区别于物理距离)。基于高通量测序开发SNP标记可以构建高密度的遗传图谱,也可以用连续多个连锁的SNP判断染色体片段来源构建Bin Map。QTL定位是通过分析分子标记和数量性状表型值的关系,将QTL逐一定位到连锁群的相应位置,并估计其遗传效应。



图2 QTL定位结果展示[1]

连锁图谱最理想的情况下是连锁群与染色体条数相同,但是如果有的染色体较长,也有可能一条染色体上被划分为不同的连锁群。染色体旁边红色、蓝色、绿色和不同的形状代表不同环境下不同的表型,图中标示了QTL定位的位置。通过连锁分析还可以计算每个QTL的效应值。



3

GWAS结果展示


manhattan plot和QQ plot(图3)[2]是查看GWAS定位结果和计算模型合理性的标配图,几乎每个GWAS文章中都有。



图3 GWAS定位结果的manhattan plot和QQ plot[2]

e、简单模型下的manhattan plot;f、简单模型的QQ plot; g、Compressed混合线性模型下的manhattan plot;h、Compressed混合线性模型的QQ plot。 Compressed混合线性模型下超过阈值的位点大幅降低。QQ plot是用于评估模型的合理性的,QQ图的意义在于基因型和性状无关联的情况下,各个标记P-value的观察值和期望值是相等的(红线),但是由于出现了基因型和性状有关联的情况,P-value往往会偏离y=x这条线。Compressed混合线性模型考虑到群体结构有效控制了P-value膨胀。



4

BGI相关文章展示


连锁分析和关联分析分别有各自适合的领域,根据研究目的和样本特性,华大基因依据多年的经验为您提供针对性的科研服务。




看到这里,您对GWAS是有更多的认识,还是新增了更多疑问呢?没关系,欢迎随时和科技君交流!



参考文献:

1.Gao Z Y, Zhao S C, He W M, et al. Dissecting yield-associated loci in super hybrid rice by resequencing recombinant inbred lines and improving parental genome sequences [J]. Proceedings of the National Academy of Sciences, 2013, 110(35): 14492-14497.

2.Huang X, Wei X, Sang T, et al. Genome-wide association studies of 14 agronomic traits in rice landraces [J]. Nature genetics, 2010, 42(11): 961-967.

3.Li H, Peng Z, Yang X, et al. Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels [J]. Nature genetics, 2013, 45(1): 43-50.

4.Chia J M, Song C, Bradbury P J, et al. Maize HapMap2 identifies extant variation from a genome in flux[J]. Nature genetics, 2012, 44(7): 803-807

5.Wang H, Xu X, Vieira F G, et al. The power of inbreeding: NGS based GWAS of rice reveals convergent evolution during rice domestication [J]. Molecular plant, 2016.

6.Valliyodan B, Qiu D, Patil G, et al. Landscape of genomic diversity and trait discovery in soybean [J]. Scientific reports, 2016, 6.

7.Xu X, Zeng L, Tao Y, et al. Pinpointing genes underlying the quantitative trait loci for root-knot nematode resistance in palaeopolyploid soybean by whole genome resequencing[J]. Proceedings of the National Academy of Sciences, 2013, 110(33): 13469-13474.

8.Gao Z Y, Zhao S C, He W M, et al. Dissecting yield-associated loci in super hybrid rice by resequencing recombinant inbred lines and improving parental genome sequences [J]. Proceedings of the National Academy of Sciences, 2013, 110(35): 14492-14497.

9.Jin Z, Jianbo J, Guannan L, et al. Rapid SNP Discovery and a RAD-Based High-Density Linkage Map in Jujube (Ziziphus Mill.)[J]. Plos One, 2014, 9(10):e109850-e109850.

10.Yu G, Hui Y, Fang D, et al. An improved 2b-RAD approach (I2b-RAD) offering genotyping tested by a rice (Oryza sativa L.) F2 population [J]. Bmc Genomics, 2014, 15(1):956-956.

11.Qi X, Li M W, Xie M, et al. Identification of a novel salt tolerance gene in wild soybean by whole-genome sequencing [J]. Nature communications, 2014, 5.

12.Shao C, Niu Y, Rastas P, et al. Genome-wide SNP identification for the construction of a high-resolution genetic map of Japanese flounder (Paralichthys olivaceus): applications to QTL mapping of Vibrio anguillarum disease resistance and comparative genomic analysis [J]. DNA Research, 2015, 22(2): 161-170.

13.Wang L, Xia Q, Zhang Y, et al. Updated sesame genome assembly and fine mapping of plant height and seed coat color QTLs using a new high-density genetic map [J]. BMC genomics, 2016, 17(1): 1.

14.Peng Y, Hu Y, Mao B, et al. Genetic analysis for rice grain quality traits in the YVB stable variant line using RAD-seq [J]. Molecular Genetics and Genomics, 2016, 291(1): 297-307.

15.Zhu J, Niu Y, Tao Y, et al. Construction of high‐throughput genotyped chromosome segment substitution lines in rice (Oryza sativa L.) and QTL mapping for heading date [J]. Plant Breeding, 2015, 134(2): 156-163.


撰稿:小   萍

编辑:市场部


猜你喜欢

5条影响GWAS定位的要素

发文36计 | 如何用同一样本发4篇文章?

省钱省时!小样本重测序发文的诀窍在哪里? | 发文36计



请继续关注“BGI华大科技”公众号,

科技君将一如既往地为你提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存