查看原文
其他

什么是Graded-seq?| 群体遗传专题

运营部-HFR 联川生物 2022-05-21

Graded-seq的概念在2019年由韩斌和黄学辉课题组提出并发表于Nature Communication(Wang et al., 2019)。这种方法与常规BSA类似的是,它也是基于性状分离群体中按照性状选择子代个体构成混池(通常加上亲本)进行测序,并进行QTL定位的方式;但与常规BSA方法仅选择两个极端性状构成子代池不同,Graded-seq通过对数量性状的中间型性状也选择子代构成混池,构成“高值组”,“中值组”,“低值组”,形成三个或三个以上的混池。其实验设计如下图所示:

既然是超过2个混池,那么常规BSA方法使用的定位算法,无论是SNP-index还是ED(欧几里得距离)都不再适用,需要使用新的算法进行关联。而Graded-seq的核心,就是Ridit检验。

Ridit是relative to an identified distribution unit一词的缩写,它是一种非参数检验分析方法,用于按等级分组资料的比较。而对于多个混池测序数据,Ridit检验会对每个位点的等位基因频率进行计算,判断其是否显著偏离标准分布,得到一个p值。换言之,这个位点的p值越小,即代表这个位点与性状相关联的可能性越高。

这听起来是不是很像GWAS关联的逻辑?对每个位点计算一个p值,并且判断是否与性状连锁。但是与GWAS不同,Ridit检验的对象只有3-4个混池,远远及不上GWAS上百个个体的基因型数据,所以Ridit检验的结果用曼哈顿图的形式展现出来,我们会发现其噪音非常强烈。如下图,我们很难从中直观地判断我们的候选区间的位置。

所以研究者们就想到了一种降噪方法,选取一定大小的窗口(根据物种不同窗口的选择也不同,论文中提到水稻的最佳窗口大小是400kb),并且将窗口内的SNP位点进行统计,计算p值低于阈值的位点所占的比例。那么经过这种滑窗计算之后,上面的图被转换成了下面这幅背景非常干净的图:

这样,就可以非常清晰地对信号进行判断了。并且由于增加了一个以上的混池,Graded-seq的定位精度通常要优于仅使用两个极端池进行的常规BSA,通常可以有数倍的提升,对于水稻等常规作物可以定位到几百kb大小的区间。如果所研究的性状是数量性状,并且有一个足够大的F2分离群体,不妨考虑一下使用Graded-seq进行定位工作,也许能够得到意想不到的惊喜。

当然了,如果得到一个足够小的区间,我们也就可以更方便地展开精细定位的工作,如何进行精细定位,我们后面会再为大家介绍。

如果等不及想要知道,不妨购买联川生物出品的《NGS时代的BSA百科全书》,不仅是关于BSA和Graded-seq的知识点,其他定位方法以及精细定位的思路也都尽在掌握,点击下方阅读原文即可购买。


参考文献:

Wang, C., Tang, S., Zhan, Q. et al. Dissecting a heterotic gene through GradedPool-Seq mapping informs a rice-improvement strategy. Nat Commun 10, 2982 (2019).



相关阅读


一文说明白BSA到底需要几个混池 | 群体遗传专题

一文说清楚BSA分析的阈值选择 |  群体遗传专题

什么是“SNP-index”?| 群体遗传专题

什么是“欧几里得距离”(ED)?| 群体遗传专题

我的候选基因里没有SNP和InDel变异,是定位错了吗?| 群体遗传专题

购书请点击下方
阅读原文


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存