查看原文
其他

省钱省时!小样本重测序发文的诀窍在哪里? | 发文36计

2016-07-20 小萍 华大科技BGITech

几个样本,只是做重测序没办法发好文章?科技君原以为想要挖掘和表型相关的基因需要群体,个体重测序只能检测变异信息,没有办法深度挖掘生物学故事。但是看了下面的内容,科技君认为这也没有什么不可能。


全文约2200字,建议阅读5分钟。


千姿百态的大自然由丰富多彩的动植物和其他生物共同组建,他们表型的多样性来源于丰富的遗传变异信息。动植物主要的遗传变异包括单碱基变异(SNP)、插入缺失(InDel)、结构变异(SV)、拷贝数变异(CNV)等,就是这些不同类型变异的存在,使得动植物间出现了颜色差异、抗病性差异、品质差异、和其他各种农艺性状差异。变异信息是我们进一步研究动植物表型差异的基础,它们可以作为分子标记帮助研究人员挖掘和选育优良的种质资源。


随着测序技术的发展,动植物变异检测有多种技术手段可以选择,现在我们可以根据具体需求选择最适宜的技术手段。


表1.动植物变异检测技术比较



不同的技术手段适用于不同的群体类型和研究目的,总的来说基于不同分型手段的研究方向如下所示,但大部分的研究方向都需要有对应的群体,如自然群体、家系群体、突变体等。






那么如果只是几个样本测序,不属于特定的群体类型但又想要深度挖掘生物学故事就无解了吗?当然不是,我们有充足的证据证明这种言论是错误的。利用高通量测序检测变异信息可以继续进行进化、功能基因挖掘等研究。针对少量个体的重测序,也是有多种研究策略的,下面我们来一看究竟:



1.优良性状个体测序,与大量的已知数据库信息比较,筛选独特位点


Lyu J, Zhang S, Dong Y, et al. Analysis of elite variety tag SNPs reveals an important allele in upland rice[J]. Nature communications, 2013, 4. (华大参与)


经过长期人工选育的具独特性状的作物优良品种,很可能固定了一些在祖先基因库中以低频状态存在的优质等位基因(elite allele)。这些优质等位基因贡献了该优良品种的优良农艺性状。在传统的遗传学研究中,科学家使用数量性状位点连锁作图(Quantitative trait loci linkage mapping)或关联作图(Association mapping)的方法定位农艺性状相关基因。但是,连锁作图需要耗费长时间构建分离群体,而关联作图对于群体中以低频状态存在的等位基因定位功效低。


为了高效快速地鉴定优质品系中的优质等位基因,新的鉴定方法——改良品系标签位点分析(Elite variety tag SNP analysis, ETAS analysis)被提出。本文选择6个优良的水稻品系与2个大的control样本数据进行比较,检测改良品系标签位点(ETASs)。




材料选择

优良品种:6个优良的水稻品种
Guichao2:indica,产量高;
Minghui63:indica, 雄性不育恢复系,抗稻瘟病;
IR64:indica,广泛的适应性和产量高;
IRAT104:japonica, 抗旱;
Koshihikari:japonica, 香味;
Chujing27:japonica, 产量高,广泛的适应性;

已发布的数据包括control I (40个栽培种主要是地方种,25个野生种),control II(517个中国地方种)。

技术应用

全基因组重测序每个测序~15X。

分析结果 

使用ETAS 分析,在著名的水稻改良品种,如高产的Guichao2、抗旱的IRAT104中,鉴定出与这些改良品种对应的标签位点;


进一步对陆稻IRAT104中的一个标签位点深入分析发现,此位点在陆稻与水稻中具有很大的频率差异(61% vs 3%),且其附近具有显著的人工选择信号;功能分析表明,此位点落在脱落酸合成的限速酶NCED基因的编码区;


通过个体基因组与群体基因组的比较,可以为鉴定改良基因提供重要依据。



2.进化研究


Mei C, Wang H, Zhu W, et al. Whole-genome sequencing of the endangered bovine species Gayal (Bos frontalis) provides new insights into its genetic features[J]. Scientific reports, 2016, 6.(华大参与)


大额牛(Gayal)是半野生濒临灭绝的牛品种,多种表型有别于家牛,而且其遗传背景未知。它的染色体条数(2n = 58)与家牛(Bos indicus和Bos taurus 染色体条数2n = 60)和印度野牛(Bos Gaurus染色体条数2n = 56)都不同。之前有报道称大额牛与家牛可以杂交,雌性后代可育,但是雄性后代不一定可育。大额牛经过自然选择但是未经过人工选择,还保留了它特有的性状。本文通过全基因组重测序深度解析大额牛的遗传特性。

 

材料选择

大额牛Gayal(半野生),红安格斯牛RAN和日本黑牛JBC作为对照。

技术应用

全基因组重测序平均11.78X。

分析结果

Gayal检测到的SNP有62.24%是其特有的,其中16,901个品种特异性非同义SNP与Gayal的一些性状关联;

利用PSMC分析发现牛的进化历史上有2次扩张和2次瓶颈效应;

结合原有已发表数据进行进化分析发现Gayal是雄性野牛和雌性家牛的杂交后代。



3.抗性诊断标记开发


Yang H, Jian J, Li X, et al. Application of whole genome re-sequencing data in the development of diagnostic DNA markers tightly linked to a disease-resistance locus for marker-assisted selection in lupin (Lupinus angustifolius)[J]. BMC genomics, 2015, 16(1): 1.


随着分子育种的发展,标记辅助选择已经成功用于商业品种的选育。但在育种过程中发现还有很大一部分的标记辅助选择(MAS)、QTL、分子标记的育种效果并未发挥作用。MAS需要标记与目标性状相关基因紧密连锁最好是共分离,另外标记需要具有广适性即该标记能用于大范围的种质筛选中。同时满足这两点需求的标记比较难获得。传统方法检测功能性标记和诊断标记耗时都比较长。


高通量测序可以用于开发高密度的分子标记,同时还可以帮助快速挖掘诊断标记。抗茎枯病是羽扇豆育种的主要发展方向之一,之前研究发现至少有Phr1Phr1 PhtjR三个主要的基因在澳大利亚驯化羽扇豆中发挥作用,但是没有挖掘到能够成功用于MAS的PhtjR共分离的标记。本文利用全基因组重测序方法快速检测到了多个候选的诊断标记。




材料选择

9个羽扇豆栽培种:Unicrop、Yorrel 、Merrit、 Kalya 、Tallerack、 Quilinock 、Mandelup、 Coromup、 Jenabillup,参考基因组序列为Tanjil且携带有PhtjR基因;


Tanjil 和Unicrop构建的F8群体,之前已构建过遗传图谱。

技术应用

●每个栽培种全基因组重测序9-15X。

分析结果

测序数据与参考基因组比对检测到180,596-795,735个SNP和33,094 -122,513个InDels;

共207,887 标记锚定到羽扇豆遗传连锁图谱上,其中387 个SNP和87个InDel与一些重要的农艺性状相关的11个基因连锁;

利用作图群体定位结果和重测序数据检测到17个候选诊断标记与抗茎枯病基因PhtjR连锁,选择10个标记(5个诊断标记、5个非诊断标记)验证了5个诊断标记的有效性;

连锁分析定位到与PhtjR基因连锁最紧密的3个基因位于一个scaffold上,利用重测序数据在这个scaffold上检测到489个SNP标记和101个InDel标记,其中有187个SNP和56个InDel标记在所有10个样品中与PhtjR基因表型关联,也可以认为是诊断标记。选择6个SNP和4个InDel经验证3个SNP和2个InDel为诊断标记。


下面,我们来划一下重点(敲黑板)!——个体重测序进行上述研究需要哪些条件?


前提是,您首先要有明确的研究目标,然后才是清晰的研究步骤。


1.找到个体重测序的样本。
——这真的不是一句废话。


2.进行深度高一些的全基因组重测序。
——高深度测序保证基因组覆盖度和变异检测的准确性。


3.针对本物种遗传背景的知识储备。
——特别重要。不过可能需要对该物种更了解的您来主导。


4.大量的本物种的、已知的、可获得的基因组数据。
——非常重要。个体重测序需要大量本物种的数据辅助过滤,以找到测序样本特有信息。


5.确定研究要点进行信息分析。
——需要强强联合。科技君内举不避亲,自信推荐华大团队,毕竟上面的前两篇文章华大都有参与,经验值还是很厉害的!



撰文:小   萍

编辑:市场部



猜你喜欢

发文36计 | 如何用同一样本发4篇文章?



请继续关注“BGI华大科技”公众号,

科技君将一如既往地为你提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存