查看原文
其他

植物育种新思路——有效利用种子库内遗传多样性 | Nature Plant 论文推荐

2016-10-31 黎茵 科研圈

这项新的研究以高粱为例,向育种学家演示了如何有效地从植物基因库中挖掘和利用遗传多样性。

 

撰文 Patrick J. Brown

编译 黎茵


在挪威一个小岛上,永久冻土的地底深处有一座精心设计的由隧道系统构成的建筑,这就是斯瓦尔巴全球种子库 (Svalbard Global Seed Vault),目前保存着超过 800,000份植物样本,而它的容量达 450 万份,是维持人类生存所需的遗传材料的“备份”。

 


种子库入口


全世界范围内的植物基因库保存了数以百万计的作物品种,其中一些无疑可以用于解决未来干旱、病虫害和作物疾病蔓延等问题,但这些品种中的大多数都埋没在库藏中而未被育种项目利用。

 

如何才能帮助育种学家获取这些对他们非常有用的遗传多样性?随着更多的基因库增加了基因分型的信息,或许通过基因组预测可以达到这个目的。

 

Yu 等发表在最近的《自然植物》(NaturePlants)中的一篇研究报告,首次通过概念验证性研究证明,可以通过基因组预测精准地预测高粱基因库中的基因性状。

 

基因组预测是根据已知个体的基因型,对其表型数据进行推断。推断过程基于由包含表型和基因型信息的个体构成“训练集”所建立的模型。具体来说,模型将表型效应指定给一个标记数据集中的每个等位基因,综合当地的管理与环境,然后求和计算预测每个个体的表型。

 

Yu 和他的同事对美国农业部基因库中的1,000个光周期敏感热带高粱品种进行了基因分型,并利用这些数据挑选了包含近300个品种的代表训练集,用于测量生物产量及其相关的性状,包括植物高度和抗倒伏能力。随后此数据集被用于预测余下的近700个品种中哪些产量最低,哪些最高。

 

这个预测模型验证了 200 个具有真实表型数据的品种,其中包括预测产量最高和最低的各 50个品种以及 100 个随机选择的品种。生物产量的预测准确度 (观察与预测表型相关性,r)是0.76,对于作物产量这样的复杂性状来说准确度是非常高的。

 

这个令人鼓舞的成果为一系列未来的研究奠定了基础。在 Yu 的这项研究中,较高的预测准确度可能归因于他们使用了高度多样化的种质资源。

 

基因组预测的一个棘手问题是群体结构,即不同个体之间隐藏共同祖先的网络的影响。群体结构在全基因组关联研究(GWAS)中是有严格控制的,但基因组预测则没有。

 

高粱分为五个小种(race,亚种以下的分类单位)(bicolor, caudatum, durra, guinea kafir),在  Yu等人的这项研究中,这些不同的小种与生物产量有很强的关联性,durrasbicolors 分别具有最大和最小的产量,他们的预测模型的准确性有部分来自于简单地预测这些品种是属于 durras 还是属于 bicolors,而受过训练的育种学家在没有基因型数据的情况下也可以作出类似的预测。他们的预测模型有可能过于强调亚种间的差异,但对于育种学家来说,需要保持作物多样性以及长期的基因储备,则需要对所有小种进行分析而不是只关注产量最高的 durras

 

基因组预测的另一个限制是遗传多样性的保持,Yu 等人在文章中的第二个验证实验使用了完全不同的另一组580个高粱品系。在这个独立集中预测生物产量的准确性明显下降 (r = 0.56),这有可能是由于这个新的数据集包含了许多训练集中没有的特殊等位基因。因此,虽然训练集被选来代表原始集的 1,000个品种,却难以代表这个新建的独立集,从而导致预测准确度下降。

 

大多数物种的遗传多样性正是因为隐藏有罕见的等位基因,而由于其出现频率很低,通常在给定的训练集中会被忽略。解决这个问题的方法包括对这些等位基因的影响进行加权,并选择基因组子集而不是全基因组。这种策略有可能发掘到令人惊喜的有价值的等位基因,但在训练集中缺少的等位基因则仍然无从识别。

 

研究结果显示训练集的设计对基因组预测结果有很大的影响。基因组预测模型的验证可以自我强化,在预测产量最高和最低的各50个用于验证表型的品种,通常属于与训练集非常相似的基因型,因为这些个体与那些表型特殊的个体相比具有更高程度的可靠性。为了处理这种偏差,Yu等人应用一个新的度量——可靠性上限,用以优先将新的、具有遗传特殊性的个体纳入训练集。建立预测模型是一个迭代的过程,每一代的表型数据显示出模型的缺点(预测较差个体),从而可以做进一步的改进。在这第一次迭代中Yu等人发现,在验证集中测量到的最高生物产量并不在他们预测为最高的 50个品系中,而是在那 100个随机选定的品系中。

 

Yu 等人证明我们已经可以开始实现基因组预测,但需要做更多的工作以确保最有效地利用好基因库的巨大潜力。

 

作者Patrick J. Brown是美国伊利诺伊大学作物科学系副教授


参考文献

1. McCouch, S. et al. Nature 499, 23–24(2013).

2. Yu, X. et al. Nat. Plants 2, 16150(2016).

3. Jannink, J.-L. Genet. Sel. Evol. 42, 35(2010).

4. Daetwyler, H. D., Hayden, M. J., Spangenberg, G. C.& Hayes, B. J. Genetics 200, 1341–1348 (2015).

5. Karaman,E., Cheng, H., Firat, M. Z., Garrick, D. J. & Fernando, R. L. PLoS ONE 11,e0161054 (2016).

 

原文链接:

http://www.nature.com/articles/nplants2016154



 相关论文信息


题目 Genomic prediction contributing to a promising global strategy to turbocharge gene banks

作者 Xiaoqing Yu, Xianran Li, Tingting Guo, Chengsong Zhu, Yuye Wu, Sharon E. Mitchell, Kraig L. Roozeboom, Donghai Wang, Ming Li Wang, Gary A. Pederson, Tesfaye T. Tesso, Patrick S. Schnable, Rex Bernardo & Jianming Yu

期刊 Nature Plants

数字识别码 doi:10.1038/nplants.2016.150

发表日期 Published online:03 October 2016

摘要

The 7.4 million plant accessions in gene banks are largely underutilized due to various resource constraints, but current genomic and analytic technologies are enabling us to mine this natural heritage. Here we report a proof-of-concept study to integrate genomic prediction into a broad germplasm evaluation process. First, a set of 962 biomass sorghum accessions were chosen as a reference set by germplasm curators. With high throughput genotyping-by-sequencing (GBS), we genetically characterized this reference set with 340,496 single nucleotide polymorphisms (SNPs). A set of 299 accessions was selected as the training set to represent the overall diversity of the reference set, and we phenotypically characterized the training set for biomass yield and other related traits. Cross-validation with multiple analytical methods using the data of this training set indicated high prediction accuracy for biomass yield. Empirical experiments with a 200-accession validation set chosen from the reference set confirmed high prediction accuracy. The potential to apply the prediction model to broader genetic contexts was also examined with an independent population. Detailed analyses on prediction reliability provided new insights into strategy optimization. The success of this project illustrates that a global, cost-effective strategy may be designed to assess the vast amount of valuable germplasm archived in 1,750 gene banks.

Yu,  et al. Nat. Plants 2, 16150(2016)

链接 http://www.nature.com/articles/nplants2016150


阅读更多


▽ 故事

· 年过九旬仍未止步 锂电池之父 Goodenough 的科研之路

· “大龄女星”偏爱的冷冻卵子技术,真的安全又有效吗?

· 张锋登上《时代周刊》封面:编辑基因组的下一代领袖

· 科学史上最著名的猫,以及它令人意外的残忍隐喻

▽ 论文推荐

· 女性经济地位高的地方,自然灾难造成的伤害更小 | Social Forces 论文推荐

· 哈欠越长,越聪明?(内含超萌视频!) | Biology Letters 论文推荐

· 面部表情啥含义?不同人眼中也许不一样 | PNAS 论文推荐

▽ 论文导读

· Science 一周论文导读 | 21 OCT 2016

· Nature 一周论文导读 | 20 OCT 2016




内容合作请联系

keyanquan@huanqiukexue.com



这里是“科学美国人”中文版《环球科学》服务科研人的微信号“科研圈”。我们:


· 关注科学进展与科研生态

· 推荐重要前沿研究

· 发布科研招聘

· 推送学术讲座与会议预告。


欢迎长按二维码关注。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存