查看原文
其他

【新品上市】喂,你是什么“品种”—— 基于 SNP 位点的品种鉴定

王德芬 诺禾致源科服 2023-02-13


品种鉴定的意义 
我国幅员辽阔,地形、气候等存在很大差异,从而造就了我国丰富的动植物地方种质资源,而品种鉴定是动植物种质资源保存、研究、开发利用以及新品种品种权保护的重要依据。品种鉴定可以降低由信号选择带来的基因多样性的减少,有利于更好的保护物种的多样性;促进了对遗传信息的有效管理;为育种策略的制定与实施奠定良好基础;为生物品牌产品的认证提供了有效信息;保护物种防止物种灭绝;为解决食品安全问题开辟了新途径;有利于对走私动物进行追查等。

传统的品种鉴定都以形态学标记为主,该方法易受环境及季节的影响,且鉴定时间长、工作量大。此外,经过几代杂交后的群体的个体表型与亲本高度相似,单纯利用表型性状进行品种鉴定不够准确、全面和科学。随后,品种鉴定工作由传统的表型鉴定发展为DNA分子标记技术,DNA分子标记的应用能够为品种鉴定提供准确、快速的渠道。早期的DNA分子标记技术一般使用微卫星、ALFP、SSR 等标记进行品种鉴定。随着基因芯片技术和测序技术的飞速发展,SNP(Single  nucleotide  polymorphism)位点逐渐被用于品种鉴定。

基于全基因组 SNP 位点的品种鉴定的优缺点



优点:与其他 DNA 分子标记相比,SNP 标记技术以其高通量、高集成、微型化和自动化等优点被广泛应用于品种鉴定:(1)SNP数目多,密度高,分布广泛。在人类基因组中,平均每1kb即存在1个 SNP 位点;(2)富有代表性。部分位于基因编码区的 SNP 有可能改变基因功能或影响基因表达,从而影响个体性状,为性状遗传研究提供一定的理论基础;(3)具有遗传稳定性。SNP 的基因突变概率小,尤其编码区的 SNP 高度稳定,遗传分析的重复性高;(4)SNP 的分型易于实现自动化。基于以上优点,SNP 成为品种鉴定新一代的理想标记。

缺点:在成千上万的 SNP 位点中识别出最具代表性的遗传标记,需利用不同的统计方法结合遗传信息对 SNP 位点进行筛选,需要计算等位基因频率,大大增加了计算复杂度和运算量,且无法评估所选 SNP 位点的重要程度。

研究策略



诺禾致源致力于为广大科研工作者提供优质的科研服务。基于以上问题,生信研发人员将 PCA 和随机森林相结合,进一步升级优化分析方法,提取高信息量的 SNP 位点,最终实现高准确率的品种鉴定,继续为大家提供更全面优质的分析服务。随机森林可以利用数据之间相互依赖的信息,构建多元分类规则;在每个类别边界上有很好的非线性;提供了变量重要性的衡量方法。运用 PCA 与随机森林结合的方法,能够实现利用少量高信息量的 SNP 进行品种鉴定,提高了鉴定的准确率,降低了品种鉴定的成本。为保证获得足够数量的SNP,且每个品种间的SNP具有差异性,需要采集的品种尽量全面,采集的区域尽量广泛。每个品种至少选择30个个体,选取的个体应具有代表性。对每个个体分别进行全基因组重测序,平均测序深度30X。


参考文献

1. Kuehn, L.A.et al. Predicting breed composition using breed frequencies of 50,000 markers from the US Meat Animal Research Center 2,000 Bull Project. Journal of animal science, 2011. 89(6): p. 1742.

2. Fontanesi, L.et al. A melanocortin 1 receptor (MC1R) gene polymorphism is useful for authentication of Massese sheep dairy products. Journal of Dairy Research, 2011. 78(1): p. 122-128.

3. Fontanesi, L. Genetic authentication and traceability of food products of animal origin: new developments and perspectives. Italian Journal of Animal Science: Proceedings of the 18th ASPA Congress, Palermo, June 9-12, 2009, 2009. 8(2s): p. 9-18.

4. Nielsen, R.et al. Recent and ongoing selection in the human genome. Nature Reviews Genetics, 2007. 8(11): p. 857-868.

5. Dalvit, C.et al. Genetic traceability of meat using microsatellite markers. Food Research International, 2008. 41(3): p. 301-307.

6. Agarwal, M., N. Shrivastava, and H. Padh Advances in molecular marker techniques and

their applications in plant sciences. Plant Cell Reports, 2008. 27(4): p. 617-631.

7.  Button P. The international union for the protection of new varieties  of  plants(UPOV)recommendations  on  variety denominations.  Proceedings  of  the  Fifth  International Symposium on the Taxonomy of Cultivated Plants,2008,799:191-200.

8. Hudson, T.J.et al. High-resolution haplotype structure in the human genome. Nature Genetics, 2001. 29(2): p. 229-232.

9. Pfaff, C.L.et al. Information on ancestry from genetic markers. Genetic Epidemiology, 2004. 26(4): p. 305-315.

10. Weir, B.S.et al. Measures of human population structure show heterogeneity among genomic regions. Genome research, 2005. 15(11): p. 1468-1476.

11. Rosenberg, N.A.et al. Informativeness of Genetic Markers for Inference of Ancestry. The American Journal of Human Genetics, 2003. 73(6): p. 1402-1422.

12. Paschou, P.et al. PCA-correlated SNPs for structure identification in worldwide human populations. PLoS genetics, 2007. 3(9): p. 1672-1686.

13. 刘月丽, 覃锡忠, 贺三刚,等. PCA 与随机森林相结合筛选高信息量 SNP 位点 ——应用于羊的品种鉴别[J]. 计算机工程与应用, 2018, 054(016):235-240.



动植物合作组  王德芬 | 文案

孙翠翠丨编辑

图片来源于网络,侵删






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存