泛基因组研究,顶级期刊他们这样发!
随着研究的深入,单一参考基因组暴露出其在遗传变异检测方面的局限性。于是,这直接促使了泛基因组概念的提出以及后续的应用。近年来,测序价格的不断下降以及算法的不断进步为泛基因组研究提供便利,泛基因组文章发表数量也逐年上升。泛基因组现已在动植物基因组学研究中被广泛用于更为全面地评估物种内遗传多样性,探究跨物种的基因交流和驯化及改良过程。
图1 泛基因组逐年发文情况
泛基因组的概念在2005年被首次提出之后[1],关键词“pangenome” 或者“pan-genome” 在PubMed上检索统计篇数(检索日期:2022-01-19)
+
泛基因组
广义来讲,泛基因组是指一个包含物种全部遗传信息的集合,这个集合可以被分为物种几乎所有个体共有的核心基因集(core genome,一般认为存在于超过95%的个体基因组中),和仅在部分个体中存在的非必需基因集(dispensable/variable/accessory/genome)[2]。
+
研究意义
单一的参考基因组对于了解不同性状的遗传基础来说是片面的,例如植物中很多重要农艺性状的基因经常见于非必需基因集内[2]。单一参考基因组可能检测不到某些存在/缺失和拷贝数变异。在这种情况下,构建一个泛基因组的价值就会凸显出来。一般来说,结构变异中的存在/缺失变异(presnece/absence variation)是泛基因组的重点研究对象,这些非必需基因组可能就是使个体产生不同性状的原因。
第一篇植物泛基因组文章于2014年发表[3],作者对7个Glycine soja种质资源进行测序。栽培大豆在驯化过程中丢失了很多遗传多样性,所以野生种某些基因可能对大豆育种改良起到关键作用。这篇文章表明,单一的参考基因组对于全面了解一个群体的遗传多样性是不够的。
同样,单一参考基因组对动物来说也是片面的。2019年,Sherman等人[4]对910个非洲人进行泛基因组研究,结果表明和参考基因组比较,10%的序列信息丢失,且大多数序列存在编码蛋白的基因。人类泛基因组的获得,对于一些单一参考基因找不到的变异位点的检测具有重要的意义。
+
构建方法
目前,构建泛基因组主要是基于迭代组装和从头组装,共有三种方法,如图2所示[5]。
基于从头组装基因组构建泛基因组是对多个个体进行从头测序并注释,然后对同一物种不同个体基因组间比较,确定核心和非必需基因组序列,最后将这些序列去冗余合并后构成一个泛基因组,这种组装方法能够检测到更多的结构变异,但是对计算资源和测序深度要求高,对于基因组大的物种和大规模群体来说不太经济。
迭代组装利用参考基因组,将每个样本的数据比对到参考基因组,对未比对的数据进行组装,然后使用非冗余序列更新参考基因组。这种方法可以利用重测序数据,对测序深度要求较低。同时,因为只对未成功比对到参考基因组上的序列进行了组装,这种方法相对节省了计算资源,已在基因组较大的物种如小麦以及大规模测序物种如水稻中被应用。
以上提到的问题还存在如个体不同变异信息丢失的问题。线性泛基因组呈现了可变基因组的序列组成,却丢失了染色体位置信息。针对这一问题,科学家们开发出图形泛基因组分析流程,这种组装方法可以将所有的变异整合到泛基因组图谱中[6]。
但是以上三种方法都有其各自的优缺点。迭代组装可能检测不到序列的插入和缺失,从头组装方法不能区分个体间常见的变异。图形泛基因组看起来似乎是最优解,但是该方法需要用到大量高质量的长读长测序数据,以及超大的计算机资源,所以在泛基因组构建方面,目前主要用于个体数量小和基因组小的物种上,还未能广泛应用[5]。
图2 泛基因组的三种构建方式
+
泛基因组文章汇总
泛基因组自概念的提出到现今已经发表了多篇影响因子高的文章。
备注:前16篇文章来源于边培培等人在线发表的综述[6],后7篇来源于基于ICBI检索影响因子>10分的文章总结而成。
+
科技君总结
构建泛基因组对于全面研究一个物种的遗传进化具有重要的意义。从已发表的文章情况来看,未来基于泛基因组的动植物研究将会是大趋势。科技君认为,如果研究人员研究的是基因组小的物种,且手上掌握可靠的种质资源,不妨考虑构建该物种的泛基因组,为后续研究打下坚实的基础。
长期以来,华大科技在基因组组装和泛基因组研究方面具有丰富的项目经验,参与过水稻、鹰嘴豆及高粱泛基因组等研究项目,能够满足客户对大规模样本测序及信息分析的需求。欢迎垂询!
华大科技为广大科研人员提供基因组De novo一站式服务。
●
项目经验多,品牌底蕴足
华大截止目前已发表总计263篇基因组文章,物种数量多达500种;CNS三大主刊文章36篇;顶级期刊封面文章28篇;影响因子>10分文章150篇。
●
提取成功率高,建库起始量低
疑难物种高达75%提取成功率,5ng超低起始量长片段建库。
●
多平台联合应用,实现精准组装
3大测序平台(DNBSEQ/ Nanopore PromethION/ PacBio Sequel II)联合应用,成熟Hi-C建库技术,可实现染色体级别组装。
欲知更多详情,
请联系华大科技当地销售代表↓↓↓
热线电话:400-706-6615
邮箱:info@genomics.cn
参考文献:
[1] Tettelin, H. et al. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: implications for the microbial "pan-genome". Proc. Natl Acad. Sci. USA 102, 13950–13955 (2005).
[2] Dominique Morneau. (2021). Pan-genomes: moving beyond the reference.
[3] Li, Y. et al. (2014). De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits. Nat. Biotechnol. 32, 1045–1052. doi: 10.1038/nbt.2979
[4] Sherman, Rachel M., et al. "Assembly of a pan-genome from deep sequencing of 910 humans of African descent." Nature genetics 51.1 (2019): 30-35.
[5] Bayer, Philipp E et al. “Plant pan-genomes are the new reference.” Nature plants vol. 6,8 (2020): 914-920. doi:10.1038/s41477-020-0733-0
[6] 边培培,张禹,姜雨.泛基因组:高质量参考基因组的新标准[J].遗传,2021,43(11):1023-1037.DOI:10.16288/j.yczz.21-214.
[7] Tao Y, et al. (2021). Extensive variation within the pan-genome of cultivated and wild sorghum. Nat Plants. Jun;7(6):766-773. doi: 10.1038/s41477-021-00925-x. Epub 2021 May 20. PMID: 34017083.
[8] Qiao, Qin, et al. "Evolutionary history and pan-genome dynamics of strawberry (Fragaria spp.)." Proceedings of the National Academy of Sciences 118.45 (2021).
[9] Zhang, Xiaohui, et al. "Pan-genome of Raphanus highlights genetic variation and introgression among domesticated, wild, and weedy radishes." Molecular Plant 14.12 (2021): 2032-2055.
[10] Li, Jianying, et al. "Cotton pan-genome retrieves the lost sequences and genes during domestication and selection." Genome biology 22.1 (2021): 1-26.
[11] Wang, Kejun et al. “The Chicken Pan-Genome Reveals Gene Content Variation and a Promoter Region Deletion in IGF2BP1 Affecting Body Size.” Molecular biology and evolution vol. 38,11 (2021): 5066-5081. doi:10.1093/molbev/msab231
[12] Cai, Xu et al. “Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa.” Genome biology vol. 22,1 166. 31 May. 2021, doi:10.1186/s13059-021-02383-2
[13] Varshney, Rajeev K et al. “A chickpea genetic variation map based on the sequencing of 3,366 genomes.” Nature vol. 599,7886 (2021): 622-627. doi:10.1038/s41586-021-04066-1
↓
向下滑动查看
往期推荐
|
关注“华大科技BGITech”,获取更多信息!
点击“阅读原文”查看官网,了解更多