专题聚焦 | 那些年,我们一起追过的棉花泛基因组和多组学研究
棉花是我国重要的经济作物,原产于亚热带。棉织物光泽柔和、透气保暖、高弹抗皱,深受世界各国人们的喜爱。栽培棉花主要包括陆地棉(细绒棉)、海岛棉(长绒棉)、粗绒棉等类型,其中又以埃及棉、新疆长绒棉、比马棉为棉中三甲,而新疆长绒棉又因量大质优而成为棉中翘楚。
我国主要种植的棉花为异源四倍体,其中陆地棉约占98%。因棉花产量与纤维品质常呈负相关关系,长期以来,棉花育种研究工作者们孜孜不倦地挖掘优良性状的成因,并试图打破目标性状基因与不利形状基因的连锁,扬长避短,试图实现品质与产量的双跃升。
焦点文章一
Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield
(诺禾致源合作文章)
期刊:Nature Genetics
发表时间:2018年1月
焦点文章二
Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement
(诺禾致源合作文章)
期刊:Nature Biotechnology
发表时间:2015年5月
De novo基因组组装(ILMN小片段、ILMN mate-pair、BAC、连锁图谱构建)、RNA-seq、比较基因组分析(分歧时间估算、系统发育、进化速率估算、共线性分析、正选择基因、基因丢失)等。
陆地棉是多倍体作物驯化和转基因改良的典范。 在此,作者通过整合全基因组鸟枪法、细菌人工染色体(BAC)和GBS遗传图谱,得到了异源四倍体陆地棉TM-1基因组。作者组装并注释了32,032个A-亚基因组基因和34,402个D-亚基因组基因。在A亚基因组中,结构重排、基因丢失、基因破坏和序列分化比在D亚基因组中更为常见,表明进化是不对称的。但是,在亚基因组之间没有发现全基因组级别的表达优势。A亚基因组中的纤维改善和D亚基因组中的胁迫耐受性的选择和驯化的基因组特征与正选择基因(PSG)相关。该基因组序列为优化棉花品系提供了参考。
图2 异源四倍体棉花基因组的共线性分析和不对称进化
焦点文章三
Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution
期刊:Nature Genetics
发表时间:2020年3月
研究策略
文章亮点
焦点文章四
Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense
期刊:Nature Genetics
发表时间:2018年12月
De novo基因组组装(PacBio+BioNano光学图谱+Hi-C)、比较基因组分析(共线性分析、PAV、SV等)、重测序(BSA、QTL等)、eQTL等。
焦点文章五
Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
期刊:Nature Plants
发表时间:2018年1月
Hi-C(A/B区室鉴定、TAD鉴定)、ChIP、BS-seq、RNA-seq等。
多倍体的形成显著增加了转录调控的复杂性,可能在复杂的高级染色质结构中得到展现。但是,关于多倍体化过程中的三维基因组结构及其动力学认知仍然不足。在此,作者通过解析二倍体和四倍体棉花的3D基因组结构,发现了A / B区室和拓扑相关域(TAD)的存在。通过对每个亚基因组在四倍体及其现存的二倍体祖先中的比较,作者发现基因组异源多倍体化促进了两个亚基因组中的A / B区室转换和TAD的重组。作者进一步发现,在多倍体化过程中TAD边界的形成优先发生在开放染色质中,这与活性染色质修饰的沉积相吻合。此外,亚基因组间染色质相互作用的分析揭示了同源基因的空间接近,可能与其协同表达有关。这项研究增加了对植物染色质的了解,并为3D基因组进化与转录调控之间的关系提供了新的思路。
图5 二倍体棉和四倍体棉亚基因组的染色质相互作用比较
焦点文章六
Epigenomic and functional analyses reveal roles of epialleles in the loss of photoperiod sensitivity during domestication of allotetraploid cottons
期刊:Genome Biology
发表时间:2017年1月
RNA-seq、BS-seq、MethylC-seq、qRT-PCR、系统发育等。
棉花的主要栽培种陆地棉和海岛棉都是由二倍体亚洲棉(A基因组)和雷蒙德氏棉(D基因组)的相似种杂交并基因组加倍,经过自然选择和人工驯化而来。在此,作者首次绘制了栽培棉花(四倍体)、野生四倍体、种间杂种、以及二倍体棉花的单碱基分辨率DNA甲基化图谱。研究发现DNA甲基化和DNA序列协同进化,但DNA甲基化进化速度远高于DNA序列进化速度。在棉花自然进化过程中,DNA甲基化的变化主要发生在基因区,而且更偏向于A亚基因组(来源于亚洲棉祖先),这些DNA甲基化变化能够显著的影响附近基因的表达。五百多个表观位点与棉花的人工驯化以及农艺性状相关,包括种子休眠、控制开花和对生境适应(生物和非生物因子)的基因。多个表观遗传靶点为将来的育种工作提供了重要的资源,并有助于开辟新的表观遗传育种方法。
图6 棉花A和D基因组中TE和DNA甲基化的不对称分布
力挺新疆棉,国人当自强。
棉花基因组学研究文章精选
参考文献
[1]. Huang G, Wu Z, Percy R G, et al. Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution[J]. Nature genetics, 2020, 52(5): 516-524.
[2]. Wang M, Tu L, Yuan D, et al. Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense[J]. Nature genetics, 2019, 51(2): 224-229.
[3]. Ma Z, He S, Wang X, et al. Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield[J]. Nature genetics, 2018, 50(6): 803-813.
[4]. Wang M, Wang P, Lin M, et al. Evolutionary dynamics of 3D genome architecture following polyploidization in cotton[J]. Nature Plants, 2018, 4(2): 90-97.
[5]. Song Q, Zhang T, Stelly D M, et al. Epigenomic and functional analyses reveal roles of epialleles in the loss of photoperiod sensitivity during domestication of allotetraploid cottons[J]. Genome biology, 2017, 18(1): 1-14.
[6]. Zhang T, Hu Y, Jiang W, et al. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement[J]. Nature biotechnology, 2015, 33(5): 531-537.
往期精彩推荐