查看原文
其他

专题聚焦 | 那些年,我们一起追过的棉花泛基因组和多组学研究

王 璐 诺禾致源科服 2023-02-13

棉花是我国重要的经济作物,原产于亚热带。棉织物光泽柔和、透气保暖、高弹抗皱,深受世界各国人们的喜爱。栽培棉花主要包括陆地棉(细绒棉)、海岛棉(长绒棉)、粗绒棉等类型,其中又以埃及棉、新疆长绒棉、比马棉为棉中三甲,而新疆长绒棉又因量大质优而成为棉中翘楚。

可可爱爱、白白净净的新疆长绒棉
(图片来源:央视新闻官方微博)

我国主要种植的棉花为异源四倍体,其中陆地棉约占98%。因棉花产量与纤维品质常呈负相关关系,长期以来,棉花育种研究工作者们孜孜不倦地挖掘优良性状的成因,并试图打破目标性状基因与不利形状基因的连锁,扬长避短,试图实现品质与产量的双跃升。

数年来,诺禾致源先后协同多家科研院所在 Nat Genet 等期刊上发表了高质量陆地棉基因组封面文章和陆地棉核心种质群体分析研究。与此同时,多位科研工作者过多组学手段,更全面地检测棉纤维产量和质量相关性状,进一步明确不同棉花品种的起源,并试图通过海岛棉研究启发陆地棉的纤维品质改良,为我国的棉花育种工作做出了重要贡献。
 


焦点文章一

Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield

(诺禾致源合作文章)

期刊:Nature Genetics

发表时间:2018年1月

   
研究策略
重测序(群体结构分析、LD衰减、GWAS)、RNA-seq等。

文章亮点
陆地棉是最重要的天然纤维作物,应广泛探讨支持纤维质量和产量的各种种质和等位基因的基因组变异。作者对419个核心品系进行了低深度重测序,并确定了约366万个SNP。作者在12个环境中进行了表型分析,并对13个与纤维相关的性状进行了全基因组关联研究。7,383个特异SNP与这些性状显著相关,并定位在4,820个基因内或附近。与纤维产量相比,检测到的纤维质量关联的位点更多。与A亚基因组相比,D亚基因组检测到的纤维基因更多。作者进一步鉴定了数个新的花期、纤维长度和纤维强度等相关的致病基因。这些特征的表型选择增加了驯化和育种过程中精英等位基因的频率。这些结果为棉花分子育种的提供了新的靶标。
图1 419个品系的系统发生树、PCA、遗传结构和LD衰减分析
 


焦点文章二

Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement 

(诺禾致源合作文章)

期刊:Nature Biotechnology

发表时间:2015年5月


研究策略

De novo基因组组装(ILMN小片段、ILMN mate-pair、BAC、连锁图谱构建)、RNA-seq、比较基因组分析(分歧时间估算、系统发育、进化速率估算、共线性分析、正选择基因、基因丢失)等。


文章亮点

陆地棉是多倍体作物驯化和转基因改良的典范。 在此,作者通过整合全基因组鸟枪法、细菌人工染色体(BAC)和GBS遗传图谱,得到了异源四倍体陆地棉TM-1基因组。作者组装并注释了32,032个A-亚基因组基因和34,402个D-亚基因组基因。在A亚基因组中,结构重排、基因丢失、基因破坏和序列分化比在D亚基因组中更为常见,表明进化是不对称的。但是,在亚基因组之间没有发现全基因组级别的表达优势。A亚基因组中的纤维改善和D亚基因组中的胁迫耐受性的选择和驯化的基因组特征与正选择基因(PSG)相关。该基因组序列为优化棉花品系提供了参考。

图2 异源四倍体棉花基因组的共线性分析和不对称进化




焦点文章三

Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution

期刊:Nature Genetics  

发表时间:2020年3月

  

研究策略

De novo 基因组组装(PacBio、ILMN、Hi-C)、LTR 分析、重测序(群体遗传、种群规模分析)、系统发育、RT-qPCR 等。


文章亮点

通过组装第一个 Gossypium herbaceum(A1)基因组并显著改善现有的 Gossypium arboreum(A2)和 Gossypium hirsutum((AD)1)基因组,作者发现所有现有的A基因组都可能起源于一个共同的祖先A0,其与A1的亲缘关系远近于A2。此外,异源四倍体的形成早于A1和A2的物种形成。两种A基因组都是独立进化的,没有祖先与后代的关系。高斯概率密度函数分析表明,570万年前至不到61万年前发生的多次长末端重复大爆发为A基因组大小的扩张、物种形成和进化做出了主要贡献。基因区域中丰富的物种特异性结构变异改变了许多重要基因的表达,这可能导致了(AD)1中纤维细胞的改善。该发现解决了围绕A基因组起源的现有争议,为棉花遗传改良提供了有价值的基因组资源。

图3 异源四倍体棉花的系统发生、Ks、同源区域比较和形成模型



焦点文章四

Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense

期刊:Nature Genetics

发表时间:2018年12月

   
研究策略

De novo基因组组装(PacBio+BioNano光学图谱+Hi-C)、比较基因组分析(共线性分析、PAV、SV等)、重测序(BSA、QTL等)、eQTL等。

  
文章亮点
异源四倍体棉花种(Gossypium hirsutumGossypium barbadense)已在世界范围内长期种植,用于纺织天然可再生纤维。二者的基因组草图都已完成,但序列高度碎片化且不完整。在这里,作者通过单分子实时测序、BioNano光学图谱和Hi-C技术,完成了二者的参考级基因组组装和注释。与此前的草图相比,新版本在高重复区域如着丝粒的连续性和完整性方面有显著改善。比较基因组学分析确定了多倍体化后可能发生的广泛的结构变异,尤其是在14条染色体的大型臂内、臂间倒位。作者构建了一个渐渗系种群,引入二者的有利染色体片段,并鉴定出13个与优良纤维质量相关的定量性状基因座。这些资源将加速棉花的进化和功能基因组学研究,并为此后的纤维改良育种工作提供帮助。
图4 Gossypium hirsutum 和 Gossypium barbadense 的染色体特征、变异密度、表观遗传信息,以及A基因组和D基因组的共线性分析
 


焦点文章五

Evolutionary dynamics of 3D genome architecture following polyploidization in cotton

期刊:Nature Plants

发表时间:2018年1月


研究策略

Hi-C(A/B区室鉴定、TAD鉴定)、ChIP、BS-seq、RNA-seq等。


文章亮点

多倍体的形成显著增加了转录调控的复杂性,可能在复杂的高级染色质结构中得到展现。但是,关于多倍体化过程中的三维基因组结构及其动力学认知仍然不足。在此,作者通过解析二倍体和四倍体棉花的3D基因组结构,发现了A / B区室和拓扑相关域(TAD)的存在。通过对每个亚基因组在四倍体及其现存的二倍体祖先中的比较,作者发现基因组异源多倍体化促进了两个亚基因组中的A / B区室转换和TAD的重组。作者进一步发现,在多倍体化过程中TAD边界的形成优先发生在开放染色质中,这与活性染色质修饰的沉积相吻合。此外,亚基因组间染色质相互作用的分析揭示了同源基因的空间接近,可能与其协同表达有关。这项研究增加了对植物染色质的了解,并为3D基因组进化与转录调控之间的关系提供了新的思路。

图5 二倍体棉和四倍体棉亚基因组的染色质相互作用比较




焦点文章六

Epigenomic and functional analyses reveal roles of epialleles in the loss of photoperiod sensitivity during domestication of allotetraploid cottons

期刊:Genome Biology

发表时间:2017年1月

 

研究策略

RNA-seq、BS-seq、MethylC-seq、qRT-PCR、系统发育等。


文章亮点

棉花的主要栽培种陆地棉和海岛棉都是由二倍体亚洲棉(A基因组)和雷蒙德氏棉(D基因组)的相似种杂交并基因组加倍,经过自然选择和人工驯化而来。在此,作者首次绘制了栽培棉花(四倍体)、野生四倍体、种间杂种、以及二倍体棉花的单碱基分辨率DNA甲基化图谱。研究发现DNA甲基化和DNA序列协同进化,但DNA甲基化进化速度远高于DNA序列进化速度。在棉花自然进化过程中,DNA甲基化的变化主要发生在基因区,而且更偏向于A亚基因组(来源于亚洲棉祖先),这些DNA甲基化变化能够显著的影响附近基因的表达。五百多个表观位点与棉花的人工驯化以及农艺性状相关,包括种子休眠、控制开花和对生境适应(生物和非生物因子)的基因。多个表观遗传靶点为将来的育种工作提供了重要的资源,并有助于开辟新的表观遗传育种方法。

图6 棉花A和D基因组中TE和DNA甲基化的不对称分布


我们怎样,我们的中国就怎样。
力挺新疆棉,国人当自强。




棉花基因组学研究文章精选


参考文献

[1]. Huang G, Wu Z, Percy R G, et al. Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution[J]. Nature genetics, 2020, 52(5): 516-524.

[2]. Wang M, Tu L, Yuan D, et al. Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense[J]. Nature genetics, 2019, 51(2): 224-229.

[3]. Ma Z, He S, Wang X, et al. Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield[J]. Nature genetics, 2018, 50(6): 803-813.

[4]. Wang M, Wang P, Lin M, et al. Evolutionary dynamics of 3D genome architecture following polyploidization in cotton[J]. Nature Plants, 2018, 4(2): 90-97.

[5]. Song Q, Zhang T, Stelly D M, et al. Epigenomic and functional analyses reveal roles of epialleles in the loss of photoperiod sensitivity during domestication of allotetraploid cottons[J]. Genome biology, 2017, 18(1): 1-14.

[6]. Zhang T, Hu Y, Jiang W, et al. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement[J]. Nature biotechnology, 2015, 33(5): 531-537.



产品研发部   王 璐 | 文案
图片来源于网络,侵删


往期精彩推荐





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存