查看原文
其他

诺禾致源助推项目攀高峰,棉花基因组助力育种NG再现

杨 阳 诺禾致源科服 2023-02-13
今日,河北农业大学马峙英教授团队在Nature Genetics期刊在线发表了题为“High-quality genome assembly and resequencing of modern cotton cultivars provide resources for crop improvement”的高水平研究论文,诺禾致源研发合作中心首席科学家田仕林为该文共同通讯作者,信息技术副总监姜亚菲为共同第一作者。接下来小编带您第一时间了解该文研究成果。文章题目

现代棉花品种高质量基因组组装及重测序分析为作物改良提供了新资源

发表杂志:Nature Genetics

影响因子:38.33

发表单位:河北农业大学、诺禾致源

文章亮点:

1. 组装了陆地棉、海岛棉2个高质量基因组,填补了现代棉花品种基因组缺乏的空白。

2. 揭示了结构变异对理解基因型-表型关系的重要作用,以及在作物改良中的潜在利用价值。

3. 发现D亚组上结构变异的密度高于A亚组,在物种形成和品种选育过程中D亚组受到更强的选择。

4. 找到446个与棉纤维品质、产量、黄萎病抗性等7个重要性状显著关联的结构变异,发现纤维品质和黄萎病抗性的变异主要位于D亚组,而产量性状的主要位于A亚组。




材料选择G. hirsutum cv. NDM8,G. barbadense acc. Pima90,1081份陆地棉种质资源(包含一套419份材料的核心种质[2]),以及1个海岛棉染色体片段代换系NDM373-9。


测序技术PacBio Sequel、10X Genomics、Hi-C、WGS-seq、RNA-seq。


研究方法基因组组装、结构变异检测、全基因组关联分析、转录组分析、基因沉默和超表达等。


研究背景作为全球广泛种植的纤维作物,棉花一直是纺织工业中天然纤维的主要来源。陆地棉(G. hirsutum)占棉花总产的90%以上。数以千计的棉花品种在增产中发挥了重要作用,现代陆地棉品种和过时品种TM-1、ZM24的高质量基因组对于育种和生物学研究至关重要,然而对新育成棉花品种的基因组信息及现代育种过程中的基因组多样性仍不清楚。海岛棉(G. barbadense)约占棉花总产的10%并可提供优质纤维。为了提高陆地棉的纤维品质和抗病性,一种策略是将海岛棉的优异性状转育到陆地棉中。然而,与现代陆地棉相比,海岛棉的基因组变异情况并不清楚。因此,提供更多基因组组装和品种资源重测序,进而揭示结构变异规律和遗传效应,对于棉花分子改良十分重要。


研究成果1. 高质量的四倍体棉花品种NDM8和Pima90基因组本研究组装了2个高质量基因组,分别为2.29 Gb 的NDM8基因组及2.21 Gb的Pima90基因组。NDM8和Pima90的contig N50和scaffold N50分别为13.15 Mb、107.67Mb和9.24 Mb、102.45Mb,染色体挂载率分别为99.57%和99.75%,Gap比率为0.003%和0.06%。高比对率(均为99.16%)及低组装错误率(1.87×10-7和2.95×10-7)显示组装的精确度高。BUSCO评估结果分别为96.1%和95.9%,且与已发表的棉花遗传图谱也具有非常高的一致性。LTR组装指数(LAI)分别达到14.2和12.1。表1. 两种棉花基因组组装结果2. 海岛棉Pima90的基因组结构变异该研究以NDM8为参考基因组,从Pima90中检测出846,363个结构变异,包括517,230个插入和317,638个缺失,插入和缺失在At12、At09和Dt11三条染色体上分布最多,Dt亚组中的变异密度显著高于At亚组。为了探究结构变异对基因表达的影响,该研究结合不同组织部位的转录组数据,发现31,296个变异-基因对呈现出表达量差异,表明结构变异在一定程度上影响了基因表达。
图-1 31,296个变异-基因对表达差异该研究发现Pima90基因组5,256个基因的外显子中存在5,815个变异,其中3,178个变异可在转录产物中检测到。在这些基因中,编码蔗糖合酶的GbM_D13G2394的跨膜区存在一个2-bp的缺失变异,该基因在海岛棉纤维伸长和次生细胞壁合成阶段的高表达,表明这个新的GbSus基因在海岛棉纤维长度与强度形成中发挥重要作用,并且这一缺失变异在海岛棉Hai7124、3-79和海岛棉渐渗系NDM373-9和Luyuan343中也同样存在。图-2 GbM_D13G2394基因的缺失变异及表达情况对陆地棉新品系NDM373-9进行了30X重测序分析(该品系是由Pima90作为供体亲本,并与陆地棉CCRI8回交后自交产生,具有比陆地棉CCRI8更好的黄萎病抗性及纤维品质)。共检测到171个来自Pima90的外显子变异,涉及已报道的34个抗病相关基因,及12个纤维发育基因。3. 陆地棉NDM8基因组结构变异将高质量的NDM8基因组与TM-1基因组(Wang et al., 2019)进行比较,可以了解现代陆地棉基因组变化。该研究从NDM8中鉴定出76,568个变异,包括27,708个插入、47,221个缺失、808个倒位和831个易位。插入缺失数量在At亚组(13,985个插入和23,677个缺失)与Dt亚组(12,705个插入和 21,076 个缺失)中相近,但Dt亚组中的变异密度高于At亚组。进一步分析插入和缺失在NDM8每条染色体上的密度,发现在端粒附近区域具有很强的偏好性,较其他区域高出3.71倍。图-3 NDM8和TM-1_HAU基因组景观图图-4 NDM8基因组插入和缺失变异的密度分布图此外,NDM8基因组中,有603个插入和缺失位于526个基因的外显子区,其中有189个与TM-1为同源基因,76个为非同源基因,261个未注释到功能。例如, GhM_A02G1731是水稻肉桂酰辅酶A还原酶的同源基因,通过控制木质素合成对真菌病害起到抗性作用。而在感黄萎病的TM-1中,该基因包含1个1-bp的缺失,导致ORF中缺失了29 bp和45 bp,从而产生了一个NAD结合域受损的截短蛋白以及基因在黄萎病菌胁迫下的低表达。图-5 GhM_A02G1731基因中的结构变异通过分析在经济性状上具有显著差异的100个早期品种与100个现代品种,发现现代品种比早期品种获得了1,128个结构变异,Dt亚组上结构变异的密度高于At亚组,说明在现代育种过程中,Dt亚组受到了更强的选择。4. 与陆地棉重要性状关联的结构变异该研究对1,081份陆地棉种质资源进行了重测序(平均深度10.65X),以NDM8基因组为参考,共获得304,630个结构变异(141,145个插入、156,234个缺失、39个倒位、6,384个易位和828个重复),以及2,970,970个SNPs,揭示了1,081份资源的分子亲缘关系,为棉花改良提供了广泛的分子基础。为了进一步探究结构变异对棉花重要性状潜在的遗传效应,对纤维品质、产量以及黄萎病抗性等7个性状进行了全基因组关联分析,共得到446个结构变异与7个性状显著关联,其中346个与3个品质性状、97个与3个产量性状、3个与黄萎病抗性关联。重点分析了BLUP值和平均值均有显著关联的193个变异,发现160个、33个分别与纤维品质、产量性状相关,与纤维品质关联的结构变异主要位于Dt亚组,而与产量关联的结构变异主要位于At亚组。在Dt11染色体上一个370-kb区域内(24.55~24.93Mb)检测到与纤维长度(FL)表型最强的关联信号包含125个变异,使得纤维长度有效提升至29mm级别。在Dt03染色体上的2个变异与衣分(LP)显著关联,该类变异可使LP值从37.47%增至40.00%。在Dt11染色体1个69.00~69.33 Mb区段内的3个变异能够使黄萎病病情指数(DI)降低13.6,可使棉花抗性反应型从感病(DI=44.5~45.2)变为耐病(DI=30.9~31.1)。研究鉴定出907个纤维品质和产量性状相关基因,60个黄萎病抗性相关基因。发现84.23%的基因在陆地棉纤维发育阶段表达,其中305个结构变异位于基因及调控区域,表明这些基因可能潜在影响纤维品质和产量。发现4个缺失位于与FL显著关联的GhM_D11G220基因的5’UTR、内含子、3’UTR,该基因与之前发表的已鉴定功能的纤维长度新基因GhFL2相同[2]为进一步验证关联分析结果的可靠性,该研究选择Dt11染色体上与2个变异显著相关的GhM_D11G3743基因,命名为GhNCS,该基因编码S-去甲乌药碱合成酶,属于10/Bet v1蛋白家族成员,其在棉花抗病中的功能未知。受大丽轮枝菌胁迫后该基因下调表达且在抗病品种中的表达量显著低于感病品种,在耐病品种NDM8和感病品种CCRI8中沉默该基因都导致抗病性显著增强,使NDM8由耐病变为抗病、CCRI8从感病变为耐病,然而拟南芥中过量表达该基因表现为更感病,表明GhNCS是控制黄萎病抗性的一个重要新基因。图-6 Dt11 染色体中与黄萎病抗性相关的GhNCS基因鉴定

研究结论该研究完成了现代陆地棉品种NDM8和海岛棉品系Pima90两个高质量基因组,鉴定出大量的种间和种内基因组变异,揭示了与棉花品质、产量、抗病等性状相关的结构变异和功能基因,为棉花分子改良提供了重要理论依据和基因组资源,并为棉种形成和品种改良提供了新见解。
参考文献:[1].Zhiying Ma, Yan Zhang, Liqiang Wu et al. High-quality genome assembly and resequencing of modern cotton cultivars provide resources for crop improvement[J]. Nature Genetics, 2021.[2].Zhiying Ma, Shoupu He, Xingfen Wang et al.  Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield[J]. Nature Genetics, 2018.




往期精彩推荐


重测序研究部    杨 阳 | 文案






点击“阅读原文”进入科研微站免费咨询

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存