查看原文
其他

解读 | 《PNAS》茶树基因组研究思路分析

小萍 刘春 华大科技BGITech 2019-05-10

日前,安徽农业大学茶树生物学与资源利用国家重点实验室(安徽省实验室)宛晓春教授研究团队,联合深圳华大基因和中国科学院国家基因研究中心(上海)等相关研究团队,解密了小叶种茶树(CSS)的全基因组信息,研究成果在线发表于《PNAS》上。(详见本号头条)

 

文章题目:Draft genome sequence of Camellia sinensis var. sinensis provides insights into the evolution of the tea genome and tea quality(《基于全基因组测序探究中国种茶树基因组和品质相关基因的进化机制》)

研究单位:安徽农业大学、华大基因、中国科学院国家基因研究中心(上海)等

发表时间:2018.04.21

期刊名称:PNAS(《美国科学院院刊》)




世界主栽茶树分属两个变种: 中国种(CSS)和阿萨姆种(CSA),前者叶小,分布广泛,适制绿茶等六大茶类;后者叶大,主要分布在热带和冬季温暖的亚热带地区,适制红茶和普洱茶。



详细解读


CSS基因组组装


茶树属于自交不亲和且高杂合多年生木本植物,基因组组装难度极高。本研究选择杂合度相对低的品种“舒茶早”进行基因组组装。利用二代测序、PacBio三代测序约125.4G辅助组装,最终组装获得3.1Gb的基因组。利用BAC文库测序数据、其他的DNA序列和ESTs序列对组装的准确度和完整性进行评估,同时与已报道的大叶种基因组进行了比较分析。BACs评估发现CSS基因组覆盖度达到了98.3%而CSA只有84.6%。同时BUSCO保守核心真核基因评估结果显示CSS仅缺失6(2%)个的保守基因,而CSA缺失16(5.2%)个保守基因。来源于GeneBank的茶树EST序列评估结果显示CSS覆盖度为93%,而CSA为89%。CSS组装获得的基因组64%为重复序列,注释获得33,932高可信度基因models。

Table 1. 基因组组装、注释及比较分析 



CSS基因组进化研究


在茶的两个变种CSS和CSA间进行共线性分析,检测到121个共线block,1,543共线基因。研究发现CSA和CSS在38到154万年前由共同祖先发生进化分歧。两者间DNA和蛋白直系同源基因的平均序列相似性为92.4%和93.9%。CSS与其他10个植物基因组比较基因组学分析,茶基因组中检测到15,224候选基因家族,其中429个是茶特有的。茶特有基因家族属于细胞色素P450、NB-ARC和TFs。


开花植物在进化历史中往往会存在全基因复制事件(WGD),并且这些基因与农艺或植物特异性性状相关。将>32,000基因models比对回葡萄的基因models,检测到2706个葡萄-茶共线性基因blocks,包含>15894茶基因。基因共线性分析发现茶在历史进程中发生了两次WGD,分别发生在90-100Mya和30-40Mya。


与茶滋味相关的次生代谢物


茶富含约700种活性化合物,这些活性物质不仅使得茶具有丰富的滋味,也是茶重要保健功能的主要原因。其中特征性成分为儿茶素、茶氨酸、咖啡碱和挥发物。


儿茶素作为类黄酮的主要成分,约占茶叶干重的12-24%。茶中的儿茶素类物质包括儿茶素(Catechin,C),表儿茶素 (Epicatechin,EC),没食子儿茶素 (Gallocatechin,GC),表没食子儿茶素 Epigallocatechin,EGC),表儿茶素没食子酸酯(Epicatechin-3-gallate,ECG),表没食子儿茶素没食子酸酯 (Epigallocatechin-3-gallate,EGCG)。其中EGCG 是儿茶素中最重要的活性物质,绿茶中富含EGCG,黑茶中儿茶素是茶黄素和茶红素的聚合物,通过发酵导致儿茶素氧化。


本文揭示了茶树的全基因组复制事件对儿茶素通路起着重要的作用,其中一个重要的基因家族是酰基转移酶基因家族(SCPL1A),茶树中22个SCPL1A基因中有4个是由于全基因复制事件产生(约3000-4000万年前),另外有14个是近期物种特异的串联重复产生。转录组和代谢组相关性分析结果表明16个茶树特异的SCPL基因跟EGCG和ECG高度相关(p<0.05)。


Figure 1.茶树及6个其他物种SCPL1A基因的进化。A. 茶,猕猴桃,咖啡,可可,拟南芥,白杨和葡萄中SCPL1A基因的进化树。B. 茶树的22个SCPL1A基因在不同器官中的表达模式。
 
对来自茶树不同器官的转录组数据进行分析,结果表明儿茶素通路的关键基因受到多元调控,比如一些跟生物和非生物胁迫相关的转录因子,如WRKY、C2H2、C3H、NAC和ERF等跟儿茶素通路基因有较强相关性。

Figure 2. 儿茶素通路关键基因的进化及表达模式。A. 儿茶素生物合成途径。B. 儿茶素合成关键基因在不同组织中表达谱及其与不同儿茶素含量的相关关系。C. 儿茶素合成基因的转录调控。


茶树中茶氨酸占所有游离氨基酸的比例超过50%,在茶树干叶中占1-2%。但茶树中合成茶氨酸的关键酶基因至今未被完全证实。本研究发现并验证了一个参与茶氨酸合成的关键酶——茶氨酸合成酶基因(CsTSI),该基因跟假单胞菌中被广泛设计用于合成茶氨酸的PtGS基因高度同源。进一步的组织表达谱跟成分的相关性分析显示该基因跟茶氨酸成分高度相关(P < 0.001)。该结果也经拟南芥过表达实验进一步确认。
 

Figure 3. 茶氨酸合成通路的关键基因。A. 茶氨酸生物合成途径和关键基因在乙胺处理实验中的表达情况。B. 茶树TS、GS基因及来源于原核、真核和植物GS基因的系统进化树。C. 茶树TS基因在拟南芥幼苗中的合成活性分析。

 

儿茶素会使茶呈涩感,非蛋白氨基酸茶氨酸则使茶呈甘甜感,使人精神放松,对神经起保护作用。此外,茶树也能合成挥发性萜类化合物。它们的水解产物及制茶过程中释放的脂类和类胡萝卜素氧化产物,让不同种类的茶呈不同的风味。这些发现首次从基因组层面系统解开了茶叶中富含独特的风味物质之谜。


撰稿:小萍、刘春

编辑:市场部



【近期热文】

单细胞RNA-Seq产品全新升级,再不来就晚了

免费微课 | 三代测序UMI定量转录组

注意!小RNA定量分析不准确!丢失的数据该如何找回?

为长江江豚正名 | 南京师大与华大基因等联合完成江豚基因组

梅花香自苦寒来 | 蔷薇科李亚科首个测序物种





请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!



点击查看原文

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存