茄科三剑客之辣椒
高质量辣椒基因组图谱的完成为辣椒的研究打开了新的一页。该图谱将促进辣椒抗性、品质等重要农艺性状基因的定位研究,为通过分子育种进行辣椒品种改良奠定基础,同时还将促进茄科植物的进化研究,以及果实发育机理等基础生物学研究。
中国辣椒
文献题目: Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization
发表期刊: PNAS(Proceedings of the National Academy of Sciences of the United States of America)
发表时间:2014年3月3日
影响因子:9.661
摘要介绍:来自遵义市农业科学研究院、四川农业大学、华南农业大学、深圳华大基因研究院和墨西哥生物多样性基因组学国家重点实验室等13家科研院所合作完成的辣椒基因组研究。作为经济作物,辣椒能够满足人们日常的辛辣口味以及发挥全球性的药用作用。为了更好地了解辣椒的进化,驯化过程和特性,文章研究了栽培辣椒Zunla-1(C. annuum L.)和其野生型辣椒祖先Chiltepin(C. annuum var. glabriusculum)的基因组序列。研究通过20个栽培种和野生种辣椒个体的重测序比较分析得到辣椒在人工选择过程中的分子标记,最后得到一个候选的辣椒驯化基因列表。此研究还发现串联重复基因的剂量补偿效应能够影响辣椒的辣度多样性。辣椒基因组的研究不仅为辣椒的进化提供重要的信息,对整个茄科植物的进化研究也有非常高的价值,辣椒基因组研究有助于我们建立更加有效的辣椒育种计划。
内容解析
研究问题:
1. 辣椒基因组比其近缘物种番茄和土豆更大的原因;
2. 辣椒基因组中反转录转座子扩增的时间推断;
3. 辣椒基因组相对于番茄,土豆的染色体水平发生了什么变化;
4. 辣椒在人工选育过程中主要保留了哪些特性品质;
5. 不同辣椒辣度有差异的原因;
6. 辣椒与番茄果实差异原因。
研究难点:通过二代测序和组装技术首次构建如此大的辣椒基因组(3.3Gb),综合评估最终选用定制的SNParray方法构建辣椒染色体的遗传图谱,最终得到高质量辣椒基因组图谱。
研究方向:
1. 辣椒De novo基因组学研究;
2. 辣椒栽培种和野生种个体重测序,群体比较分析;
3. 辣椒转录组和小RNA分析;
4. 辣椒蛋白质组和代谢组分析。
研究成果:
1. 在这项研究中,研究人员分别对Zunla-1和Chiltepin进行了全基因组测序,构建了高密度的连锁图谱,并组装得到高质量的基因组精细图谱。两个基因组大小约为3.3Gb,分别有35,336和34,476个基因,12对染色体,其中约90%的基因都锚定到这些染色体上。研究发现辣椒基因组包含大量的重复序列,约有2.7Gb(占基因组大小的81%),远高于其在西红柿(479Mb,61%)和马铃薯(399Mb,61%)中的含量,并且以Gypsy(54.5%)和Copia(8.6%)两种类型的重复序列为主。进一步的进化分析表明Gypsy在约30万年时发生了大规模的扩张和复制,导致辣椒基因组是西红柿和马铃薯基因组大小的4倍。
2. 在对辣椒与其他茄科植物的比较基因组及进化分析中,研究人员发现,辣椒和西红柿、马铃薯一样,经历了一次三倍化事件和一次全基因复制事件,但是由茄科中分化出的辣椒属分支并未发生全基因组的复制,进一步证实辣椒的基因组扩张是由近期重复序列的扩张复制导致的。相对于马铃薯和西红柿,辣椒基因组产生了大量的重排和异位事件。
3. 辣椒基因组序列为茄科植物的生物学研究提供了宝贵的新资源。在这项研究中,对18个栽培品种和2个其他野生种的重测序数据分析鉴定得到511个候选的驯化基因,这可能解释野生和栽培种辣椒之间的差异;在这些基因中有一些可能与种子休眠缩短、抗病原体和抗逆性增强以及储存寿命增加有联系。
4. 不同辣度的辣椒相关转录组数据的比较分析揭示辣椒素合成的相关基因,其中两个相邻的酰基转移酶基因(AT3-D1和AT3-D2)可能负责辣椒素的最终合成,初步解释了"辣椒为什么会辣"这个备受关注的生物学问题。
5. 研究人员还对辣椒和西红柿果实的发育进行了深入的比较分析,获得了辣椒果实成熟后仍然坚硬等生物学特性相关的候选基因。这些发现为辣椒开展分子标记辅助育种提供了重要的基因资源。
研究亮点:
1. 辣椒与番茄、土豆的比较分析,并详细阐述了在与番茄、土豆分化之后,辣椒基因组的变化和进化特性;
2. 辣椒在人类栽培和选育过程中主要保留了辣椒的哪些品质和特性;
3. 不同辣椒拥有不同的辣度的原因。
研究方法
研究对象:栽培辣椒Zunla-1(C. annuum L.)的基因组序列和其野生型辣椒祖先Chiltepin(C. annuum var. glabriusculum)基因组de novo研究以及20个栽培种和野生种重测序分析;
所用软件:SOAPdenov--进行组装、LASTZ,BLAT,BLAST--比对软件、RepeatMasker,RepeatProteinMask,LTR-FINDER,LTR_STRUC--转座子分析、Augustus, Genewise, Glean, InterProScan--基因预测和功能注释、Tophat, Cufflinks--转录组比对分析、MUSCLE,Mcscan,OrthoMCL--家族聚类、SOAP2, SOAPsnp --重测序分析;
所用数据:
1. 栽培辣椒Zunla-1(C. annuum L.)的基因组序列和其野生型辣椒祖先Chiltepin(C. annuum var. glabriusculum)基因组de novo;2. 20个栽培种和野生种重测序;3. 不同时期和不同组织的辣椒14个转录组数据;4. 辣椒成熟小RNA数据;5.辣椒果实的蛋白质组和代谢组数据;
所用数据库:Repbase,GyDB_2.0 data,TrEMBL databases, KEGG, miRBase, the database NONCODE,inmiRBase 等数据库;
实验过程:
Denovo样品准备:首先,辣椒种子在培养箱中灭菌并发芽。 发芽的种子播种在盆中并在16小时/ 8小时夜间周期(28℃/ 21℃日/夜温度循环),直到幼苗发芽8叶为止。 然后再提取DNA之前将组织冷冻在在-80℃储存液氮;
转录组样品准备:转录组样品包括根,茎,叶,芽,花,F-Dev-1,F-Dev-2,F-Dev-3,F-Dev-4,F-Dev-5,F-Dev-6,F-Dev-7,F-Dev-8和F-Dev-9。根,茎,叶,芽,花取混合RNA样本,而果实从产生,不成熟到成熟完全变红分为不同阶段分别取RNA样,所有组织均在液氮中冷冻储存于-80°C。
研究结果
图1 辣椒基因组的特征Circos图。
轨道A表示辣椒(megabases)的12个假染色体;遗传图谱中有效标记的位置显示为垂直灰线。 推测的着丝粒的位点由垂直的红色条表示。 轨迹B显示重组密度。 轨迹C显示Gypsy(绿色),Copia(浅蓝色)和蛋白质编码基因(海军蓝)的密度分布。 曲线D显示组织特异性表达基因的分布,包括根(红色),茎(绿色),叶(深红紫色),花(蓝色)和果实(黄色)。 轨迹E显示全部小RNA位点(蓝色和绿色线)的全基因组分布。 直方图绘制从20到25nt的小RNA读数,并将它们归一化以解释反向链逆序列的出现。 轨迹F显示由不同颜色表示的所鉴定的miRNA家族的分布。 轨迹G显示由不同颜色表示的三份拷贝的基因组区间。
图2 辣椒基因组的比较分析和进化
(A)C. annuum,Solanum lycopersicum,Solanum tuberosum,拟南芥,番木瓜,葡萄葡萄和Oryza sativa之间的基因组差异。 使用直系同源基因和C. annuum中的所有编码DNA序列(CDS)和其他六种植物的系统发育树。 (B)由OrthoMCL鉴定的七个植物物种中的直系同源和旁系同源基因家族统计。 (C)栽培的辣椒,番茄和马铃薯的基因组发生了基因组重排。 (D)通过4DTv分析揭示的双子叶植物基因组(辣椒,番茄,马铃薯和葡萄)中的基因组分化和复制事件。
图3 栽培辣椒种群多样性
(A)在Chr03,-09和-11之间的19个驯化品种中显示了多样性度量(θπ,θw和Tajima D); (B)候选人选择地区策略的说明;x轴上方的灰色区域对应于具有0.5%显着性差异的区域。
图4 假定的酰基转移酶(AT3)基因的选择组织和基因的辣度和基因表达模式
(A)Zunla-1,Chiltepin,拟南芥,马铃薯和番茄中AT3基因家族的系统发育分析;(B)辣椒,番茄和马铃薯之间AT3蛋白序列的比较。这些蛋白质的核苷酸相似性显示在上部,对齐在下面显示。辣椒,番茄和马铃薯中具有零个,一个和两个突变体的氨基酸的比对密码子序列分别标记有“*”,“。”和“:”。(C)辣椒素和二氢辣椒素的浓度,辣椒种的选定组织中的基因表达模式以及辣椒素合成中涉及的基因。绿色背景表示次级代谢物(辣椒素和二氢辣椒素),红色背景表示在辣椒种类的选定组织中表达的基因。 RPKM,每百万映射读取每kb读数。另外,灰色背景表示丢失的数据。 Zunla-1,Chiltepin,HYL,JZ32和G16是高辣度辣椒; SP163,T803,11c320,ZJ9和11c255是低辣度辣椒。
表1 结果表格解读
栽培种/野生种辣椒与番茄、土豆的基因组整体比较结果。结果显示栽培种/野生种辣椒基因组大小分别是3.35Gb和3.48Gb,远远高于同源物种番茄和土豆的基因组大小,组装得到的辣椒栽培种、野生种的contig N50 和scaffold N50分别是55.44Kb,1227Kb和52.23Kb,446Kb。两种辣椒的GC含量与土豆更接近。栽培种/野生种辣椒中的转座子含量比例在81%左右,远远高于番茄的61.3%和土豆的61.6%,主要的转座子类型为LTR类,约占基因组的70%左右。最终预测得到的栽培种/野生种辣椒基因数量分别是35336和34476,基因数量与番茄土豆接近,各种基因指标(基因长度,CDS长度和外显子数量)均与番茄、土豆比较接近,说明预测的基因集比较准确、可靠。另外辣椒栽培种通过SNParray的方法锚定到染色体的scaffold长度百分比是78.95%,锚定的基因数量百分比为88.29%。
【参考文献】
Qin, C., et al. (2014). "Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization." Proc Natl Acad Sci U S A 111(14): 5135-5140.
韩国辣椒
辣椒是全球最广泛种植的香料作物之一,它不仅是重要的烹饪原料,也是广受欢迎的观赏植物,同时还有一定的药用价值。辣椒富含维生素和营养,可以用来生产药物、天然染色剂和化妆品。大家都知道辣椒的辣味来自于辣椒素,但此前人们并不清楚辣椒素产生的分子机制。该研究首次获得了辣椒的基因组图谱并深入解析了辣椒素合成机理,解开了辣椒辣味来源之谜。
文献题目: Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species
发表期刊: Nature Genetics
发表时间:2014年1月19日
影响因子:27.959
摘要介绍:辣椒是美国最古老的一种农作物,也是世界上广泛种植的香料作物,韩国首尔大学的科学家们对辣椒进行了测序,获得了首个高质量的参考基因组。辣椒基因组约是其近亲-番茄的四倍,基因组学和转录组学的研究表明辣椒素合酶基因的表达变化和新功能化,促成了辣椒素的生物合成。此外,他们还在此基础上鉴定出负责生成辣椒素的基因,同时还发现辣椒和番茄在成熟调控和乙烯合成过程上的不同的分子模式。这项发表在Nature Genetics杂志上的研究,可以帮助人们进一步理解辣椒的辣椒素合成和果实成熟机制。
内容解析
研究问题:
1. 辣椒基因组为什么这么大?
2. 辣椒为什么辣?为什么有的辣椒不辣?番茄为什么不辣?
3. 辣椒和番茄的果实成熟机理差异
研究难点:
开创先河,利用高通量测序技术首次解析辣椒基因组,第一次向人们展示辣椒的基因组图谱并解析辣味的合成机理。辣椒基因组大小约3.48Gb,是植物里较大的基因组,, 组装比较困难,研究人员利用SOAPdenovo和SSPACE组装出了覆盖基因组87.9%的序列,经BAC序列评估组装结果可信以后,利用遗传图谱将86.0%的组装scaffolds挂载到染色体上。
研究方向:1. 辣椒基因组的组成特点;2. 辣椒素合成机制和相关基因;3. 果实成熟机制
研究成果:
1. 辣椒属于茄科,是马铃薯、西红柿、茄子等物种的近亲。研究人员通过比较发现,辣椒的基因组大约是西红柿的四倍。可能跟辣椒在异染色质和常染色质区的重复序列特别多有关。
2. 通过辣椒与不辣的辣椒以及番茄的比较分析,发现CS等基因的表达、复制导致了辣椒素的合成等
3. 通过对辣椒和番茄成熟相关的基因的转录本分析,这些基因转录本的分歧和保守性,以及他们的表达互作导致了物种(在成熟生理现象下的数量和质量差异?)。
研究亮点:
1. 辣椒是全球最广泛种植的香料作物之一,它不仅是烹饪的重要原料,也是广受欢迎的观赏植物,此物种非常重要;
2. 当时装配出来的最大的基因组之一;也是第一个辣椒基因组;
3. 此前对辣椒素产生相关的遗传学机制并不清楚,文章首次深入阐明了辣椒素合成的途径和机理。
研究方法
研究对象:辣椒品种C. annuum cv. CM334
所用软件:Quake rea--纠错;SOAPdenovo--组装;GA pipeline--基因注释;RepeatMasker--重复序列注释;PAML package--LTR同义替换率;OrthoMCL--基因家族聚类;CLC Assembly Cell--转录组组装;DESeq--基因表达差异。
所用数据:地方种
C. annuum cv. CM334和野生种C. chinense PI159236基因组数据,C. annuum cv. Perennial 和C. annuum cv. Dempsey 重测序数据;120个重组自交系的重测序数据,构建遗传连锁图谱;标准环境生长的CM334播种后6周的根,叶,茎RNA数据; CM334的果皮,胎座组织,取于不同发育时间的ECW(不辣的辣椒)和Solanum lycopersicum cv. Alisa
Craig番茄的胎座组织RNA数据。同时也用了之前发表过的一些番茄果皮的RNA-seq数据。
所用数据库:基因组功能注释用到UniProt数据库
实验过程:地方种
C. annuum cv. CM334,野生种C. chinense PI159236,C. annuum cv. Perennial,C. annuum cv. Dempsey DNA提取,illumina KIT 构建测序文库,Genome Analyzer IIx 和 HiSeq 2000平台测序;标准环境生长的CM334播种后6周的根,叶,茎RNA数据; CM334的果皮,胎座组织,不同发育时间的ECW(不辣的辣椒)和Solanum lycopersicum cv. Alisa;Craig番茄的胎座组织取样后,总RNA用TRIzol提取,构建TruSeq的转录组链特异性文库,Illumina HiSeq 2000平台测序。
研究结果
辣椒基因组与番茄基因组有着高度的保守区域,辣椒基因组约是番茄基因组大小的四倍,可能是由辣椒基因组在异染色质和常染色质区都积累了大量的重复序列导致的,辣椒基因组的大部分重复序列都是LTR,这与其他植物比较类似。辣椒中转座子Gypsy的含量远高于番茄,而两者的Copia含量差不多,辣椒的Caulimoviridae含量也更高。大量Gypsy家族的扩增可能是辣椒基因组扩张的原因。Gypsy家族里Del含量最多,该类转座子主要积累在异染色质区域,而Del与番茄的常染色质区域有对应的共线性关系,说明辣椒的基因组扩张可能是由于辣椒现存的异染色质区扩张和常染色质向异染色质转换造成的。辣椒和番茄的进化分歧时间约为19.1Mya, 通过转座子Gypsy的插入时间估算,辣椒的Gypsy大概在辣椒分化之前就开始积累,祖先种异染色质区域Gypsy的不规则积累可能在辣椒的物种形成和分化过程中发挥着重要作用。
辣椒素决定了辣椒的辛辣味。辣椒素的合成依赖辣椒素合酶(CS 和Pun1), 虽然其生物合成的相关基因有部分报道,但对辣椒素的生物合成的生化反应过程、进化和调控机制还知之甚少。通过对不同组织的基因表达分析,研究人员发现BCAT、KAS、CS等基因在CM334的关键组织中表达量很高,而在番茄中几乎不表达;CS在不辣的辣椒中也几乎不表达。由此推测这些基因的表达可能影响辣椒素的合成。同时对CS基因的旁系同源基因进行基因复制分析,发现相比于番茄,这些基因经历了更多次的复制,这与辣椒素的合成也可能有关联。
表1 结果表格解读
基因组kmer评估基因组大小约3.48 Gb,实际组装出基因组约3.06Gb, 组装完整度约87.9%,得到37,989 个scaffolds,contig N50约30.0kb, scaffold N50约2.47Mb。
参考文献
Kim, S., et al. (2014). "Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species." Nat Genet 46(3): 270-278.
原文链接:http://www.nature.com/ng/journal/v46/n3/full/ng.2877.html
撰稿:动植物大项目部
编辑:市场部
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!