百菜不如白菜 | 研究基因组多倍化的好模型
第二章 十字花科
地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。
十字花科往期回顾
前一段时间,大家热烈讨论的“南北方买菜差异”中,关于买白菜是论斤,还是论颗的,南北方的差异是相当的大的。但是科技君相信,对于白菜的吃法,无论是炖、炒、腌、拌……各位吃货都不会拒绝的。白菜不仅品种繁多,营养丰富,且具有一定的药用价值。本期180+植物基因组文章解读大全,科技君就带大家一起来了解一下白菜的基因组。
文献题目:The genome of the mesopolyploid crop species Brassica rapa
发表期刊: Nature Genetics
发表时间:2011年8月28日
影响因子:36.377
摘要介绍:本文对中国大白菜Brassica rapa accession Chiifu-401-42进行测序,注释了41,174个基因。白菜经历了基因组三倍体化事件,以拟南芥作为外类群,研究三倍体化事件对白菜基因组结构和功能的影响。三倍化的片段基因丢失程度不同,其中的一份保留较多的祖先基因。白菜的不同表型可能与各基因家族的基因个数变异有关。白菜基因组是研究基因组多倍化较好的模型,为白菜属植物的遗传研究奠定了坚实的基础。
研究背景:
基因组进化史:和番木瓜分化后,拟南芥经历了两次全基因组复制事件,由于基因组进化较快,存在较多基因的扩增和丢失,使得拟南芥和十字花科的祖先基因组差异较大。和琴叶拟南芥相比,拟南芥基因组减小了约30% ,其中约有9–10次染色体重排事件。目前已经测序的物种均有全基因组复制事件发生,拟南芥有三次,蔷薇分支和菊分支的古六倍体化事件(γ)(此时拟南芥还没有形成,复制的是拟南芥的祖先物种)、十字花目(Brassicales)的两次古四倍体化事件(先β后α)。白菜也有相同的多倍体化事件,此外在1300至1700万年前,还有一次全基因组三倍体化事件,所以,‘mesohexaploidy’是十字花目家族的一个典型特征。芸薹属植物是人类重要的蔬菜之一,是研究基因组进化的良好材料。二倍体的B. rapa (A genome)、B. nigra(B genome)、B. oleracea(C genome)杂交形成了B. juncea(A and B genomes), B. napus(A and C genomes)和B. carinata(B and C genomes)。物理图谱的比较研究表明在1300至1700万年前和拟南芥分开后, B. oleracea和B. rapa的祖先进行了一次三倍体化事件。
内容解析
研究问题:
1. 白菜基因组组装;
2. 白菜基因组注释;
3. 白菜基因组进化研究;
4. 基因剂量学说验证;
5. 芸薹属表型多样性研究;
6. 开花调控研究;
研究方向:
1. 白菜de novo基因组学研究;
2. BAC sanger 测序;
研究成果:
1. 基因组组装:
基因组总长283.8 Mb,覆盖>98%的基因区,大于最初估计的220Mb。整合199,452个BAC-end数据,得到159个super scaffolds,占基因组的90%,Contig N50、Scaffold N50 分别为27.2kb和1.97Mb。整合1,427个markers的遗传图谱,得到10条染色体,占基因组的90%。基因组组装评价:和已经发布的染色体A03及647个Sanger测序的BACs结果一致。
2. 基因组注释:
重复序列:白菜基因组散在分布着大量转座子,约占基因组的39.5%(反转座子、转座子、LINE分别为27.1%, 3.2%和2.8%),着丝粒附近尤其多,转座子的影响使得拟南芥和白菜的遗传距离较大;
基因注释:注释了41,174 个基因,99.3%有公用数据库的EST或者de novo Illumina mRNA-Seq数据支持,95.8%的基因至少被一个数据库支持。
3. 基因组进化研究:
白菜和拟南芥大约在1300至1700万年前分开,90.01%的拟南芥基因组(108.6 Mb)和91.13%白菜基因组有较好的共线性(259.6Mb)。用拟南芥作为外类群研究三倍体化事件对白菜基因组的影响,结果表明三倍体化发生在500至900万年前(LF、MF1 和MF2),比以前报道的时间要早。拟南芥含有90,000 个基因,表明白菜基因组存在大量的基因丢失,LF、MF1和MF2 基因丢失程度不同,分别保留了70%、46%和36%的基因。
Ks分析表明MF1和MF2的丢失发生得比LF早;在拟南芥和玉米中,有假说称四倍体化后由于表观遗传学的作用使得复制的区域发生不同的基因沉默,共线性的区块是DNA 重组的重要位点。白菜和拟南芥中,25%和30%的旁系同源相似性高于直系同源。表明两物种发生了大量的基因转换,端粒的基因比远端里的基因核苷酸替换率较低。
4. 基因剂量学说认为协同作用表现功能的基因会over retained,单独表现功能的基因会under retained,在白菜中的研究与该假说一致:转录因子、细胞质核糖体及蛋白质酶等over retained,而DNA修复、核酸激酶,叶绿体基因等under retained。over retained基因的GO 分析表明,三倍体区域有更多的基因家族扩增与适应环境有关,包括响应环境变化的基因(如盐、冷、渗透压、光、伤害、病原菌等)。
5. 芸薹属表型多样性研究:
可能与快速的核苷酸替换率有关(Ka和Ks,白菜>拟南芥>番木瓜>葡萄),番木瓜核苷酸替换率较低可能与其世代周期较长有关;生长素相关基因家族(合成、转运、信号转导及失活)的作用,白菜和拟南芥分别有347 和187 个相关基因;TCP 基因家族对表型有重要作用,白菜(39)>拟南芥(24)>番木瓜(21)>葡萄(19);开花调控是芸苔属植物的重要特征,分析关键调控基因的拷贝数变化:由于三倍体化,在白菜中FLC、VRN1分别有3个和6 个拷贝,而GI、SVP及COL家族的3个成员都仅有一个拷贝,拷贝数的变化可能与不同的开花调控机制有关。
研究亮点:
了解现存物种的起源和分化是现代生物学研究的主要目标,全基因组复制在植物的起源和分化过程扮演了主要角色。基因复制后,来自于同一祖先基因的几个拷贝可能分化出不同的功能,这为新基因的起源提供了材料,进一步为物种的分化奠定了基础。芸薹属植物表型多态性高,亲缘关系很近的物种都存在巨大的表型差异,全基因组从头测序研究从基因组复制的角度研究了这个问题,是进化领域最有力的工具。
研究方法
研究对象:B. rapa ssp. pekinensis line Chiifu-401-42
所用软件:
SOAPdenovo—进行组装;NUCmer—长序列比对;TBLASTN,BLAT,PASA,BLASTP—比对;GLEAN–整合基因集;OrthoMCL—基因家族聚类;McScan–共线性分析;MEGA–系统发育树分析。
所用数据:
1. B. rapa ssp. pekinensis line Chiifu-401-42基因组de novo;
2. 4个群体得到的1427个标记数据;
3. BAC数据;
所用数据库:
Repbase、Swiss-Prot、InterPro、TrEMBL databases、KEGG、dbEST、Genbank等数据库
研究结果
图1 B. rapa基因组特征的染色体分布
反转录转座子,基因(外显子和内含子)和DNA转座子区域数量分布图;x轴表示以百万(M)个碱基为单位的B. rapa染色体的物理位置。
图2. 维恩图显示了四种测序的双子叶植物B. rapa(白菜)
A.thaliana(拟南芥),C.papaya(木瓜)和V.vinifera(葡萄)之间的共有和特有的基因家族数量。
图3 B. rapa和拟南芥基因组的片段共线性。
在白菜基因组(横轴)的十条染色体和拟南芥基因组的五条染色体(垂直轴)之间,显示基因的保守共线片段。 颜色块被标记为A到X,并按照建立的惯例通过推断的祖先染色体进行颜色编码。
图4 B. rapa中的过度保留基因表现出强烈的偏见
x轴表示基因类别; y轴表示每个类别中不同拷贝的比例。 每个类别上的B. rapa直向同源物的数量显示在每个条上。RE,对环境的反应; RH,对激素的反应;
TF,转录因子;CR,细胞溶质核糖体;CW,细胞壁。(a)橙色bar是单拷贝或双拷贝直系同源物的比例,浅绿色条是三份的比例。(b)黄色条是单拷贝直系同源物的比例,深绿色条是两份或三份直系同源物的比例。最后一类是作为对照列出的所有直向同源物的总数。每个类别的P值在条形图下表示。
表1. 组装结果
【参考文献】
Wang X. et al. . The genome of the mesopolyploid crop species Brassica rapa. Nat. Genet. 43, 1035–1039 (2011).
来吧~ 留言区告诉科技君你们家都是怎么料理白菜的~
撰稿:大项目部-陈海新
编辑:市场部
猜你喜欢
IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全
近期热文
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!