《Nature》主刊!这篇拟南芥论文说了啥?
第二章 十字花科
地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。
十字花科往期回顾
拟南芥 (Arabidopsis thaliana),十字花科,拟南芥属。2000年之前,拟南芥的基因组信息研究还是乏善可成,仅有的报道都是较零散的序列信息和不完整的几条独立基因组。因此,作为模式生物,拟南芥并没有被透彻研究,也没有一篇关于拟南芥基因组很全面的报道。
这篇文献中提及的完整拟南芥的基因组序列信息,以及详细的基因集以及其他的基因组序列结构信息、拟南芥基因组的进化历史、一些重要信号通路的细节等在当时来说都是跨时代的研究。
文献题目:Analysis of the genome sequence of the flowering plant Arabidopsis thaliana
发表期刊:Nature
发表时间:2000年12月14日
影响因子:40.454
摘要介绍:本文作者隶属于1996年成立的一个拟南芥基因组组织,该组织从1996年开始,重点研究拟南芥的基因组草图、基因组复制事件的发生、基因组大小变化的原因、进化、以及各种基因相关的生物过程等,以兹全面揭露拟南芥的神秘面纱。
研究亮点:
1. 拟南芥的完整5条基因组序列详细信息研究;
2. 拟南芥跟其他植物的分化时间的研究,以及全基因组复制事件、基因丢失、基因转移和片段复制事件的发生时间研究;
3. 拟南芥中跟转座子、细胞膜运输、端粒、中心粒相关基因、DNA修复和重组等相关信号通路的详细研究。
内容解析
研究问题:
1. 完整的拟南芥基因组序列;
2. 拟南芥基因组的结构注释,功能注释以及功能分类;
3. 拟南芥基因组的分化,进化以及基因组变小的原因等;
4. 拟南芥基因集各种功能特异的基因集合;
研究方向:
1. 基因组的组装;
2. 基因集的结构和功能注释;
3. 各种功能基因集合:转座子、重复单元、来自细胞器的基因序列、特有基因集合的预测等;
4. 基因集的全复制时间、基因丢失、分化、片段基因序列的复制事件等;
5. 各种植物特有信号通路的详细研究;
研究成果:
1. 原始拟南芥基因组大小为125Mb,本实验组装出了115.4Mb基因组;
2. 获得了到当时为止最多的25,498个基因,五条基因组的结构注释信息,包括端粒、中心粒、异染色体钮、EST分布、基因密度分布、RNA分布等详细信息;
3. 基因集合的功能注释,包括了代谢途径、基因调节途径、防御途径、分泌途径、线粒体和叶绿体等。植物特有基因集合途径,找到了植物中独立进化的一些保守基因集合,特有基因集合。
4. 共线性分析发现拟南芥等植物在112Myr以前就因为发生全基因组复制事件而形成了四倍体祖先,随后发生了基因丢失事件,基因转移事件以及片段复制事件,最终形成了较祖先基因组更小的多的新的基因组序列。
5. 拟南芥和芸薹属植物的分化发生在12.2~192.Myr以前,拟南芥和土豆的分化发生在150Myr以前,复制则发生在112Myr以前,拟南芥和水稻的分化发生在200Myr以前。
研究方法
研究对象:拟南芥
所用软件:
1. Computational gene finder 基因查找;
2. BLASTP 复制序列和串联重复序列查找;
3. Genescan、GeneMark、HMM、Xgrail Genefinder and GlimmerA BAC序列基因集合查找;NetGene2,Splice Predictor and GeneSplicer 剪切位置的查找;
4. MUMer 比对;
5. DDS/GAP2 or BLASTN BAC序列比对到EST序列 ;
6. PEDANT analysis system 功能分类;
7. TargetP 信号蛋白预测 ;
8. TBLASTX 共线性聚类;
9. DIALIGN2 片段复制事件分析;.
10. ALOM2 INTERPRO 跨膜区域查找。
所用数据:
1. BAC、TAC、cosmid、P1 clones data;
2. YAC and IPCR data。
所用数据库:
1. C.elegans’ 19,099 genes and Drosophila’s 13,061 genes
2. yeast genome;
3. SCOP domain database;
4. Escherichia coli genome, Synechocystis sp.genome , C. elegans and Drosophila genome ,Saccharomyces cerevisiae genome , Non-redundant protein set of Homo sapiens;
5. EST database。
创新方法:
很多研发中的软件:INTERPRO,ALOM2,GeneSplicer,GeneFinder等。
研究结果
图1 拟南芥5条染色体的结构注释详细信息
注释:每个条状代表一条染色体,其中包括了端粒,中心粒,异染色体钮等结构,其中序列信息为红色,端粒和中心粒为蓝色,异染色体钮为黑色,rDNA重复区域为酒红色;没有测到的端粒2N和4N为虚线;
Genes:展示了相应的区间的基因密度分布,红色为高密度,蓝色为低密度;
ESTs:展示了EST覆盖分布图;TEs:转座子元件密度分布图
MT/CP:线粒体,叶绿体插入元件分布;
RNAs:tRNA和snoRNA分布图。
图2 拟南芥基因集功能注释图
a图:预测的拟南芥基因在不同功能分区的比例情况;
b图:不同组织的功能分类条目的比较。
图3 每个基因芯片中串联重复基因的个数
拟南芥基因组中串联重复基因芯片的分布
图4 拟南芥基因组中片段复制区间分布
单条染色体使用灰色条表示,中心粒使用黑色表示,彩色条连接了相应复制片段,相似的rDNA重复片段被去除,反方向的复制片段使用交叉的彩色条连接。单位是metabases。
图5 拟南芥染色体中一类,二类和Basho转座子分布
一类转座子是绿色,二类转座子是蓝色,Basho转座子是紫色。
上图以100kb的间隔区间展示这些转座子元件的分布。
图6 中心粒结构预测
条状两端的实心圆代表了中心粒的边界;来自BAC序列的完全和全部组装序列使用黑色实线和黑色虚线标记;中心粒中重复序列的大小来自于重复复制次数,物理图谱以及细胞遗传学分析。
图7 拟南芥等三个物种对不同分子的运输能力的比较
饼图展示了每个组织中转运子的百分比;
a.图是生物能力的转运能力;
b.图是特殊分子的转运能力。
表1 拟南芥基因组统计
包括了5条染色体的完全基因组的统计信息以及不同功能分类中基因集的统计信息
表2 不同组织中,作为单个家族或者同源进化家族的基因集的百分比分布信息
使用了5个物种的基因组进行蛋白共线性分析,
其中两个序列相似性被定义为:E<10-e20,且覆盖度>=80%。
表3 跟人类疾病基因相似的拟南芥基因集
表4 分别由细胞核/细胞质,质粒体,线粒体编码的基因集的特征统计
【参考文献】
Kaul S, Koo H L, Jenkins J, et al. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J]. Nature, 2000, 408(6814): 796-815.
撰稿:大项目部-何伟明
编辑:市场部
猜你喜欢
IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全
近期热文
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!