查看原文
其他

IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全

2017-07-31 动植物大项目部 华大科技BGITech

图片来源IBC官网

7月29日,被称为植物学界的“奥林匹克”——国际植物学大会在深圳圆满落幕。本届大会注册人数近7,000人,创历史之最。212个专题研讨会议,1447个口头报告,49个卫星会议,涵盖了生物多样性、资源和保护、生态学、环境和全球变化等六大主题。绿色创造未来”不仅仅是大会的主题,也是华大对于植物基因组研究的初衷。在此影响下,华大基因主导或参与完成了目前全球已发表植物基因组文章的三分之一。


植物无处不在,据估计现存大约有 350,000个物种。而我们又对植物了解多少呢?辣椒为什么会辣?大豆为什么能固氮?竹子为什么开花就会死?莲又为什么“出淤泥而不染”?这些看似不起眼的常识,其实都与植物的基因组息息相关。


为了帮助大家从基因层面寻找答案,全面了解植物基因组进展,深入了解各种有趣的生物学故事,科技君吐血整合给大家带来史上最强植物基因组解读。科技君的小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集解读归类,经分类归纳后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。


华大基因理事长杨焕明院士在IBC大会上发表题为“绿色的生命、美丽的基因”公众报告





>>>>本次推送文章为茄科的东北菜地三鲜(马铃薯、茄子、辣椒)


1

马铃薯


马铃薯

马铃薯(Solanum tuberosum L.)是世界上最重要的非谷类粮食作物,是全球重要的淀粉膳食来源、是全球粮食安全的核心,在世界粮食生产和安全方面起到关键作用。在当时,马铃薯表现出严重的近交繁殖衰退,加上其基因组序列的不完善和其块茎生长进化、发展机制不明确,传统育种方法对马铃薯进行改良有重大障碍,因此对马铃薯进行基因改良成为热点问题。华大基因在这个时候坚定的站了出来,联合Cayetano Heredia大学团队对马铃薯进行了一系列的基因组研究。


文献题目: Genome sequence and analysis of the tuber crop potato


发表期刊: Nature


发表时间:2011年7月14日


影响因子:34.48


摘要介绍:深圳华大基因Cayetano Heredia大学团队使用纯合双单倍体马铃薯克隆序列组装了844Mb基因组,预测39,031个蛋白质编码基因,提供了至少2个古多倍体基因组重复事件证据以及对杂合二倍体克隆序列进行了测序。研究发现基因的插入缺失变异和其他潜在的有害突变经常发生,可能导致马铃薯近交繁殖衰退。基因家族的扩张、组织特异性的表达和将新基因引入新的通路将有助于块茎发育的演变。

内容解析


研究问题:

1. 对于杂合度很高的马铃薯来说,如何组装出高质量的基因组?

2. 马铃薯表现出近交繁殖障碍的原因;

3. 古多倍体全基因组复制事件研究、双子叶和单子叶植物之间分歧时间研究、马铃薯和葡萄的差异发生时间研究;

4. 马铃薯单倍体多样性的程度探究;

5. 马铃薯地下组织抗生物胁迫压力的原因;

6. 马铃薯抗病性基因的研究。


研究难点:

1.土豆的栽培种是同源四倍体(2n=4x=48),杂合度较高,不利于基因组的组装。

2.当时的全基因组组装或单基因组重组可使用的方法有限,如RH,如k-mer频率计数直方图分析,缺少细菌级的比较分析方法。


研究方向:

1. 基因组组装和注释分析;2. 基因组进化分析;3. 单倍体多样性分析;4. 块茎生物学方向分析;5. 抗病能力分析。


研究成果:

1. Illumina GA、454及Sanger共测序的原始数据为96.6Gb。17 K-mer分析表明基因组大小为844Mb,和流式细胞仪结果一致,组装得到727 Mb基因组(93.9%为非gap区) 。


2. 注释的重复序列约为基因组的62.2%,小于用BAC和Fosmid-end估计的值74.8%,表明没有组装出的序列有较多的重复序列。


3. 注释了39,031个蛋白质编码基因。rna-seq数据显示存在可变剪切;9875个基因(25.3%)编码了两种或更多的异形体,这表示比单独的基因表达有更多功能变异。


4. 基因家族聚类分析:11 个其它植物,共有基因家族3,181 ,土豆有4,479 个基因,土豆特异基因为3,372;全基因组复制分析:用1,811个共线性区块中10,046个基因进行4DTv分析,表明有两次全基因组复制事件。古老的复制事件和蔷薇分支的葡萄古六倍体化事件一致。


5. 自交衰退和品种多样性研究:土豆有严重的自交衰退,一般用无性繁殖。研究表明DM中的纯合子有害等位基因的补充可能导致其活力的降低。


6. 块茎生物学:研究块茎发育的各个阶段的基因表达情况。KTIs基因家族对块茎的生长有重要作用,对该基因家族进行了表达分析,发现KTI家族的扩张可能为脆弱的地下器官提供压力抗性。


7. 抗虫和抗病毒研究:,基于结构域鉴定了抗性相关蛋白,研究了相关基因在基因组上的位置、拷贝数、基因家族的多态性及表达情况,为后期提高土地的抗虫和抗病毒行提供了基础。


研究亮点:

1. 提出使用纯合双单倍体的DM的测序数据进行组装,解决了杂合对基因组组装的影响。


2. 马铃薯蛋白质组与其他11个绿色植物基因组的正交聚类分析,给出古多倍体全基因组复制事件的解释以及双子叶和单子叶植物之间分歧的时间、马铃薯和葡萄的差异发生的时间。


3. RH的细菌克隆序列和DM基因组比较分析,阐述了马铃薯单倍体多样性的原因和近交繁殖障碍的原因。

研究方法


研究对象:纯合双单倍体马铃薯、杂合二倍体马铃薯;


所用软件:SOAPdenovo、SOAPalign 2.20、BLAST、BLASTX、Cufflink、Tophat

Augustus 、Genscan、EMBOSS 6.1.0、HMMER V.3、MARCOIL、RepeatMasker、RepeatProteinMask,LTR-FINDER、MCscan 和i-adhore 3.0、MUSCLE、OrthoMCL家族聚类;


所用数据:1. 纯合双单倍体马铃薯测序数据;2. 杂合二倍体马铃薯测序数据;3. 11个其他植物的基因组数据;4. RH块茎组织(幼嫩块茎,成熟块茎,块茎皮,皮层和髓)的转录组数据;


所用数据库:RHPOTKEY BAC库、R基因组、TE蛋白质数据库、KEGG数据库、Repbase数据库、TrEMBL数据库;


创新方法:本研究创造性的使用了DM来进行测序和组装,解决了杂合对基因组组装的影响。


实验过程:南美栽培品种经过经典组织培养技术获得加倍单倍体纯合子马铃薯,提取细胞核和细胞器的DNA,用全基因组鸟枪法对其进行测序。


研究结果


图1


图2:马铃薯基因组的比较分析和进化

a,由OrthoMCL 鉴定的12种植物物种中的直系同源和旁系同源基因家族簇。

基因家族号码列在每个组成部分中; 组成部分内所有物种家族的基因数目都在括号内标明。

b,通过4DTv分析显示双子叶植物基因组中的基因组重复。

c ,拟南芥,马铃薯和葡萄之间的合成区块,表示出这些分类群之间高度保守的基因顺序。


图3:单倍型多样性和近亲繁殖抑制

a,DM和RH的植物和块茎显示出RH具有更大的活力。b,DM和RH的Illumina K-mer体积直方图。y轴表示k-mer的体积,x轴表示其发生的频率。低频率和高体积最左方无顶端的峰值表示随机测序错误的K-mers,而右侧的分布表示测序正确的(假定的无错误)数据。与DM的单一模式相反,RH表现出由杂合性引起的明显的双重形态。c,基因组分配(分布)的提前终止,移码和插入/缺失变异导致近亲繁殖抑制。假定RH的假分子从相应的DM基因组中推断。由于不能将RH的杂合PS和FS分配给确定的单倍型,所以将所有杂合的PS和FS任意地比对到RH的左侧单体型。d,DM和RH基因组放大的比较视图。左和右对齐处分别来自染色体5的常染色质和异染色质区域。其中大多数的基因注释,包括PS和RH的特异性基因,都有转录数据的支持。

注:DM(DM1-3 516 R44)和RH(RH89-039-16)表示的是2种栽培的马铃薯,为马铃薯的编号(名字)。


图4:所选组织和基因的基因表达

a,马铃薯基因组的KTI基因结构。黑色箭头表示位于四条染色体上的六个scaffold上的单个基因的位置。b,系统发育树和KTI基因表达热图。使用所有可用的马铃薯和番茄基因与杨树KTI基因作为KTI基因簇的外群体。热图中显示了高度扩张的马铃薯基因家族的个体成员的组织特异性。表达水平由红色的阴影表示,其中白色表示没有表达或者表达的基因中没有来自番茄和白杨的基因。c,淀粉合成模型中酶活性显示图。如左图所示。AGPase,ADP-葡萄糖焦磷酸化酶; F16BP,果糖-1,6-二磷酸酶; HexK,己糖激酶; INV,转化酶; PFK,磷酸果糖激酶; PFPP,焦磷酸-果糖-6-磷酸-1-磷酸转移酶; PGI,磷酸葡萄糖异构酶; PGM,磷酸葡萄糖变位酶; SBE,淀粉分支酶; SP,淀粉磷酸化酶; SPP,蔗糖磷酸磷酸酶; SS,淀粉合成酶; SuSy,蔗糖合成酶; SUPS,蔗糖磷酸合成酶; UDP-GPP,UDP-葡萄糖焦磷酸化酶。灰色背景表示底物(蔗糖)和产物(淀粉),红色背景表示RH相对于DM特异性上调的基因。在右侧,显示了基因参与碳水化合物代谢的热图。ADP-葡萄糖焦磷酸化酶大亚基,AGPase(1); ADP-葡萄糖焦磷酸化酶小亚基,AGPase(s); ADP-葡萄糖焦磷酸化酶小亚基3,AGPase 3(s); 胞质果糖-1,6-二磷酸酶,F16BP(c); 颗粒结合淀粉合成酶,GBSS; 叶型L淀粉磷酸酶,叶型SP; 质体磷酸葡萄糖变位酶,pPGM; 淀粉分支酶Ⅱ,SBEⅡ; 可溶性淀粉合酶,SSS; 淀粉合成酶V,SSV; 质子醛缩酶,PA的三个变体。



【参考文献】

Potato Genome Sequencing, C., et al. (2011). "Genome sequence and analysis of the tuber crop potato." Nature 475(7355): 189-195.





撰稿:动植物大项目部

编辑:市场部



近期热文

表达谱芯片没告诉你,在这12个方面RNA-Seq完胜!

华大基因通过宏基因组学揭示中国克罗恩病患者的肠道微生物特征

关于联合保护中国人类遗传资源的倡议书

众志成城共护人类遗传资源

7000次实验得出的单细胞研究7步法,你真的不看吗?

美颜届新宠 | 石榴是如何做到的?

最新研究成果揭示中国2型糖尿病患者的脂代谢特征

颤抖吧!奢华上市晚宴一顿吃掉一部基因组测序编年史(文末有彩蛋)

16个Small RNA样本也能发5.9分文章

生物信息|暑期常用技术培训,你想知道的都在这里!




请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存