查看原文
其他

单身必看 | 这个植物……真的可以帮助脱单吗?

大项目部-刘青峰 华大科技BGITech 2019-05-10

 180+篇植物基因组文章解读大全 

第三章 蔷薇科

地表最强植物基因组文献解读,正在继续。科技君和小伙伴们特地对植物基因组领域已发的180多篇高质量文章进行收集、解读和归类,经归纳整理后共分十章,前九章为相关领域已发表物种文献解读,最后一章为植物基因组未来发展趋势及预测。

第三章往期回顾

金冠苹果 ◆ 甜樱桃





导读

年关一天天近了,街上的年味儿也越来越浓,眼看春天就要来临,桃花的花期,就在眼前。自古人们就用桃花来形容女子,《诗经》中有言:“桃之夭夭,灼灼其华,之子于归,宜其室家”;在现代,也常用“桃花运”来形容男女之间的姻缘。单身的各位,如果在观赏桃花之后脱单了,请一定回来留言告诉科技君!


桃树(Prunus persica),原产于中国,是李属中一种重要的落叶乔木,果实多汁。花可观赏,其作为蔷薇科中二倍体物种的代表,尽管基因组比较小,但生长习性非常多样化,并且已历了4000多年的栽培驯化。因此,桃树的全基因组测序对于研究蔷薇科植物的进化、比较基因组分析以及栽培驯化对其基因组进化的影响有重大的意义。


文献题目:The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity, domestication and genome evolution


发表期刊:Nature Genetics


发表时间:2013年3月24日


影响因子:27.959


摘要介绍:由来自意大利、美国、西班牙、智利和法国5个国家26家科研院所的科学家发起了国际桃基因组计划并且合作完成桃树基因组研究,文章的通讯作者是意大利科学家Ignazio Verde、Michele Morgante和美国科学家Albert G Abbott、Daniel S Rokhsar。


蔷薇科是盛产水果的一个进化分枝,其中具有重要商业价值的属包括草莓属、蔷薇属、悬钩子属和李属。虽然它们的生长习性和果实类型差异较大,但都有紧凑的二倍体基因组。文章首先介绍了一棵纯合基因型桃树的高质量基因组图谱的获得,利用Sanger全基因组鸟枪法,组装得到了一个完整的染色体水平的基因组图谱,并且预测了27,852个编码蛋白的基因和一些非编码RNA。另外,通过14个李属物种的全基因组重测序,科研人员调查了桃树的栽培驯化路径,结果表明遗传瓶颈效应显著改变了桃树基因组的多态性。最后,通过比较基因组分析发现,桃树近期并未发生全基因组复制,且与葡萄树相比,尽管桃树中的祖先三倍化复制区段比较片段化,但是祖先来源的7个古老的同源基因在桃树基因组中都可以找到。


研究难点:只使用Sanger测序来组装桃树的基因组,利用已公布的李属植物的遗传图谱,最终获得染色体水平的桃树基因组图谱。

内容简析

研究方向:

1. 桃树de novo基因组学研究和比较基因组分析;

2. 桃树群体重测序及遗传进化分析;


研究亮点:

1. 从分子层面来研究栽培驯化对桃树基因组进化的影响;

2. 桃树与其它蔷薇科植物的比较基因组学分析;


研究问题:

1. 桃树基因组中LTR重复元件插入时间的推断;

2. 桃树基因家族是否有特异的扩张,扩张原因是什么;

3. 桃树的栽培驯化对其基因组有哪些影响;

4. 桃树近期是否有全基因组复制发生;

研究方法

研究对象:

基因组测序:双单倍体型桃树 Lovell PLov2-2N;

重测序: 10个不同品种的桃树(P. persica),新疆桃(P. ferganensis)、甘肃桃(P. kansuensis)、 山毛桃(P. davidiana)和光核桃 (P. mira)各一个;

转录组:不同时期的不同组织,包括果实、根、叶、胚和子叶;


所用软件:

基因组组装:Arachne v.20071016;

基因注释:FGENESH+、GenomeScan;

重复序列分析:RepeatScout、ReAS、LTR_finder和Censor;

非编码RNA:tRNAscan-SE、INFERNAL;

Duplicated区间分析:SynMap、BLASTZ62 and DAGchainer;

共线性分析:Mercator;

比对软件:BLAT、BLAST;

转录组组装及比对:PASA、rNA;


所用数据:

1. 双单倍型桃树的全基因组数据;

2. 14个桃树及其近缘种的全基因组重测序数据;

3. 已公布的李属植物的遗传图谱;

4. 不同时期不同组织的转录组数据;


所用数据库:Repbase、GenBank、Genoscope、KEGG 等数据库;


实验过程:

基因组:先用双单倍体型桃树提取DNA,构建2.8kb、4.4kb、7.8kb、fosmid (35.3-kb)和BAC (69.5-kb) 文库,然后用于Sanger测序。

转录组:从不同时期的不同组织中提取mRNA,检测其质量,最后进行测序。

重测序:对于每个样品,准备1-3μg的基因组DNA来构建测序文库,最后进行上机测序。

研究结果

研究成果:

1. 对双单倍体型桃树Lovell PLov2-2N  ( 2n=16) 进行测序,使用已公布的李属植物的遗传图谱,组装得到其染色体水平的基因组精细图谱,大小为224.6Mb。为了评估常染色质部分组装的完整性,将来自GenBank的74,606条李属植物的EST序列比对到基因组上,比对率为99%。


2. 通过对基因组注释得到27,852个编码蛋白的基因、474个tRNAs、25个tRNA假基因以及769个其它非编码RNA。另外,通过注释发现桃树基因组中重复序列的比例为29.6%,比苹果树(42.4%)和葡萄树(44.5%)的更低,但是比拟南芥(18.5%)的更高。使用分子古生物学方法评估LTR元件的插入时间,发现绝大部分情况下LTR分歧非常慢,且253个(12.6%)LTR反转座元件具有相同的LTRs,因此表明这些元件的反转座移动很可能是在非常近的时期发生的。


3. 与其它已测序物种的基因家族比较分析,发现了桃树中的2个代谢途径:多元醇合成和苯丙烷代谢,它们与桃树中相应基因家族的扩张有关。其中山梨醇在绣线菊亚科中的合成积累与SOT、A6PR和SDH的扩张相关,而在木质素和酚酸生物合成中起关键酶反应作用的基因家族C3H、HCT和HQT在桃树中也都有扩张。


4. 为了调查桃树的栽培驯化路径,研究人员重测了10个桃树(P. persica)品种和4个李属野生种的全基因组序列,获得了953,357个高质量SNP。通过核苷酸多样性的研究分析发现,假染色体2前端和假染色体4后端的核苷酸多样性(π)较高,前者可能与该区域中抗性基因的快速进化有关,后者与多样化的果实成熟时间有关。另外通过核苷酸多样性分析发现了两次主要瓶颈效应的存在,第一次发生在约4000-5000年前,桃树在中国开始栽培驯化,第二次发生在约16-19世纪,桃树被引入美国。


通过桃树与苹果树及葡萄树的比较基因组和进化分析发现,与苹果树不同,桃树近期并未发生全基因组复制事件,而只是进行了一些基因组间的重排。另外,也表明双子叶共有的古六倍化事件发生在蔷薇科和葡萄科分离之前。



图1 桃树的基因组特征

图中展示了桃树基因组8个假染色体上的各种注释特征,横坐标的刻度为Mb,其中用堆叠面积图(以500Kb的非重叠窗口为单位)表示某特征在基因组中的比例,紫色代表Ⅰ型转座元件,粉色表示Ⅱ型转座元件,蓝色表示基因。灰色的线表示每50Kb窗口中所有SNP的平均r2值的100倍,着丝粒的近似位置用垂直的黑色条形表示。在下方有3行垂直线分别表示预测的miRNA(黑色)、非编码RNA(浅蓝色)和tRNA(橙色)。


图2 桃树基因组中核苷酸多样性的分布

图中最外圈表示核苷酸多样性(π),它是以50Kb的非重叠滑动窗口对23个单倍体基因型(11个二倍体品种和参考序列)计算得到的。内部的14圈分别展示了10个桃的栽培品种和4个李属野生种的SNP频率的分布,滑动窗口没有重叠且大小为50Kb。从外到内的顺序分别为:P. ferganensis (E)、Oro A (W)、Shenzhou Mitao (E)、Yumyeong (E)、Sahua Hong Pantao (E)、GF305 (W)、Quetta (E)、Earligold (W)、IF7310828 (W)、Bolero (W)、F1 Contender × Ambra (W)、P. kansuensis (S)、P. davidiana (S) 和 P. mira (S)。E指来自东部;W指来自西部;S指野生种。


图3 桃树基因组的二倍化和三倍化复制区域

每条曲线连接着桃树二倍化复制的两个区域,7种不同的颜色分别代表了在双子叶植物祖先发生六倍化事件之前已经存在的7个连锁群。桃树基因组与葡萄基因组的同源区间用不同颜色的线表示,当同源区间有不同祖先来源时颜色的优先顺序为TR1、TR2、TR3、TR4、TR5、TR6、TR7和灰色。7个主要的3倍化复制区间(TR1-TR7)如图所示,PC为“Prunus chromosome”的简写。


图4 桃树、苹果树和葡萄树的共线性基因对的4DTv距离的分布

同源基因的片段是通过BLASTP比对找到的,要求E value≤10-10且比对间最多有5个干扰基因的存在。这些片段上同源基因的4DTv距离如图所示。


【参考文献】

International Peach Genome Initiative. The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity, domestication and genome evolution. Nat. Genet. 45, 487–494 (2013). 


↙点击下方“阅读原文”查看文献


撰稿:大项目部-刘青峰

编辑:市场部


猜你喜欢

IBC意犹未尽?彩蛋来袭!|180+篇植物基因组文章解读大全

茄科三剑客之茄子茄科三剑客之辣椒

撑起家常菜半边天的它,到底是水果还是蔬菜?

撩妹神器,茄科颜值担当!不信你别点

一言不合就变性?芦笋要被科学家玩坏了!

古早植物进化史 | 琴叶拟南芥基因组


近期热文

春风十里,不如鹏城有你

再添新成员!10台Sequel测序仪加入华大测序大平台

华大基因全球发布2项重大计划,引爆J.P.Morgan健康大会

国际顶级生物信息专家李恒博士出任BGI Online资深顾问

转录组测序后差异表达基因太多?这4招解决你的难题

BGISEQ-500癌症基因组首次公开

喜报!高强博士入选国家“万人计划”科技创业领军人才

别走!看完这篇今年才算完整(文末有个新年礼物,请查收)

那个当年被嘲笑成小灵通的测序仪,现在怎么样了?



请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存