查看原文
其他

Nature:1000种植物的测序揭示10亿年来的进化

市场部-YDW 联川生物 2024-03-27

论文标题:One thousand plant transcriptomes and the phylogenomics of green plants

刊登日期:2019年10月

发表杂志:Nature

影响因子:69.504

研究机构:加拿大科学家发起,近200名植物学家参与的国际联盟

技术手段:转录组测序



导读

一个由近200名植物科学家组成的国际联盟公布了1100多种植物的转录组测序,这是一个为期9年的研究项目—— One Thousand Plant Transcriptomes Initiative(1KP)。1KP是一个全球性的合作项目,旨在研究植物物种、基因和基因组的多样性,这些多样性跨越了从开花植物和绿藻的祖先开始的超过10亿年的绿色植物历史。该项目由加拿大阿尔伯塔大学教授 Gane Ka-Shu Wong于2008年11月发起。

主要研究内容

 

1. 基因组进化的综合分析


图1 绿色植物科内的多样性

由于陆地植物的基因组大小相差2,340倍,绿藻和链藻的基因组大小相差4,680倍,因此该研究使用简化表示测序方法来重建基因和物种历史。具体地说,该研究共产生了1,342个转录本,代表了原始色素体生物中的1,124个物种,包括绿色植物、蓝藻和红藻。比较基于核和叶绿体基因的系统发育推断(图2、图3),该研究在不同的数据集和分析中获得了得到良好支持的、基本上一致的结果。然而,一些关系的解决被基因树不一致(图3)所混淆,这可归因于包括快速多样化、网状进化、基因复制和丢失以及估计误差在内的因素。

 


图2 主要支系的系统发育推论

使用ASTRAL15估计的基因树摘要系统发育中推断的全基因组复制(WGD;即多倍体)不是均匀分布的。将每个物种的基因复制时间分布和同源分化时间与基因树分析进行比较,该研究推断出244个古老的WGD分布在病原菌中。除了大多数卷柏属物种和一些苔类植物(图1g)外,该研究分析表明,每个陆地植物谱系的祖先中至少有一个古老的WGD。相比之下,大多数藻类谱系没有显示出WGD的证据。值得注意的是,预测的陆地植物姐妹支系(图2),桫椤科植物(图1E)显示了藻类谱系中最高的WGD密度(图4),尽管WGD的明显增加在很大程度上限于桫椤科内的结节支系(Desmidices)。

基因家族的扩张(和收缩)有助于代谢、调节和信号网络的动态进化。考虑到转录组数据的内在局限性,该研究搜索了拟南芥中23个最大的基因家族的大倍变化,这些基因参与了许多重要功能(如转录调节、酶和信号功能以及运输(图5)。虽然我们基于RNA测序的表达基因样本是不完整的,但在病毒科的分类群中,普遍保守的基因31的中位数为80%-90%。此外,我们转录本中的基因家族大小(专注于最大的基因家族)与全序列基因组的基因家族大小之间有很强的相关性(r=0.95)。该研究确定了基因家族的扩张和收缩,包括之前描述的一些。

沿着维管束植物和维管束植物起源之间的系统发育的“脊椎”推测了最高密度的扩展事件(图5B)。在胚芽起源之后,一些局部基因家族的扩展也在继续;然而,没有发生与被子植物的起源和辐射相关的扩展(图5)。基因家族的扩展和功能的多样化可能有助于陆地生境中的生命所需的适应,但在维管植物整个进化过程中,面对持续的基因复制和丢失,这些关键基因家族的大小显然是稳定的。


2. 叶绿体的初步获得:

在现存的古生物的祖先中,最初获得了质体,这是生命史上的一个关键事件。所有可能的关系之间的病原植物,蓝藻和红藻之间的假说,以及在早期历史上的三个谱系的特征的获得和损失的另一种含义。在绿藻和被子植物进化的早期,肽聚糖的生物合成被独立地丢失(图2、3a)。


3. 病原菌的历史

病原菌的起源是由藻胆蛋白组成的捕光藻胆体的丧失,与叶绿素a具有明显光吸收光谱的副光合色素叶绿素b的进化,以及质内淀粉的合成和沉积有关。维管藻一致地恢复为单系,早期分化为绿藻和链藻。然而,在该研究中,微小浮游藻类Prasinodiccales的位置是不稳定的(图3e)。

图3 争议性关系的替代分支顺序

绿藻中的多样性:所有核基因分析都确定了一个等级的以海洋为主的单细胞谱系,其核心分支由树叶、石藻和绿藻组成。核超母体和星际树将银杉作为包含绿藻和石藻的分支的姐妹。然而,超基质树支持石藻为单系,星形树支持石藻为一个等级,而苔藓目作为绿藻的姐妹支持较差(图3H)。所有的树估计都表明,在石藻中有多个来源的多细胞。在119个采样的绿藻物种中,只有12个物种在它们的祖先中显示出WGD的证据,并且这些假定的WGD大多局限于单个支系。

链球菌:链藻的进化与对陆地生境的几次适应有关。所有的分析都在一个与链球菌的其余部分姐妹的分支中发现了MesostigmaChlorokybusSpirotaenia minutaKlebsormidicesCharophyceae(图1D)、ColeochaetophyceaeZygnematophyceae(图1E)相对于胚芽植物依次分化。然而,与以前的工作相比,分类单元样本大大增加,内部分枝长度减少,不能排除真正的辐射引起鞘毛目、桫椤科和胚芽植物谱系变化的可能性。虽然四重奏支持将鞘毛目和旱生植物作为胚芽植物的分支,但不支持由鞘毛目和陆地植物组成的分支。

陆生植物:陆地植物包括许多最常见的绿色植物(例如苔藓植物(图1f-h)、石蒜(图1i)、蕨类植物(图1j,k)和种子植物(图1l-p))。它们展示了关键的创新,包括受保护的生殖器官(颈卵器和雄蕊),以及颈卵器内的受精卵发育成接受母体营养的胚胎。长期以来,解决苔藓植物(苔藓、地钱和角藻)之间的关系以及它们与剩余陆地植物的关系一直是一个难题,但对于理解陆地植物中基本创新的进化是至关重要的,这些创新包括对干燥的耐受性、多细胞单倍体和二倍体世代优势的转移以及多细胞胚胎的亲本保留。该研究当中,基因家族扩展的最大数量与陆地植物的起源和苔藓植物的进化(图5B中链藻和苔藓植物之间的过渡)有关。相比之下,该研究在陆地植物的茎枝上没有发现WGD的证据。


图4 推断的古代WGD在绿色植物谱系中的分布

维管束植物:在维管束植物中,番茄是裸子植物(蕨类植物和种子植物)的姐妹群。我们没有发现泛维管植物或祖先真叶植物WGDS的证据,但一些基因家族的扩展与维管植物的起源有关(图5B)。在蕨类植物(水龙骨目)中,核基因分析有力地将木龙目列为其余蕨类50的姊妹种。细孢子蕨类植物(图1K)经历了比被子植物以外的任何其他病原菌谱系更多的WGD事件,在每个采样物种的历史上平均推断出3.79个WGD(图4)。

种子植物:所有现存种子植物的祖先中的WGD已经被推断出来了,但仍有争议。基因树分析显示,导致现存种子植物的分支上的基因复制明显多于背景基因的出生率和死亡率。许多基因家族的扩展也与种子植物的起源有关,在分析的基因家族中只发现了一个收缩的基因家族(图5b)。现存的裸子植物(大约1000种)是有花植物的姐妹,该研究所有的分析都将苏铁类和银杏(图1l)恢复为其余裸子植物的姐妹支系(图3c)。

被子植物是迄今为止最大的绿色植物支系(超过37万种),并以多种关键创新为标志,包括心皮、双受精、胚乳,以及大多数被子植物的容器元素。核子和质子的系统发育分析与以前的研究一致,为被子植物的单系化提供了强有力的支持,并将Amborellales、Nymphaeales和Austrobaileyales作为所有其他被子植物的连续姐妹(图2,3)。


图5 最大植物基因家族显著扩增和收缩的评估

该研究通过上述分析结果为深入了解绿色植物的总体系统发育框架和导致与病毒科重大进化转变相关的特征性状的遗传变化奠定了基础。这里报告的物种树的部分仍然没有得到解决。对从全基因组序列的广泛样本中提取的基因进行系统发育分析,可能会改善基因家族的限制,并进一步解析物种树。扩展的基因组测序也可能有助于准确地解释物种间的基因流动,以及面对基因复制和丢失时的正交学。然而,对于物种树中的一些节点,推断的基因历史之间的广泛不一致表明,快速的多样性可能并不总是符合祖先物种分成两个后代物种的严格分歧。

长期以来,基因和基因组复制一直被认为是进化新颖性的来源,为植物发育和生态中的关键途径和转变的适应性进化产生了一个扩展的分子谱系。然而,关键创新和特定基因复制之间的直接联系鲜为人知,部分原因是复制和这种创新之间的滞后时间。对基因内容和功能变化的系统发育实验研究将提高我们对基因和基因组复制在关键创新进化中的作用的理解。


总结

总之,该研究揭示了全基因组复制的时间,以及基因家族的起源、扩张和收缩,有助于推动绿藻、苔藓、蕨类植物、针叶树、开花植物和其它绿色植物谱系的进化。植物如何以及在何时开始长高、结出种子、花朵和果实的历史,为理解地球上植物多样性提供了一个框架。值得注意的是,该研究发现,在绿色植物、陆地植物和维管植物起源之前,基因家族就有了大范围扩展,而全基因组复制则是在开花植物和蕨类植物的进化过程中反复发生。


相关阅读

用户案例NSR(IF=23)暨南大学张力课题组发现调控社交的杏仁核神经元集群 | 转录调控专题

案例解析:miR167-ARF3/30-多胺氧化酶 1 模块赋予玉米对MCMV的抗性 | 转录调控专题

JEB(IF=7.298):拟南芥金属蛋白酶FtsH12调控叶绿体发育 | 转录调控专题

肺鳞癌生物标志物研究思路,你值得拥有 | 转录调控专题

点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存