对于辛勤的农民伯伯和农业科学研究者来说,稗草这个名字想必一定不会陌生。有一首元代古诗题为《种稗叹》,首颔两联是“农田插秧秧绿时,稻中有稗农未知。稻苗欲秀稗先出,拔稗饲牛唯恐迟。”稗草是一种主要的作物杂草,稻田稗草在苗期与水稻的形态别无二致,难以分辨。这种现象即是著名的“瓦维诺夫拟态”,得名于前苏联生物学家尼古拉·瓦维诺夫,描述了一种农田杂草模仿作物的形态,避免人类拔除的现象。在这个拟态过程中,拟态三要素分别为拟态者(杂草)、被拟态者(作物)和受骗者(人类)。来自浙江大学农学院等单位的研究者通过对不同的稗草群体进行重测序,对稗草的群体结构以及稗草拟态的分子进化机制进行了细致的研究,研究结果于2019年9月发表于《Nature Ecology and Evolution》。
难以分辨的水稻(左)和稗草(右)
研究者们从长江流域的稻田以及附近的区域采集了共328个稗草品系,并将将不同品系的稗草集中栽种进行表型鉴定。提取DNA后,使用Hiseq 4000进行高通量测序。研究者将测序数据使用BOWTIE比对到稗草参考基因组上,并使用SAMtools和GATK检测突变。得到变异数据后根据质量值和深度等对数据进行质量过滤。经过过滤的SNP被用于使用FastTree构建系统发育树,以及使用SMC++进行分化时间计算。为了检测选择信号,研究者采用VCFtools进行π、Fst、Tajima's D值的计算,窗口大小设置为20 kb和50 kb。Scaffold 445(包含LA1基因)上的SNP和Indel被用于研究该基因的受选择模式。最后,研究者还选取了一个拟态品系和一个非拟态品系进行了转录组测序。稗草的拟态涉及许多不同的性状,研究者使用叶片夹角、叶片宽度等性状综合计算出了拟态指数(mimicry index,MI)。研究者对328个稗草品系进行了平均深度为15×的高通量测序,产生了7.17 Tb数据。变异挖掘过程得到了903万个高质量SNP以及240万个高质量InDel。从构建的稗草系统发育树的拓扑结构中我们可以看出,328株稗草品系清晰地分成了3个进化类群, 并且此结果与PCA分析的结果相吻合。与表性鉴定的结果结合来看,三个类群分别呈现出典型的拟态(MIC)、非拟态(NMC)和中间表型(MIX)。其中拟态表型类群的平均MI值高于8,非拟态表型类群的MI值低于2。从进化树的外类群来看,拟态稗草是由非拟态稗草进化而来的。并且从分化时间的分析结果来看,拟态稗草从非拟态稗草中分化出来的时间大约是1000年前的宋朝年间。而拟态和非拟态稗草群体之间的Fst值相对较低(Fst=0.062),验证了两类稗草的分化时间较近这一事实。稗草的系统发育树、PCA分析、表性鉴定以及历史种群分析从代表遗传多样性的π值的计算结果来看,拟态稗草的遗传多样性相对非拟态稗草更低,显示出进化过程中的瓶颈效应。其中全基因组水平的多态性降低(ROD=1.324)小于基因区域的多态性降低幅度(ROD=1.650),显示正选择(positive selection)在拟态进化过程中的重要作用。从Tajima's D的分析结果来看,也支持拟态稗草的部分基因组区域在进化过程中经历了正选择的过程。拟态(MIC)和非拟态(NMC)稗草的选择信号分析在选择信号分析中,共有7596个基因(114652个变异)位于受到正选择的区域。对这些基因和变异进行筛选,选取出在拟态品系和非拟态品系中显著差异,且影响基因功能的变异,共得到1986个基因(占总基因数的1.83%)以及8373个变异(7167个SNP和1206个InDel)。在这些基因中,有87个基因在水稻中被证实和植物形态有关,包含455个影响基因功能的变异。而在总共1986个候选基因中,通过Fisher精确检验发现与植物形态相关的基因是显著富集的。除此之外,与植物向重力性相关的基因也是显著富集的。
LAZY(LA1)是拟态过程中最重要的基因之一,该基因控制植物的分蘖角度,并通过重力反应参与生长素的重分配。该基因在水稻,玉米,拟南芥中功能均保守。在进化的过程中,拟态和非拟态稗草的LA1基因区域出现了显著的分化(Fst=0.476),遗传多样性显著下降(ROD=4.956),Tajima's D和连锁不平衡分析也都支持该区域是拟态进化过程中的重要区域。单倍性分析也显示,在拟态品系中占优势而在非拟态品系中较少见的一种单倍性hap01相对而言拥有更小的分蘖夹角。最后,转录组数据也显示,在拟态品系JS26中,LA1的表达量显著高于非拟态品系JX58。这些证据均说明,LA1是拟态进化过程中控制表型变化,且受到强烈选择作用的重要基因。
靠谱er点评:想要做出有亮点的研究,从实验设计之初就需要做足功夫。本研究选取了稗草拟态这一在农业上有较大影响,而又十分有趣的现象,通过重测序手段结合恰当的采样方案,对稗草拟态的进化过程进行了详尽的研究。并且在文章撰写过程中,整体和局部的把控非常到位,不仅有全基因组水平的群体结构和选择信号分析,也有单个基因水平的细致研究,将整个研究变得更加立体。最后重点基因的重测序分析结合转录组数据,也更能够说明核心基因在生物学过程中发挥的重要作用,为重测序项目的后续验证提供了可靠思路。Ye C Y, Tang W, Wu D, et al. Genomic evidence of human selection on Vavilovian mimicry[J]. Nature ecology & evolution, 2019: 1-9.需要原文的小伙伴,公众号回复“稗草重测序遗传进化”,即刻下载原文