蔗茅着丝粒主要由137bp的重复序列组成,其CEN137序列与甘蔗热带种着丝粒序列(So1)的相似度大于93%。通过Oligo-FISH发现CEN137序列特异分布于蔗茅的着丝粒区域。不同染色体间着丝粒序列差异较大,而同一条染色体的着丝粒序列则高度相似。研究进一步鉴定获得1,626,903个高阶重复(CEN137首尾相连组成的单元),距离较远的高阶重复间的变异度大于距离近的高阶重复间的变异度,与着丝粒序列均质化的理论一致。蔗茅着丝粒区域有大量的Gypsy LTR插入,在LTR插入区域附近的CEN137序列的变异度比其它区域的高,表明LTR的插入可能驱动着丝粒区域变异,在着丝粒序列的进化中起重要作用。张积森团队的研究利用STAG(Species Tree Inference from All Genes)方法构建物种进化树,结果表明,与高粱和芒草相比,蔗茅与甘蔗亲缘关系更近。蔗茅基因组与高粱、细茎野生种和热带种基因组均保持着良好的共线性。利用碱基同义替换率计算分析表明,蔗茅与细茎野生种AP85-4741、细茎野生种Np-X和热带种的分化时间分别为2.5、1.9和2.3百万年。而通过组装蔗茅叶绿体基因组构建进化树,支持将蔗茅划分到甘蔗属。通过直系同源基因家族比较和重测序数据mapping,研究结果表明蔗茅比高粱更适合作为研究甘蔗的二倍体参考物种。
图2. sRNA介导的甲基化调控古复制染色体上基因表达的模式
张积森团队的研究发现一对古复制染色体5号和8号染色体上的基因整体趋向于低表达,值得重点指出的是,进一步的研究发现,这种现象在甘蔗属乃至禾本科中都是普遍存在的。通过甲基化测序和sRNA测序分析表明,24nt sRNA介导的甲基化(RdDM)差异,特别是基因启动子区域CHH甲基化差异,是导致该对染色体基因表达量降低,从而保持基因表达剂量平衡的调控机制。同时研究还还发现该对染色体上的基因存在协同进化现象,并富集了大量NBS抗病基因。通过群体全基因组测序分析了蔗茅的群体遗传学特征,并探究了蔗茅和甘蔗属的群体历史,结合蔗茅和甘蔗属的分化时间和分布情况,研究认为甘蔗属可能起源于泛喜马拉雅地区,Gelasian epoch时期(2.59–1.81百万年)气候巨变可能促使了蔗茅与甘蔗细茎野生种和热带种的分化,此后蔗茅保持二倍体的模式,而甘蔗细茎野生种和热带种则分别经历了多倍化。该研究成果以题为A complete gap-free diploid genome in Saccharum complex and the genomic footprints of evolution in the highly polyploid Saccharum genus的研究论文在线发表在《自然-植物》(Nature Plants)上。福建农林大学海峡联合研究院基因组中心张积森课题组博士生王天友、广西大学亚热带农业生物资源保护与利用国家重点实验室(国重室)汪柏宇、华秀婷、福建农大学基因组中心教授唐海宝为论文共同第一作者,广西大学国重室张积森教授和姚伟教授为论文共同通讯作者,参与作者还有福建农林大学的张泽宇、齐浥颖、张清、张哲、梅静、王宇浩、张以星、李艺寒、孟雪、王勇军、潘浩然、陈姝琦、李珍、石会红、顾连峰教授、邓祖湖教授和明瑞光教授,广西大学国重室的高瑞婷、余泽怀、陈保善教授、张木清教授,盐城师范大学的王刚老师,闽江学院黄永吉老师,佛罗里达大学王建平教授,云南省农业科学院甘蔗研究所刘新龙研究员。