Nature Communications | 瑞士纳沙泰尔大学通过机器学习预测小麦病原菌结构变异的决定因素!
包括复制、倒置、插入和缺失在内的结构变异往往是物种内最常见的遗传变异形式。包括人类疾病、作物改良性状和病原体毒力在内的各种表型都与染色体重排有关(PLOS GENETICS | 塞恩斯伯里实验室Kamoun团队揭示影响稻瘟病菌毒力的微型染色体!)。基因组串联的断裂会对减数分裂期间等位基因的忠实交换产生重要影响。因此,染色体重排也可以支持来自共同适应的等位基因的适应,包括性别决定位点。结构变异来自于基因组中重复区域之间的非平行同源重组、同源定向修复和微同源介导的末端连接或可转座元件的活动。然而,预测序列重排事件的可能性仍然具有挑战性。在大多数物种中,重复序列内容在核苷酸水平上的分辨率很低,导致对容易发生重排的脆弱位点的预测模糊不清。此外,在种群水平上分析分离的结构变体只能部分地反映序列重排事件,因为选择往往会在几代的时间里去除有害的变体。
近日,国际权威学术期刊Nature Communications发表了瑞士纳沙泰尔大学Daniel Croll课题组(ISME | 瑞士纳沙泰尔大学研究揭示小麦病原菌对异质环境适应性的遗传基础!)的最新相关研究成果,题为Machine-learning predicts genomic determinants of meiosis-driven structural variation in a eukaryotic pathogen的研究论文。
在这篇文章中,科研人员分析了一组小麦病原真菌的端粒到端粒的基因组组装,以建立一个核苷酸水平的结构变异图。结果表明,最近出现的农药抗性是由重排不成比例地驱动的。科研人员使用机器学习来训练一个基于30条染色体序列特征的结构变异事件模型。结果表明,碱基组成和基因密度是结构变异的主要决定因素。反转录转座子解释了大多数倒置、插入和复制事件。科研人员将他们的模型应用于拟南芥,并表明他们的方法可以延伸到更复杂的基因组。最后,科研人员分析了一个四代系谱中单倍体后代的完整基因组。减数分裂的交叉位置富集了新的重排,与交叉位置是突变热点相一致。根据物种范围内的结构变异训练的模型准确地预测了沿系谱产生的>74%的新变体位置。预测能力突出了特定序列特征与诱导染色体重排之间的因果关系。科研人员的工作表明,训练序列衍生的模型可以准确地识别真核生物基因组中固有的DNA不稳定性区域。
Nature Communications | 蒙大拿大学揭示氮磷施肥有利于植物土壤中的病原菌而非共生菌!
Nature Communications | 悉尼大学研究揭示小麦重组的抗病基因堆叠编码不相关的NLR基因!
点个在看你最好看