鲲鹏院唐中林团队成功组装猪染色体级别的分相基因组,开启个体基因组新时代
近日,我院唐中林科研团队利用单细胞配子测序和长读长测序成功组装猪染色体级别的分相基因组,从而精确重建Y染色体序列并构建猪的个体遗传图谱,首次实现对猪精子运动表型的定位。这标志着基因组组装领域又增添了新的工具,预示着个体基因组新时代的到来。
研究成果以“Haplotype-resolved assembly of a pig genome using single-sperm sequencing”为题发表在NATURE 子刊Communications Biology上(生物学1区top期刊)。
科研团队结合PacBio HiFi测序和单精子测序,成功实现了一头雄性长白猪的染色体级别分相组装。在组装过程中,科研团队开发了一种利用单精子数据推断父母单倍型的方法,并完成了Y染色体的组装。
这一成果不仅有助于理解父母单倍型的遗传贡献,还在遗传学和精子表型研究中展示了单配子测序的巨大潜力。这项研究展示了单精子测序在基因组组装和精子表型研究中的重要价值。通过这种方法,研究人员能够推断父母单倍型,精确构建染色体级别的分相基因组,并且有效组装复杂的Y染色体序列,这对于理解个体基因组遗传特征和配子表型具有重要意义。
未来,单细胞配子测序和长读长测序的结合有望在更多物种中实现染色体级别的分相基因组组装,为个性化医学和遗传学研究提供更为精确的工具和数据支持。
研究背景:二倍体基因组中同源染色体之间的差异对基因分析的诸多方面有着关键影响,包括基因组注释、等位基因表达以及个体间同源染色体变异的探究等。传统方法是将二倍体基因组融合成为单倍体序列,给后续研究带来了挑战。测序技术发展后,虽然出现多种可利用长读长进行单倍型组装的软件,却都存在局限。如 Falcon-unzip 和 SupernovaTM assembler 能确定短距离单倍型差异,Falcon-phase 结合 Hi-C 数据能产生较长单倍型但无法实现染色体水平分相组装等。如trio binning对双亲遗传信息的获取限制了其应用。单细胞配子测序有望实现染色体级别的分相基因组组装和个体遗传图谱构建。
研究方法与成果:在这项研究中,科研团队对一头雄性长白猪进行了PacBio HiFi和Hi-C测序,并对其102个精子细胞进行了单细胞测序。使用分相标记和长读长数据,研究人员巧妙的利用了一种基于Binmap的分型和纠错算法(图1),成功获得了染色体级别的分相基因组组装,该组装在分相准确性方面表现出色(图2)。
图1:配子分型示意图。1-8号精子的染色体分别用数字1-8表示,父母本基因型用A、B字母和橙色、蓝色表示。黑色水平线代表群体中假重组位点。a)八个精子的真实染色体重组图。b) 以1号精子为参考进行基因分型后的重组图。与1号精子基因型相同的标为橙色,不同的标为蓝色。除1号外,所有精子在这一位点都发生了假性重组,这是由1号精子的实际重组造成的。c)假性重组位点修正后2-8号精子的重组图。d)对所有精子进行修正后的重组图。e) 根据群体基因型信息得到的完整单倍体路径,用深橙色和深蓝色表示。
图2:不同基因组分相策略下的结果。a-c图展示了Dipasm组装流程(a)、Falcon phase组装流程(b)和单精子组装流程 (c)中分相标记的分布情况。d图是单精子流程组装结果和Duroc基因组之间的共线性分析。
此外,在携带Y染色体的精子数据帮助下,研究人员组装了26 Mb的Y染色体非N序列(表1)。通过精子的基因组数据,科研团队构建了遗传图谱,研究了猪染色体的重组规律(图3),并将精子运动性状成功定位到第1号染色体上的特定区域。
图3:遗传图谱与物理图谱的比较。横坐标为物理聚类,纵坐标为遗传聚类。
科研团队介绍:唐中林研究员为中国农业科学院“猪基因组设计育种”创新团队首席科学家,佛山鲲鹏现代农业研究院执行院长,2016年入选国家重大人才工程领军人才。其团队研究方向为猪的遗传育种研究,综合利用多种组学技术解析猪重要经济性状形成分子机制和鉴定性状关键基因标记,利用生物信息、分子和细胞生物学等手段,在分子、细胞和个体水平,阐明关键基因和调控元件的功能和作用机理。通过基因编辑和体细胞克隆创制猪新种质,利用基因组选择等方法培育高效优质猪新品种和配套系。