查看原文
其他

Nanopore测序升级及经典组装案例分析

金 戈 诺禾致源科服 2023-02-16

Nanopore测序技术是是基于电信号对碱基进行识别的的测序平台,该原理不同于Illumina和PacBio平台(基于荧光信号识别碱基)。因此Nanopore优点是测序时间短,通量大,读长更长。特别是推出了ONT Ultra-long模式,其读长更是有了一个质的飞跃,可以大量获得读长>100K的数据。因为其测序原理是对电信号进行判断,基于深度学习的进步可以对reads的准确度进行不断地提升。目前ONT公司对软件及硬件同时进行了升级,软件上升级了Basecalling算法,在超高精度碱基识别的模式下,原始序列的准确度已经能够达到98.3%;在硬件上支持GPU计算,使Basecalling的时间大大缩短,同时对于可支持GPU的组装、纠错软件也是大大缩短了其分析时间,直接解决了组装周期较长的通病。在测序手段已经如此优秀的Nanopore,在组装方面也是不遑多让的,接下来就由小编带领大家看下近期发表的Nanopore经典文章。


文献一


Giant lungfish genome elucidates the conquest of land by vertebrates[1]



 
发表期刊:Nature
发表时间:2021.01
测序数据:
澳大利亚肺鱼(Neoceratodus forsteri)的基因组大小在已知物种中排名前列,关于肺鱼基因组大小的研究也是研究者关注的热点。本次研究者使用Ultra-long Nanopore测序技术及Hi-C染色体构象捕获技术,得到了肺鱼的高质量染色体基因组,基因组大小为36.53Gb,contig N50为1.8Mb,BUSCO(基因集)完整性90.9%,并挂载出17条大染色体臂,及10条微小染色体。通过基因组序列信息分析发现肺鱼基因组是超大的基因间区域和众多高重复含量(约90%)的内含子造成的。针对肺鱼、腔棘鱼和四足动物之间的一直存在争议的系统发育问题,通过系统发育分析,得到了解决。同时肺鱼的呼吸、嗅觉、陆地运动等进化方面的研究也加深了对脊椎动物进化过程的理解。

图 1 基于697个直系同源物种的贝叶斯系统发育树


文献二


Large-scale sequencing of flatfish genomes provides insights into the polyphyletic origin of their specialized body plan[2]





发表期刊:Nature Genetics
发表时间:2021.04
测序数据:
该研究解析了10个比目鱼及其近源物种的基因组,对其中的Psettodes erumei (大口鳒,基因组大小467Mb,contig N50 2.5Mb,BUSCO完整性98.1%)、Toxotes chatareus (七星射水鱼,基因组大小620Mb,contig N50 8.4Mb,BUSCO完整性93.6%)和Polydactylus sextarius(六丝马鮁鱼,基因组大小565Mb,contig N50 18.4Mb,BUSCO完整性98.4%)三个在系统发育中存在争议的物种使用了Nanopore测序技术进行了基因组组装,对其他Trinectes maculatus(三鳍鳎)、Chascanopsetta lugubris(黑大口鲆)等七个物种使用了Illumina测序技术并进行了基因组组装,该研究解决了鲽形目鱼类起源上存在的长期争议,对解析鲽形目鱼类的各种重要性状的分子机制具有重要意义,也为人类肌肉萎缩和颅面畸形等疾病的致病机理提供了参考。

图2 十个比目鱼基因组组装和基因注释


文献三


Reference genome assemblies reveal the origin and evolution of allohexaploid oat[3]




发表期刊:Research square
发表时间:2021.06
测序数据:
该研究对六倍体栽培裸燕麦(Avena sativa)进行了全基因组测序组装,选用了Ultra-long Nanopore测序技术并辅助Hi-C染色体构象捕获技术,超长读长能保证序列完整跨过燕麦高达87%的重复序列区域,取得了基因组大小10.76Gb,contig N50 93Mb,BUSCO完整性97.75%的高质量基因组。同时还组装了燕麦二倍体(基因组大小3.74Gb,contig N50 7.3Mb,BUSCO完整性97.53%)和四倍体(基因组大小7.52Gb,contig N50 7.8Mb,BUSCO完整性98.11%)的祖先种,理清了栽培燕麦的亲缘关系和网状进化模式,解决了争议已久的燕麦进化中的多倍体起源问题,同时也为多倍体作物类的育种研究奠定了基础。
图3 六倍体、四倍体、二倍体燕麦circos图
 

文献四


Chromosome-scale assembly and analysis of biomass crop Miscanthus lutarioriparius genome[4]



   


发表期刊:Nature communications
发表时间:2021.04
测序数据:
南荻(Miscanthus lutarioriparius)是我国特有的芒属物种,该物种具有较高的生物产量及较强的抗逆性,具有较大的生物能源生产潜力,是一种很有前途的第二代能源作物。该研究通过结合 Nanopore测序技术及Hi-C染色体构象捕获技术得到了南荻的染色体水平参考基因组,基因组大小2.25Gb,contig N50 1.71Mb,BUSCO完整性97.40%,其中94.3%的序列挂载至了染色体水平。通过与其他禾本科植物的比较基因组学研究,证实了南荻基因组内近期的WGD(whole Genome Dupilcation,全基因组复制),同时通过对基因组着丝粒区微卫星重复序列的分析,证实了南荻的异源四倍体起源,并进一步将19条染色体分配到了两个亚基因组。该研究有助于解析南荻的独特性状的基因组基础及辅助分子育种发展的进程。

图4 南荻基因组组装






以上的几篇文章只是Nanopore的一部分代表文献,不难看出在动植物的组装中,Nanopore技术不仅可以解决超大基因组的组装难题,而且还能够解决泛基因组、多倍体基因组等对组装有特殊要求的组装问题,三代测序技术Nanopore也在各方面证实了其测序技术更加趋于成熟,诺禾致源动植物板块拥有着成熟的Nanopore测序及组装经验,这里小编也对组装策略进行了汇总(下表),我们将秉承精益求精的态度,为您提供更加专业及更加优质的服务。

参考文献

[1] Meyer, A., Schloissnig, S., Franchini, P. et al. Giant lungfish genome elucidates the conquest of land by vertebrates. Nature 590, 284–289 (2021).

[2] Lü, Z., Gong, L., Ren, Y. et al. Large-scale sequencing of flatfish genomes provides insights into the polyphyletic origin of their specialized body plan. Nat Genet 53, 742–751 (2021).

[3] Miao, J., Feng, Q., Li, Y. et al. Chromosome-scale assembly and analysis of biomass crop Miscanthus lutarioriparius genome. Nat Commun 12, 2458 (2021).

[4] Yuanying Peng, Honghai Yan, Laichun Guo et al. Reference genome assemblies reveal the origin and evolution of allohexaploid oat, 29 June 2021, PREPRINT (Version 1) available at Research Square





往期精彩推荐



DENOVO研究部   金 戈 | 文案




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存