向完美基因组进军 | ONT超长测序实现T2T!
高质量基因组的获取是研究物种生物学功能、疾病以及生物多样性的基础[1]。随着长读长测序技术以及算法的不断优化升级,基因组中着丝粒、端粒等高重复区域的序列不再是基因组“黑洞”,基因组研究迈入了新的时代。
2022年3月31日,一个由近100名研究人员组成的国际性的科学组织——端粒到端粒(Telomere to Telomere,T2T)联盟,在《科学》杂志上发表了6篇论文,表示迄今为止最完整的人类基因组图谱已被破译[2]。这一里程碑式的事件,将T2T基因组研究提升到历史高度。
截止2022年5月26日,在Google Scholar以及NCBI上以关键字“genome, gapless, telomere to telomere”检索文章,去除真菌基因组以及综述等,结果列表整理如下:
表1 T2T基因组发文汇总
以上12篇文章中,9篇运用了ONT Ultra-long测序,其中具有代表性ONT超长测序深度以及N50长度等信息如下:
表2 各文章ONT Ultra-long信息
往往前沿科学技术以及重大研究结果在学术界如一面大旗,指引学术的研究方向,人类T2T基因组的破译无疑是这样的一个重大事件。针对T2T基因组,华大推出PacBio HiFi+Nanopore Ultra-long Reads+HiC的研究策略(表3)。
表3 T2T组装策略
华大科技实验团队通过不断测试,改进提取方法,目前已完成多种动植物超长片段DNA提取建库及测序,积累了大量经验。超长DNA片段提取+建库测序项目实例如下:
某哺乳动物Ultra-long DNA提取:
Qubit检测浓度:232ng/μl
OD260/280:1.93;OD260/230:1.83
DNA总量:38μg
长度分布:主带位于250Kb
脉冲电泳图如下:
实测项目单张芯片测序数据表现:
从数据来看,华大Ultra-long测序单张芯片产出稳定,平均在100G以上;超过100Kb的数据占比约为1/4,总体产量比较稳定。
此外,近期华大科技利用HiFi、ONT Ultra-long、Hi-C等多个测序平台数据进行联合组装,使gap-free基因组组装成为可能:某物种的23条染色体,除了第6条和第17条有一个gap外,其余染色体均达到gap-free的水平,结果如下图:
华大已经发表了包括罗式长颈鹿(Contig N50: 35.9 Mb)[14]、喜马拉雅红豆杉(Contig N50: 8.6 Mb)[15]、麂鹿(Contig N50: 24.47 Mb -37.86 Mb)[16]等300+篇基因组文章,项目经验非常丰富。如有T2T需求,请联系当地销售。
参考文献:
[1] Rhie, Arang, et al. "Towards complete and error-free genome assemblies of all vertebrate species." Nature 592.7856 (2021): 737-746.
[2] Nurk, Sergey, et al. "The complete sequence of a human genome." Science 376.6588 (2022): 44-53.
[3] Navrátilová, Pavla, et al. "Prospects of telomere-to-telomere assembly in barley: analysis of sequence gaps in the MorexV3 reference genome." bioRxiv (2021).
[4] Naish, Matthew, et al. "The genetic and epigenetic landscape of the Arabidopsis centromeres." Science 374.6569 (2021): eabi7489.
[5] Belser, Caroline, et al. "Telomere-to-telomere gapless chromosomes of banana using nanopore sequencing." Communications biology 4.1 (2021): 1-12.
[6] Wang, Bo, et al. "High-quality Arabidopsis thaliana genome assembly with Nanopore and HiFi long reads." Genomics, proteomics & bioinformatics (2021).
[7] van Rengs, Willem MJ, et al. "A gap-free tomato genome built from complementary PacBio and Nanopore long DNA sequences reveals extensive linkage drag during breeding." bioRxiv (2021).
[8] Miga, Karen H., et al. "Telomere-to-telomere assembly of a complete human X chromosome." Nature 585.7823 (2020): 79-84.
[9] Xue, Lingzhan, et al. "Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair." Genome biology 22.1 (2021): 1-20.
[10] Song, Jia-Ming, et al. "Two gap-free reference genomes and a global view of the centromere architecture in rice." Molecular plant 14.10 (2021): 1757-1767.
[11] Li, Kui, et al. "Gapless indica rice genome reveals synergistic contributions of active transposable elements and segmental duplications to rice genome evolution." Molecular Plant 14.10 (2021): 1745-1756.
[12] Liu, Jianing, et al. "Gapless assembly of maize chromosomes using long-read technologies." Genome biology 21.1 (2020): 1-17.
[13] Logsdon, Glennis A., et al. "The structure, function and evolution of a complete human chromosome 8." Nature 593.7857 (2021): 101-107.
[14] Liu, Chang, et al. "A towering genome: experimentally validated adaptations to high blood pressure and extreme stature in the giraffe." Science Advances 7.12 (2021): eabe9459.
[15] Cheng, Jian, et al. "Chromosome-level genome of Himalayan yew provides insights into the origin and evolution of the paclitaxel biosynthetic pathway." Molecular Plant 14.7 (2021): 1199-1209.
[16] Yin, Yuan, et al. "Molecular mechanisms and topological consequences of drastic chromosomal rearrangements of muntjac deer." Nature communications 12.1 (2021): 1-15.
往期推荐
了解更多产品服务及资讯,关注我们!