其他
案例分析 | Hi-C 辅助组装未来可期
图2 Hi-C 热图分辨率对染色体结构的关系[2]
Hi-C技术通过捕获染色体DNA的交互关系,根据染色体内部互作频率显著高于染色体间互作频率,以及在同一条染色体上互作频率随着互作距离的增加而减少的原理,将Contig/Scaffold聚类到组群,并进一步对组群内的Contig/Scaffold进行排序及定向,完成基因组挂载,得到趋近于染色体水平的组装结果。目前常见的软件:LACHESIS, 3D-DNA, SALSA2, ALLHiC等。
ALLHiC基本原理:包含修剪、分区、补救、优化和构建。首先会将存储三代数据的bam文件和等位基因的Contigs列表文件输入,通过prune修剪掉核酸片段间的一些平行信号和弱信号,随后采用层级聚类算法,将Contigs划分到不同的染色体群组中,并对每个组中的Contigs进行排序和定向,其中ALLHiC会根据提供的Allele.ctg.table过滤BAM文件中等位基因间的HiC信号,同时筛选出坍缩区域和未坍缩区域的HiC信号。这些信号会用于Rescue步骤,将未锚定contig分配到已分组的contigs群,最终构建获得染色体水平的基因组。
介绍了HiC的辅助组装原理,还是要看实战,诺禾最近也是利用HiC技术完成上百的项目交付,这里挑一些案例展示一下我们的实力。哺乳动物-猪-挂载率 97.49%Development and Genome Sequencing of a Laboratory-Inbred Miniature Pig Facilitates Study of Human Diabetic Disease
图6 基因组组装流程及染色体情况
中药-山苍子-挂载率 94.56%
The Litsea genome and the evolution of the laurel family超大基因组-大蒜-挂载率 87.5%A chromosome-level genome assembly of garlic (Allium sativum L.) provides insights into genome evolution and allicin biosynthesis
表1 诺禾已发表文章中的Hi-C辅助组装(部分)
Hi-C 辅助组装几乎成为了高质量基因组组装的标配,超大基因组以及多倍体组装中都有重要的技术补充,同时 Hi-C 技术不断升级,例如2018年名为 DLO Hi-C[6](digestion-ligation-only Hi-C)的全基因组染色体构象捕获技术发表在NatureGenetics 上,该技术相对于传统的全基因组染色体构象捕获技术 HiC 而言更加高效简单,仅需要两轮的消化连结过程(即 digestion-ligation),无需生物素(biotin)标记,未连结的 DNA 也可以被有效地去除,极大提高染色体构想捕获效率。再例如:Nanopore 公司在2019年推出的 Pore-C[7] 技术,结合纳米孔长读长和染色质构象捕获,意味着单个纳米孔长读长可以跨越多个接触点,从而获取更高阶的多重信息。
参考文献[1]Lieberman-Aiden E, Van Berkum N L, Williams L, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome[J]. science, 2009, 326(5950): 289-293.[2]Liu N, Low W Y, Alinejad-Rokny H, et al. Seeing the forest through the trees: Identifying functional interactions from Hi-C[J]. bioRxiv, 2020.[3]Burton J N, Adey A, Patwardhan R P, et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions[J]. Nature biotechnology, 2013, 31(12): 1119-1125.[4]Dudchenko O, Batra S S, Omer A D, et al. De novo assembly of the Aedes aegypti genome using Hi-C yields chromosome-length scaffolds[J]. Science, 2017, 356(6333): 92-95.[5]Zhang X, Zhang S, Zhao Q, et al. Assembly of allele-aware, chromosomal-scale autopolyploid genomes based on Hi-C data[J]. Nature plants, 2019, 5(8): 833-845.[6]Lin D, Hong P, Zhang S, et al. Digestion-ligation-only Hi-C is an efficient and cost-effective method for chromosome conformation capture[J]. Nature Genetics, 2018, 50(5): 754-763.[7]Ulahannan N, Pendleton M, Deshpande A, et al. Nanopore sequencing of DNA concatemers reveals higher-order features of chromatin structure[J]. bioRxiv, 2019: 833590.
denovo 研究部 苏亚南 | 文案图片来源于网络,侵删
往期精彩推荐