查看原文
其他

Pore-C:使用纳米孔长读长描述人类基因组中基因座长程相互作用

中国市场部 OxfordNanopore 2019-12-11


与Imielinski实验室(纽约基因组研究中心)合作:结合长读长测序和染色质构象捕获(3C法)探索人类细胞中染色质三维空间组织。


使用Pore-C对相互作用基因座的多个连锁片段进行测序


染色质构象捕获是用于研究在原始序列中不相邻基因座基因组之间的相互作用的方法。首先,通过甲醛将基因组DNA交联至组蛋白,甲醛可以保护相互作用基因组的空间邻近性。邻位连接后进行限制性酶切,将交联、相互作用的片段连在一起。这些片段在测序前经过大小选择和PCR扩增(图1)。长读长纳米孔序列可以跨越整个扩增子,其中包括来自多个相互作用基因座的片段。这可以揭示例如启动子-增强子相互作用等生物功能。


图1. Pore-C实验室工作流程


通过Pore-C序列获得全基因组染色体接触图谱


首先使用BWA-SW将连锁Pore-C序列比对至参考序列以识别分离比对序列。筛选每个比对序列,只保留横跨大部分序列的最小片段集合。在优化比对通道后,将每个序列部分指定到一个限制性片段,这将由模拟酶切参考序列来决定。参考基因组随即被分成同等大小的类别且限制性片段被指定到相应的类别。最后,计算所有序列分箱-分箱间接触总数并通过接触图谱进行可视化呈现(图2)。


图2. Pore-C生物信息学工作流程概览


乳腺癌和类淋巴母细胞细胞系全基因相互作用图谱


使用如图2所示的生物信息流程,我们以1Mb分辨率,通过定位到人类参考序列hg37,构建了接触图谱,基质中的每个细胞系都代表着比对到基因组两部分的Pore-C序列数。两个细胞系都有清晰可见的染色体边缘,这意味着大部分相互作用都发生在染色体内部(图3a)。就癌症细胞系而言(HCC1954,对角线下),可见基础基因组扩增,表现为更高密度的水平和竖直带,而对角线外更高密度的区域表明有基因组重排或与癌症相关的染色质空间组成发生了变化(图3b)。


图3a-b. 乳腺癌细胞系HCC1954和NA12878标准细胞系接触图


使用全基因组相互作用图改善组装连续性


NA12878的Pore-C序列被定位至同一样本全基因组从头组装产生的contig上。Salsa2工具使用生成的接触密度图分割、重定向并连接contig,形成与接触数据一致的scaffold。图4a显示了8号染色体contig(左)和scaffold(右)的接触密度。Salsa2认为该染色体上最大的两个contig是相邻的并且是反向的,事实上,二者可以相连,构成的scaffold可以跨越整个染色体约90%。组装后的contig和生成的scaffold可见于使用mumme绘制的点图(图4b)。


图4. 通过Pore-C改善组装 a) 8号染色体接触图 b) 点图


我们的目标:

使任何人,在任何地点,

能对任何生物进行分析。


相关阅读

【11月21日-23日】纳米孔专家与您相约#2展位 第五届国际农业基因组学大会

如何利用高通量PromethION平台在100天测序100个植物全基因组

【微生物病原菌检测专题一:5分钟NTT 2019闪电演讲】:伤寒副伤寒病原菌/人乳头瘤病毒和微生物群分析

【NTT2019 演讲视频】华大基因 杨林峰:基于纳米孔长读长技术的复杂基因组组装

中国科学院武汉病毒研究所刘翟课题组利用纳米孔测序技术成功解析一例非洲猪瘟病毒基因组


网上订购:请点击“阅读原文”或者浏览:https://store.nanoporetech.com/cn


NanoporeEvent服务号用于会议、讲座、资料下载,OxfordNanopore订阅号发布最新技术 、 科研、 资讯等。


媒体查询:media@nanoporetech.com


如欲了解更多产品信息,请长按二维码关注我们


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存