查看原文
其他

【NTT2019 演讲视频】华大基因 杨林峰:基于纳米孔长读长技术的复杂基因组组装

中国市场部 OxfordNanopore 2019-12-11


杨林峰 华大基因


华大完成的基因组项目


华大基因目前已经完成了很多基因组项目,作为一家在动植物基因组测序和组装方面经验丰富的领先服务提供商,动植物基因组方面,华大基因与合作方共发表了165篇研究文章,24篇作为封面刊登,其中30篇文章发表在Nature/Science/Cell主刊。


植物基因组组装统计


据来自Nature Plants上的 文章《Chromosome-scale assemblies of plant genomes using nanopore long reads and optical maps》统计显示,基于传统短读长测序平台组装得到的数据,Contig N50基本都在100K左右,而长读长测序组装的Contig N50都在Mb级别。


纳米孔测序数据特性


我们对高深度的数据基于质量值分成数据集,发现纳米孔测序读长自身测序随机性和测序后的质量值分布都很好。对Transducer和Flip-flop HAC模式进行了基准测试,使用最新版本的Guppy可以减少4%的错误率,Flip-flop HAC可以进一步减少2%的错误率。我们建议使用Guppy和Flipflop HAC模式来获得更精确的纳米孔数据。


复杂基因组组装案例


纳米孔测序能够实现高度重复的动植物基因组的超长连续N50,对5种不同的植物和5种不同的动物复杂基因组进行组装,其中一个高度杂合子(1.4%)植物基因组的最终组装数据为:基因组大小633Mb,覆盖度120x,Contig N50为3.6Mb,Busco得分为92.4%。


纳米孔测序提高高度重复的植物基因组组装的案例:

  1. 植物基因组1

    K-mer预估基因组大小为1.15Gb,含有71%重复序列,比较两种不同的碱基识别方式:Transducer和Flip-flop HAC。使用CANU进行纠错和组装,在100X的测序深度下,使用Flip-flopHAC碱基识别进行组装的效果提升明显。


  2. 植物基因组2

    预估该基因组大小为2.5Gb,重复率74%,先进行预组装错误校正,然后使用NECAT为从头组装选择最长读长(>40kb)。最终组装Contig<1500个,基因组大小2.23Gb,N50为24.5Mb,Busco得分为96%。


纳米孔测序具有长读长、低偏倚和高一致性、足够的测序深度等优势,这些都是短读长测序无法比拟的,对于染色体和参考序列基因组水平的研究,可以借助Hi-C和Bionano进行研究。而对于未来需要去完善的难以组装的基因组,纳米孔测序则给我们提供了很好的平台。


纳米孔测序用于植物研究案例:

一图诠释纳米孔测序如何弥合植物基因组中的缺口

【用户讲座】越长越佳:多倍体植物案例

你问我答 | 杨俊副研究员聊多倍体植物纳米孔测序

【用户讲座】Oxford Nanopore测序技术贯通复杂玉米基因组

【用户讲座】如何在100天内测序分析100个番茄基因组

【植物基因组学】生菜基因组的测序与组装

【植物基因组学】了解你的洋葱

【植物基因组学】纳米孔长读长从头测序和组装植物基因组


想查看更多NTT 2019的精彩演讲,请持续关注我们微信公众号最近的推送。


我们的目标:

使任何人,在任何地点,

能对任何生物进行分析。


相关阅读

【NTT 2019演讲视频】日本东京大学Yutaka Suzuki教授:利用PromethION进行全基因组测序分析

【NTT 2019演讲视频】中山大学副研究员肖传乐:三代测序关键技术开发及应用

植物单cell N50 143kb!希望组Super Ultra Long硬核实力,您还等什么?

【NTT 2019 演讲视频】张士伟:Nanopore技术在植物基因组中的应用

【NTT 2019演讲视频】新加坡基因研究所Yue Wan:使用直接RNA测序进行RNA结构研究

【NTT 2019演讲视频】玛氏全球食品安全中心:评估纳米孔测序技术用于沙门氏菌血清型预测的可行性研究


网上订购:请点击“阅读原文”或者浏览:https://store.nanoporetech.com/cn


NanoporeEvent服务号用于会议、讲座、资料下载,OxfordNanopore订阅号发布最新技术 、 科研、 资讯等。


媒体查询:media@nanoporetech.com


如欲了解更多产品信息,请长按二维码关注我们

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存