三代全基因组测序成本降至1万元,有望成为打开基因测序基层市场的一把钥匙
希望组CEO汪德鹏第一次接触到三代测序技术,是在2009年。当时有传言说三代技术可以在15分钟内就完成一个全基因组测序,而且成本仅在大约1000美元左右,全世界都为之震惊。
但从实测的数据来看,无论是测序结果还是测序成本,三代测序平台都远远没有没有达到大家的预期,使得这项技术在全世界面前都面临非常大的争议。“单分子测序的错误率一直保持在15%左右,如果没有特殊的算法,数据是很难用的。”在那个时间点,整个行业对这项技术都持比较保守的态度。
时间继续向前推进到了2012年,在进行一次难度较高的植物基因组组装时,汪德鹏与团队用二代数据尝试了多次都没有办法解决问题。经过了大约3个月的文献调研,他发现通过三代测序和二代测序相结合将有可能解决一直以来困扰他们的问题。
心动不如行动,汪德鹏的团队马上开始进行测试,该试验以三代测序为主,并通过二代测序对结果进行矫正,最终使得基因组组装的完整性得到了大幅地提升。
正是这次成功的经历使得汪德鹏对于三代测序在基因组组装方面的前景信心满满,半年后,希望组开始布局三代测序技术,并成为国内首家提供三代测序应用领域服务的公司。
三代测序用于临床检测,
须有算法做支撑
彼时,Oxford Nanopore测序仪的错误率在30%左右,并且连工程样机都很难获得。与此同时,另一种三代测序平台进行一次人的10X覆盖深度的全基因组测序,其成本动辄便要超过10万人民币。
2013到2018这几年间,希望组主要利用三代测序平台做面向科研的技术服务。经过二代测序的矫正,三代测序现在已经可以满足各式的科研需求,但如果要在临床应用,这样的错误率和成本还是不能被接受的。在临床检测市场,到现在仍然是二代测序的天下。
汪德鹏认为,二代测序之所以能成为精准医学的主流技术,其主要原因是因为二代测序已经经历了较长的发展时间,有完整的数据库和算法做支撑,有大量的临床样本信息做考据。但不可否认的是,二代测序的检出率并不能完全满足临床需求,例如,对遗传病的检出率整体上还不超过50%。
“剩下的50%,我们希望通过三代测序来部分解决。”汪德鹏这样表示,“除了三代测序,现有的其他技术都很难做到。”人类基因组中包含了50%以上的重复序列,二代测序由于读长很短,没有办法精确地对这些重复序列进行判断。
同样是因为二代测序的短读长,大片段的结构变异、微卫星串联重复以及单体型信息,在过去都是临床检测上的难点甚至盲点,三代长读长测序技术的出现将完美填补之前临床检测上的这些空白。
PacBio和Oxford Nanopore的三代测序技术在读长和测序速度上都占据优势,尤其是Oxford纳米孔测序仪,其读长甚至可以超过1Mb(一百万碱基对),并且在测序的过程中还能同时检测DNA的甲基化修饰。汪德鹏判断,在不远的未来,三代测序将有望成为遗传病检测的主流技术。
孤独的公司
当理想走进现实时,会经历许多波折。希望组从2014年便开始尝试将三代测序应用到临床遗传病检测,但这个过程并非一帆风顺。
“我们从2014年就启动了相关研究,但直到近期才开始与少量医院展开合作。这些年,我们填了很多坑,包括算法、流程、数据库的构建等方方面面。”他这样表示。
这其中,最核心的原因是因为三代测序的算法不如二代测序成熟,很难下载到开源软件,一般的商业化公司往往对此望洋兴叹、知难而退。而希望组正是全球首家用三代测序进行遗传病检测的商业化公司。
汪德鹏调侃道,公司不仅在国内显得很孤独,在全球领域同样也是孤独的存在。“在国内找不到同伴,在美国的ACMG和ASHG这样的医学遗传学盛会上,我们也找不到同伴。最近两年,每次涉及到三代测序精准医疗技术服务的,就我们一家企业。”
没有任何经验可供参考,没有任何模式可以照搬,希望组只能靠自己一路摸索。而在这个过程中,他们面临的最大的困难就是团队的组建,无论是实验研发团队还是生信研发团队,都对每一个成员和个体提出了非常高的要求。因此,在团队成员的搭建过程中,希望组表现出对专业度和产业经验的极致追求。
CEO汪德鹏毕业于北京大学生命科学学院,随后进入华大基因,主持参与了一系列一代测序和二代测序相关的推广工作,紧跟测序行业时代脉络,把握住了几乎每一个关键性节点。
CTO吴昕师从我国著名生物信息学专家罗静初,曾任中通软联开源咨询公司副总裁、全球知名的跨国农业公司孟山都(Monsanto)中国应用架构师、孟山都生物科技有限公司生物信息科学家等职位;在生物信息学、基因组学R&D及IT咨询服务领域有近二十年的工作经历。
CSO刘山林毕业于哥本哈根大学,曾以主要负责人身份主持或参与国家高新技术研究发展计划(863计划)、“十二五”国家科技支撑计划及深圳市自由探索研究等一系列重大项目;作为核心科研人员在Science、NAR、PNAS、GigaScience、Current Biology等国际知名SCI杂志发表文章30余篇,被引数千次,其中通讯/第一作者10篇。
“很多公司都不愿意走这条路,但我们有非常棒的合伙人团队和投资人,他们都对团队很信任,也有耐心。”他补充道。在与汪德鹏的交流过程中,你会发现他是一个对自我极为挑剔的人。当预测到二代测序即将进入价格战和渠道为王的阶段时,便果断地从更为小众的三代测序技术切入,他认为这样的选择更具创新价值。
“但这就很考验投资人的眼光。”汪德鹏继续说道。在最初,他也担心自己坚持的方向没有投资人认可。但随着经纬中国、远毅资本等领先机构的加入,以及公司内部研发的快速推进,汪德鹏也对自己的想法越来越有底气,“大的方向很多公司去抢,但是做事情一定要提前布局。”
到现在,希望组已经在基于三代测序的遗传病诊断和辅助生殖领域取得了大幅的领先优势,即使有新的公司进入,也很难跟上希望组的脚步。
三代测序或许能打开更广阔的测序市场
2016年,Oxford Nanopore测序仪的错误率大约在30%,在经过了连续几次的升级和迭代后,目前人类基因组测序的错误率已经接近5%,“这对结构变异和甲基化检测没有太大影响,结构变异和甲基化检测不太在乎单碱基的准确度。”谈到这里,汪德鹏对业界普遍认为三代测序还只能应用在科研领域的认知有点懊恼,“其错误率已经得到了极大的改善,且成本还在持续下降。”
“任何技术都不是完美的,但是通过开发软件、算法,通过对数据的矫正,我们可以对缺陷进行弥补。”汪德鹏这样说道。
过去,二代测序的最大优势是成本低、通量高,而在读长和测序速度上,一直是三代测序更具优势,但是现在随着Oxford Nanopore推出PromethION48测序平台以后,三代测序的成本已经接近二代测序,通量也与二代测序最高通量持平,大约3天便可以产出5-8Tb的数据。
他认为,在三代测序一路狂奔的升级迭代下,二代测序的优势将逐步弱化,一旦三代测序解决单碱基准确度的问题,可以直接进行SNP的识别,三代测序便会成为大部分应用场景的主导技术。
不仅如此,三代测序或许还能成为测序技术打开基层医疗市场的一把钥匙。三代测序仪对测序场景不挑剔,NASA甚至还用Oxford Nanopore的测序仪在太空完成了测序。这些更为灵巧的仪器不需要给它们配备专门的实验室,价格也不像二代测序仪一样动辄上百万。即便是社区医院,都有可能具备三代测序平台的建设能力。此外,由于流程更简便,三代测序的测序速度也更快。
汪德鹏告诉动脉网,他们通过三代测序进行一次遗传病检测的周期大约为1周,这其中还包含了人工注释的时间,而二代测序的周期则接近一个月。随着流程的优化,他们甚至希望能在2年之内实现当天出报告的愿景。
成本和可靠性是衡量技术是否适合在临床使用的重要指标,汪德鹏认为,1万元一次的全基因组测序价格,可能是三代测序技术发展的一个分水岭,或许可以推动该技术在临床应用上的快速爆发。
成本下降带来的价值体现
在将三代测序的应用到临床的早期,由于成本和准确度的原因,希望组走了不少弯路。但随着三代测序成本的下降,此前的投入和布局价值得到了体现。
他们在一个项目中接触到了一位来自云南的患者,其家族5-6代人都患有同一种遗传病。患者在进行一代测序、二代测序后都没有得到明确的致病原因,希望组在对其家族进行三代测序的遗传检测后,发现这是一种由600万个碱基对的倒位突变导致的疾病。
“患者跟我们说这解决了他们家族的‘魔咒’,我们也很兴奋。”汪德鹏表示,“我们可以解决一代测序和二代技术都没有办法解决的问题,并且通过遗传分析,这些数据可以给医生提供临床干预和指导的有效信息。”从成本上,汪德鹏透露目前三代测序15X全基因组检测的成本已经可以控制在1万元以内。
“这项技术一定很快就能成为遗传病检测的重要手段。”他如是说道,可以预见,作为全球第一家用三代测序做遗传病检测的公司,希望组将具有显著的先发领先优势。
未来:看好辅助生殖应用和肿瘤、微生物检测
汪德鹏透露,公司已经在辅助生殖领域的难题平衡易位诊断上取得良好的结果。即使是临床级别的全基因组测序,他们也能做到仅仅倚赖15X测序深度的三代数据便可以得到明确的断点位置,这对想要解决问题的患者来说相当具有吸引力。目前希望组已经进行了相当数量的样本测试,且有两篇文章已经发表在国际权威杂志上,一篇正在投稿中。
汪德鹏告诉动脉网,他的愿望就是能通过希望组,把三代测序变成全世界遗传病检测的主流方法之一,“这个技术不成熟,但是我们把它变成熟了。”他计划在2-3年内可以实现全部突变类型的遗传病均可快速诊断的宏伟目标。
在三代测序临床检测应用沉淀数年后,汪德鹏还希望公司在遗传病检测以外的领域取得突破,他非常看好三代测序辅助生殖、肿瘤检测、微生物检测上的应用,也看好大数据的未来价值。“三代测序应用场景非常广,我们一定会做更多的布局。”汪德鹏表示。
*封面图片来源:https://pixabay.com
文 | 周梦亚
微信 | rencontre_my
添加时请注明:姓名-公司-职位
网站、公众号等转载请联系授权
近期推荐
点击“阅读原文”,每天都有新发现