谈谈细菌基因组测序之三次革命 | 专题
二十年前,当嗜血流感杆菌(Haemophilus influenzae )的全基因组序列被公布时,细菌组的科学家们为之一震,这是世界上第一个完成测序的细菌。时光更替,如今测序技术已经发生了翻天覆地的变化。近日,Nature Reviews Microbiology上发表了综述文章”Twenty years of bacterial genome sequencing”,让我们一起回顾总结这二十年来细菌基因组测序领域的发展历程和三次伟大的革命。
第一次革命
细菌基因组测序开始于上世纪90年代初,当时是为了测定一些模式物种(如大肠杆菌、枯草芽孢杆菌等)的基因组信息。而在1995年,Craig Venter和Hamilton Smith等人第一次使用鸟枪法测序技术却对一个非病源菌--嗜血流感杆菌完成了全基因组测序,这之后开启了微生物测序竞赛的序幕。之后的几年,病源菌、极端微生物、模式菌等相继测序完成,如结核分枝杆菌、鼠疫耶氏菌等。这个时期的基因组测序,基本上都是没有缺失碱基的全基因组测序。而后为了揭示不同的细菌拥有不同的基因组结构等信息,又催生出了比较基因组学。对于进化的研究,又发展出了核基因组(core genomes)(这些基因在所有的菌株中都出现),附属基因组(accessorygenomes)(这些基因只出现在某单一或者部分的菌株中)和泛基因组(pan-genomes)(包括了上述两种情况下的基因总和)等研究。并且开发出了一些非常优秀的生物信息分析软件,如:Phred,Phrap,Glimmer和Artemis等。
图2 细菌基因组测序的第一个二十年。改变细菌基因组测序面貌的三次测序技术革命:全基因组鸟枪法测序、第二代高通量测序、单分子长序列测序。
第二次革命
在二代测序的推广普及下,为细菌学的研究带来了新一轮的技术革命。二代测序的成本优势使得微生物组学在实验室及医院中得到广泛的应用,并且成功开展了诸如基于SNP的系统进化分析方法,基于小规模流行病的SNP分析方法等方法迅速地被应用到转化医学和药物开发等领域中去。当然,由于二代测序本身的技术特点,一些长的重复序列面临着无法被完全正确组装的问题,这也造成了和鸟枪法测序比起来,利用二代测序组装的细菌基因组很多情况下只能算草图。当然,这种情况将会在第三次技术革命中得到较好的解决。在这一段时期,涌现了一大堆生物信息组装软件,如Newbler,SOAPdenovo和Velvet等。
图3 左图为不同测序技术的细菌基因组组装效果对比,右图为大肠杆菌E.coli C227-11的基因组注释图
第三次革命
以单分子实时测序(SMRT)为代表的第三代测序,很好地解决了二代测序技术的读长短的问题,是对二代测序技术很好地一种补充,这些技术让细菌基因组完成图再次成为可能。目前国内很多细菌基因组测序完成图就是采用了二代测序和三代测序结合起来进行组装的。相信在不久的将来,当人类全基因组测序成本降到1000美元时,细菌基因组测序成本将降到1美元。到那个时候,相信有更多地“未知物种”将被发现,而对于微生物学家,临床或环境研究者而言,只需静静地等待这一天的到来。
参考文献
Twenty years of bacterial genome sequencing. (2015) Nature Reviews Microbiology 13, 787–794.
方超(生物信息部)丨文案
吴鹏丨编辑
看过了细菌基因组,再瞅瞅细菌基因组集合的故事——《宏基因组学那些事》。
回复“宏基因组”,马上观看。