19周年献礼 | 华大智造测序仪建库技术全解析
全文约2600字,推荐阅读时长5分钟
文末有惊喜,千万不要错过!
1999年9月9日为了参与人类基因组计划华大基因正式在北京顺义成立,开始了基因科技造福人类的历程。人类基因组计划、水稻基因组计划、炎黄基因组计划、千人基因组计划到百万人基因组计划,19年以来我们从基因开始探索生命奥秘。不仅如此,我们已经开始将基因科技应用于疾病防控和健康管理中,在生、死、染三大疾病防控中初显身手,但是要实现人人普惠,真正做到造福民生,还需要掌握先进工具。长久以来,我国基因检测上游一直被欧美测序设备供应商垄断,为了打破技术制约,华大集团于2016年正式成立华大智造,致力于研发和生产中国制造的基因测序设备。经过不断的努力与发展,华大智造已成为国内唯一世界唯三, 能够量产临床级别测序仪的企业。目前,华大智造已有四款高通量测序仪BGISEQ-500、BGISEQ-50、MGISEQ-2000和MGISEQ-200获得国家食品药品监督管理总局医疗器械认证,成为中国生命科学产业发展中智能制造的代表。
华大智造现有的BGISEQ/MGISEQ系列测序仪都采用了微阵列DNA纳米球测序技术(DNBseq技术),通过超高密度微阵列芯片和PCR-free DNA纳米球技术(DNB, DNA Nanoballs)的整合可以实现高精准基因测序。BGISEQ/MGISEQ测序仪上的测序流程和其他测序平台一样,也可以将数据产出分成三个环节——样本制备、样本加载和测序分析。样本制备主要是为了DNA或RNA加上BGISEQ/MGISEQ测序仪所需特殊接头形成可测序文库(请注意文末有惊喜);样本加载主要是将可测序文库转换成为DNA纳米球并加载至微阵列芯片上,在BGISEQ-50和MGISEQ-200测序仪上这一过程已经自动化整合在测序分析流程中;测序分析就是将DNA纳米球上序列信息逐一采集形成基因测序数据。
图1 华大智造测序平台全流程
下面针对样本制备、样本加载及测序分析各个环节还有详细解析。
文库制备主要分为五个环节: 片段化-末端修复及添加A尾-接头连接-PCR扩增-单链成环(图2) 。
针对DNA样本,首先可以通过超声仪器或打断酶对DNA进行片段化,根据文库大小可以选择不同片段化条件获得预期长度的小片段DNA。打断后的片段DNA两端会有缺口,需要对DNA缺口进行修复并同时完成5’端磷酸化和3’端添加A尾。连接上带BGISEQ/MGISEQ测序仪特有接头后,进行PCR扩增得到DNA文库。以上步骤是常规建库中常规步骤, 在BGISEQ/MGISEQ测序仪,为了获得DNA纳米球,还需要将DNA文库中的双链产物进行单链变性、环化、消化得到可用于制备DNA纳米球的单链环状DNA,即单链环化步骤。
2 华大智造测序平台WGS建库流程
针对血浆游离DNA样本,由于提取获得核酸已经是片段化DNA,因此不需要进行片段化,整体建库时间不到3.5小时。针对RNA样本,需要去除rRNA或进行mRNA富集,并进行反转录形成DNA文库。除了以上常规样本之外,miRNA、甲基化和单细胞测序等都已开发了对应样本制备处理方法。
由于DNA纳米球的制备是在液体系统中进行,因此华大智造测序仪样本制备全流程可以在自动化工作站完成,目前华大智造自主开发的自动化建库平台上已经实现十余种的建库流程。
样本加载样本加载主要可以分为两个环节: DNB制备和DNB加载(图3)。
单链环状DNA文库通过滚环扩增技术(RCA, Rolling Circle Amplification),得到的扩增产物即DNA纳米球。采用这种线性滚环等温扩增技术,每个扩增循环都以原始的单链环状DNA为模板,能保持每次模板扩增的独立性。因此,即使扩增过程中出现碱基错配,也不会被累积,保证最高的扩增保真度。
将制备好的DNB加载到微阵列芯片(Patterned Array)上,这一过程称为DNB加载。Patterned Array技术是通过先进的半导体精密加工工艺,在硅片表面形成阵列和对准标记,保证芯片表面的活化位点精准排布,每个活化位点结合一个DNB,实现了DNB的规则排列吸附,提高了测序芯片的利用效率。
图3 DNB制备和加载
测序分析DNB加载后芯片可装载到测序仪上进行测序,华大智造测序平台使用优化的联合探针锚定聚合技术(cPAS, Combinatorial Probe-Anchor Synthesis),将测序引物锚定分子和荧光探针在DNA纳米球上进行聚合反应之后,利用高分辨成像系统对光信号进行采集、读取和识别获得单个碱基序列信息,然后进行下一个循环获得下一个碱基序列信息。如此经过单端或双端50-150次循环后,最后经算法将碱基序列信息组合成为完整DNA序列。
视频1 华大智造测序平台cPAS技术原理
基于上面文库构建和数据产出流程, 到目前为止在BGISEQ/MGISEQ测序仪上产出数据达到10Pb以上,发表文章超过100篇, 在这里也简单总结BGISEQ/MGISEQ系列测序仪上产出数据特点:
高准确性: PCR-free DNB使用的滚环扩增技术,使得扩增模板始终不变,扩增错误不会累积,与PCR指数扩增相比有保真优势,在进行Indel检测上具有显著性优势。 (更多数据揭秘需要持续关注)
低Adapter Rate: BGISEQ/MGISEQ测序仪采用单链环化DNA文库,其制备过程中残留的接头由于没有环化而被消化掉,使得华大智造测序平台有着超低的adapter rate,一般情况下低于0.5%。
低Duplicate Rate: 基于纳米球测序技术的BGISEQ/MGISEQ系列芯片上的活化位点与DNB纳米球的大小一致,使芯片位点只能结合一个DNB纳米球。因此,BGISEQ/MGISEQ测序仪产出duplicate rate只在3%以下。(点击了解更多信息)
“0” Index Hopping: 华大智造测序平台独特的文库构建技术和单链环状文库滚环扩增技术使得index hopping发生概率远低于其他测序平台,仅采用单barcode就可将index hopping发生概率控制在0.0001%~0.0004%。(点击了解更多信息)
看到这里,是不是想把自己的新想法、新技术和新产品在BGISEQ/MGISEQ测序仪上测试呢? 为了让大家可以实践自己的想法,我们也正式开放BGISEQ/MGISEQ系列测序仪上的核心序列信息,欢迎各位同行下载交流。
点击“阅读原文”或扫描二维码,下载华大智造测序仪文库构建核心序列
往期精彩内容推荐
MGISEQ-2000重磅推出PE150测序试剂 | 只等你来