查看原文
其他

“基因2.0时代”的核心技术:基因合成(下)

联川生物 2022-05-21

The following article is from 基因慧 Author 李璐璐


百家谈
生命健康的先锋声音



关键词/基因合成  


高通量基因测序等技术“读”DNA,基于遗传信息正快速用于医疗健康等,此为当下“基因1.0时代”;而正在酝酿的“基因2.0时代”,通过基因合成 “写”DNA,能够深度理解和设计生物系统,重构育种和能源等领域。预见未来,本文从技术角度一览基因合成原理和流程(下篇)。

                                                                                          本文转自基因慧


划重点

1. 主要技术平台:物理掩膜法原位合成仪器、光敏保护基团介导的光控原位合成仪器、基于电化学介导酸脱保护合成方法的半导体原位合成仪器、喷墨式打印DNA原位合成仪器、基于硅片的喷墨式合成仪器及原位拼接技术。 

2.主要技术挑战:产量过低、合成长度受限、合成准确性局限、成本仍需优化。

3.提高合成保真性的对策:需改进芯片设计以及合成工艺,并引入额外的错误纠正措施,来降低合成错误率。


图片来自网络


DNA测序和人工合成技术共同推进了合成生物学的快速发展。随着技术发展,测序成本被急剧压缩,基因合成和寡核苷酸合成的成本有一定降低,但并没呈现显著态势,仍有优化空间,这也是规模化量产的核心因素。


如何解决这个问题,我们先来认识DNA合成成本及技术平台。


基因合成的成本一般与寡核苷酸的合成成本直接相关。十多年来,寡核苷酸的合成成本没有明显下降。通常根据合成规模、寡核苷酸的长度和供应商的不同,每个碱基的合成成本不同。传统的供应商进行基因合成的成本约为每碱基0.10到0.30美元(1kb基因的成本为100-300美元)(Hughes, R.A. and A.D. Ellington 2019)。


基因合成的主要成本来自寡核苷酸合成的试剂消耗,此外,DNA合成还是一个劳动密集型的过程。因此,减少合成试剂消耗,提高通量,提高基因装配过程的自动化和准确性,才能显著降低基因合成的综合成本。基于微阵列的寡核苷酸合成技术,以及对应的下游DNA片段组装技术的发展,正是显著降低基因合成成本的希望所在。


 一   寡核苷酸微阵列合成


1) 主要技术平台



图1:寡核苷酸固相合成方法。A.柱式合成;B.微阵列合成。(来源:Cold Spring Harb Perspect Biol)



微阵列寡核苷酸合成技术,也被称为芯片合成技术 (图1B) ,最初用于诊断,现在已经成为一种极有希望低成本替代柱式寡核苷酸合成的方法。Affymetrix公司是这一领域的早期先驱之一,开发了物理掩膜法原位合成仪器(Fodor et al. 1991;Pease et al. 1994) ,采用光活化化学技术,利用标准掩膜光刻技术在芯片表面选择性地脱保护特殊的光不稳定性核苷亚磷酰胺单体,从而控制不同区域的寡核苷酸合成。



图2:主要微阵列合成技术平台。(来源:作者)



Roche Nimblegen公司和LC Sciences公司(联川生物国际研发中心)简化了光介导的合成过程,将光控方法从物理掩膜升级到数字化控制方法,开发了光敏保护基团介导的光控原位合成仪器(Singh-Gasson et al. 1999;Gao et al. 2001)。


CustomArray公司开发了基于电化学介导酸脱保护合成方法的半导体原位合成仪器(Egeland, R.D. et al. 2002; Ghindilis, A.L., et al.2007),可使用标准的亚磷酰胺单体和相关试剂进行DNA合成,避免了昂贵的物理掩膜或光学仪器。Agilent公研发的喷墨式打印DNA原位合成仪器则采用非接触式工业喷墨印刷工艺,四种碱基单体作为“墨水”逐个喷点在芯片上,实现原位打印寡核苷酸引物,该公司能够合成长度超过200个核苷酸的长链引物(Recht, M.I., et al.1996;Hughes, T.R., et al.2001)。Twist公司开发了基于硅片的喷墨式合成仪器及原位拼接技术(专利US9981239B2, US9677067B2)。


2) 主要技术优势及缺陷


基于芯片的寡核苷酸微阵列合成技术提供了传统柱式合成所不可能实现的多通道合成模式。由于每张芯片可能有上万的合成密度,一些合成仪甚至能够同时合成多张芯片,微阵列的合成能力远远超过了最大的柱式合成仪器。但是因为芯片合成的寡核苷酸组分过于复杂,无法单独分离,如果这些寡核苷酸用于DNA合成,会存在组装背景过于复杂的挑战。


微阵列合成平台可以显著提高寡核苷酸的合成通量,合成所需消耗的试剂量显著减少,从而大大降低了成本。根据平台、寡核苷酸长度和合成规模的不同,基于微阵列平台合成的寡核苷酸成本从0.00001到0.0001美元不等。与柱式合成寡核苷酸每个碱基0.05-0.10美元的成本相比,芯片合成寡核苷酸在基因合成应用中的优势十分明显。


【对于基因合成应用场景,不利之处】


1.单条寡核苷酸的产量过低,通常比柱式合成低2-4个数量级。

2.合成长度受限、产物过于复杂,干扰后续的DNA组装过程。

3.合成准确性受限,引入更多合成错误,提高验证和错误矫正成本。



 二   基于微阵列寡核苷酸的基因合成策略


1) 主要挑战及对应解决方案


目前基因组层面的人工合成基本是始于柱式合成的寡核苷酸,或者商业合成的经过克隆验证的1-2 kbDNA模块,无法成熟运用成本更低、通量更高的微阵列合成寡核苷酸,原因在于微阵列进行DNA的从头合成拼接仍存在一系列待解决的问题。


【待解决的问题】


1.合成长度短。

2.错误率高。

3.单种序列合成产量低。

4.寡核苷酸库成分复杂,不利于拼接。


但是这些问题不是不可逾越的(图3)比如,Church研究组等采用寡核苷酸亚库扩增的策略,并引入酶法纠正系统,解决了错误率、产量和成分复杂的难点(Kosuri, Eroshenko et al. 2010);高晓连研究组和Church研究组等通过扩增提高寡核苷酸浓度,并通过反向链杂交来降低错误率(Tian, Gong et al. 2004);田敬东研究组采用物理手段将寡核苷酸分组到不同微孔,再通过原位扩增拼接,来降低成分的复杂性(Quan, Saaem et al. 2011)。



图3:微阵列寡核苷酸用于基因合成。A. 芯片原位组装;B. 亚库组装策略。(来源:Cold Spring Harb Perspect Biol)


2) 微阵列寡核苷酸合成及拼接保真性低


微阵列合成寡核苷酸用于基因合成最严峻的一个问题是微阵列合成的寡核苷酸质量往往较低,与柱式合成的寡核苷酸相比存在更多合成错误(Kosuri and Church 2014;Wan et al. 2014)。 


导致合成质量下降的原因之一是芯片上寡核苷酸序列的脱嘌呤化,在合成周期中,由于新生的寡核苷酸长时间暴露在脱保护试剂中,脱嘌呤会自发发生。优化反应条件和试剂在合成芯片的流动循环,可以有效提高寡核苷酸合成芯片的质量,减少脱嘌呤的发生,提高得率,进而合成长达200nt的寡核苷酸(LeProust et al . 2010年)。 


另一个原因是 边缘效应”,包括反应液滴未对准,试剂封闭不力,或光控系统中光束偏移导致不精确的脱保护反应,都会造成边缘效应,导致邻近区域的寡核苷酸序列产生碱基错误。对芯片设计的改进可以提高微阵列寡核苷酸的保真度(Saaem et al. 2010)。因此,微阵列芯片设计和合成试剂、工艺的不断改进,将推动低成本、高质量、长寡核苷酸的高保真合成,为基因合成服务。


3) 提高合成保真性的对策


目前微阵列寡核苷酸直接用于基因合成的最大问题依旧是错误率较高,需改进芯片设计以及合成工艺来降低合成错误率(Wan, Li et al. 2014, Lubock, Zhang et al. 2017)。在寡核苷酸化学合成过程中,每一步单体成功偶联的效率大于或等于98% (Tian, Gong et al. 2004)。插入和缺失突变是这一过程中最常见的两种突变类型。缺失突变通常来自未完成的偶联或者脱保护步骤,每个位置发生缺失突变的概率大约是5%。而插入突变通常是非预期的DMT切割反应导致的,每个位置发生的概率高达0.4% (Hall, Micheletti et al. 2009)。除去这些非特异的副产物,芯片合成的100 mer寡核苷酸中只有30%是目标产物(Tian, Ma et al. 2009)。存在合成错误的寡核苷酸被引入基因拼接阶段,会将错误率进一步放大。


【拼接过程错误率高的应对方法】


1.寡核苷酸纯化:纯化后的寡核苷酸可以将合成产物的保真性提高数倍(Xiong, Yao et al. 2006)。但是这种方法只能去除长度不正确的错误序列,无法识别碱基替换的突变类型(Young and Dong 2004)。对于分辨和去除单个碱基缺失或插入突变的寡核苷酸也存在一定困难,而这种突变类型恰好是基因拼装过程中的主要突变类型(Tian, Gong et al. 2004)。 


2.功能筛选:当合成的目标DNA是编码序列时,功能筛选可以用来去除含有突变导致失去功能的DNA产物。在化学合成寡核苷酸的过程中,n-1的边产物是引入突变的主要类型(Tian, Gong et al. 2004)。功能筛选方法对于去除寡核苷酸化学合成过程中的单个碱基缺失突变类型是非常有效的。Cox等人利用该方法,将正确合成的DNA序列的比例提高了4到5倍(Cox, Lape et al. 2007)。 


3.二代测序方法选择正确寡核苷酸:Matzas等人利用罗氏454测序技术与挑拣磁珠的机器人相结合,从测序序列中有选择地去除寡核苷酸序列(附着在磁珠上),将正确序列用于基因合成(Matzas, Stahler et al. 2010)。Kim等人使用随机序列标签在454测序反应中标记单个序列,并使用这些标签选择性地扩增正确序列(Kim, Han et al. 2012)。Schwartz等人采用类似的方法,利用Illumina测序条码,通过选择性扩增序列验证的条码序列,选出正确的序列(Schwartz, Lee et al. 2012)。2016年Klein等人改进了这一方法,从单个寡核苷酸池中组装了2271条131-250 bp长度的片段,将正确比例提高到70.6% (Klein, Lajoie et al. 2016)。 


4.错配识别纠错方法:错配修复系统相关的蛋白可以维持基因组DNA复制过程中序列的保真性(Modrich 1991)。引入错配识别蛋白到人工合成DNA的纠错系统,可以显著提高DNA拼装产物的保真性。


基于错配修饰系统相关蛋白来提高合成保真性的策略,一种是错配结合蛋白系统。错配结合蛋白可以选择性地结合含有错配的DNA双链,形成蛋白质-DNA复合体,该复合体和未结合的正确DNA可以通过凝胶阻滞分析(Gel-shift assay)或者亲和柱分离,最终达到错误去除的目的(Modrich 1991)。Carr等人成功开发用于纠错系统,并可以显著提高DNA的保真度,将错误率从1.8 errors/kb降低到0.1 error/kb (Carr, Park et al. 2004, Binkowski, Richmond et al. 2005)。Binkowski, B. F.等人则在此基础上优化了纠错系统,将蛋白质固定在固相基质上,特异性结合含有错配的DNA双链,形成较大的蛋白质-DNA复合体,而后通过离心方法去除,得到未结合的正确配对的DNA双链,该方法可以将组装的GFPuv基因序列的错误率从1.3 error/kb降低到0.3 error/kb(Binkowski, Richmond et al. 2005)。联川创始人高晓连教授课题组使用MutS固定化纤维素柱成功将基于芯片寡核苷酸拼接的DNA片段错误率降低超过20倍(从14.25 error/kb 降至0.66 error/kb) (Wan, Li et al. 2014)。 


另一种用于纠错系统的蛋白——错配识别内切酶,可以特异性地识别并切割异源DNA双链上的错配位置。切割后的序列可以进行大小筛选,或加入另外的酶,比如DNA聚合酶或者外切酶进行降解或者修复。修复后的DNA片段可以通过片段之间的重叠区域重新被延长至目标长度。Fuhrmann等人比较了噬菌体T4内切酶VII和大肠杆菌内切酶V的纠错效果,分别可以将合成基因的错误率从6.52 error/kb降低到1.62 error/kb和1.98 error/kb(Fuhrmann, Oertel et al. 2005)。基于特异性错配识别内切酶CEL的纠错系统已经有商业化试剂盒,可以将化学合成DNA产物的错误率降低16倍,至0.11 error/kb(Kosuri, Eroshenko et al. 2010, Saaem, Ma et al. 2012)。但目前这些方法要想应用到自动化基因合成中,其成本、通量和工作模式仍需要改进。因此,对于基于微阵列寡核苷酸的DNA从头合成来说,合成基因长度且序列正确的DNA片段比拼接更长片段(比如代谢通路或基因组)更需要突破时间和成本的限制。


 三   展望


在过去的40年中,化学合成方法的自动化发展以及基因合成方法的发展促进了我们对生物学的理解,并为生物系统的可预测工程化改造奠定了基础。人工合成的DNA已被用于评测功能组件(Salis et al.2009;Callura et al. 2012),合成基因疫苗(Dormitzer et al.2013),构建合成基因回路(Salis et al.2009;Sowa et al. 2015;Nielsen et al. 2016),基因组合成以及新兴的“DNA存储”领域。


DNA合成技术在生物工程发展中处于核心地位,当与由NGS产生的大量序列数据相结合时,将有助于合成生物学向更广阔的应用方向发展。高通量寡核苷酸合成技术,与高保真组装技术、自动化技术的结合,使大规模的工程化改造成为可能。 


当前,较短的DNA片段(1kb)通常可以轻易得到,但更长的DNA片段组装仍然对操作人员的技术水平提出更高要求和挑战。目标序列中存在二级结构以及重复序列都会对其组装构成挑战。在DNA合成完毕转入细胞时,合成DNA结构还可能对宿主细胞造成生长抑制。然而,科技的进步之快令人咋舌,40多年前第一条tRNA基因被合成,2016年第一个最小细菌基因组被合成。人们对生物系统及工程改造的复杂性已经有了深刻的认识,但未来仍有许多知识等待我们去探索。



  作者简介  

李璐璐  博士


李璐璐(微信号:luannelee),博士,毕业于中国科学技术大学生物化学与分子生物学专业,师从合成生物学先驱高晓连教授,主要进行基于芯片寡核苷酸的高保真组装技术开发,成果发表于Nucleic Acids Research 杂志。2014年加入杭州联川生物,现任研发部主管,负责DNA合成技术及NGS基因检测技术的开发工作。




参考资料:


1.Binkowski, B. F., K. E. Richmond, J. Kaysen, M. R. Sussman andP. J. Belshaw (2005). "Correcting errors in synthetic DNA throughconsensus shuffling." Nucleic Acids Research 33(6).

2.Carr, P. A., J. S. Park, Y. J. Lee, T. Yu, S. G. Zhang and J. M.Jacobson (2004). "Protein-mediated error correction for de novo DNAsynthesis." Nucleic Acids Research 32(20).

3.Cox, J. C., J. Lape, M. A. Sayed and H. W. Hellinga (2007)."Protein fabrication automation." Protein Science 16(3): 379-390.

4.Fuhrmann, M., W. Oertel, P. Berthold and P. Hegemann (2005)."Removal of mismatched bases from synthetic genes by enzymatic mismatchcleavage." Nucleic Acids Research 33(6).

5.Hall, B., J. M. Micheletti, P. Satya, K. Ogle, J. Pollard and A.D. Ellington (2009). "Design, synthesis, and amplification of DNA poolsfor in vitro selection." Curr Protoc Nucleic Acid Chem Chapter 9: Unit 92.

6.Kim, H., H. Han, J. Ahn, J. Lee, N. Cho, H. Jang, H. Kim, S.Kwon and D. Bang (2012). "'Shotgun DNA synthesis' for the high-throughputconstruction of large DNA molecules." Nucleic Acids Res 40(18): e140.

7.Klein, J. C., M. J. Lajoie, J. J. Schwartz, E. M. Strauch, J.Nelson, D. Baker and J. Shendure (2016). "Multiplex pairwise assembly ofarray-derived DNA oligonucleotides." Nucleic Acids Res 44(5): e43.

8.Kosuri, S., N. Eroshenko, E. M. Leproust, M. Super, J. Way, J.B. Li and G. M. Church (2010). "Scalable gene synthesis by selectiveamplification of DNA pools from high-fidelity microchips." Nat Biotechnol28(12): 1295-1299.

9.Lubock, N. B., D. Zhang, A. M. Sidore, G. M. Church and S.Kosuri (2017). "A systematic comparison of error correction enzymes bynext-generation sequencing." Nucleic acids research 45(15): 9206-9217.

10.Matzas, M., P. F. Stahler, N. Kefer, N. Siebelt, V. Boisguerin,J. T. Leonard, A. Keller, C. F. Stahler, P. Haberle, B. Gharizadeh, F.Babrzadeh and G. M. Church (2010). "High-fidelity gene synthesis byretrieval of sequence-verified DNA identified using high-throughputpyrosequencing." Nat Biotechnol 28(12): 1291-1294.

11.Modrich, P. (1991). "Mechanisms and biological effects ofmismatch repair." Annu Rev Genet 25: 229-253.

12.Quan, J., I. Saaem, N. Tang, S. Ma, N. Negre, H. Gong, K. P.White and J. Tian (2011). "Parallel on-chip gene synthesis and applicationto optimization of protein expression." Nat Biotechnol 29(5): 449-452.

13.Saaem, I., S. Ma, J. Quan and J. Tian (2012). "Errorcorrection of microchip synthesized genes using Surveyor nuclease."Nucleic Acids Res 40(3): e23.

14.Schwartz, J. J., C. Lee and J. Shendure (2012). "Accurategene synthesis with tag-directed retrieval of sequence-verified DNAmolecules." Nature Methods 9: 913.

15.Tian, J., H. Gong, N. Sheng, X. Zhou, E. Gulari, X. Gao and G.Church (2004). "Accurate multiplex gene synthesis from programmable DNAmicrochips." Nature 432(7020): 1050-1054.

16.Tian, J. D., K. S. Ma and I. Saaem (2009). "Advancinghigh-throughput gene synthesis technology." Molecular Biosystems 5(7):714-722.

17.Wan, W., L. Li, Q. Xu, Z. Wang, Y. Yao, R. Wang, J. Zhang, H.Liu, X. Gao and J. Hong (2014). "Error removal in microchip-synthesizedDNA using immobilized MutS." Nucleic Acids Res 42(12): e102.

18.Xiong, A. S., Q. H. Yao, R. H. Peng, H. Duan, X. Li, H. Q. Fan,Z. M. Cheng and Y. Li (2006). "PCR-based accurate synthesis of long DNAsequences." Nature Protocols 1(2): 791-797.

19.Young, L. and Q. H. Dong (2004). "Two-step total genesynthesis method." Nucleic Acids Research 32(7).

20.Xie, Z.-X., et al., "Perfect" designer chromosome Vand behavior of a ring derivative. Science, 2017. 355(6329).

21.Shen, Y., et al., Deep functional analysis of synII, a770-kilobase synthetic yeast chromosome. Science, 2017. 355(6329).

22.Wu, Y., et al., Bug mapping and fitness testing of chemicallysynthesized chromosome X. Science, 2017. 355(6329).

23.Zhang, W., et al., Engineering the ribosomal DNA in a megabasesynthetic chromosome. Science, 2017. 355(6329).

24.Hughes, R.A.and A.D. Ellington, Synthetic DNASynthesis and Assembly: Putting the Synthetic in Synthetic Biology. ColdSpring Harb Perspect Biol, 2017. 9(1).

 

往期精彩回顾

“基因2.0时代”的基因合成技术干货(上)

肠道菌群通过miR-181家族调节白色脂肪组织炎症和肥胖 | miRNA专栏

联川生物10X单细胞培训班杭州站招生啦~

Cell : 人类心脏中RNA翻译的规律和机制 | 翻译组

免疫组库测序(IR-SEQ):BCR/TCR分子结构及多样性

Nanopore测序原理与应用 | 知识分享


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存