再创|基因线路的设计原则(一)
细胞通过启动基因的表达实现对信号的响应,应对多样的环境,进行胞间通讯以及形成复杂的模式。工程师们试图利用这种能力对细胞进行编程,使得其能够执行特定功能,或创造复杂的化学物质或材料。本文总结了能够协助构建遗传线路的工具,列举了组装遗传线路时的常见问题模式及解决方法,并讨论了遗传电路在活细胞中发挥作用的限制。总体来说,先进的工具、表征良好的元件以及对遗传线路构建的全面认识,正推动着工程细胞在更尖端领域(从疾病治疗到功能材料制造)应用实现更多的突破。
作者:高元力 中国科学院大学本科生
原文以Principles of genetic circuit design发表在《Nature Methods》
全文约4000字,阅读时间约为10分钟
基因线路设计的潜力和挑战
在活细胞内实现逻辑计算将改善现有生物过程、拓宽应用范围,从而实现生物技术领域的革新。短期内,通过在发酵的不同阶段实现基因的时序表达,或在特定条件(如高细胞密度)下酶表达的上调,可以提高化学药物分子的产量。而在发酵罐外, 工程细胞可以作为治疗药物治疗遗传疾病,或是在人类微生物组的环境中定植以执行治疗功能。而长期的应用包括感知和适应环境挑战的"智能植物"和能够编织具有纳米特征功能材料的细菌。
Figure 1. 基因线路设计的潜在应用
然而,基因线路的一些特性使得基因线路设计这一领域充满挑战:
遗传线路需要精确地平衡其各个调控元件以产生适当的响应。而能够调节表达水平的计算工具和元件库在最近才开发出来;在此之前,能够调节表达量的元件十分稀少,而且可调精细程度较低。
在定向进化实验中,对许多线路很难进行筛选,难以获得正确的表型。数字逻辑有明确的开和关的状态,可以构成筛选的基础;然而对动态电路(dynamic circuits)如振荡器(oscillators)的筛选要复杂得多,而且很难想象如何去筛选才能得到更加复杂的功能。
用于量化遗传电路性能的工具很少。通常情况下,荧光蛋白信号常用来表征输出, 但是荧光检测需要实现高表达,而且荧光蛋白的降解速率会限制测量动力学特征的能力。
合成线路对环境、生长条件和遗传背景非常敏感,但我们对这些方面的了解仍然很少。
一个大型基因线路涉及许多DNA元件的组装,而这一组装过程在技术上充满难度,而且组装的准确性不高。
基于不同种类的调节因子(regulator)的基因线路设计
转录层次的线路功能是通过改变RNA聚合酶在DNA上的流量实现的。影响这种流量的调节因子有很多,如DNA结合蛋白,CRISPRi系统,重组酶等。本节总结了这些方法的最新进展(译者注:文章发表时间为2014年)及每种调节因子对线路的影响。
DNA结合蛋白(DNA-binding protein)
DNA结合蛋白可以与特定的DNA序列结合。利用DNA结合蛋白做转录调控因子的最简单的办法就是设计能够阻止RNA聚合酶结合或延伸的启动子和操纵子。这种抑制回路可以由锌指蛋白、TALE(transpcription activator-like effector)、TetR同源物、噬菌体抑制因子和LacI同源物构建而成。目前人们在努力扩大可用的DNA结合蛋白文库,但是由于对蛋白之间正交性的要求,仍然困难重重。由于阻遏物(repressor)的功能较简单,他们容易在物种间迁移,甚至是原核生物与真核生物之间。另一方面,DNA结合蛋白也可以作为激活剂,提高与DNA结合的RNA聚合酶水平。
Figure 2. 基于DNA结合蛋白的NOR gate和AND gate
DNA结合蛋白可以用于构建许多逻辑门(Figure 2)。通过连接两个启动子以及输出阻遏信号可以建立NOR gate。而其他类型的转录逻辑门可以通过蛋白对构建,蛋白之间的关系可以是协同(激活)或抑制(如anti-因子),如AND gate和NAND gate。同时DNA结合蛋白可以用于构建包含正负反馈的回路,如脉冲发生器、双稳态开关和振荡器等。类似的,可以用DNA结合蛋白构建模拟线路(Analog circuits),如加法器和比率计,其可以通过更少的调节因子实现更复杂功能。
然而,使用DNA结合蛋白构建基因线路仍然存在挑战。虽然单个转录因子的使用可能没有明显毒性,但多个调节因子同时使用可能造成高毒性。另外,这些线路非常依赖宿主的生长速度,因为这些蛋白的稀释速度的差异会改变它们积累或降解的速度,从而改变其稳态浓度,最终影响线路的响应。最后,它们的响应函数通常不是最优的,而且很难控制,因为它们具有高OFF状态(即它们在OFF状态下生成重要的转录信号)和低动力学范围(dynamic range)。
重组酶(recombinase)
重组酶可以促进DNA片段在其结合位点之间反转,位点特异性重组酶通常介导"剪切-粘贴"(cut-and-paste)重组,在此过程中,DNA发生成环、剪切、重组。在 基因线路的构建中可以使用两种重组酶:第一种是酪氨酸重组酶(tyrosine recombinase), 它们需要宿主特异性的因子,而且可以可逆(双向翻转)也可以不可逆(单向翻转);第二种是丝氨酸整合酶(serine integrase),它可以催化依赖于双链断裂的单向DNA翻转,通常不依赖于宿主因子,而且有可以独立表达并恢复DNA到初始方向的切除酶(excisionase)。
Figure 3. 基于重组酶的NOR gate和AND gate
重组酶可以用于构建开关、记忆电路、计数器和逻辑门。重组酶是记忆存储的理想选择,因为它们可以永久性的翻转DNA, 一旦DNA被翻转,其新方向就能被保持,而不需要继续向体系内输入材料或能量。在逻辑门中,这种翻转的状态可以对应于ON或OFF,相互正交的重组酶可以用于构建多输入逻辑 (Figure 3)。但是由于重组酶的DNA翻转后不会恢复,这种逻辑电路无法区分几种输入的时间顺序,因此可以使用可重写开关(rewritable switches)来解决这一问题,其中一种重组酶被组成型表达维持起始状态,而另一种重组酶响应输入信号而启动表达。
重组酶的缺陷在于反应很慢(通常需要2~6h),而且目标是一个多拷贝质粒或者使用可逆性的重组酶时,常常产生多个DNA方向的混合群体。因此,丝氨酸整合酶和其切除酶的搭配使用可以代替可逆性的重组酶。
CRISPR干扰(CRISPR interference)
CRISPR系统用Cas核酸酶和引导RNA在特定的DNA序列中引入双链断裂,而不具有核酸酶活性的突变Cas蛋白(如dCas9和Cas9N-)可以用作转录因子,通过形成DNA bubble干扰RNAP活动,降低基因的表达。另一方面,CRISPR还可以通过在失活Cas9上融合RNAP招募结构域来激活转录。CRISPRi的一个优点是RNA-DNA复合物的可设计性:我们可以设计非常大的相互正交的gRNA序列库,以靶向不同的启动子。这种库可以用于大型遗传线路的构建,但是考虑到预测gRNA的正交性的复杂性,这个库仍需要进行实验筛选。总的来说,CRISPRi线路的性质可能类似于DNA结合蛋白线路。由于调控dCas9-sgRNA-DNA复合物的稳定性,基于CRISPRi的线路有望在类似于蛋白线路的时间尺度上运行。
目前构建CRISPRi电路的挑战之一是难以控制的毒性。毒性可能是由于Cas9与宿主基因组在原受体邻近基序上结合,形成影响宿主基因表达的DNA bubble的结果;通常gRNA通常不存在时,这种非特异性结合发生。当Cas9用作核酸酶时,由于RNA过量,毒性不那么明显;但在基因线路中,Cas9需要在逻辑门启动之前以无RNA的形式存在。构建CRISPRi线路的另一个需要考虑的因素是追溯性,这可能源于多个系统共同使用一种Cas9蛋白。规避这种问题的方法是表达多种正交的Cas9同源物。
Adapted RNA-IN/OUT
在天然RNA-IN/OUT系统中,短链非编码RNA (RNA-OUT)与目标mRNA (RNA-IN)的5'端特定序列结合,阻止其与核糖体的结合并且促进mRNA的降解。Adapted RNA-IN/OUT利用tna操纵子对天然系统进行重组以抑制转录而不是翻译。tna调控元件由RBS、短肽tnaC的编码序列、Rho因子结合位点和RNAP暂停位点组成,RNAP暂停位点可以促进Rho介导的转录终止。翻译tnaC会导致核糖体的停滞,从而阻止Rho因子的结合,进而允许RNAP转录tnaC下游的基因。然而当RNA-IN/OUT系统抑制tnaC的翻译时,Rho可以和延伸中的mRNA结合,敲除RNAP,从而抑制转录的延伸过程。
Figure 4. 基于Adapted RNA-IN/OUT的NOR gate
与CRISPRi一样,Adapted RNA-IN/OUT系统基于可设计的RNA-RNA相互作用,可以用于生成大量相互正交的调节因子。Adapted RNA-IN/OUT已经用于构建多输入的NOR gate(Figure 4), 在这些系统中,相互正交的RNA-IN/OUT变体相互连接,任何同源RNA-OUT的表达都会抑制输出基因的表达。额外的调控功能可以通过引入调控RNA-OUT活性的配体或控制tnaC处核糖体停留的tRNA实现。
构建更大型RNA-IN/OUT线路的一个挑战是,每个转录因子需要相同的tna调控元件(~290bp),而在多个线路中重复使用这部分可能导致同源重组。通过改造tnaC, 减少重复序列的长度或使用来自其他生物体及其他Rho结合位点的同源物,可能是降低重组概率的方法。
选择元件以调谐线路响应
研究者需要调谐遗传电路以满足特定应用的要求,而新的表征良好的元件库和计算工具使得设计和优化遗传电路变得更加容易。另外,新型的绝缘子(insulators)提高了这些元件在线路局部环境中的可靠性。而附加的生化工具(如sRNA) 也可以用于线路设计,以获得更多的调谐旋钮,达到更细致的调节效果。下面将以两个线路模型来展示不同元件的选择和修改如何影响电路的响应。
NOT gate
Figure 5.调节基因线路的方法--NOT gate
NOT gate代表简单的逻辑线路。逻辑门通常由响应函数表征,响应函数描绘了稳态输出如何根据输入函数变化的过程。响应函数的形状由以下因素决定:
开/关状态,决定线路的动态范围
达到一半的最大输出需要的输入量(也称为阈值)
开关的协同性
数字逻辑门的响应函数可以通过改变启动子强度(Figure 5b)、RBS强度或蛋白质降解速率(Figure 5c)来上下移动。启动子强度可以通过启动子序列的突变或从文库中选择新的启动子来改变。蛋白质降解的增加可以通过添加蛋白酶标签或N端降解序列实现。当整个电路分布在同一个质粒上时,可以通过改变拷贝数来同时改变电路的动态范围和阈值。
数字逻辑门的阈值决定了响应函数的陡峭程度,即输出产生细微变化时对输出的影响。阈值可以通过调节RBS强度,在启动子中添加多个operator或改变operator的位置(Figure 5e)调节。
数字逻辑门的协同性可以通过减小诱导下游线路所需的、上游线路产生的输入范围,使得连接不同的逻辑门变得容易。一种使逻辑门更像开关的方法是改变与启动子结合的抑制因子的协同性,或者引入DNA环(loop);另一种方法是表达一种与电路元件结合并能够阻止其正常工作的隔离分子。与mRNA结合的sRNAs(Figure 5f), 与转录因子结合的蛋白质,以及能够与转录因子结合防止其影响输出启动子的decoy operator都能实现这种隔离功能(Figure 5g)。
振荡器(oscillator)
Figure 6.调节基因线路的方法-- oscillator
振荡器代表典型的动态电路,这种类型的电路很难进行调谐,因为其需要在一个狭窄的参数空间内进行平衡才能正常工作。对于振荡器来说,调谐可以改变振荡的周期、振幅和形状;另一方面也可以迫使系统走出参数空间,从而导致故障。
蛋白质的快速降解(Figure 6c)是维持动态电路正常工作的关键,如果蛋白质降解缓慢,则线路可能会减慢甚至停止功能。振荡器中振幅和周期的改变可以通过调节基因表达率, 即调节启动子和RBS(Figure 6b,e)改变。改变质粒拷贝数会影响振荡的幅度(Figure 6d)。协同性是获得鲁棒振荡器的关键,因为它扩大了产生振荡的相空间区域,因此隔离分子对振荡周期和振幅有较大的影响(Figure 6f,g)。
(未完待续)
参考文献:
[1] Brophy J A N , Voigt C A . Principles of genetic circuit design[J]. Nature Methods, 2014, 11(5):508-520.