查看原文
其他

【观点】从传统到构造——浅谈合成生物学的功能与研究范式

郭昊天 蓝晶微生物Bluepha 2022-12-28
作者:郭昊天2013年复旦iGEM队长巴黎第五大学 合成生物学 在读博士
2013年我带领复旦iGEM本科生团队,阴差阳错获得了研究生组的亚洲区World Championship,当时我不禁想起两句诗(误)。无心插柳十之八九,从高中到大学,我接受的都是传统的生物学训练,本科论文也是细胞生物学方向,最后怎么就做合成生物学了呢?合成生物学的发展带来的不仅仅是一种思维变革,也是对已有的生物学研究必不可少的补充,这也是我对它充满希冀与热忱的原因所在。自2011年参加iGEM的这5年,我常常感慨于传统学科与合成生物学之间巨大的思维差异。今天我想与大家分享一些阳春白雪的形而上,并谨以此文谈一谈我眼中在生物学发展的大背景中合成生物学的功能与价值,最后再立一些flag,浅谈未来的发展方向。 
2013 iGEM Jamboree(photo from iGEM website)
 如何定义合成生物学?
首先要讨论的一个问题是——什么是合成生物学?每每与年轻的新iGEMer交流的时候,我都难免会被问到这个问题,然而合成生物学的定义本身却并不那么清晰,甚至还颇具争议。绝大多数传统学科的定义方式都是简单明快地面向对象的——“XX学是一门研究X的学科”。但是用研究客体难以定义合成生物学。基因工程、代谢工程、基因组学等学科与合成生物学的研究对象有大量重叠。在iGEM比赛中尤为显著,我们常评价一个项目“不是”合成生物学,有时候却只需在原有数据的基础上改变分析和诠释方法,合成生物学的“味儿”就有了,可见一斑。
合成生物学是以研究“范式”即方法论进行划分的。早至1974年,对于合成生物学与其他学科的差异,遗传学家Wacław Szybalski就有了初步的描述:“直至现在,我们的工作仍处于分子生物学的描述性阶段……真正的挑战始于我们进入一个生物学领域的“合成”阶段。我们将发展全新的控制元件,在基因组中增加新的模块,甚至建造一整个全新的基因组……建造‘新的更优的控制线路’……最终建造其他‘合成的’有机体,比如一个‘新的更优的老鼠’”。这一描述当下看来依旧具有十足的现代感,初入门径者足以领会到一丝合成生物学的精神。Waclaw也很好地预言了现如今主要的三个研究方向,一是构建类似于电子线路的生物分子线路(比如逻辑门、模拟线路、生物存储等等),包括iGEM比赛在内的很多合成生物学研究都围绕这一模式展开;二是理性设计代谢途径,比如酵母合成青蒿酸和吗啡的两项工作;三是基因(组)的人工合成,比如最小基因组设计,酵母染色体全合成项目Sc2.0,以及最近完成的细菌基因组密码子兼并后的重编码。一些前沿方向也开始涉及以合成的生物分子线路重编码有机体发育过程,最终目标也许就是实现“人创”的生命个体。可见,Waclaw的理解是符合逻辑与现实发展规律的。但Waclaw的这个论述还是有些不尽人意。首先所谓传统学科如分子生物学也并非那般“不堪”。其次,随着遗传学尤其是反向遗传学的发展,预言中诸如“基因组中插入新的模块”这样的工作,在转基因时代就已被实现,却并没有被认为是合成生物学的开端。归根结底,还是究竟什么是“合成”,这个概念的阐述不够清晰,总有些只可意会不可言传的意味在其中。
J. D. Watson and Wacław Szybalski in IBB PAN in Warsaw(Author: Stako)
 隔壁学科的研究范式与合成生物学应承担的功能与价值
既然合成生物学与其他学科的差异是研究范式的差别,我们不妨看一看其他学科的研究范式,讨论合成生物学在生物学发展的大背景中应该充当什么角色,发挥怎样的功能,则可以顺理成章地诠释合成生物学的研究范式是如何的了。
生物学的目标是理解生命系统的结构、功能以及发展的规律,并在现实世界进行应用,一言以蔽之,生物学最终要回答这样一个问题——“生命是什么”。
除合成生物学之外已有的生物学下的分支学科,主体仍是描述性的,这也是学科发展的第一步。进一步,我们试图分析生命系统内的相互作用与因果关系,比如遗传分析、蛋白互作分析。生物学的研究主体也再不断进步,从粗放的定性描述与建立因果链,转变为精细的、定量的描述与系统动态的分析。这些工作为我们理解生命本质提供第一手材料,但距离回答终极话题“生命是什么”还尚远。我们仍需透过现象寻找本质,以简明的基本“定律”统一纷繁复杂的生命现象。理论模型的研究如今大多归于系统生物学,不过回溯历史,在更早的时候就已显现于许多基本学科中。普适定律的提出,无外乎基于三种推理方法——归纳(inductive)、演绎(deductive)与溯源(adductive)。大多数是归纳与溯源结合,由一系列特殊事件归纳出一个普遍规律并直接抽象出模型,或追溯猜想出一个最简单可能的理论模型。如孟德尔和摩尔根的遗传定律,图灵斑、Hodgkin–Huxley的动作电位模型都属于这一研究方法,较近的经典案例有Uri Alon的调控网络motif研究。另一些极早期的理论模型则是纯粹的演绎推理:自人口论(1798)及Logistics方程(1838)以降,理论生态学衍生了极丰富而可靠的数学体系以解释种群动态;生物化学诞生之初,就有了Michaelis–Menten方程(1903-1913)描述酶促反应动力学,沿用至今一百年不动摇;遗传学中的Hardy-Weinberg平衡(1908)的提出则是以孟德尔遗传为假设,对理想群体的演绎结果。今天的系统生物学,就是在系统论、控制论等的加成之下综合使用三种方法揭示生命设计原理。
三种推理方法只能提出规律,却不能实现最后一步“证实/证伪普适定律”。对于特定系统的规律证明衍生了两种方法论,一是如遗传分析,由表及里(top-down),将系统视为黑箱,对其扰动观测,以验证预测模型;二是如生化分析,自下而上的(bottom-up),将待研究组分纯化、重建,直接验证功能性质。而对普适定律,Top-down方法因为我们对黑箱的无知,难以证明普适性,只可以用来证伪定律。因此我们只好正面硬刚,用bottom-up的方法给出生命设计原理的构造性证明,也就是合成生物学家经常引用的“What I cannot create, I do not understand”,而这正是我认为合成生物学所承担的功能。合成生物学的开端恰恰就是用最简单的构造性证明,展示这一研究范式的可行性:相互抑制的两个分子可以形成双稳态并实现记忆储存,好的,我们就构建一个扳键开关出来;三分子的抑制环可以实现周期振荡,那就制作一个振荡器吧。在合成生物学的乌托邦里,如果一个定律普适为真,那么我们就可以在其指导下任意构建生命体系。在实现这一理想的过程中开发的技术、方法、思想都可视为合成生物学基础。以这些理论、技术成果推动的新应用(New applications)则是合成生物学转化实践的成果。
相互抑制拓扑结构的模型十分经典,通过调整参数,可以实现双稳态、振荡器等动力学特征变化,这如今被用于描述干细胞的分化命运控制机制。合成生物学中的动力学模型来自经典分子生物学研究,经过独立发展之后又被用以解释生物细胞原有的现象或机制,这是合成生物学成果在基础研究领域运用的常见模式。(编者)
(Figure from Chikara Furusawa and Kunihiko Kaneko, 'A Dynamical-Systems View of Stem Cell Biology', [J] Science, 338, 215 (2012))
最初的困境至此也有了解答。对于相同的研究客体,如近年火热的CRISPR领域,一些专注于CRISPR本身的性质,一些开发CRISPR用以构建更复杂的系统,一些以合成生物学的已有方法推动CRISPR改造,其实分属于传统领域与合成生物学的范畴。
 “古典”合成生物学之殇
合成生物学的最终目标是可以在理性设计指导下构造任意的生物系统实现指定的功能,现阶段我们显然尚不具有这样的能力,因此必要提出一个具体的解决方案。最先流行的范式是机械与电子工程的,尤其是标准化和模块化思想,这也是合成生物学早期以及iGEM所提倡的概念。工程学研究怎样从零部件构建复杂系统,核心思想就是标准化,标准件可以最大化每个元件的通用性和可重复性,所有机械零部件都有明确标准的结构尺寸以及稳定性能;合成生物学也希望能够制作生物标准元件,并在此基础上构建生物线路。这种“古典”的还原论观点有着美好愿景:组装复杂系统只需要了解他的零部件。标准化思想拥有的另一个巨大优势是一个复杂系统的设计可以简化为若干功能模块之间的拼接,可以极大地降低“遗传机器”的设计成本,并实现设计的自动化。

合成生物学在实际操作中面临各种瓶颈,主要源自人们面对复杂系统缺乏足够强大的认知手段和描述方法

(编者)


但是古典范式已经遭遇了它的瓶颈,根源在于生物标准件思想本身是早熟的。在机械工程中,所有的元器件有着成熟精确的理论刻画,比如经典力学和电动力学,而在生物学中,对于基本元件的功能描述并没有足够的理论。另一个标准化思想所需的前提假设也往往被忽视——元件的集总性,即所有的物理化学过程发生在元件内部,一个元件的参数、性质、特征可以抽象于一点。从基因的到网络motif,很多生物学工作用抽象和粗粒化的方法降低系统复杂度,以切中肯綮,然而这并不能支持生物元件的抽象概念本身是合理的。在电子线路中,元件的电磁效应在元件外迅速地衰减,从而可以近似为集总元件;而生物体系像是一锅燥热的面条汤,虽然具有自组织的时空结构,大多数分子间却可能有非特异的、弱的相互作用,同一分子上的各个组分也并非泾渭分明,("When we try to pick out anything by itself we find it hitched to everything else in the Universe")。差的集总性,一方面使得我们难以划定元件的边界(如启动子),从而难以设计标准接口与规格;另一方面,无法保证标准件的性能稳定与一致性,即可重复性,在不同使用条件下具有相同的功能。只有元件具有稳定性能时,我们才有可能通过有限测量充分了解元件的性质,否则工程学的解决方案就无法实现。

“生物体系像是一锅燥热的面条汤,虽然具有自组织的时空结构,

大多数分子间却可能有非特异的、弱的相互作用。”


可重复性现如今是合成生物学的一个主要难关,研究者们开发了很多绝缘子元件、发明了一些奇技淫巧,以解除生物元件与遗传背景和相邻元件之间的偶联。可合成生物学元件与机械元件还是有着天壤之别。在遗传线路的自动化设计与建构的一系列尝试中,我们可以发现在较复杂的线路中,即使针对系统的特异预测,也常常由于遗传背景与元件间非特异作用,与实验结果大相径庭,而随着系统的复杂度提高这一现象愈加显著。不少研究者也因此逐渐从机械论的观点中转向寻求新的范式。
 一点展望:现在的与未来的合成生物学
现有的一些合成生物学研究中有一些研究与调控系统无关,故而没有追随机械工程学的范式。一个著名的例子就是支原体辛西娅及其升级版的构建,其目的只是为了证明:1.细胞是可以化学合成的;2.存在一个最小的细胞基因组。一些研究中则借用了计算机科学的概念,如利用DNA进行信息的数字存储。化学工程的研究方法在一些代谢网络设计、生物分子设计中也被广泛借鉴。可见,除了标准化和模块化的思想,仍有很多新的元素已经被引用进合成生物学。
早熟的生物标准件思想承受了早衰的代价,但同时我们还要认识到,在工程学的格局中,标准件的提出有着非常久远的历史,早不是新潮事物。因此合成生物学也要接受新鲜事物,不断修正革新对于生命体系的理解,以提出更可靠的研究范式;另一方面我们也可尝试开创全新的、最适于生命系统的研究范式。生命系统中,精确的调控与普遍的热噪声矛盾而统一,分子随机游走也可能形成自组织结构,边界不断生长,细胞不断分裂,基因组不断突变演化,这一切,都是合成生物学发展中所要面临的挑战,同时也可能是提出新范式的出发点。
关于系统构建与设计,我最后想做一些“民科式的”大胆构思。或许我们可以实现不基于元件进行自动设计,而是给出逐个碱基的优化方案,并给出相应最优的DNA合成方案。这样一个自动设计程序,将抛弃元件的抽象概念,而是基于程序与实验交互式的机器学习的结果:计算机程序给出设计与预测,实验室自动化平台构建系统并测量,通过不断试错修正优化程序的内部结构和参数(也许还可以通过众包平台使城市科学家参与进来优化程序的学习进程)。而这一程序也许是神经网络的,也许是基于新的算法。最初的尝试可以专注于某些特定的生物系统,比如信号转导通路的从头设计?至于是否能成功,也不妨拭目以待。
  公众号BluephaLab 合成生物学研究范式|iGEM|展望

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存