再创·观点丨合成生物学系列提问第一问:合成生物学需要坚持工程学理念吗?(二)
合成生物学作为一门以工程学为基础的学科,近年来也面临着一些对于合成生物学工程化理念的质疑。2019年一篇文章名为《Real-World Synthetic Biology: Is It Founded on an Engineering Approach, and Should It Be?》的文章在合成生物学领域引起广泛热议。文章中提出了合成生物学不应受到经典工程学理念的束缚,应当更多的接受利用工程学理念改造和设计生物所面临的生物本身的特殊性。那么:
合成生物学需要坚持工程学理念吗?如何看待关于合成生物学不应局限于工程学理念的看法?
这是【再创丨Regenesis】2019年在知乎发起的合成生物学系列提问第一问。经过两周的时间,我们最终选取了4位知乎大V的精彩观点分享于此,分别是知乎ID@Yang Liu(爱丁堡大学 合成生物学博士在读)、知乎ID@张浩千(蓝晶微生物CEO 北京大学整合生命科学(生物学)博士)、知乎ID@郭昊天(巴黎第五(笛卡尔)大学 前沿生物学博士在读)、知乎ID@夜神K2(香港大学 系统生物和生物信息学博士)。所有回答均已获得原作者的转载授权。
在昨日的推送中,我们带来了Yang Liu、张浩千以及夜神K2三位答主的精彩回答,详情请点击:合成生物学需要坚持工程学理念吗?(上)。
今天我们将郭昊天博士的精彩回答整理于此,欢迎各位进行讨论!
知乎答主:郭昊天
巴黎第五(笛卡尔)大学 前沿生物学博士在读
谢邀,很好的问题,也是合成生物学从业者比较经典的困惑吧。其实类似的问题,我2016年给蓝晶实验室写的这个稿子就已经讨论过一些:从传统到构造——浅谈合成生物学的功能与研究范式。借此机会在详细说说。
(长文预警以下全文约9000字,预计阅读时间10‑15分钟左右)
要深入地回答这个问题,我们需要花大篇幅讲清楚什么是合成生物学,什么是工程学方法,什么是科学方法。什么是科学方法,什么是工程学方法,早有定论,不是因为合成生物学的发展才有的。
只要我们花一定篇幅统一规范我们我们使用的语言,那么下面两个问题:
合成生物学可以放弃工程学理念吗?上帝能画一个方形的圆吗?
就是相似的,只是看起来很艰深,但是靠逻辑分析就能迎刃而解:
再广义的合成生物学也 不得不 使用工程学的研究方法,再全能的个体也不能创造一个逻辑上不存在的东西。
所以我下面的回答会论述这么几个事情:
通过定义入手解释合成生物学需要坚持工程学理念吗?
什么是工程学,什么是工程学方法,什么是”经典工程学“
什么是合成生物学
解释目前已有的合成生物学研究和工程学、工程学方法之间有什么关系:
合成生物学是否实践了工程学方法?
如果是,什么样的合成生物学项目使用了什么样的工程学方法?
这些方法是否成功?是应该坚持还是急需改变?
现有的争论,很大程度是因为对工程学方法这个概念的狭隘理解甚至曲解。
所以我要先喷一下Jamie Davies的这篇文章,如果不看作者我还以为是本科生期末赶出来的大作业……如果他能提出了新理论和见解,那是好的,但是文章里新的都不对,对的都不新,论证错得一塌糊涂,让我觉得实在是误人子弟。我个人是觉得,如果没有知识论和方法论功底,没有必要超出自己的能力范围揽这个瓷器活,还是应该”多研究些问题,少谈些主义“。
实际上Davies想做的讨论,早有珠玉在前。Davies整篇文章翻来覆去地就是想讨论一件事:合成生物学从哪里来,应该到哪里去。别笑,这就是一个Cell 杂志创刊40周年的特邀综述的正经标题。
Integrating Biological Redesign: Where Synthetic Biology Came From and Where It Needs to Go
我个人推荐对合成生物学研究范式想深入了解的同学读一下这篇5年前的文章,比Davies现在的论述还要清楚深刻地多。联名的后三位作者都是合成生物学领域的顶级大佬,参与见证了合成生物学的创立和发展,水平不知道比Davies高到哪里去了……
Davies的文章错在何处
(已经能看出来Davies的文章怎么有问题的同学,可以跳过这一段)
如果做一个段落概括,Davies的文章的逻辑链条之薄弱就显而易见:
作者提出了一个中心问题:现在的合成生物学是像一个正常的工程学学科运行的吗?is synthetic biology operating like a normal engineering discipline now?
作者提到,过去很多合成生物学的研究人员撰写过综述文章,讨论工程学方法的特征,尽管前人的观点并不尽相同,但作者还是总结出了大家关于“什么是工程学方法”的共识,共计5个特征。
在之后,作者挑选了一些成功的、现实世界应用的合成生物学项目 ”successful, real‑world synthetic biological projects“,按照上述的5个特征中的4个去分析,认为他们极少符合工程学方法的要求。
到此为止,作者就得出了这样的结论,大多数合成生物学项目并没有实践“工程学方法”。
我们把这个结论再准确地描述一遍,就是说,合成生物学家在一些项目中,没有使用合成生物学家共识的、合成生物学项目应该使用的、工程学方法,并称这些项目是合成生物学项目?
得出这样自相矛盾的结论,最大的可能难道不是论证出了错?
做过GRE的同学们应该很容易就能找出以上论证中的一大堆谬误了,我就不逐条说了。简单一点,我用韦恩图直接表示一下,Davies这篇文章讨论的内容和现在合成生物学之间关系的实际情形的一个最简单的解释,大概是下图这样的,距离他想论证的内容还远得很。
由此一个错误的结论出发,作者继续讨论,认为合成生物学不应囿于传统工程学方法,相反,工程学应该拓展其外延吸收传统生物学的方法,就完全跑偏了。
Davies的文章不仅仅是论证本身有问题,而是一开始就使用了错误的论述方法。
给一个项目(在这里是合成生物学整个学科)设计发展蓝图,本身就是个大工程,而Davies整个文章使用的论证思路却还是经典的科学研究方法。这要是不出bug就见鬼了。
这体现了一个很普遍的现象——很多自称是做“合成生物学”的研究人员,不仅说不清楚什么是工程学方法,也从来没有实践过工程学方法。他们的思维模式,探讨问题、分析问题、解决问题的方法,只有传统生物学工作者的那一套,没有一点工程师的特征。
传统生物学的研究方法,是完全使用经典的科学方法(scientific method)。这个方法在20世纪已经形式化为了经典的假设演绎法 (Hypothetico‑deductive model)。现在的大多数生物学学研究都没出过这个圈。大家也可以照着比对Davies文章的论证,看看是不是完全一样的流程,这就是典型的“理科思维”。
科学方法适用于提出新的知识,在我们对研究对象了解很少,希望了解更多的时候,尤其有用。但是科学方法不是用来”解决问题“的,尤其是对于较为复杂的系统性问题,非常难用。
而对于绝大多数工程师而言,什么是工程学方法(engineering method),他们也不一定能给你一个明确统一的答案。但是你给他们一个问题——即使和他们所学的没什么关系——他们关于怎么解决问题的第一反应也是大同小异的。这也就是传说中的“工科思维”,工程学方法在工作中的不断应用造成的思维模式惯性,这就是差别。
对于这种科学方法和工程学方法之间的差异,讨论的比较好的,我首推Yuri A.Lazebnik的名篇《生物学家能修好收音机吗?》Can a biologist fix a radio?—Or, what I learned while studying apoptosis。
在科学网上有全文翻译:科学网‑生物学家能修好收音机吗? ‑ 席鹏的博文。
Lazebnik用修收音机这件事做比,描述了生物学家的思维模式。Davies的这篇文章就是这样的:为了论述合成生物学和工程学的关系,从前人的工作中挑选出来一些“看起来重要”的内容——也就是所谓的”原教旨“,再用原始粗糙的自然语言去分析,提出假说,寻找证据。
试图以这种方式解决复杂问题,只会一叶障目不见泰山,过些日子,就会有很多来自合成生物学其他山头的人,提出不同的”新教旨“,或是提出不同的”证据“,互相掐架。
早期的开拓者什么都不知道,用传统生物学的这种思维模式,试图给合成生物学画发展蓝图。2003年,Drew Endy牵头提了个理想化的纲领,看能不能行得通,走到哪算哪。但是这都9102年了,合成生物学少说又发展了15年,现在想探讨合成生物学应该如何,还延用传统的思维模式只会让人陷入盲人摸象的怪圈。
-----------------
下面回到我们的问题:
合成生物学需要坚持工程学理念吗?合成生物学应不应该局限于经典工程学理念吗?
1. 什么是工程学 engineering?
我们这个圈子里一个有点好笑的异象就是,由于领域过于年轻,这里面充斥着各种半路出家人员。直接导致,对于什么是合成生物学,各有各的解释。甚至对于什么是工程学方法,居然也能吵出各种版本出来。
不过恕我直言,工程学光是英文的engineer这个单词就能追溯到14世纪,人类造的第一个轮子更是久远得难以追溯,合成生物学作为一个不到30年的新兴学科,你说了不算,轮不到你再造轮子。
什么是工程学,是有明确共识的。工程技术认证委员会ABET的前身美国专业发展工程师会,定义工程学是科学原理的创造性应用。
The creative application of scientific principles to design or develop structures, machines, apparatus, or manufacturing processes, or works utilizing them singly or in combination; or to construct or operate the same with full cognizance of their design; or to forecast their behavior under specific operating conditions; all as respects an intended function, economics of operation and safety to life and property.
2. 什么是工程学方法?
工程学方法,虽然没有之前讲的科学方法那样有简明而统一的步骤和框架,但是也有大量的系统性研究和总结。最经典的大概是Walter G. Vincenti的《工程师知道什么以及他们是如何知道的》:
其中How they know it,就是所谓的工程学方法(engineering method),一种和科学方法(scientific method)截然不同的认知论。在此我们只提纲挈领地说几点,为后面的讨论做铺垫。
首先工程学是从根上就和科学截然不同。差异化的目的,导致了差异化的方法。
科学的目的是为了获得更多知识。对研究客体的更深入探索,会得到更多的知识,更具解释性的假说。这些个假说可能离你最开始的目标会越来越远,但是对于科学家来讲是无所谓的,有时候可能更好。
How To Choose a Good Scientific Problem, Uri Alon, 2009
工程学的目的只有一个,解决问题(problem solving)——解决甲方爸爸的需求。
对于工程学而言,你对一个工程项目的内在原理了解得再多,也不会对这个工程项目本身是不是能够解决问题有什么影响——很多情况下,我们根本不能完全了解一个工程项目的内在原理。
这就引出了工程学方法的特征①:工程学方法,是一种启发式的方法,在对可用资源的了解不充分的情况下,去实现最优的结果。
Engineering method is the use of heuristics to cause the best change in a poorly understood situation within the available resources. (Koen, Billy Vaughn, 2013)
这个”不充分“,仅仅是对工程师而言,他们不需要使用对可用资源充分的知识,即使他们可以有这个知识。以电子工程为例,绝大多数电子元器件的内在原理的知识是被人类已知的,但是没有任何一个电子工程师设计电路的时候会用到这些知识——电路设计所需要的知识,和电动力学几乎没有多少交集。
由于工程学的目的是为了解决问题,因此这就又有了工程学方法的特征➁:工程师并不必须使用工程学方法。Koen提出一个重要的概念:工程师是否使用了工程学方法,不应该看他们最后产出了什么,而要看他们是如何产出的。他们完全可以对可用资源充分了解之后,再进行工程设计和改造,并不需要跳出盒子思考。
至于如何具体地实践这种方法论,历史经验积累了大量的策略和技巧,则都属于problem solving的范畴,可以分为两个基础的门类:一个就是试错法(trial and error),另一个是一系列使用理论和洞察指导进行设计的方法(approach using insight and theory)。
3. 什么是合成生物学?合成生物学是否需要实践工程学方法?
到目前为止,关于什么是合成生物学,没有一个统一的定义。这里面既有历史原因——合成生物学具有多个不同的来源;也有山头林立的分配问题。但是一个学科,之所以能够存在,总归是要有一个学术共同体的一个共识——这个学科的有一定的特征将其与其他学科区分开。
我也不在这里引战,就给合成生物学下一个最弱的,总是正确的定义:
合成生物学是一个生物学的分支子学科,与任何一个不是合成生物学的生物学子学科,以及各种子学科的并集,不完全等同。
这是合成生物学作为一个学科能存在的必要不充分条件。还好,对于我们今天要讨论的这个问题,这个最弱的定义就已经足够了,因为生物学的其他各个子学科的定义都是相对的明确的。
下面我们通过穷举就可以划定合成生物学最广义的范围有什么特点:
根据学科的研究目的,我们可以把生物学的子学科进行分类:
绝大多数子学科属于基础科学Fundamental science,都有一个确定的研究对象,使用科学研究方法,去获得有关研究对象的知识。
生物学的应用科学Applied science,也就是生物工程了。生物工程没有特定的对象,目的是应用其他生物学子学科的知识,模拟生物学系统,或者改造、控制生物学系统。历史上生物工程没有规定其特定的研究方法。
那么合成生物学包含了如下可能:
1. 是基础科学,但是与其他学科研究对象不同:天然存在的对象都被其子学科瓜分掉了,那么合成生物学只能利用已有的生物学知识研究还不存在的客体。其实这很大程度也是解释了为什么最开始给学科命名的时候用了”合成“这个词。根据工程学方法的特征➀,这就要求即使我们在科学方法的大框架下去做研究,为了做实验去验证或否定假说,我们还是需要使用工程学方法。由于这个客体尚不存在,我们对其的知识一定是不完备的,只能通过启发式的方法获得结果。
——我们常说的2000年合成生物学的两篇开山之作,扳键开关和振荡器,就是这样的工作。
(a) Scheme of the Toggle switch circuit. (b) Scheme of the Repressilator (Figure from Hasty et al, Nat Rev Genet 2001)
2. 仍然是工程学,但是与生物工程的研究方法不完全相同。由于生物工程没有限定方法,因此合成生物学就必须明确其方法论,否则就和生物工程无法区分。
由于科学方法是无法应用在工程问题上的,所以在我们已有的认知中,合成生物学只能使用工程学方法:换句话说,合成生物学不允许”研究人员完全了解被改造个体才能进行工程改造“这种情况的出现,而生物工程允许。
# P.S: 实际上,传统生物工程很多工作和合成生物学一个肉眼可见的区别,就是需不需要了解充分了解被改造的特征。
综上,即使是最广义的合成生物学,也要使用工程学方法,否则你怎么把自己和其他学科区分开呢?
至于合成生物学是不是应该有更高的要求,那就不在我这个答案的讨论范围内了(逃)。
4.什么是”经典的“工程学方法?
工程学方法在不同的工程领域都有其特定的形态,是问题解决技巧针对性的组合。其中真正有共性的东西恐怕就这么几样:
标准 Standard
差异一选择模型 Variation‑selection model
工程设计流程Engineering design process
(1)工程学的首要目的是为了解决问题。对于一个不成熟的工程领域,一般工程师解决不了问题,或者只有一个明显更好的解决方案。
但是对于较为成熟的工程领域,复杂的问题,会有若干复杂的解决方案。工程学的下一个问题就是,如何在备选方案中挑选最好的方案——为了保证设计方案可以良序地排列,技术标准(technical standard)总是必须的。
但这并不是说标准化是工程学必须的,只是普遍需要,因为很多情境下也不需要选择和排序。
标准也不是工程独有的概念。科学领域一样存在大量的标准,事实上任何领域都可能自发的产生”事实上的标准“ De facto standard。
(2)差异‑选择模型Variation‑selection model,来自Vincenti对航空航天发展史研究的总结,参考了进化理论,形式化地描述了工程学方法是如何产生包括各种新的工程知识。对于一个新的问题,工程师要做的是需要基于有限的知识,尝试设计不同的解决方案,从中选择更优的方案。
其中方案设计是一个相对盲目的过程——因为工程师并不能在预先清楚方案是否可行。但与自然进化的试错不同的是,这不是完全盲目的、随机的且毫无目的的。专业知识和目标偏好会让他们集中搜索特定的解决方案。
很多时候工程师也不能知道如何选择真正的最优解。选择过程中的这种不确定性,只有通过理论模拟环境和实际的操作环境中通过竞争才能得到解决。对解决方案的理论模拟测试和实地测试,会提供新的工程知识。当测试结果难以用已有的标准排序的时候,就需要发明新的标准。
(3)完整的工程设计流程其实是一个相对很简单的事情,不管是什么领域,流程都是大同小异,就是定义需求、选择方案、构建样机、测试、优化这么主要几部。
至于各个领域的工程设计具体的解决策略和方法花样繁多,其实没有什么经典不经典的。Davies认为必须有某种特定的工程设计解决方案,才是工程学方法,这是不符合更普遍的工程学领域的实践历史。
事实上,合成生物学领域内,经常说的,所谓的原教旨”经典的工程学概念“本来在工程学就不存在,是合成生物学借鉴了机械工程和电子工程的设计方法而发明的新东西,是一个遗传系统设计的工程化方案,主要包括两个关键内容:
Adam Arkin和Drew Endy 1999 DARPA白皮书里的遗传系统设计纲领中提到的,生物元件标准化,以及其参数刻画的标准化。
Drew Endy的这个遗传系统设计的抽象与分层方法(an abstraction hierarchy for integrated genetic systems)。P.S. 如果你搜索 abstraction hierarchy看不出生物学的名词,却只会找到合成生物学比赛iGEM的官方页面。所以说这根本不是什么别的工程学早就总结出来的东西。
这实际上也不过就是从机械工程和电子工程里面借鉴了这么几个具体的实践方法:
使用测量技术标准和标准件
对设计对象进行抽象化处理,便于理论分析
分层式的设计,及自下而上设计和自上而下设计
但是如果以这些方法为标准为衡量,工程学里的很多分支其实都是不满足要求。
5. 什么样的“合成生物学”项目使用了什么样具体的工程学方法?成功吗,是不是应该改变?
被(至少一部分人)认为是合成生物学的研究,一般而言可以分解成这么几个大方向:
(1)最原教旨的,绝大多数做遗传线路设计的(genetic circuit design),以Drew Endy、Adam Arkin和Chris Voigt为代表,以及绝大多数的iGEM比赛项目,都是在前文所述的经典方法继续前行,只不过原教旨的程度各有不同而已。
虽然这里面充斥着各式各样的”原教旨“理想主义者,实际上反而手工作坊可能最多,工业化程度最低。
利用标准件,以抽象模型进行分析,从而快速的进行分层式的设计,这个方案的初衷,是为解决遗传线路设计问题,提供一个可靠的工程学方法,让遗传工程师不了解生物学机制的情况下,也能设计遗传线路。
从这个角度而言,它是失败的。最早的扳键开关和振荡器,不过涉及两三个功能模块,随着我们设计的遗传线路目标变得更复杂,我们一次次地碰到天花板。每次出了无法解决的bug,我们就不得不深挖其中的生物学机制,然后从其他工程学科借鉴引入新的工程概念,去完善原来这套相对简单的方案。这什么时候是个头?
很多合成生物学家现在遗传和生化学得比正经科班的还好,这和当初的目标简直南辕北辙。
在我看来这条路注定是走不通的,究其原因,抽象模型对于遗传系统的解释是唯象的,而且解释力太弱。【观点】从传统到构造——浅谈合成生物学的功能与研究范式一文中我有详细的讨论。
但它也有它的成功,那就是我们现在的确可以自动化地设计、构建足够大的遗传线路了,对于目前我们需要实现的大多数生物工程目标而言,足够用了……我个人觉得如果我们放弃通用线路设计的目标,那么对于足够小的遗传线路而言,现在的技术完全可以实现比较可靠的设计了。
(2)DNA合成和基因组合成的研究工作可能是整个合成生物学里面工业化、集成化和自动化程度最高的,整个领域的发展历史比遗传线路设计更像个工科的样子。
虽然Drew Andy和Adam Arkin提出的那套纲领仅仅是给遗传线路准备的,但是以Craig Venter institute的最小生命,和Jef Boeke领衔的合成酵母基因组Sc2.0为代表的基因组合成领域,在历史发展中也采用的相同的思路也差不多。
他们使用标准化的DNA片段(相同长度与接口),以标准方式进行拼接。在设计水平上,他们使用计算机辅助设计(Computer‑aided‑design,CAD),将遗传功能元件抽象化,进行分层设计,最后实现整个基因组的设计图。在实验架构上他们完全使用了常规的工程设计的流程。只不过他们的具体的标准、标准件和设计方法的内涵,与遗传线路设计中所指代的有很大的差别。
目前从结果来看是非常成功的,绝大多数基因组通过统一的方法就可以人工合成,放到细胞里能够实现功能,只需要在局部进行纠错debug,只有少数基因组(比如戴俊彪老师在清华时负责的chromosome XII)需要专家负责重新设计特制的合成方案。未来可能出了具体的技术革新之外,并不需要什么方法论的改动。
(3)做代谢途径设计的(metabolic pathway design),以Jay Keasling,Christina Smolke的研究工作为代表。他们使用的方法,是扎根于化学工程的,因此看起来会和前两者非常不同。
代谢工程的首要目标是设计反应途径——反应物都是什么,需要哪些酶,各多少量,在什么样的“容器”和环境下进行反应,最后达到多少预期产量。
他们的测量标准和交流语言标准,不需要再人为地去发明创造,在化学和生物化学中早已有之。
而且对于代谢途径而言,他们的“标准件”,各种酶的描述和刻画,远比遗传线路中的元器件要精细和清晰得多,各项性能而也更标准得多。这里面的很多标准,就是事实上的标准(De facto standard)。
至于他们构建表达酶的遗传体系的过程里面是不是也用了Drew Endy的这套工程化方案,那是次要的。很多人诟病的代谢工程缺乏数学模型和理性设计,这种问题从化学工程开始就有。化学工程虽然和机械工程和电子工程是完全不一样的两种语言,但你不能因为这个就说他们使用的不是工程学方法了。
如雨后春笋般的合成生物学领域的创业项目,绝大多数都是做代谢工程设计的,可见一斑。现行的方法还没有要到更改的地步。
(4)蛋白质和功能核酸工程,代表包括18年炸药奖得主Frances Arnold的蛋白质定向进化(protein directed evolution),09年炸药奖得主Jack Szostak的RNA定向进化(RNA directed evolution),David Baker的计算辅助蛋白质理性设计(protein design)。他们的研究对象是蛋白质和RNA,对他们进行设计和功能改造,已经是对Drew Endy的方案里面的最小单位进行改造了,所以实践那套方案压根就是不可能的。
定向进化的创始人Arnold原来是搞太阳能的,后来学了化工,你说这里面没有使用工程学方法那是不可能的,人家就没学过别的东西……定向进化思路其实很简单,就是随机突变、大规模筛选、暴力求解,30年来其实没有什么大的变化。和自然进化唯一的不同就是,并非完全地盲目试错,这个领域解决(1)如何实现搜索规模远远比自然的遗传漂变更庞大的随机测试;(2)在天然的蛋白质功能难以测量时,怎样设计合理的筛选。——“工程师是否使用了工程学方法,不应该看他们最后产出了什么,而要看他们是如何产出的。”
目前来看定向进化是非常成功的,有很多的成功应用案例,不然怎么拿了炸药奖呢……
蛋白质和核酸的理性设计,就是基于特定的力学原理,利用计算机辅助,或第一性地、或数据驱动地,去理性设计特定的蛋白质结构。这妥妥的和土木工程一套流程,仅凭人力已经实现不了。曾经有一段时间大家认为蛋白质设计按照这个方案是搞不定的,但是最近几年David Baker实验室为主导,又产生了井喷式的突破,因此短时间内可能也不需要有什么改变。
6. 合成生物学是不是应该引入新的方法?
我个人认为是的。作为一个新兴学科,整个领域还处于一个草台班子的状态,对于很多问题我们并没有一个系统化的分析方法,也不知道什么样的工程化方案是可行的。从其他领域吸纳新的思维模式、方法、技术手段,有助于我们最终形成一个最适合于生物的工程学方法。之前【观点】从传统到构造——浅谈合成生物学的功能与研究范式一文中我也做过一定畅想,目前来看,借着深度学习的火热,将仿生学发展出来的连接主义,回引到合成生物学是非常可能的。
合成生物学本身也是有做基础研究的需求的,因此科学方法本来就是一直被使用的。
但是我不认为像Davies畅想的那样将科学方法引入工程学会有什么用,《生物学家能修好收音机吗?》Can a biologist fix a radio?—Or, what I learned while studying apoptosis 这篇文章已经说得很清楚了,
科学方法不是用来解决问题的。
以上。
本文为观点性文章,欢迎大家积极讨论!同时知乎回答仍在进行中,欢迎各位在知乎发表自己的观点!(点击原文便可直达问题界面)