未来生物实验室的图景
赛博科学家:科学研究中的人工智能
生物技术初创公司Zymergen 利用AI控制一项菌株培养任务,机器人手指正在选择能够产生更多化学物质的微生物菌落
人工智能不再只是一种工具,在一些实验室里,它能够构思并做实验,然后解释结果。如果说这是未来生物实验室的图景,那么今天的实验室和它已经没有什么很大的不同了。穿着白色实验服的科学家在装着冷冻试管的箱盒旁走动着,架子上摆满了各种化学品:一瓶瓶纯酒精、糖、蛋白质和盐,这些是培养微生物和操纵基因的标准配置。至于人工智能,直到你在风扇低沉的嗡嗡声中听到机器人似蛐蛐叫的声音时,你才会注意到它们的存在。
这些机器人都是为Zymergen工作的,Zymergen是一家生物技术公司,2014年建立于加利福尼亚旧金山湾东海岸的一个电子厂旧址上。这里每天都在进行着各种各样的微生物实验,以寻找提高有用化学品产量的途径。在一片杂乱的设备丛中有一个叫“回声”的机器人,它的机械臂抓起一个嵌有数百个装着液体小格的塑料块,激光扫描塑料块一侧的条形码后,“回声”将它放到托盘上。接下来发生的事情非常微妙,人眼难以观察得到。
“它吸移液体时并不是复制人手操作的方式,”该公司联合创始人之一、分子生物学家、运营工程副总裁杰德•迪安(Jed Dean)说道,“而是一种完全不同的方式。”它用一个移液管吸取以微升计的微量液体并喷射到塑料块的每个凹槽小格里(在细胞尺度上就相当于潮汐波浪般的水量了),事实上机器人从来没有接触到它,而是通过每秒500次的声波脉冲使液体自身产生涟漪,吸移比人类传送操作时小到1‰的水滴。
以上情景并不是在未来发生的。一些大型生物实验室使用机器人和条形码已经有多年历史,被称为声波液滴喷射(ADE)的液体移动技术甚至已经存在了几十年。当问及实验机器人目前正在做什么实验的时候,迪安透露说,这个实验不是他设计的,而是一个计算机程序的输出结果。
发现自动化
“我想让一切都清楚明白,”Zymergen首席执行官约书亚•霍夫曼(Joshua Hoffman)说道,他指的是一个长期以来的误解。他说,“在这个决策圈里有一位人类科学家,观察结果并进行真实性检验。”但是,在数据解释、假说产生以及实验计划制定方面,最终的目标是“摆脱人类的直觉”。
Zymergen是有着相同目标的几家公司之一:利用人工智能(AI)来增强或取代人类在科学过程中的作用。“说起人工智能,人们就会想到机器人下棋。”该公司首席技术官亚伦•金伯尔(Aaron Kimball)说道。“我对ML很满意,”霍夫曼说,ML指的是机器学习,是计算机科学的一个分支,它几乎包揽了AI最新进展的所有成果,“AI渗透进了所做的一切事情。”
自动化的发现之路
Zymergen实际研究开发的工业微生物,最终为生物燃料、塑料或药物提供原材料。为了提高生产效率,一些公司将他们主要的菌株样本送到Zymergen,然后由机器人对每种微生物的基因组进行探索和修改,以便设计出生产效率更高的产品。“问题是,被送到Zymergen的微生物本身已是高度优化的。”霍夫曼说。经过多年的研究和培育,这些细胞对于它们所要做的事情已经非常擅长。因此,要“挤出”更高的效率需要深入研究基因组,做很多次的实验,并且跟踪每次实验的数据;换句话说,就是要搞科学研究。Zymergen试图加速科学研究的进度。霍夫曼说道,在传统生物学研究中,“一个人站在实验台前,对各种假设进行测试,但数量终究有限,比如说每个月可以测试10种假设。”而让机器人来做这样的工作就快多了,Zymergen运行的机器每周可做多达1 000次实验。但是机器人只会遵照人类的指令行事:如何给它们提供正确的命令才是真正的瓶颈。
当有人问如何通过算法设计实验时,金伯尔从一个简单的前提开始说起,“比如原来的微生物有大约5 000个基因,假设有10种方法可以改变某个基因,那么你就需要做50 000次实验来进行尝试,实验性的“战役”一开始就要培育1 000个菌株,每一株都有一个有意为之的突变。”他说,“每一株都生活在一个小水滴里,你要给它喂糖,让它‘烹调’一段时间,然后检测可以获得多少产品。”其中可能会有25株能够产生稍微多一些的目标化学物质,这些菌株成为下一轮实验的“种畜”,其余的则存放到冷冻室。“但发现之路绝不会是平坦的。寻找正确的突变组合需要对遗传基因的整体‘景观’进行漫长而曲折的探索,”金伯尔说,“盲目地朝着效率顶峰的方向走去,永远不会实现真正重大的登顶。这是因为如果你只是把所有产生微小改进的突变结合到一种微生物中,它们不会有大的增益。相反,微生物还会‘生病’,远远不如原来的菌株健康。”在选择正确道路的过程中,需要绕过许多曲折的歧路旁道,才有可能抵达广阔的山谷,需要心中拥有一种同时显示所有突变影响的心理地图,一种三维的、包括成千上万突变的心理地图。机器学习需要时刻保持导向。但这里关键的区别在于:当机器人最终发现能促进化学产出的基因变化时,人们对生物效应背后的生物化学却仍然毫无头绪。
机器取代人类?
如果实验不能加深我们对生物学原理的理解,那真的是科学吗?但对于金伯尔,这并不是问题,“我们能得到回报,是因为它可行,而不是因为我们明白为什么。”
霍夫曼说道,至目前为止,Zymergen的机器人实验室将生产效率提高了10%以上,这个增长幅度听起来可能并不算多,但对于以微生物发酵为基础的年产值1 600亿美元的化学工业部门来说,这一点提高转化的经济效益,比国家科学基金会每年70亿美元的预算还要多。机器人发现的占有优势的遗传变化代表着真正的发现,包括那些人类科学家可能还没有确认的一些发现。例如,大多数促进产出的基因与合成想要的化学物质没有直接关系,其中一半没有已知的功能。“我已经在几种不同的微生物中看到了这种模式,”迪安说,在没有机器学习的情况下,找到正确的基因组合就像在保险箱的转盘上试图用数千个数字破解密码一样,“我们的直觉在复杂性面前很容易一触即溃。”到底有多少科学可以委托给机器学习系统,这取决于你问的是谁。“很多。”加利福尼亚大学研究基因组学的计算机科学家伊利亚斯•塔格科波洛斯(Ilias Tagkopoulos)说,“如果没有理由,我们就不能让数据决定我们下一步应该做什么实验,从而最大限度地提高信息的获取率和接近我们的目标。”它看似无穷无尽的应用包括预测改变医院环境的细菌的进化,以及设计更健康美味的休闲食品等,基本上包括任何复杂的优化问题。
如果机器真的能在某些科学任务中取代人类,许多科学家都将欣然接受。与工人或出租车司机不同的是,大多数研究人员都喜欢自动化部分工作。特别是在分子和细胞生物学领域内,诸如喷出液体、电镀细胞、计数菌落等手工操作,都是相当繁琐和昂贵的。某位研究生最微不足道的一点小小的失误或计算不精确,都有可能会浪费数周的工作成果。在更糟糕的情况下,为那位学生设计实验的博士后的草率决定,甚至可能会导致几个月的辛勤劳动付之东流。
然而,一些生物学家在用人工智能解释数据和设计实验后,却发现它并没有想象中那么理想。“我们发现,现有的机器学习方法仍然不足以完成这个任务。”加利福尼亚斯坦福大学计算生物化学家莱朱•达斯(Rhiju Das)说道,他的研究领域是分子折叠和新药物设计。“与利用同样数据的人类相比,它们在RNA设计问题上失误得可怕。”尽管他不知道这是为什么,但涉及“设计”的任务似乎更需要人类的直觉。也许Zymergen碰巧遇到了一些生物学中极少见的非常适合计算机控制的部分实验。加利福尼亚门洛帕克的Transcriptic是另一家探索自动化的生物技术公司,它的创始人之一马克斯•霍达克(Max Hodak)也意识到了这种方法的局限性,他相信机器人可以承担实验室很多单调乏味的工作。但他说,“如果你还在用你的双手做事,那你就不是在做科学研究。”但生物学家的大脑不会很快被取代,因为自然世界是如此的复杂。霍达克说道,“进化带来了生物物种的丰富性,但这也是为什么它这么难以理解,它具有不可简约、不可还原的复杂性。”为了设计更好的实验,人工智能可以给生物学家一些有限的帮助,但他担心外包更多的科学过程将“比我们想象的复杂得多。”霍达克说。
即使人工智能控制研究工作能够行得通,人类会明白计算机发现了什么吗?结果背后的计算可能仍然是一个黑匣子。“一个引人注目的可能性是,我们正在结束一个‘可理解的’科学时代。”宾夕法尼亚匹兹堡市卡内基梅隆大学与分子生物学家进行合作研究的计算机科学家阿德里安•特里尤勒(Adrien Treuille)说道,研究人员对计算机的依赖可能不仅是做科学实验,而且还要对它做出解释,生物学理论的一些证据是如此的复杂,接受这些证据需要对计算结果有信心才行。
既然如此,科学家是否应该把他们的计算机也作为论文的合著者呢?“我当然不会这么做,”波士顿一家利用人工智能进行科学发现的Nutonian公司的首席执行官迈克尔•施米特(Michael Schmidt)说道,但他又加了一句,“嗯,当人工智能可以读并能理解报纸的时候,它们就能成为作者了。”