生物是人工智能改变世界的拍档
我们正生活在人工智能革命和生物革命的交叉时代。消失的龙(missing dragon) 与隐藏空间(latent space), 是我之前随手记在笔记本上的两个词,代表合成生物技术和人工智能之间诗意的纠缠。
每一个新技术刚刚出现并开始萌发的时候,人们总是难免会去想象用这个技术去做现在这个时代人们喜欢做的“已知的事情”,而很快这个技术就会找到它真正的使命和归宿,打破大多数人的想象。
人工智能在未来一些年可能就是这样。而它真正的归宿可能还是与生物为伴,在最微观的隐藏之处发现,以及最浩瀚的宇宙中寻找,那里是它的乐园。
我可以想象在不久的未来,人们会崇拜AGI,也会崇拜月球,火星,太阳能,元素的能量,猛犸象,龙,纳米自组装材料,仿生人,telepathy, swarm intellience 等等。
人类的上线就是我们想象力的边界。
今天我分享的这篇文章依然是有关于 “ abundance 繁荣 ” 和 " hope 希望 "的系列,来自于聚焦在生物技术和人工智能领域的科技博主 Elloit Hershberg, 他在斯坦福大学读基因工程的博士学位,同时运营自己的科技博客 Century of Bio, 英文原文请点击阅读原文或者查看 Elloit Hershberg 的博客。Enjoy!
物理世界的预言
Physical Predictions
通过生物和人工智能改造世界
Transforming the world with biology and AI
作者:Elloit Hershberg
翻译:范阳 + 人工智能翻译 Deepl
2023年1月9日
人工智能正在改变着数字世界。机器学习现在可以解释复杂的图像和人类语言。它们还可以生成(generate) 美丽的图像和语言 -- 有效地将我们推进到一个无尽延伸的媒体世界(Endless Media)。虽然这将永远改变我们的数字生活,但物理世界还没有受到同样的影响。一个主要的例外是生物( biology,范阳注:在这里 biology 不只是生物学作为一种自然科学,也包括生物技术,利用生物的能力和智能创造物质的技术)。在此,我将提出以下主张:
生物是使用人工智能改造物理世界的最有力的方式。
Biology is the most powerful way to transform the physical world using AI.
要理解为什么这样说,重要的是要研究我们正在谈论的底层技术。人工智能正处于一场革命之中。经过几次错误的热潮和人工智能的冬天,AI 终于开始真正发挥作用。人工智能现在是许多数字产品的核心,包括像谷歌搜索这样广泛被大众使用的系统。推动这场革命的主要突破被称为深度学习(deep learning)。
深度学习是一个受生物启发的算法(biologically inspired algorithm) 的例子 -- 模型被称为人工神经网络。它们由单个神经元组成,这些神经元在一系列的层中连接。模型被训练成使用实例数据(example data) 来执行任务,而不是被明确编程。训练过程会调整神经元之间的权重。该领域的关键见解是,扩大训练数据量和网络中的神经元和层的数量可以达到惊人的效果。更多会导致不同(More is different)。
这个模型的另一个关键细节是,网络中的节点之间存在着非线性激活函数(nonlinear activation function)。虽然这似乎是一个小的数学细节,但它与主导科学和统计的经典线性模型有着重要的区别。一张图片和它的适当标签之间没有明确的线性关系。通过在图片中引入非线性,神经网络能够逼近任何令人难以置信的复杂函数。事实上,有一些定理表明,在给定足够的数据和规模的情况下,神经网络能够逼近几乎任何函数。
深度学习有效地引入了一种新的编程范式。对于像图像识别这样的问题,人类实际上不可能编码一个考虑到所有可能的边缘情况的函数,我们可以训练计算机使用数据学习近似的解决方案。安德烈-卡尔帕斯(Andrej Karpathy,特斯拉前人工智能技术总监)将这个过程称为编程2.0(Programming 2.0) 。
这种范式在数字世界中产生了真正令人难以置信的结果。自从我开始编程以来,我一直对人工智能感到兴奋,但没有想到,到 2023 年,Github Copilot将为我编写近一半的代码。我也没有完全预料到人们可以使用像 Dall-E 2这样的系统从文本提示词(prompts) 中生成美丽的艺术。正如智慧的 Yogi Berra曾经说过," 预测是很难的,尤其是对未来的预测 "。
在物理世界( physical world ) 中,现实要复杂得多。两个例子是机器人技术和自动驾驶汽车方面的努力。在机器人方面,人们对深度学习的一个分支,即强化学习(reinforcement learning),感到非常兴奋。但进展比人们最初预期的要慢得多,特别是在学术实验室之外的部署。OpenAI 在 2021 年关闭了他们的机器人项目 -- 该公司创造了许多我迄今为止提到的令人惊叹的系统。同样,自 2012 年以来,自动驾驶汽车也被预测为只有几年的时间就可以进入真实世界。
是什么解释了人工智能在比特和原子之间的这种差异?深度学习总是能得出近似的解决方案。这种模糊性对于模拟我们的视觉系统很有效,或者生成语言 -- 在复杂的汽车软件内部运行时,模糊性的问题就大了。在数字世界中,如果Github Copilot 的代码建议是错误的,我可以随时按下退出键,或者在我对第一张图片不满意的情况下生成一张新的图片。
如果拉长时间来看,我相信这些都是可以解决的问题。机器人和自动驾驶汽车都拥有令人难以置信的前景。
然而,我的论点是,生物才更适合于人工智能。
Biology is a much more natural fit for AI.
在生命科学领域,神经网络的模糊性是一个特点(feature),而不是一个错误(bug) 。人工智能公司 DeepMind 的首席执行官 Demis Hassabis 提出过以下主张:
“ 在其最基本的层面上,我认为可以将生物视为一个信息处理系统,尽管是一个异常复杂和动态的系统。从这个角度来看,生物学和信息科学之间可能有一个共同的基本结构--两者之间的同构映射(isomorphic mapping) -- 因此公司的名字 DeepMind 也是如此。生物学可能太过复杂和混乱,不可能被封装成一套简单的整齐的数学方程式。但是,正如数学被证明是物理学的正确描述语言一样,生物可能被证明是应用人工智能的完美领域。”
范阳注:Paul Graham 在1月9日的推文,“ 如果要让我预测在2020年代会彻底改变世界的技术,我很难在 AI 和可控核聚变之间做选择。但是往往预测都是错的,可能是第三个答案。我想这个答案就是生物。”
支持这一论点的证据正在迅速增加。在大分子层面上,深度学习已经是对DNA、RNA和蛋白质进行建模的最先进技术。在细胞和组织层面上,预测更复杂的功能也是如此。生物系统是非常复杂和非线性的 -- 这使得深度学习解决方案有可能大大超过我们试图用数学或代码手工创建的模型。
生物有另一个人工智能需要的基本要素 -- 丰富的数据。
(范阳注:这里我的思考,生命科学和生物技术会提供给人工智能全新维度的数据,生物体和生物圈,包括人,微生物,植物,动物等等还将提供给人工智能有关身体,心理,意识等我们还只是浅浅涉猎的数据,去帮助我们decode biology 和 consciousness )
正如我在 Sequencing, Synthesis, Scale, Software 系列中所论述的那样,我们正生活在一个历史上前所未有的时期,我们用于解码生命系统的工具的改进速度甚至超过了摩尔定律。因此,生物正朝着成为地球上最大的数据发生器的方向发展。这与人工智能革命完美地融合在一起,因为使这些机器学习模型产生神奇事物的主要组成会是“互联网规模的海量数据”。
人工智能应用在生物的另一个重要优势是,生物系统对错误和噪音的适应性比人类工程系统要强得多。生物学的适应性对于生存是至关重要的。生命系统的灵活性和可塑性要比人工系统强得多。人类工程往往依靠 "九个九 "的精度(99.9999999%)来有效运作。与自动驾驶汽车不同,人工智能在达到这种精确度之前就能对生物医疗和合成生物学产生巨大影响。
未来充满希望,因为生物是改造物理世界的最有效的方式。
Biology is the most effective way to transform the physical world.
生物实际上帮助我们的星球创造了生命的土壤,并建立了一个包括我们人类在内的全球生物圈。生物有能力进行行星规模的分布式制造。我说的是Viriditas,即 " 持续的压力,向模式推进。物质中的一种趋势是演化成越来越复杂的形式。这是一种模式引力,一种神圣的绿化力量,我们称之为Viriditas,它是宇宙的驱动力。生命,你看。"
随着我们开发出越来越强大的生物学人工智能模型,我们可能会成为这个庞大而强大的系统的管家。这为改进物理世界带来了巨大的潜力。生物能够在必要的规模上运作,以减轻气候变化的后果,并能使我们走向更可持续和有弹性的生产方式。当然,人类的身体作为生物系统,这也将有利于我们自己的健康。
对于蛋白质来说--它是生物系统的组成部分--我们已经看到了不可思议的进展。据说新的蛋白质人工智能模型正在 "改变生物分子结构预测和设计领域"。当我们从蛋白质,到细胞,甚至是生物体,这将是什么样子?我不确定,但我认为个人生物制造器( Personal Biomaker,范阳注:就像上一个时代的家用个人电脑一样,个人生物制造器可以让个人和家庭变成一个“生物精酿生产车间”,甚至放在家里的厨房桌子上 ) 或解剖编译器(Anatomical Compiler) --这两者在人工智能时代似乎更具体--会对世界产生比ChatGPT 或其前身更大的影响。
随着基础科学的发展,也将出现巨大的商业机会。哪些类型的商业模式对 AI-first 的生物公司来说将是有意义的?最有见识的人工智能投资者之一 Nathan Benaich,主张建立他所说的 "全栈式机器学习公司"。
(范阳注:有关 “ 全栈式机器学习公司 ”这个概念,可以参考这篇英文文章:
https://www.nathanbenaich.com/blog/the-full-stack-machine-learning-startup )
其核心思想是,获取一个新的人工智能模型的全部经济价值的最佳方式是将其直接整合到一个产品中,而不是将其授权给另一个用其创造产品的公司。
( 范阳注:同理也应用于很多其他新兴高科技领域,比如合成生物技术,先进材料科学等,充分实现技术的潜力以及加速技术允诺的未来远景,领军的公司会是 full-stack startup, 从核心技术开发到终端产品和品牌一体化建设的创业公司。)
从这个角度来看,AI-first 的生物医疗公司( Recursion、Exscientia 等)是将机器学习预测进行商业化的最有希望的领域之一。如果人工智能真的能更快地制造出更好的药物,那么创造巨大价值的道路就显而易见了。将有许多机会创建深度整合的人工智能驱动的生物技术公司,甚至超越医药本身。人工智能有可能在加速研发时间表和降低所有类型的生物产品的成本方面发挥重要作用。虽然几乎肯定会有很多噪音,以及资本涌入这个领域,但在这个交叉点上也有一个真正的机会,让代表下一个时代的公司出现。
去年,NotBoring的Packy McCormick 和我对使用人工智能加速生物技术的尖端公司进行了几项投资。今年,是时候帮助这些公司讲述他们的故事了。当见到这些优秀的创始人时,他们正致力于建立对地球存在的问题有高度影响的解决方案,很难不感到乐观。我想分享一些这种乐观情绪。希望这些即将到来的故事能够帮助说服你相信 ——
生物是利用人工智能改造物理世界的最有力方式。