Sequoia 2024年AI峰会开幕致辞:AI机遇(全文)
核心观点
我们正站在人类历史上最大的价值创造机会的起点上:1.AI的一个重要机遇是用软件取代所有服务;2.目标TAM可能是数万亿。 未来几十年将是AI的时代,前景广阔,机会无限:10到15年产生40/50个年收入10+亿美元企业。 SaaS市场用了近十年的时间才达到30亿美元,而生成式AI在短短一年内就实现了这一突破。 2024年预测:Copilots --> Agents;Planning & Reasoning;Reliability & Robustness;Prototyping --> Production。 AI的业务本质:作为一种强大的成本驱动力,它将引发一场生产力革命,使我们得以在社会的关键领域中,以更少的资源完成更多的工作。 AI对业务的价值:整个公司可能会开始像神经网络一样运作,可能会迎来“一人公司”的兴起。
-----[以下为正文]-----
Pat Grady
为了准确把握这次机遇,我们不禁要问:它究竟是什么?一年前,它仿佛是一个蕴藏着无限创意与奇迹的魔盒。在过去的一年中,我们已经经历了这种过高期望的修正过程。我们经历了巅峰般的热烈期许,也经历了破灭感的低谷,而现在,我们正奋力走出困境,迈向生产力的新阶段。
在我看来,我们已经认识到,LLM和AI今天真正能为我们带来的是三种不同的能力,这些能力交织在一起,能够构建出种种神奇的应用场景。首先,是创造能力,也就是我们所说的生成式AI。能够生成图像、文本、视频乃至音频等各种素材,这是以前的软件所无法做到的,因此颇具突破性。
其次,是推理能力。无论是单次的简单推理,还是多步骤的复杂逻辑,这同样是过去软件所无法做到的。由于它既能创造又能推理,能够像人类那样同时运用左右脑思维,这意味着软件首次能够以类似人类的方式进行交互。这意义重大,因为它将对我们即将在下一张幻灯片中讨论的商业模式产生深远的影响。
当我们面对新事物时,很多时候我们会尝试通过类比来理解它。在这种情况下,我能想到的最贴切的类比,尽管存在许多不足但仍有一定参考价值,就是过去大约20年的云计算转型。那是一次技术领域里的结构性巨变,催生了全新的商业模式、应用形态以及人与技术互动的新方式。如果我们回顾云计算转型的早期,大约在2010年左右,全球软件市场的总规模(TAM)约为3500亿美元,而当时云计算软件的市场规模仅为60亿美元。然而,到了去年,整个市场的规模已经从约3500亿美元增长到6500亿美元,而云计算软件的收入已经达到了惊人的4000亿美元。这15年间的年复合增长率高达40%,这确实是惊人的增长。
如果我们尝试用类比的方式来理解,可以说云计算是用新的软件替换了旧的软件。而由于AI具备了类似人类的交互能力,AI的一个重要机遇是用软件取代服务。如果我们瞄准的市场发生如此转变的话,那么起点可能不仅仅是数千亿,而有可能是数万亿。因此,我们完全可以憧憬这个机会可能带来的巨大变革。因此,我们完全可以憧憬这个机会可能带来的巨大变革。在此,我要提出一个假设,因为今天我们所讨论的一切都还是基于假设。我假设,我们正站在人类历史上最大的价值创造机会的起点上。
为什么是现在?作为Sequoia的一员,一大优势在于我们有着深厚的历史积淀,这使得我们得以深入研究不同的技术浪潮,理解它们如何相互作用,如何引领我们走到今天。接下来,我们将快速回顾一下这段历史。
上世纪60年代,我们的合伙人Don Valentine创立了Sequoia公司,并实际推动了Fairchild半导体的市场营销工作,这也正是硅谷因其硅基晶体管产业而闻名的起源。我们亲历了这一系列变迁。我们看到了70年代基于这些芯片建立起的系统架构;80年代芯片通过网络与个人电脑相连,以及软件套装的兴起;90年代互联网面向公众开放,重塑了人们的交流与消费模式;2000年代互联网进一步成熟,足以支撑复杂应用的运行,即我们后来所说的“云计算”;2010年代,所有这些应用纷纷入驻每个人的口袋,以移动设备的形式深刻改变了我们的工作方式。
我们为什么要分享这段历史呢?因为每一个技术浪潮都是在前一个浪潮的基础上发展起来的。AI的概念并不新鲜,它可以追溯到20世纪40年代。神经网络作为一个概念首次出现也是在1940年代。但是,将AI从概念、梦想变为现实,解决实际问题,并围绕这些要素建立持久业务的能力,这些关键要素直到近几年才逐渐成熟。我们拥有了便宜且丰富的计算资源,快速、高效和可靠的网络。全球近80亿人口中,有7亿人口袋里装着一台超级计算机。在某种程度上,由于COVID的影响,许多活动被迫在线进行,为这些便捷体验提供了海量数据支持。因此,现在是AI成为未来10年甚至20年主题的最佳时机。
我们对这个假设有着最坚定的信念:未来几十年将是AI的时代。那么,这个机遇会以什么形式呈现呢?同样,我们可以类比云转型和移动转型。幻灯片左侧的这些标志,代表了这些转型中诞生的大部分公司,它们的收入超过10亿美元。这个列表并不详尽,但它可能涵盖了这些转型中约80%的公司,它们以收入超过10亿美元的成绩脱颖而出,这里说的是收入,而不是估值。这张幻灯片最值得关注的地方在右侧,不是已经存在的公司,而是尚未出现的机会。前景广阔,机会无限。我们认为,如果我们在今天站在这里的10或15年后再次回顾,右侧将出现40或50个新的标志。很可能这些标志会代表这个房间里的许多公司。这就是机会,这就是让我们感到兴奋的原因。
Sonya Huang
哇,这是一个多么不可思议的一年!ChatGPT在一年半前问世,对在座的每个人来说,这无疑是一场科技风暴。在这个瞬息万变的时代,我们可能一直在不断前行。所以,让我们稍作停留,放大视角,回顾一下至今为止所发生的一切。
去年,我们讨论了AI将如何彻底改变各个领域,并带来惊人的生产力提升。一年后,这些变化开始变得清晰可见。有人看到Sebastian的关于Klarnas AI Assistant的那条推特吗?真是太神奇了!Klarnas现在正使用OpenAI处理三分之二的客户服务问询,相当于自动化了700个全职客服的工作。全球有数千万呼叫中心客服,而AI在客户支持领域已经找到了产品市场适应性的最激动人心的领域之一。
一年前,在法律服务市场,法律被认为是科技应用最滞后、最保守的行业之一。但现在,我们有了像Harvey这样的公司,它们正在自动化律师的许多工作,从日常繁琐任务到更高级的分析或软件工程。我相信最近相信在座不少人在Twitter上看到过相关的演示。值得注意的是,从一年前AI理论上编写代码,到现在已经出现了能够完全自主工作的AI软件工程师。我认为这真的很令人兴奋。
未来,软件将更加丰富,而AI并不仅仅是为了革命性地改变工作方式。它已经在提高我们的生活质量。前几天,我和Pat在Zoom上聊天,我注意到他看起来有点奇怪,整个过程中都没说话。经过深入思考,我相当确定他实际上是派了他的虚拟AI化身去健身房,这可以解释很多事情。它甚至还准确地模仿了我皱眉的表情。这要归功于AI技术。这真是太神奇了!这就是技术在一年内取得的进展。想到这一点真令人惊叹。想到未来十年它将如何发展,既令人害怕又让人充满期待。
两年前,当我们预测生成式AI可能会掀起下一波技术革命时,内心其实充满了未知。是否会涌现出真正的创新型公司?是否能实现真正的收入增长?如今,用户数量和收入增长的惊人势头几乎令所有人瞠目结舌。据我们估计,生成式AI目前的总收入已接近30亿美元。而这还没算上“FANG”公司(Facebook/Amazon/Netflix/Google)和云服务商在AI领域创造的所有增量收入。要知道,SaaS市场用了近十年的时间才达到这一收入水平,而生成式AI在短短一年内就实现了这一突破。
可见,生成式AI变革的速度和规模已经充分证明了其持久的生命力,而且AI在客户层面的吸引力远不止一两个应用场景;它已渗透到了各行各业。大家或许都了解ChatGPT的用户基数有多么庞大,但当你细看众多AI应用的收入及使用数据时,不论是针对消费者的公司还是面向企业的公司、初创企业还是老牌企业,众多AI产品都已经开始与客户产生强烈共鸣,并在各行业中找准了自己的产品市场定位。因此,我们对正在涌现的各种多样化的应用案例感到极度兴奋。
过去一年,至少对我而言,最令人惊讶的是资金环境的不均衡分配。如果把生成式AI比作一个多层蛋糕,底层是基础模型,上面是开发工具和基础设施,再上面是应用。一年前,我们预期由于基础层的技术突破,应用层会迎来爆发式增长。然而,事实却截然相反。越来越多的基础模型涌现并筹集到巨额资金,而应用层似乎才刚刚开始起步。
我们的伙伴David Cahn在去年的文章《AI的2000亿美元问题》(AI's $200B Question)中提出过一个引人深思的问题。如果你看看业界目前对GPU的投资规模,去年仅在采购Nvidia的GPU上就花费了大约500亿美元,而普遍的看法是,如果你建设了基础设施,用户自然就会来。AI被视为一个充满梦想的领域。但现实是,尽管已经确定了大约30亿美元的AI收入,再加上云服务商的额外收入,在这方面的投入已经高达500亿美元,再加上能耗、数据中心成本等。得到的回报仅仅是三分之一。这意味着目前的投入与产出之间还存在巨大的差距。因此,我们仍然面临一些非常现实的问题需要解决。即使AI的收入和用户数量看似惊人,但使用数据表明我们仍处于早期阶段。
对比生成式AI应用的日活跃用户与月活跃用户比率,或是一个月内的用户留存率,我们会发现这类应用与成熟的移动应用相比仍有很大差距。在我看来,这既是挑战,又是机遇。因为目前AI对大多数人来说可能只是每周或每月的小改进,而我们有机会打造让用户每天都会想用的AI应用。
我们在用户调研中发现,阻碍他们持续使用AI应用的一个重要原因就是期望值与实际表现间的落差。所以,当模型不能稳定可靠地完成用户期待的任务时,原本令人惊艳的社交媒体演示瞬间就变成了失望。不过,好消息是,去年我们投入了超过500亿美元购买GPU,现在已经有了越来越智能的基础模型可供构建。就在上个月,我们见证了Sora、Claude 3等项目的发布,周末又有Grok亮相。随着基础智能水平不断提升,AI产品的市场契合度有望加速。
与某些市场的不确定未来不同,AI的好处在于你可以清晰地看到这些应用程序如何逐步变得越来越好。我们要牢记,成功需要时间。这是我们在去年的活动中强调过的观点。以iPhone为例,最初的App Store中充满了各种有趣但轻量级的应用,如啤酒品尝应用、光剑应用等。这些最终演变成了实用程序和小工具。iPhone于2007年发布,App Store于2008年发布,但直到2010年我们才看到了Instagram和DoorDash这样的标志性应用。而2013年以后,更多的企业投入时间来发现和利用iPhone的新功能,以我们目前还无法想象的方式进行创新。
我们相信,同样的事情正在AI领域上演。我们已经开始看到一些有望成为下一个传奇公司的企业崭露头角。以下是最近引起我们注意的一些公司,我认为这比这一页上列出的用例集要广泛得多。
我们认为客户支持是企业内部率先实现产品/市场契合的几个应用场景之一。正如我在Klarnas的例子中提到的,这并非个案,而是一种普遍趋势。对于我们大多数人来说,AI的友好互动无疑是最令人惊喜的应用之一。我们花了好几个月的时间来思考这个问题,但从用户数据和使用指标来看,用户显然对此十分喜爱。接下来是企业级知识管理——我们稍后会听到更多关于Glean和Dust的信息——我们认为企业知识的应用终于开始取得突破。
接下来,让我分享一下对未来一年的几点预测。
2024年,我们将见证真正意义上的应用程序从辅助角色转变为智能化代理,不仅能为用户提供建议,还能直接协助甚至完全替代人类的角色,让AI更像一位合作共事的“同事”而非单纯的工具。这一转变将在软件工程、客户服务等领域初显成效。
LLM面临的一大质疑是,它们似乎仅是模仿文本中的统计模式,缺乏对任务本身的深度推理和精心规划。然而,随着众多新研究的涌现,如推理时计算和游戏风格的价值迭代,这一状况正在发生转变。试想一下,当给予模型足够的时间去深入思考行动方案时,会发生什么呢?我们认为,这是众多基础模型公司的主要研究焦点之一,我们预计这将使AI在未来一年内更胜任高级认知任务,如规划和推理。
我们观察到从趣味性的消费者应用或专业消费者应用(在这个阶段,用户相对不太介意AI偶尔犯错或输出离奇内容),到真正的企业级应用程序(比如医疗和国防领域),其中风险非常高。好消息是,已经出现了不同的工具和技术,能够让LLM在某些情况下达到99.9%的可靠性,其中包括RLHF、提示链(Prompt Chaining)和向量数据库。
Konstantine Buhler
Pat刚才提出了一个至关重要的问题:“为什么这件事如此重要?”为什么我们今天齐聚一堂?Sonia带领我们深入了解了“现状是什么?”——当今AI发展的现状如何?接下来的环节将聚焦于“未来会发生什么?”我们将退一步,共同探讨这将给更广泛的技术领域乃至整个社会带来怎样的意义。
技术革命有多种形式,有通信革命,如电话的兴起;有交通革命,如火车头的问世;还有生产力革命,比如食品收割的机械化。我们认为,本质上是生产力革命。这些革命遵循一定的模式:它们起始于一个人使用简单工具,进而发展到一个人与机器助手合作,最终演变成一个人运用整个机器网络。
接下来,我们将探讨的两个预测都与人类与机器网络协同工作的概念相关。
让我们以历史上的一个例子来看。镰刀作为人类的工具已经有一万多年的历史。而在1831年发明的机械收割机则是人类与机器助手的合作,即一个人操作的一个单一机器系统。如今,我们生活在一个由成千上万的机器系统共同构成的复杂网络时代。在AI领域,我们开始使用这样的语言来描述这一现象,比如将系统中的单个机器参与者称为“代理”。如今,这个话题备受关注。这些代理之间的信息传递方式、拓扑结构,我们开始将其称为“推理”。本质上,我们正在AI的基本元素之上构建极其复杂的抽象层。
我将分享两个正在知识工作中发生的实例。首先是软件开发。起初,软件开发是一个纯手工的过程,人们用笔和纸编写逻辑程序进行计算,没有机器的辅助。随着时间的推移,我们在计算方面得到了越来越多的机器辅助,不仅有计算机,还有集成开发环境和越来越多的技术来加速软件开发。我们现在正在进入一个新时代,这些系统作为一个复杂的机器网络共同工作,形成一系列联动过程,合力打造复杂的工程体系,其中的代理们不再是孤立地生成代码,而是真正实现了协调一致。
同样的模式也在写作领域得到了应用。写作原本纯粹是人与工具互动的过程,随着时间的推移,逐渐演变为人与机器助手协作,现在我们实际上在使用不止一个助手,而是一个由多个助手组成的网络。我可以分享一下我的个人工作流程,每次调用AI助手时,我不仅限于使用GPT-4,还会同时调动Mistral Large、Claude 3等不同助手,让它们一起工作,也相互竞争,以获得更好的答案。这是我们眼前正在见证的未来。
那么,这场革命对在座的每个人,乃至更广泛的群体意味着什么呢?从经济学的角度来讲,它意味着成本的显著降低。这张图展示了标准普尔500公司中需要多少工人才能产生100万美元的收入。这一数字正在迅速下降。我们正在进入一个这种趋势将继续下降的时代。这意味着什么?更快的速度,更少的人力投入。好消息是,这并不意味着我们要做得更少,相反,我们可以做得更多。在接下来的预测中,我们将详细探讨这一点。更令人欣慰的是,过去这些领域的进步都带来了通货紧缩。以计算机软件及外围设备为例,随着我们不断加深这些领域的联系,其成本实际在不断下降。电视也是如此。然而,我们社会上一些至关重要的领域,如教育、大学学费、医疗保健和住房,它们的价格增长速度却远超过通货膨胀。或许是个幸运的巧合,AI有望助力推动这些以及其他诸多关键领域降低成本。
关于AI长远发展的第一个结论是:作为一种强大的成本驱动力,它将引发一场生产力革命,使我们得以在社会的关键领域中,以更少的资源完成更多的工作。
第二个论点与一年前的一幕紧密相关,在那次活动中,Jensen Huang做出了一项颇具影响力的预测。他断言,未来,像素将不再是被渲染出来的,而是被生成的;任何一个给定的图像,甚至是信息,都将是生成而产生的。他这是什么意思呢?众所周知,现在图像都是以只读存储器(ROM)的形式存储的。以字母“A”为例,它的ASCII码是97。它被存储为一个像素矩阵,每个像素的存在与否代表着特定的信息。如果我们采用最基本的黑白两色表示,那么这些像素的状态就是存在还是不存在。
我们现在正进入一个新时代,在这个时代里,我们不再将像字母“A”这样的概念以ROM的形式存储,也不再仅仅是以像素的存在或不存在来表示,而是作为一个概念,一个多维点。我的意思是,我们应该将字母“A”的概念视为一个可泛化的概念,它可以适用于该字母的任何给定格式,在多维度的空间中,有无数不同的字体样式。我们正处于这个多维度空间的中心位置,接下来我们该如何发展呢?关键在于,计算机现在开始不仅仅理解这个多维度的点,也不仅仅理解如何将它渲染成图像,就像Jensen所讨论的那样。我们现在达到了一个新的阶段,我们将能够将这种理解置于具体的语境之中。计算机将理解这个“A”,能够渲染它,理解它是一个字母,知道它是英语字母表中的一部分,并理解这一点在更广泛的渲染背景中的含义。
计算机在看待“多维”这个词时,甚至不会去考虑字母“A”本身,而是会理解这个词出现的全部背景。令人惊讶的是,这种未来正是我们人类思考的方式。我们不再将计算机内存中的像素视为单纯的书写,这不是我们的思考方式。我不会将字母“A”视为页面上像素的存在与否。相反,我们会将其视为一个概念。这是几千年来我们在哲学上所思考的方式。正如我的希腊同胞柏拉图在2500年前所说,这种柏拉图式的形式概念是我们所有人都认同或努力追求的。在这个案例中,我们有字母“A”的概念,或者软件工程的概念,我们实际上能够围绕这个概念建立一个模型。
那么,现在我们应该怎么做呢?我们已经谈到了第二种模式,即在计算本身内部会有泛化的概念。这对我们每个人来说意味着什么呢?对于公司建设而言,意义深远。如今,我们已经将这个概念融入到了具体的流程和关键绩效指标(KPI)中。Sonya刚才提到了Klarnas如何利用这一点来加速他们围绕客户支持的KPI。他们知道他们可以朝着某些KPI努力,他们可以有一个实际上正在检索信息、生成出色客户体验的系统。而未来,这将在新的用户界面基础上发生变化,可能是一个完全不同的界面,用于实际的支持交流。
我个人对此感到无比激动,因为这个未来将会实现概念的具体呈现,一切都将通过生成来实现。最终,整个公司可能会开始像神经网络一样运作。
我来通过一个具体的例子来解释这一点。这个描述可能有些夸张,就像这次演讲中的其他内容一样,实际上一切都是连贯的,而这里呈现的是离散的、夸张的客户支持流程描述。你的客户服务部门设定了一些KPI,这些KPI由文本到语音的生成、客户的个性化等因素驱动。
这些信息将反馈到你正在优化的子模式、子树中,最终将形成一个完全连接的图。在这个模型中,你将从语言生成到最终客户服务的KPI获得反馈。在某个阶段,这将成为一个抽象层次,客户服务将由神经网络来进行管理和优化升级。然后,针对每一个特定客户的场景,是构建业务的另一个关键环节。同样地,从语言生成到增长引擎,再到广告定制和优化,各个环节都有AI的基础组件参与其中,它们相互促进着整个过程。
这里的深刻结论是,最终这些抽象层将会互相兼容,达到这样一个地步:整个公司能够像神经网络一样运作。这就迎来了“一人公司”的兴起。一人公司将使我们不仅仅是做得更少,而是能够做更多。更多的人可以解决更多的问题,从而共同创造一个更加美好的社会。
接下来会发生什么?实际上,这里的各位将决定未来的走向。你们是正在构建这个未来的人。我们对这样的未来感到非常激动,因为我们相信AI有望降低成本,提高社会中一些最关键领域的生产力——更好的教育、更健康的人口、更高的生产力。这就是今天召集这个小组讨论的目的。你们都将能够探讨如何应用我们的技术,摆脱复杂性和单调乏味的细节,实际上构建一个更为强大的未来。
--【本文完】---
近期受欢迎的文章:
更多交流,可添加本人微信
(请附姓名/关注领域)