知名海外投资人谈AI新趋势

Original 凯瑞kerry SV Technology Review 2024-04-14

去年11月ChatGPT横空出世之际，美国媒体人Mario Gabriele访谈了十位海外VC投资人，包括Reid Hoffman、Saam Motamedi、Sarah Guo、Lan Xuezhao、Matt Turck、Leigh Marie Braswell、Nathan Benaich、Rob Toews、Cat Wu和Michael Dempsey。每位投资人都从自己机构和个人角度预测AI未来发展趋势，还提到自己已经下注的人工智能公司。6个月后的今天，大部分预测已经得到验证，几家公司已经获得多轮融资，有的已经成长为新的独角兽（比如Synthesia）。我们一起来看看这些趋势未来是否继续延续，提及的公司是否会继续成长。enjoy~

Mario Gabriele，

Founder at The Generalist

无所不能的合作伙伴。人工智能已经在简化插图、写作和编码方面发挥作用。它可能很快成为所有知识工作者的助手。未来，我们可能会在律师、金融分析师、建筑师等领域看到类似GitHub的“合作伙伴”功能。

追踪价值积累。由于人工智能初创公司通常依赖于像GPT-3或Codex这样的公开可用模型，一些人对它们的可持续性表示质疑。根本问题集中在价值积累上。利用GPT-3的应用程序是否能成功捕获价值？还是这种价值将积累到基础层？

超越文字和图像。GPT-3和DALLE-2因其自动化文本和图像生成的能力而受到应有的关注。尽管如此，人工智能在生命科学领域可能带来最具影响力的用途。人工智能可用于设计更好的药物或运行更高效的临床试验。

改进人机交互。与人工智能的交互通常采用用户输入“提示”文本框的形式。尽管使用简单，但可能需要更多的控制来发挥技术的力量。挑战在于在不引入不必要的复杂性的情况下实现这一潜力。应用程序需要流畅、富有创意的界面才能蓬勃发展。

解决劳动力短缺问题。随着社会需求的增加，熟练劳动力短缺。例如，熟练焊工需求每年增长4％，而供应下降7％。由人工智能驱动的机器人可能是解决劳动力短缺问题的一部分，可以自动化焊接、建筑和其他体力劳动任务。

趋势一：

提升人类的工作效率

还有什么职业比"艺术家"更典型地代表右脑思维？或者有什么职业比"程序员"更典型地代表左脑思维？

对于我们来说，过去一年的快速发展，尤其是在大型语言模型领域的发展，令人印象深刻。现在它们正为各行各业的专业人士提供动力，大大提高了生产力、影响力和价值。

对于艺术家来说，我们有像OpenAI的DALL-E、Midjourney等人工智能图像生成工具。对于程序员来说，我们有微软的GitHub Copilot，它帮助软件开发人员在许多目前最流行的计算机语言中编写、测试和优化代码。

尽管一些人对人工智能持怀疑态度，认为大型语言模型只是一种粗暴的预测机器，无法赋予计算机类似人类智能或意识，但我们在实践中看到的是，这类人工智能工具已经开始深刻地提升了人类的繁荣。

Copilot为开发人员和DALL-E为各类视觉创作者所做的，就是减少或消除工作中单调、耗时但仍然至关重要的方面。当然，这种动态并不仅限于软件开发人员和艺术家。大型语言模型是通过大量文本数据进行训练，然后将所学内容结合起来，生成符合上下文的统计概率输出，以响应用户提供的提示。因此，虽然GitHub Copilot是通过摄入大量计算机代码进行训练的，但对于几乎任何职业来说，都有可能出现不同版本的Copilot。

例如，律师的Copilot可以帮助他们根据自然语言查询、先前的案例和最佳实践起草合同、动议、案情陈述和其他法律文件。它还可以提供相关的先例、法规和引用，或者指出现有文件中的潜在错误、不一致性或风险。

建筑师的Copilot可以帮助他们根据规格、限制和目标设计、建模和优化建筑和结构。它还可以生成交互式可视化，并帮助评估项目的环境、社会和经济影响。

想象一个世界，在这个世界上，成千上万行业的数百万专业人士都使用特定领域的Copilot版本，以更快、更高的速度提升生产力、准确性和创造力。在这个世界里，各行各业的专业人士可以使用我们投资组合公司Adept的通用工具Action Transformer，通过界面来描述他们想要用简单语言完成的任务，从而利用所有已经编写的应用程序、API或软件的功能。

在对未来的末日幻想中，技术，尤其是人工智能，常常被描绘为导致更加两极分化的力量，大多数人将被机器剥夺权益、边缘化和贫困化。

然而，在我们今天真实发展的世界中，新的人工智能工具以前所未有的方式有效地使能了便利和效率的民主化。通过这样做，它们使个人专业人士能够实现新的生产力水平，整个社会也能获得超过工业革命所带来的收益。不仅如此，人们还会发现他们的工作更有吸引力和满足感，因为他们将有更多的时间专注于最具创造力、战略性和新颖性的方面。

这个未来已经到来。在五年内，每个主要行业都将有一种人工智能增强工具。这些工具可以促进不同行业的人类优秀表现——包括右脑、左脑和其他任何大脑。

Reid Hoffman，Greylock联合创始人

Saam Motamedi，Greylock合伙人

趋势二：AIGC与生命科学

又一个炎热的夏天过去了，人工智能领域出现了新的研究集体，以前所未有的速度开源了由大型中央实验室开发的突破性人工智能模型。尽管这些文本到图像/视频的模型提供了捕捉我们想象力的病毒级消费品，但这些模型最有影响力的应用可能不是它们的一阶效应。我认为，构建的最佳领域是人工智能和科学的交叉点，特别是在生命科学领域。

如今的科学方法坚实地基于数据驱动的实验。我们可以生成的用于解释生物系统的数据的分辨率和规模不断提高，同时发展了能够建模人类语言、自然图像或社交网络图的人工智能模型架构。这些架构可以直接应用于建模蛋白质的语言、细胞的图像或化学分子的图形。这种奇特的泛化能力正在推动蛋白质结构预测和药物分子设计方面的突破。人工智能正在推动一代新的技术驱动型生物技术公司（“TechBio”），攻击价值万亿美元的制药行业，以更快、更低成本地提供改进的药物。

我与Air Street Capital一起，在推动这个行业发展的公司上进行了大量投资。我支持的其中一家公司是Valence Discovery，他们开发了生成设计方法，用于创建以前因设计复杂性而无法实现的新型有效药物分子。Valence正在与领先的研究机构开展超大规模的生成化学计划，以推动当今药物设计领域的生成式人工智能方法的界限。

在这个领域的一位创始人是Ali Madani，他在Salesforce Research领导了一个名为ProGen的蛋白质工程人工智能计划。在那里，他开发了专门应用于设计全新人工蛋白质的大型语言模型，这些蛋白质重现甚至超越了自然存在的同类蛋白质的功能。该团队生成了第一个由人工智能生成的蛋白质的三维晶体结构。蛋白质是所有生命的功能执行器，这样的技术可能会带来巨大的可能性。

Nathan Benaich，Air Street Capital总合伙人

趋势三：

协作人机交互

大型语言模型（LLM）是我们见过的最强大的工具之一。我们仍然在集体测试这些模型的指导边界。聪明的提示工程迅速成为极客们最喜欢的运动。（“让我们一步一步思考”的提示几乎滑稽地增强了模型的推理能力。）

但自然语言并非万能之策 - 我们仍然在盲目地发布命令，没有手册可依。在提示中没有明确的指导性、连贯的抽象概念，没有明显的地图来导航模型的“潜在空间”，只有大量的试错和巧妙的技巧。

为特定行业用户简化工作提升效率的初创公司已经获得了回报。一个例子是Jasper为生成营销文案提供模板化提示。我们现在还处于早期阶段，正如大多数语言模型产品暴露给用户的“抽样步骤”和“种子”的不透明概念所示。

几乎每个拥有互联网访问权限的人都很快将在日常任务中间接使用大型语言模型。至少，搜索将被彻底改变，按需提供答案和摘要。我们还应该看到基于LLM的工具，设计得更加精通和深入互动。创意人员已经希望生成的图像在结构上可操作，而工作者则希望获得可靠的输出而不产生幻觉。许多人可能希望他们的AI助手具备特定的知识。这些是为知识工作者释放生产力的复杂的“思维自行车”。

Ilya Sutskever将“提示”视为一个暂时的术语，仅因为我们的模型存在缺陷而相关。我认为他是正确的（因为他通常是正确的），我们的模型将越来越能够理解意图。但一个根本性的问题是，人类的意图并不总是确定的；它往往是迭代的、探索的。随着模型参与需要这种思维的更复杂任务，我猜想理解工作流程并实现更多定制化的控制和反馈对于创造最终用户价值至关重要。改进用户体验的早期想法包括模板、用于选择生成结果的用户界面，添加更多约束的能力，控制上下文长度，链接处理过程中的中间控制，以及暴露模型的“思考过程”。

一些企业家和投资者对于是否可以建立基于他人模型的商业价值感到绝望，但我们对于如何与人工智能互动只是刚刚开始。在领域上可能存在差异，并且研究人员不太可能满足每个用户的需求。难道这些强大模型的唯一界面将永远是一个简单的静态文本框吗？我认为不会，而在其中就蕴藏着一个产品机会。

Sarah Guo， Conviction创始人

趋势四：AI 视频创作

生成式人工智能（Generative AI）如今非常流行，原因充分，因为它确实非常令人兴奋。除了技术实力之外，通常的商业问题也适用：你能否通过生成式AI构建出比其他方式解决问题更好10倍的产品？你能否逐渐建立起具有竞争优势的可持续发展优势？

在我（带有偏见的）观点中，视频创作平台Synthesia是如何在生成式AI基础上构建一个令人激动的业务的绝佳例子。在Synthesia中，用户只需输入几行文本，点击几个按钮，然后哇！几分钟内就会出现一段专业的视频，其中一个虚拟人物以60种语言之一叙述着文本内容。

Synthesia用于各种企业用例，尤其在入职培训方面取得了显著的进展。对许多客户而言，曾经的替代方案是发送很少有人阅读的长篇PDF文件，或者花费成百上千万美元来制作由演员、导演、摄像机和后期制作团队创作的专业视频。

通过生成式AI，Synthesia大大减少了创建业务视频所需的工作量、时间和金钱，或许可以减少100倍，并使任何人都能够轻松创作视频。此外，它还构建了自己的专有AI技术——其两位联合创始人都是AI教授，并拥有强大的内部研究团队。虽然公司已经利用了大型语言模型，但它避免了像直接在GPT-3上构建应用程序的初创公司所面临的平台依赖性问题，为长期具有竞争优势和行业领导地位铺平了道路。

Matt Turck，FirstMark董事总经理

趋势五：自动代码生成和应用开发

现代机器学习（ML）的进展速度似乎一直很快；仅仅十年前，一种深度学习模型首次赢得了最受欢迎的计算机视觉竞赛。然而，当GitHub在2021年底发布他们的“AI对编程员”Copilot产品时，许多人（甚至包括我这样从事ML工作的人！）都对今天的深度学习模型已经能够为高技能软件开发人员自动补全代码感到震惊。在开发人员用于编码的界面内，Copilot建议如何完成一行代码，甚至可以根据纯文本描述生成多行代码。一些使用Copilot的工程师声称它每天为他们节省了数小时的时间，甚至能够自动编写他们40%的代码。

Copilot是使用OpenAI的Codex大型语言模型（LLM）构建的，它将自然语言翻译成许多流行的编程语言，并使用数千万个公共GitHub代码存储库进行训练。OpenAI是一家总部位于旧金山的人工智能研究公司；它于2015年作为非营利组织成立，于2019年转为盈利性公司，然后从微软（后者于2018年收购了GitHub）获得了10亿美元的资金用于研究。作为回报，微软获得了一些OpenAI的LLM的独家访问权限，包括Codex。

最终，Copilot提供了令人信服的证据，证明当前的机器学习能力可以自动化越来越多的代码生成和应用开发。新成立的初创公司和老牌公司已经开始解决产品构建过程的多个方面，包括自动化代码审查、代码质量改进、Shell命令自动补全、文档甚至前端和网站生成。

一个在这个领域的早期初创企业的例子是Grit。Grit完成了任何公司最令人害怕的工程任务，通常被称为“技术债务”。当开发人员为了更快地推出功能而采取编码捷径时，就会累积这种债务，从而牺牲了长期的可靠性和性能。Grit的产品充当一个自动化开发者，修复许多常见问题，并根据建议的代码更改接受人工反馈进行改进。通过将静态分析与LLMs结合起来，Grit的愿景是创建自我维护的软件。

考虑到这项技术改变软件开发的潜力，多个投资者已经编制了相关公司列表，许多其他初创企业正在秘密建设。其中一些初创企业利用Codex API进行开发，并通过独特的产品体验和专有数据轮动来实现差异化。其他企业则从头开始构建自己的模型或对开源模型进行微调。随着这些公司的成熟，AI基础设施提供商和AI应用本身之间的价值大多数将变得更加明显。

Leigh Marie Braswell，Founders Fund负责人

趋势六：临床试验中的数字孪生

人工智能将改变我们使用药物治疗人类疾病的方式。

当人们谈及人工智能和制药时，最常被提及的应用就是用于药物研发的人工智能。这是有充分理由的：基于人工智能的药物研发具有巨大的潜力。

但还有另一个引人注目的机器学习应用场景，虽然没有得到广泛报道（也没有得到如此热情的资金支持），但承诺能够更快、更有效地将改变生活的治疗方法带到市场上，造福数百万患者。这就是在临床试验中使用数字孪生体。

目前已经有大量的证据表明，临床试验效率低下且昂贵，平均而言，一种新药需要花费十多年和20亿美元才能上市。在推动一种药物通过临床试验过程中，招募试验参与者是一个主要障碍。一项试验需要招募数百到数千名志愿者来填补实验组和对照组。这已经成为一个重要的瓶颈。80%的临床试验会出现与招募相关的延误问题，试验赞助商每天延迟一项试验可能会损失高达800万美元的潜在收入。每年有数百项临床试验因患者招募不足而被终止，事实上，这是临床试验终止的头号原因。

"数字孪生体"为这一挑战提供了一种革命性的解决方案。基本概念很简单：生成式机器学习模型可以模拟临床试验中患者的安慰剂效果。这可以在个体患者水平上进行：在试验的实验组中，可以为每个人类试验参与者创建一个数字孪生体，模拟如果该个体参与对照组，他们的表现如何。

至关重要的是，这意味着制药公司只需要招募更少的人类参与者，因为大部分对照组的患者群体可以由数字孪生体来替代。这使得临床试验变得更快速、更便宜，能够更快地将改变生活的治疗方法带到市场上，并惠及数百万有需要的患者。

总部位于旧金山的Unlearn是一家处于这一变革性技术前沿的人工智能初创企业。Unlearn目前正在与一些全球最大的制药公司合作，包括默克集团，后者正在采用这家初创企业的数字孪生技术加速其临床试验。今年早些时候，欧洲医药管理局（相当于美国FDA）正式批准了Unlearn的技术在临床试验中的使用，这是对该技术具备大规模部署能力的主要监管认可。

未来几年，预计制药和生物技术公司将把数字孪生纳入其临床试验方案的标准做法，以加快治疗药物上市的过程。

值得注意的是，临床试验中的数字孪生是生成式人工智能的一个引人注目的例子，尽管与时髦的文本到图像模型无关。为个体患者生成模拟的安慰剂结果是生成式机器学习模型如何对现实世界产生巨大影响并创造数十亿美元价值的极好例证。

Rob Toews， Radical Ventures合伙人

趋势七：因工作流而来，因个性化而留

随着越来越多的用户与生成式人工智能模型互动，我们对人工智能最直接可解决的问题有了更深入的了解：那些已经有大量训练数据的问题；在这些问题中，99%的准确率非常有用，而1%的错误不会造成灾难；同时，在这些问题中，基础模型可以不断地吸收人类反馈并随着时间变得更好。随着人工智能越过鸿沟进入主流，直观的工作流将推动其广泛应用，使那些对人工智能不太熟悉的人能够迅速看到其价值。

在下一代人工智能创业公司中，最佳产品将由专注于工作流设计和根据用户反馈微调模型的创始人创建。

符合这一模式的两类创业公司是人工智能代理和AI增强的SaaS。人工智能代理将完成重复的知识工作，无论是律师、工程师、会计师还是医生等。AI增强的SaaS将依赖于人工智能层，以从现有的工作流中获得更多的价值，例如，在已经收集音频数据的平台上添加转录和摘要，或者在SaaS应用中添加语言接口以简化流程。在这两种情况下，人类仍将进行监督，以确保输出质量。用户将提供积极和消极的反馈，这些反馈将被捕捉并用于调整模型。

获胜的创始人将通过创新当前提示和自动完成模式之上的界面和工作流程，为用户提供高度控制和低认知负荷。这些工作流将通过模板或专门的可组合模型加速常见用例，同时确保对于不常见的边缘情况，可以提供备选方案。用户不需要理解模型的工作原理或调整自己适应模型。当用户与产品互动时，接受答案生成的数据将自动反馈到推动个性化和保留的数据循环中。

这些初创企业将专注于其核心竞争力，并将通用人工智能模型的开发交给研究实验室和开源社区，后者已经发布了非常有能力的模型。我们已经看到了像Stable Diffusion这样的文本到图像模型，像Whisper这样的音频转录模型，以及像GPT-J和GPT-Neo这样的语言模型。初创企业将利用人工智能研究的最新进展，根据历史专有用户反馈进行模型的更替和微调。目前的限制在于产品设计师专注于使非人工智能意识的消费者能够轻松参与并快速从这些模型中获得价值的界面。护城河将建立在全面的工作流程和用户与这些模型互动时收集的数据上，这将为更强大的未来模型提供信息。

Cat Wu， Index Ventures合伙人

趋势八：串联提示和多步自动化

现在许多人已经体验到了提示界面的强大功能以及大型语言模型（LLMs）所带来的各种创造性和实用的用例，是时候深入了解更多了。提示界面和LLMs的美妙之处在于它们可以解释意图并产生行动结果。到目前为止，我们主要看到的是单人体验，实现了非常具体或一对一的任务完成，例如图像生成、文本补全等。接下来，我们将看到人们建立起将提示串联起来的基础设施，使我们能够通过LLMs和/或最终与API进行交互来实现多步骤的操作，并获得巨大的投资回报率。

这对消费者和企业用例都有各种意义。虽然有些是简单的用例，可能无法达到创业规模（例如：“帮我在布鲁克林南部的一个安静浪漫的亚洲餐馆预订两人晚上6-8点之间的桌位”），但其他用例可以为运营、采购、数据分析等任务提供实质性的支持。

在消费者方面，我们可能会看到这些用例作为更广泛水平的竞争策略。在企业方面，这些行动可能会更加专注于特定行业或环境，难以集成或专有数据管道的作用将更加重要。

将提示和不同类型的模型串联在一起的概念（并非总是必需）还有助于克服目前更加API驱动模型（如GPT-3）的一些现有限制，其中模型的记忆是相对静态的，您可以查询信息、总结信息，然后根据需要使用结果。一个例子是像最近的webGPT一样创建新的搜索引擎的用例。

总的来说，我们只是开始揭示被前者启用的串联提示或顺序操作如何导致更高级的工作流程、新类型的软件产品以及在AI和可能（一些）人类智慧的帮助下解决常见问题的新范例的表面。

Michael Dempsey， Compound管理合伙人

趋势九：解决现实挑战的工业自动化

我们都已经读到了关于最近人工智能模型的突破，比如DALL-E 2、GPT-3等等。由于这些创新，企业正在被重新构想，一些开发者和设计师对自己的工作感到担忧。与此同时，我们在办公室之外面临着有史以来最严重的劳动力短缺，例如餐馆、建筑工地和工厂等地。

以焊工为例，平均年龄为55岁。每年熟练焊工的数量减少7%，而对这些焊工的需求增加了4%。到2024年，仅在美国就将有40万个焊工空缺职位。

这就是为什么像Path Robotics这样自动化熟练劳动力的公司如此重要的原因。Path使公司能够使用现成的机器人自主进行焊接，而无需耗费时间和金钱进行繁琐的重新编程。如今，Path为各种金属应用提供自主焊接的服务，包括电线杆、液压油箱和消声器等。通过其软件，机器人可以通过视觉学习焊接，而不是通过编程进行教导。这使得该公司可以通过视觉质量检查随着时间的推移提高性能。将来，Path的核心技术可以应用于许多其他制造任务。

同样，在劳动力短缺与供应链挑战相结合的情况下，就像目前在建筑行业中所见到的那样，情况变得更糟。这种痛苦的组合使得房屋或商业物业的业主无法按时完成建筑项目。Ergeon正在利用先进的人工智能自动化整个围栏建设过程，以实现远程测量和自动化设计、报价等功能。这项技术使得该公司能够比普通承包商更快地完成项目，速度提高了10倍。他们已经建立了全球最大的住宅建设数据库之一，并赋予任何人建造的能力。

尽管很少有人讨论，但许多价值千亿美元的企业将在我们的办公室之外建立起来。这是一次千载难逢的机会，让我们重新构想桌子和电脑之外的世界，我们对此感到非常兴奋。

Lan Xuezhao，Basis Set创始人

更多阅读：

Marc Andreessen：为什么说AI将会拯救世界？

科技狂人OpenAI CEO萨姆奥特曼的梦想世界

如果您也在从事AI相关工作，欢迎扫码添加小编微信（pkcapital2023），和一群对创业和投资有热情的小伙伴一起交流

继续滑动看下一个

SV Technology Review

向上滑动看下一个

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

13岁！史上最严重霸凌案宣判，如何亡羊补牢？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

知名海外投资人谈AI新趋势

Mario Gabriele，

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

13岁！史上最严重霸凌案宣判，如何亡羊补牢？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

生成图片，分享到微信朋友圈

知名海外投资人谈AI新趋势

Mario Gabriele，

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡