MAD 24问,AI 2023年总结,2024年展望
马特·特克(Matt Turck)是FirstMark的合伙人,主要关注美国和欧洲的早期投资。他在数据、机器学习和人工智能领域非常活跃。在职业生涯的早期,他是是TripleHop的联合创始人,这是一家企业搜索软件初创公司,后来被Oracle收购,收购后成为Oracle的高管。在加入FirstMark之前,他创立了彭博(Bloomberg)孵化部门彭博风投,并担任董事总经理。他毕业于巴黎政治学院,并获得耶鲁法学院的法学硕士学位。
自2011年以来,他一直在组织Data Driven NYC,这是美国最大的数据/人工智能社区。自2012年以来,他一直在发布数据/人工智能行业的年度景观报告MAD报告。最近他第十次发布MAD报告,覆盖2011家公司,提出MAD 24问,结合硅谷科技评论(svtr.ai)近年来的研究,这是对AI世界2023年进行总结,对2024年进行展望的最好方式。
添加凯瑞微信(pkcapital2023),获取《The 2024 MAD (ML, AI & Data) Landscape》报告。
1、结构化数据与非结构化数据,谁的机会更大?
结构化数据
指那些能够适配进行和列的数据。出于分析目的,数据从事务数据库和SaaS工具中提取出来,存储在云数据仓库(例如Snowflake)中,通过商业智能(BI)工具进行转换、分析和可视化,主要用于理解现在和过去(即所谓的“描述性分析”)。这一流程通常依靠“现代数据技术栈”(Modern Data Stack)来实现,其核心用途是分析。
此外,结构化数据也可以用于“传统”机器学习/人工智能模型,进行预测性分析——例如,预测哪些客户可能会流失。
非结构化数据
指通常不适合行和列的数据,如文本、图像、音频和视频。非结构化数据主要是喂入生成型人工智能模型(如大型语言模型等),用于它们的训练和使用(推理)。
这两类数据(及其相关工具和公司)目前关注程度大相径庭。非结构化数据(机器学习/人工智能)非常热门;结构化数据(现代数据技术栈等)则相对冷门。
2、现代数据堆栈已死吗?
三年前,软件界没有什么比“现代数据堆栈”(Modern Data Stack,简称MDS)更引人注目。与“大数据”一道,它是少数几个为大众熟知的基础设施概念之一。
现代数据堆栈主要涵盖了前文提及的结构化数据管道。它围绕着快速增长的云数据仓库展开,供应商分布在其上游(例如Fivetran和Airbyte)、正上方(DBT)和下游(Looker、Mode)。
随着Snowflake创下有史以来最大的软件IPO记录,对MDS的兴趣随之爆炸性增长,ZIRP(零利率政策)助推了众多公司的创立和风险投资的涌入。在短短一两年内,整个行业变得拥挤不堪,如数据目录、数据可观察性、ETL(数据抽取、转换与加载)、反向ETL等领域。
但是2023年,现代数据堆栈开始面临压力,而这种压力在今年将持续增加。主要来自两个方面:
构建现代数据堆栈需要整合多个独立供应商的各种最优解决方案。因此,无论是在资金、时间还是资源方面,成本都很高。
MDS已不再是那个街头巷尾的潮流焦点。生成式人工智能已经所有人关注的重点。
3、数据基础设施的机会在哪里?
2024 年数据基础设施和分析领域的发展可能如下:
现代数据堆栈及其周边的许多初创公司将积极重新定位为“人工智能基础设施初创公司”,并尝试在现代人工智能堆栈中找到自己的位置。但在大多数情况下,从结构化数据转向非结构化数据可能需要根本性的产品革新。
数据基础设施行业将会看到一些并购活动。2023年的收购包括Stemma被Teradata收购、Manta被IBM收购、Mode被Thoughtspot收购等。
在该领域的大公司,无论是扩大规模的公司还是上市公司,都将加倍投资于其平台战略,并努力扩展更多功能。
4、Databricks 与 Snowflake,谁会胜出?
Snowflake和Databricks是数据基础设施的两位关键参与者。
Snowflake(历史上来源于结构化数据管道领域)是目前估值最高的上市科技股之一。然而,像许多软件行业一样,其增长速度已大幅放缓——目前产品收入同比增长38%,总额达到26.7亿美元,预计未来十二个月的收入增长为22%。更重要的是,Snowflake在产品前线面临压力,它接受人工智能的步伐较慢,且较少进行收购。最近的首席执行官突然更替,是另一个值得关注的点。
Databricks(历史上来源于非结构化数据管道和机器学习领域)正展现出全面的强劲势头,据报道(因其仍为私营公司),2023财年的收入达到16亿美元,增长率超过50%。更为重要的是,Databricks正在成为生成式人工智能的关键玩家,无论是通过收购(尤其是以13亿美元收购MosaicML)还是内部产品开发。作为LLMs所需非结构化数据的关键仓库,同时也在打造大模型,从Dolly到最近宣布的新生成式人工智能模型DBRX。
Snowflake与Databricks的竞争中,值得关注的是2023年5月推出的Microsoft Fabric,一个用于数据和分析的端到端的、基于云的SaaS平台。它整合了许多微软产品,包括OneLake(开放式湖屋架构)、PowerBI和Synapse Data Science,并基本覆盖了从数据集成和工程到数据科学的所有数据和分析工作流程。如同大公司产品发布的常态,公告与产品的现实之间存在差距,但结合微软在生成式人工智能方面的重大推动,这可能成为一个强大的威胁(此外,Databricks在很大程度上依托于Azure)。
5、BI + Gen AI 是否会改变数据分析?
在现代数据堆栈和结构化数据管道中,商业智能(BI)领域似乎最具重塑潜力。
商业智能和数据分析领域仍主要由一些老牌产品占据主导地位,例如Microsoft的PowerBI、Salesforce的Tableau和Google的Looker,这些产品有时会在销售合同中免费提供。市场还见证了一些并购活动(例如Thoughtspot收购Mode;Snowflake收购Sisu)。一些年轻的公司正采取创新的方法发展,无论是成长阶段公司(如dbt及其语义层/MetricFlow),还是初创公司(如Trace及其指标树),但这些公司通常还处于早期阶段。
此外,生成式人工智能在数据提取和转换方面不仅有潜在的强大作用,还可能在数据分析的强化和民主化方面产生深远影响。例如,OpenAI推出了代码解释器Code Interpreter,后更名为高级数据分析Advanced Data Analysis。Microsoft为Excel中的财务工作者推出了Copilot AI聊天机器人。在云服务供应商、Databricks、Snowflake、开源以及众多初创公司中,许多人正在研发或已发布“文本到SQL”的产品,帮助用户使用自然语言对数据库进行查询。
数据分析的终极目标是实现其民主化。如果自然语言成为操作系统、数据库和商业智能工具的接口,那么将使更广泛的人群能够进行分析。然而,BI行业的许多人对此表示怀疑。他们认为,SQL的精确性和理解查询背后业务上下文的细微差别是自动化的重大障碍。
6、现代人工智能堆栈的兴起,巨头还是初创的机会?
非结构化数据是LLMs的食粮,对此需求极为旺盛。每个尝试或正在部署生成式人工智能的公司都在重新提起一个老生常谈的话题:“数据即新石油”。人人都想利用LLMs的强大能力,但前提是基于他们的(企业)数据。
大大小小的公司都在争先恐后地提供生成式人工智能的基础设施。一些人工智能公司积极发展其产品以利用市场动力——从Databricks到Scale AI再到Dataiku(推出了其LLM Mesh,使全球2000强公司能够在多个LLM供应商和模型之间无缝工作)。
此外,新一代人工智能基础设施初创公司也在兴起,包括:
向量数据库(Vector databases),存储生成式AI模型可利用的数据格式(矢量嵌入)。Pinecone、Weaviate、Chroma、Qudrant等专业供应商度过了辉煌的一年,现有的数据库厂商如MongoDB也迅速反应,增加了矢量搜索功能。目前正就更长上下文窗口是否会完全替代矢量数据库的需求进行激烈讨论。
框架(Frameworks),如LlamaIndex、Langchain等,用于连接和编排所有移动部分。
护栏(Guardrails,),位于LLM与用户之间,确保模型输出遵循组织的规则。
评估器(Evaluators),帮助测试、分析和监控生成式人工智能模型的性能,这是一个由于公众对基准的普遍不信任而显得尤为复杂的问题。
路由器(Routers),帮助实时跨不同模型导向用户查询,以优化性能、成本和用户体验。
成本监控(Cost guards),帮助监控使用LLMs的成本。
端点(Endpoints),实际上是API,抽象了底层基础设施(如模型)的复杂性。
新一代人工智能基础设施初创公司将面临一些与MDS公司相似的挑战:这些类别中的哪一个足以建立一个价值数十亿美元的公司?大公司(主要是云提供商,还包括Databricks和Snowflake)最终会自己构建哪些部分?
7、我们处于人工智能周期的哪个阶段?
人工智能有着长达数十年的“夏天”和“冬天”的历史。在过去的10-12年中,我们经历了三次AI炒作周期:2013-2015年间,深度学习在2012年ImageNet之后成为焦点,激发了第一次炒作;另一次则发生在2017-2018年,期间聊天机器人和TensorFlow崛起;最近则是从2022年11月开始的生成式人工智能。
这轮AI周期异常激烈,几乎让人感觉像是人工智能的泡沫,原因包括:技术本身令人印象深刻;它直观且吸引了广泛非技术圈的关注;对于手握重金的风险投资人来说,这是市场上唯一的热门项目,因为科技领域的其他行业普遍低迷。
炒作带来了许多典型的好处(“没有非理性的热情就没有伟大的成就”、“让百花齐放”,为雄心勃勃的项目提供了充足的资金)和噪音(每个人一夜之间都成了人工智能专家,每个初创公司都声称自己是人工智能公司,人工智能相关的会议、播客、新闻通讯泛滥成灾……)。
不容忽视的是,这一领域的标杆公司具有非常不寻常的法律和治理结构;存在很多未被充分理解或披露的“以计算换股权”的交易(可能涉及资金往返);许多顶尖初创公司由人工智能研究者团队领导;许多风险资本给予非常年轻的公司惊人的估值。尽管如此,种种迹象表明,资金流向AI领域的趋势不会很快结束。
8、2023年的突破与现实:能持续吗?
2023年AI领域发生很多大事:
a) 每家技术供应商都急于将生成式人工智能纳入其产品线,
b) 每个全球2000强公司的董事会都要求其团队“实施人工智能”,一些企业甚至像摩根士丹利和花旗银行这样的受监管的行业,以创纪录的速度进行部署,
c) 消费者对生成式人工智能应用的兴趣极大。
同时2023年AI公司也取得了重大突破:OpenAI的年收入流水率达到20亿美元;Anthropic的增长速度使其能够预测2024年的收入将达到8.5亿美元;Midjourney在没有外部投资和仅40人团队的情况下,收入达到了2亿美元;Perplexity AI的月活用户从0增长到1000万等。
但是,我们这领域依然存在一些担忧:
在企业领域,大量支出用于概念验证或简单的胜利,这些通常来自支持创新的预算。
这些支出有多少是高管不想显得措手不及,而不是为了解决实际的商业问题?
在消费者市场中,人工智能应用的用户流失率很高。这种现象有多少只是出于好奇心理?
无论在个人生活还是职业生活中,许多人都表示不完全确定如何利用生成式人工智能应用和产品。
并非所有生成式人工智能产品都会奇迹般地成功,即便这些产品是由顶尖的人工智能专家开发的。Inflection AI在筹集到13亿美元后迅速结束运营的决定,是否表明世界其实并不需要另一个人工智能聊天机器人或LLM提供商?
9、LLM 公司:能否成为新的云厂商?
数十亿风险资本和企业资金正投入到基础模型公司中。在过去18个月中,人们最关心的问题是:这些LLM提供商将成为新的AWS、Azure和GCP?
一个不容忽视的事实是,似乎没有任何LLM建立起持久的性能优势。当前Claude 3 Sonnet和Gemini Pro 1.5的表现优于GPT-4,而GPT-4又优于Gemini 1.0 Ultra,以此类推——但这种情况似乎每几周就会改变一次。性能也可能会波动——ChatGPT在某个时刻“失去理智”并“变得懒惰”,但这是暂时的。
此外,开源模型(如Llama 3、Mistral和DBRX等)在性能方面正在迅速赶上。
另一方面,市场上的LLM提供商比最初预期的要多。几年前,普遍的看法是市场上只会有一两家LLM公司,存在赢者通吃的局面——部分原因是世界各地能够扩展Transformers的专家极为稀少。
事实证明,有实力的团队比预期的要多。除了OpenAI和Anthropic,还有许多初创公司在进行基础人工智能工作,如Mistral、Cohere、Adept、AI21、Imbue、01.AI等,当然还包括Google、Meta等公司的团队。
到目前为止,LLM提供商似乎表现不错。OpenAI和Anthropic的收入增长速度非常快,他们已经成为“全栈”公司,在底层模型之上,为消费者、企业、开发者等多个受众提供应用和工具。
10、LLMs,SLM 和混合模型,谁能代表未来?
尽管大型语言模型令人兴奋,但过去几个月明显的趋势是小型语言模型(SLM)的快速发展,如Meta的Llama-2-13b、Mistral的Mistral-7b和Mixtral 8x7b,以及Microsoft的Phi-2和Orca-2。
当大型语言模型(LLM)变得越来越大——GPT-3拥有1750亿参数,GPT-4有1.7万亿参数,全世界都在期待更庞大的GPT-5时——小型语言模型正成为许多用途的强有力替代品,因为它们运行成本更低,更易于微调,并且通常能提供出色的性能。
另一个加速的趋势是专用模型的兴起,这些模型专注于特定的任务,如编程(Code-Llama、Poolside AI)或特定行业(例如彭博社的金融模型,或Orbital Materials等初创公司为材料科学构建的模型)。
正如我们在许多企业部署中已经看到的,世界正迅速向结合多种模型的混合架构演变。尽管价格一直在下降,但大型专有LLM仍然非常昂贵,并且存在延迟问题,因此用户/客户将越来越多地部署各种大小、商业与开源、通用与专用的模型组合,以满足他们的具体需求和成本限制。
11、传统人工智能已死?
ChatGPT的推出带来了一件有趣的事:此前部署的大多数人工智能一夜之间被标记为“传统人工智能”,与“生成式人工智能”形成了鲜明对比。这对许多被认为在从事前沿工作的人工智能从业者和公司来说,稍显震惊,因为“传统”这一术语明显预示着新技术将全面取代所有现有的人工智能形式。
实际上,传统人工智能和生成式人工智能在处理的数据类型和用例上各有侧重,最终它们是非常互补的。现在所说的“传统人工智能”,有时也被称为“预测性人工智能”或“表格式人工智能”,同样是基于深度学习的现代人工智能的重要组成部分。然而,它主要关注结构化数据,处理的问题包括推荐系统、客户流失预测、价格优化和库存管理等。“传统人工智能”在过去十年中已被广泛采用,并已在全球数千家公司的生产环境中大规模部署。
相比之下,生成式人工智能主要处理非结构化数据(如文本、图像、视频等),在另一类问题(如代码生成、图像生成、搜索等)上表现出色。在这方面,未来也是混合型的:公司将针对特定任务使用大型语言模型,对于其他任务则使用预测模型。更重要的是,它们通常会将这两者结合使用——大型语言模型可能不擅长提供如客户流失预测这样的精确预测,但你可以使用一个大型语言模型调用另一个专注于提供该预测的模型的输出,反之亦然。
12、薄套壳、厚套壳的机会在哪里?
“薄套壳”(Thin wrappers)是2023年大家常用来轻蔑描述套壳AI应用的术语。虽然这么模式造就了大量“成功的”独立创始人,但常见的观点是,如果你的核心能力依赖于别人的技术(比如OpenAI),那么建立持久的价值和差异化将非常困难。类似Jasper这样的初创公司在经历了收入的迅猛增长后遭遇了困境,似乎验证了这种看法。
一个有趣的问题是,随着时间的推移,当年轻的初创公司开发出更多功能时,会发生什么变化。薄套壳会变成厚套壳吗?
到了2024年,厚套壳公司有以下几种实现差异化的途径:
针对具体问题进行专注,这些问题往往是垂直领域的——任何过于横向的问题都有可能进入大型科技公司的“危险区”。
构建针对特定问题的工作流程、协作和深度整合。
在人工智能模型层面进行大量工作,无论是用特定的数据集对模型进行微调,还是为特定的业务需求定制混合系统(LLMs、SLMs等)。
换句话说,他们需要在狭窄的领域内实现“全栈”(应用程序与基础设施)的发展。
13、2024 年值得关注的领域:人工智能代理、边缘人工智能?
去年,围绕人工智能代理(AI agents)的概念引发了广泛的兴趣——这基本上是智能系统的“最后一英里”,通常以协作方式执行任务。这包括的任务范围很广,从帮助预订旅行(消费者用例)到自动执行完整的SDR(sales development representative)活动(生产力用例),再到RPA风格的自动化(企业用例)。
人工智能代理被视为自动化的圣杯——一个“文本到行动”的范式,在这种模式下,人工智能仅仅帮我们完成任务。每隔几个月,人工智能领域就会对类似代理的产品感到狂热,从去年的BabyAGI到最近的Devin AI(“人工智能软件工程师”)。然而,总的来说,迄今为止这种狂热大多被证明为时过早。在多模型的复杂系统能够协同工作并代表我们采取实际行动之前,首先需要做大量工作来增强生成技术的鲁棒性和可预测性。此外,还缺少一些组件,比如需要在人工智能系统中增加更多的记忆功能。尽管如此,预计在未来一两年中,人工智能代理将成为一个特别令人兴奋的领域。
另一个有趣的领域是边缘人工智能(Edge AI)。尽管大规模运行的LLM并作为端点提供有巨大的市场,但人工智能的另一个理想目标是模型能够在本地设备上运行,特别是在没有GPU的设备上,如手机以及其他智能的、物联网类型的设备。这一领域非常活跃,包括Mixtral、Ollama、Llama.cpp、Llamafile、GPT4ALL(Nomic)等。谷歌和苹果也可能越来越活跃地参与其中。
14、Gen AI正在走向通用人工智能,还是走向停滞期?
在走向通用人工智能的进程中,生成式人工智能的发展速度是否可能会放缓而非加速?这意味着什么?
这个论点有两层含义:
a)基础模型是一种暴力方法,我们将耗尽供养它们的资源(计算力、数据),
b)即便资源未耗尽,通向AGI的真正路径是推理能力,而现有的LLMs尚未能做到这一点。
尽管我们在人工智能推理方面取得了一些进展——尽管DeepMind的AlphaGeometry项目似乎是一个重要的里程碑,因为它结合了语言模型和符号引擎,使用逻辑规则进行推断——但总体上,我们的进展仍不甚明朗。
此外,评估我们距离计算或数据资源耗尽有多远是非常困难的。似乎每天都在进一步推迟“计算耗尽”的边界。NVIDIA最近宣布的Blackwell GPU系统就是一个例子,该公司声称可以部署一个27万亿参数的模型(相比之下,GPT-4是1.7万亿)。
数据问题更为复杂——不仅有关于合法许可数据耗尽的更具战术性问题(参见所有OpenAI的许可交易),还有关于一般文本数据耗尽的更广泛问题。围绕合成数据的工作显然正在增多。Yann LeCun讨论了如何将模型提升到新的水平可能需要模型能够处理更丰富的视频输入,这在当前还无法实现。
当前普遍对GPT-5的期望极高,都想知道它与GPT-4相比将有多大改进,这也被广泛看作是评估人工智能整体进步速度的风向标。
单身,从创业生态系统参与者(创始人、投资者)的角度看,这个问题在中期内可能不那么重要——即使生成式人工智能的发展进入平台期,陷入停滞,我们仍然会在未来几年里有大量的商机,比如将当前的技术部署于各种垂直领域和应用场景中。
15、GPU 之战,NVIDIA 是否被高估?
我们是否正处于一个大周期的初期,其中算力将成为世界上最宝贵的商品,或者我们是否在急剧过度建设 GPU 生产,从而必然导致严重的算力过剩?
作为市场上几乎唯一支持生成式 AI 的 GPU 的公司,NVIDIA 当前的表现非常出色,其股价自 2022 年底以来已上涨五倍,达到 2.2 万亿美元的估值,总销售额增长了三倍。其当家人黄仁勋也成为AI领域炙手可热的明星。
尽管 NVIDIA 作为公司拥有不可否认的能力,其命运将取决于当前淘金热的可持续性。硬件领域充满挑战,准确预测台湾台积电需要制造多少 GPU 是一门复杂的技术。此外,从 AMD 到 Intel 再到三星,竞争对手正在尽力应对;初创公司如 Groq 或 Cerebras 正在加速发展,而像 Sam Altman 传闻中价值 7 万亿美元的芯片公司这样的新企业也可能出现。包括谷歌、英特尔和高通在内的科技公司新联盟正试图挑战 NVIDIA 的秘密武器CUDA,该软件是开发人员与 Nvidia 芯片绑定的关键。
随着 GPU 短缺的缓解,NVIDIA 可能会面临短期到中期的下行压力,但人工智能芯片制造商的长远前景仍然非常光明。
16、开源人工智能:数量太多了?
开源人工智能,显然是过去一年的大趋势。
Meta通过其Llama模型取得了重大突破,法国的Mistral从争议焦点一跃成为生成式人工智能的新星,谷歌发布了Gemma,而HuggingFace继续其上升势头,成为开源人工智能的活跃中心,托管了众多模型。在开源社区中完成了一些生成式人工智能领域最具创新性的工作。
然而,开源社区里,数十万个开源人工智能模型已经上线。其中许多只是玩具或兼职项目。这些模型的排名时涨时跌,有些模型在短短几天内就依据GitHub星级(尽管这一指标有缺陷)飞速上升,但最终并未转化为特别实用的工具。
也许只有经过市场验证,大浪淘沙后,才知道谁会是最终的玩家。
17、人工智能的实际成本是多少?
生成人工智能的成本是备受关注的话题。
这一领域的许多未来前景都与其经济学息息相关——例如,如果人工智能提供的答案的成本明显高于提供传统搜索结果成本,我们是否能在搜索领域真正对谷歌构成挑战?如果推理成本消耗了软件公司的大部分毛利,这些公司还能否真正实现人工智能驱动?
对于人工智能模型的客户和用户来说,一个好消息是我们似乎正处于一个价格竞争到底的初期阶段,这种竞争的速度比预期的要快。一个关键的驱动力是开源人工智能(如Mistral等)和商业推理服务供应商(如Together AI、Anyscale、Replit)的崛起,这些供应商采用开源模型并将其作为服务端点提供。客户转换的成本很低(除了处理不同模型带来的结果差异的复杂性之外),这对OpenAI和Anthropic构成了压力。一个明显的例子是底层模型的显著降价,包括OpenAI和Together AI在内的多家供应商同时降价。
从供应商的视角来看,构建和提供人工智能服务的成本仍然非常高昂。有报道称,Anthropic为了运行其LLMs,需要将其所生成的超过一半的收入支付给AWS和GCP等云服务提供商。此外,还需要支付与出版商的许可协议费用。
18、大公司和AI初创:微软赢了吗?
这是2022年末大家最关心的问题之一,到了2024年,这个问题还是摆在了众人面前:大型科技公司能否占据生成式人工智能领域的大部分价值?人工智能具有规模效应——更多的数据、更多的计算能力、更多的人工智能研究人员往往能带来更大的力量。大型科技公司已经非常清楚这一点。不同于以往平台转变中的老牌公司,它们对未来可能的颠覆也做出了积极的反应。
在大型科技公司中,微软显然一直在进行复杂的多层次策略游戏。微软首次在2019年投资OpenAI,并已增资至130亿美元。但微软也与开源竞争对手Mistral建立了合作。它对ChatGPT的竞争对手Inflection AI(Pi)进行了投资,最近直接进行收购。
所有这些合作伙伴关系似乎只会增加对微软云计算服务Azure的需求——2024年第二季度,Azure的收入同比增长了24%,达到330亿美元,其中6个百分点的增长归功于人工智能服务。
同时,谷歌和亚马逊也与OpenAI的竞争对手Anthropic建立了合作关系,并进行了投资(亚马逊在其计划的40亿美元投资中,向该公司追加了27.5亿美元)。亚马逊还与开源平台Hugging Face合作。此外,谷歌和苹果正在讨论将Gemini AI集成到苹果产品中。Meta通过全面投入开源人工智能,可能在削弱所有竞争对手。
显而易见的问题是,初创公司有多少成长和成功的空间。一些初创公司(主要是OpenAI和Anthropic,可能很快包括Mistral)似乎已经建立了正确的合作关系,并且已经获得了突破性的成功。对于许多其他初创公司,包括那些资金充裕的公司,他们的前景仍然不明朗。
19、OpenAI 未来的命运怎么样?
OpenAI 毫无疑问是AI市场的明星,近千亿的估值、收入增长、宫廷阴谋,以及 Sam Altman 成为这一代的史蒂夫·乔布斯。有几个有趣的问题:
OpenAI 是否做的太多了?在2023年OpenAI的开发者日,OpenAI明确表示它打算在人工智能领域做尽一切,无论是垂直(全栈)还是水平(跨用例):模型 + 基础设施 + 消费者搜索 + 企业 + 分析 + 开发工具 + 市场等。对于一家在重大范式转变中,处于领先地位且可以无限制获得资本的初创公司来说,这并非前所未有的策略(Coinbase 在加密领域也是这么做的)。
但值得关注的是:OpenAI是否真有能力做到这一切,尤其的在实力玩家众多的AI领域,实现一统江湖?
此外,OpenAI 和微软会分手吗?它与微软的关系一直很引人注目——显然,微软的支持在资源(包括算力)和分销(企业中的 Azure)方面极大地推动了 OpenAI 的发展,此举在生成式人工智能早期被广泛视为微软的高明之举。同时,正如上文提到的,微软已明确表示它并不依赖 OpenAI(已拥有所有代码、权重、数据),它已与竞争对手(例如 Mistral)建立合作关系,并通过收购 Inflection AI 显著增强了其人工智能研究团队。
同时,OpenAI 是否愿意继续仅与 Microsoft 保持单一合作关系,而不是在其他云平台上部署?
考虑到 OpenAI 的庞大野心,以及微软对全球主宰的目标,也许有一天两者更像是竞争对手而非合作伙伴?
20、2024年会是企业人工智能元年吗?
2023年对大部分企业来说是一个关键年份,每个人都急于拥抱新趋势,但除了一些概念验证之外,实际上大都数企业并没能将AI转化为现金流。也许2023年生成式人工智能最大的赢家是像埃森哲这样的公司,据报道,该公司通过人工智能咨询业务获得了20亿美元的收入。
无论如何,人们都寄希望于2024年将是企业人工智能的重要一年,但我们首先要解答企业面临的如下问题:
到目前为止AI有哪些实际应用案例?一些容易实现的用例主要包括:
a) 开发团队的代码生成辅助驾驶,
b) 企业知识管理(搜索、文本摘要、翻译等),以及
c) 用于客户服务的AI聊天机器人(这种用例早于生成式人工智能)。当然还有其他的用例(如营销、自动化的销售开发代表等),但还有很多问题需要解决(辅助驾驶模式与全自动化等)。
我们应该选择哪些工具?未来似乎是一个混合体,结合了商业供应商和开源、大型和小型模型、横向和纵向的生成式人工智能工具。但我们应该从哪里开始呢?
谁将部署和维护这些工具?大都数企业普遍存在技能短缺。如果招聘软件开发人员很难,那么招聘机器学习工程师可能更加困难。
我们如何确保它们不产生幻觉?目前围绕可靠性、护栏和评估等方面正在进行大量工作,但生成式人工智能工具可能会出错,更广泛的问题是我们并不真正了解生成式人工智能模型是如何工作的,这在企业中是一个大问题。
投资回报率是多少?大型科技公司很早就利用生成式人工智能满足自身需求,并展示了一些有趣的早期数据。例如,在财报电话会议中,Palo Alto Networks提到将其T&E服务成本减半,ServiceNow提到将开发创新速度提高了52%,但对于企业中生成式人工智能的成本/回报的实践还处于初期阶段。
今天,对2B的生成式人工智能初创公司来说好消息是,企业客户非常有兴趣分配预算(重要的是,这已不再是“创新”预算,而是实际的运营支出预算,可能会从其他地方重新分配)和资源来解决这些问题。
21、AI会杀死SaaS吗?
一个普遍的预期是人工智能将使编程效率提高10倍,因此,即使只有几个普通开发者,也能根据自身需求创建定制的SaaS产品版本。当你可以自己构建时,为什么还要向SaaS供应商支付大笔费用呢?
从更长远的角度来看:未来将由一个人工智能智能体(可能包含多个模型)来运营整个公司,通过一系列的代理执行操作。你将不再需要购买人力资源软件、财务软件或销售软件,因为人工智能将以全自动和无缝的方式处理所有这些工作。
我们离这两种趋势的全面实现可能还有一段时间,但正如我们所知,人工智能领域的变化非常迅速。
此外,未来还有一种可能性是,随着人工智能被整合进每一个SaaS产品,这些产品将变得越来越强大。
22、AI会杀死VC吗?
撇开人工智能是否能在VC投资和资后增值方面实现投资自动化不谈,此外,在VC领域还有一系列有趣的问题:
风险资本规模是否太小?像 OpenAI 这样的公司需要筹集数十亿美元,未来可能还需要筹集更多资金。这些资金中有很多是由像微软这样的大公司提供的——很可能主要是通过算力资源换股权的方式。也许人工智能投资需要的是超大规模的风险资本基金。
风险资本规模是否过大?如果人工智能将使我们的生产力提高10倍,包括超级编程工程师、自动化的销售开发代理和自动化的市场营销,那么我们即将见证一个全自动公司的诞生,这些公司由极少数团队(或许只有一位独立创业者)运营,理论上可以实现数亿美元的收入(甚至公开上市)。
一家由独立创业者运营、年收入达到1亿美元的公司,在其成长过程中的任何阶段真的需要风险资本吗?
23、AI会重振消费经济吗?
自从社交媒体和移动互联网问世以来,消费者一直在寻找下一个机遇,生成式人工智能很可能就是这样的风口。
以下是一些有趣的领域:
搜索:谷歌垄断的搜索领域首次出现了一些有力的竞争者。像 Perplexity AI 和 You.com 这样的少数初创公司正在将搜索引擎演变为答案引擎,引领这一变革。
人工智能伴侣:如果每个人都有一个无限耐心且乐于助人、完全符合个人特定需求的伴侣,无论是提供知识、娱乐还是治疗,那将如何改变我们的生活?
人工智能硬件:Humane、Rabbit、VisionPro 可能是消费类硬件领域的激动人心的新产品。
超个性化娱乐:随着生成式人工智能工具持续进步(同时成本降低),我们将创造出哪些新型的娱乐和艺术形式?
24、AI和区块链:陷阱还是馅饼?
人工智能和加密货币的交集听起来像是 X/Twitter 网络笑话的完美素材。
然而,不可否认的是,人工智能被集中在少数几个公司手中,这些公司拥有最多的计算资源、数据和人工智能人才——从大型科技公司到不开放的 OpenAI 。与此同时,区块链的核心理念是建立去中心化的网络,让参与者能够共享资源和资产。
一些与人工智能相关的加密项目已经出现,包括 Bittensor(去中心化的机器智能平台)、Render(去中心化的 GPU 渲染平台)和 Arweave(去中心化数据平台)。
但问题得关键在于加密货币行业是否能避免沦为数百种与 AI 相关的模因币、操纵市场的抛售计划和诈骗行为。
在读的你,如果对AI有兴趣,欢迎联系凯瑞(pkcapital2023),与一群志同道合的小伙伴一起探讨。
我们AI创投社区覆盖人数超过10W,其中AI从业者超过10000人,大都来自全球科技大厂、顶尖投资机构和高潜创业企业。同时我们也在动态追踪全球1500多家高潜力AI初创企业,文末扫码访问AI数据库和社群通讯录。
AI公司
+
OpenAI:
人工智能突破的前沿丨员工名册丨董事会丨营销团队丨GPT Store丨科技狂人丨马斯克丨地产生意经丨微软丨投资帝国丨婚礼丨产品生态系统
其他:
Adobe丨Anthropic丨Amazon丨Canva 丨Cohere丨DoNotPay丨Figma丨Google丨Hugging Face丨Midjourney丨Neuralink丨Pika丨Replicate丨Reddit丨Replite丨Runway丨Scale AI丨Shein丨Stability AI丨Stripe丨Vannevar Labs丨Zapier
AI行业
+
工具:
写作丨编程丨客服丨法律丨医疗丨视频丨搜索丨企服丨Agent代理丨个人助手丨生产力丨
研报:
AI合成数据丨LLMOps丨AI创始人丨全球高增长AI 50丨企业生成式AI丨AI +云计算丨Gen AI地理分布丨AGI丨巨头的AI战争丨欧洲AI创业地图丨AI+浏览器丨开源AI丨北美科技人才中心地图丨AI+电商丨AI+勘探丨AI+游戏化学习丨AI华裔创始人丨AI+安全丨Top 50 AI工具丨AI域名丨Product Hunt 年度最佳应用
AI创投
+
创业:
性格决定创业成败丨 创业方向丨CEO的薪水丨股权和头衔丨创业公司董事会丨GTM指南丨选择VC丨商业计划书(BP)丨公司估值丨创业合伙人丨商业模式
投资:
顶尖VC投了哪些AI公司丨中美AI创投异同丨如何评估AIGC初创公司丨海外投资人谈AI新趋势丨做通才还是专才风险投资人丨红杉资本如何做投资丨如何及早识别独角兽创始人丨如何避免7大投资陷阱丨合伙人是怎么炼成的丨Thrive Capital丨英伟达投资策略丨Souring的艺术丨精品基金VS超级基金