State of AI: 2023 年度人工智能报告之 Industry 篇
本周四 stateof. ai [1]出品了 2023 年度人工智能报告[2]。本文编译自其 2023 年报告,并附带简单分析,强烈推荐阅读原报告。本系列上一篇为 State of AI:2023 年度人工智能报告之 Research 篇。
以下为全文目录,受限于篇幅,本报告将分为 3 篇发布,本篇为第 2 篇,主要关注过去一年中 AI 在产业界的相关突破与进展,之后一篇将在明天同步发布,敬请期待。
State of AI 2023 报告年度总结 科研进展:技术突破及其能力 产业界发展:当前 AI 创新的商业化应用以及对应的商业化影响 政治影响:AI 监管,AI 产生的经济影响,AI 的地缘政治演进 AI 安全:明确和减轻将来庞大 AI 系统可能产生的灾难性影响 对 2024 年的预测
Industry 进展总结
NVIDIA 迅速突破了市值 1 万亿美元的俱乐部,其 GPU 产品受到国家、初创企业、大型科技公司和研究人员的热切需求。 出口管制限制了向中国出售先进芯片,但主要芯片供应商推出了免受出口管制影响的替代产品。 在 ChatGPT 等领导下,GenAI 应用在图像、视频、编码、语音以及 CoPilots 等领域迎来了突破性的一年,推动了 180 亿美元的风险投资和企业投资。
算力成为新的石油
GPU demand sees NVIDIA print blowout earnings as it enters the $1T market cap club
截至 2023 年第二季度,NVIDIA 数据中心的收入创下了创纪录的 103.2 亿美元,比 2023 年第一季度增长了 141%,比一年前增长了 171%[3]。虽然 2022 年度收入达到 270 亿美元,较 2021 年增长了 61.4%,但该股票在 2022 年表现疲软[4]。而在 2023 年英伟达(NVIDIA)的市值现在达到 1.1 万亿美元,相比 10 年前的 85 亿美元增长了 130 倍。
Selling faster than Coachella: GPUs snapped up from upstart infra providers
CoreWeave、Lambda 和 Crusoe Cloud 是 NVIDIA 选择的合作伙伴,它们构建和运营 GPU 数据中心,总共拥有数以万计的 GPU。Lambda 在其按需云中提供了价值 9 位数美元的 H100 GPU,并在一个多小时内售罄。CoreWeave 是市场上规模最大的 GPU 运营商之一,规模与几个超大规模运营商相当[5]。该公司的建设计划已经预订满了,直到年底,他们正在签订 2024 年第一季度的合同。
Private companies are shoring up NVIDIA GPUs and wielding them as a competitive edge[6][7][8][9]
Footballers Compute is the new oil in Gulf States? [10]
据称,沙特阿拉伯国王阿卜杜拉国王科技大学(KAUST)已经购买了超过 3,000 枚 H100 GPU,用于构建名为 Shaheen III 的超级计算机,该计算机预计将于 2023 年底投入运行。该大学以研究 LLM 为主,其研究人员主要是中国国籍,因为他们所在的大学受到限制,无法进入美国。与此同时,阿联酋马斯达尔城的技术创新研究所(Technology Innovation Institute)开发的 Falcon LLM 据称也正在从 NVIDIA 采购计算资源。最后,总部位于阿布扎比的 G42 与美国的 Cerebras 达成交易,以采购价值高达 9 亿美元的公司硅片级计算系统,并构建 9 台相互连接的人工智能超级计算机[11]。预计还会有更多的支出。
Compute Index: NVIDIA A100 clusters
自去年以来,大规模的 NVIDIA A100 GPU 集群数量增长了,特别是在特斯拉(Tesla)和 Stability 公司,以及 Hugging Face 新的集群上。
Compute Index: NVIDIA H100 clusters
在大规模模型训练方面,私营和公有云公司正在宣布新的 H100 基础设施,尽管现在还处于早期阶段[12][13][14]。截至目前,谷歌和 Inflection 公司尚未达到全面规模,我们了解到其他公司,包括 OpenAI、Anthropic、Meta、Character.ai、Adept、Imbue 等,都具备相当的能力。我们预计会有更多公司很快上线。
NVIDIA chips are used 19x more in AI research papers than all alternative chips combined
在去年的报告中,我们开始追踪人工智能研究论文中特定半导体的利用情况。我们发现,与其他替代品相比,NVIDIA 芯片的引用次数要多得多。在 2023 年,NVIDIA 的受欢迎程度更高:与 FPGA 相比高出 31 倍,与 TPU 相比高出 150 倍。
NVIDIA chips have remarkably long lifetime value: 5 years from launch to peak popularity
在 2023 年,所有目光都聚焦在 NVIDIA 的新一代 H100 GPU 上,这是 A100 的更强大继任者。尽管 H100 集群正在建设中(不是没有问题),研究人员仍然依赖于 V100、A100 和 RTX 3090。引人注目的是,NVIDIA 产品具有相当长久的竞争力:2017 年发布的 V100 仍然是人工智能研究中最常用的芯片。这表明 2020 年发布的 A100 可能在 2026 年达到峰值,而 V100 则可能处于低谷期。因此,新的 H100 可能会一直陪伴我们,直到下一个十年。
While NVIDIA is king, Cerebras ramps amongst the challenger crop
Cerebras,创造了世界上最大的人工智能芯片,参与了几个开源模型训练和数据集创建项目,这帮助其在研究人员中取得了竞争对手之间的优势。总体而言,NVIDIA 的竞争对手仍然面临艰巨的挑战。
Hyperscalers scale their spending on AI as a % of total capex
超大规模运营商将进一步增加人工智能支出占总资本支出的比例[15]。同时,有传言称 NVIDIA 将在 2024 年发货 150 万至 200 万枚 H100 GPU,而今年的预期数量为 50 万枚。
Tesla marches towards a Top-5 largest compute cluster for AI in the world[16]
根据我们 2022 年的计算指数,特斯拉在 A100 GPU 数量上排名第四。截至 2023 年夏季,该公司上线了一个新的拥有 10,000 个 H100 GPU 的集群,使其成为迄今为止规模最大的在线集群之一。
More hyperscalers develop their own inference hardware for internal AI workfloads
Meta 宣布推出 MTIA,这是该公司基于开源 RISC-V 架构的首个内部加速器,旨在满足基于深度学习的推荐模型的需求[17]。这是由于在生产环境中部署的模型规模和复杂性越来越大,而 GPU 所提供的推理速度较慢所推动的。
NVIDIA, Intel and AMD make Chinese-export controls proof chips
根据 NVIDIA 的首席财务官所说,中国历来占据了 NVIDIA 数据中心产品收入的 20-25%[18]。因此,随着美国商务部对人工智能芯片的出口管制日益严格[19],NVIDIA(以及其竞争对手)开发了刚好低于出口限制的芯片。
2022 年 8 月底,NVIDIA 的 A100 和 H100,它们用于人工智能应用的最强大芯片,被列入美国商务部的出口管制名单,中国企业无法获得这些芯片[20]。到 11 月,NVIDIA 已经开始推广 A800 和 H800 芯片,这些芯片的性能低于美国禁令设定的阈值。 英特尔也采取了类似的做法,推出了哈巴纳 Gaudi 2 芯片的新版本,AMD 也表达了类似的意图。 因此,像字节跳动和百度这样的公司已经订购了价值超过 10 亿美元的 A800/H800 NVIDIA GPU。还有报道称中国境内 A100/H100 GPU 的使用量有所增加,但规模要小得多。
Softbank re-lists Arm on the NASDAQ after its sale to NVIDIA was blocked 在 NVIDIA 的收购计划被阻止后,Softbank 将 Arm 重新列入纳斯达克交易所。
早在 2020 年,我们就预测到 NVIDIA 将无法完成对 Arm 的收购。今年 9 月,Arm 重新在纳斯达克上市,开盘时估值达到 600 亿美元[21]。
作为支持全球 99%智能手机芯片的 IP 提供商,Arm 正在努力将自己重新定位为人工智能市场的参与者。它与自动驾驶汽车公司 Cruise 和 NVIDIA 合作开发 Grace Hopper 芯片(其中 Arm 的技术在支持角色中发挥作用)。 然而,前方并非一帆风顺。过去一财年的收入保持平稳,其中 25%来自 Arm 中国,这是销售到中国市场所需的独立子公司。考虑到 Arm 在市场份额上的巨大优势,它有可能提高每个设备的低版税率,但需要在此与 RISC-V 等开源替代架构的增长之间取得平衡。 由于 Arm 本身不销售物理芯片,迄今为止它成功地避免了制裁的影响。然而,随着美中芯片战升级,无法保证这种情况会持续下去。
GenAI 应用
2022 Prediction: Generative AI applications grow in popularity
在 2022 年,我们曾预测:「到 2023 年 9 月,将出现吸引超过 10 万开发者的生成音频工具」。而 ElevenLabs(英国)和 Resemble AI(美国)都超过了这一门槛[22]。另一个领域,产品设计,正迅速整合生成式人工智能技术,使快速发展的公司如 Uizard 受益。
ElevenLabs 现在已拥有超过 200 万注册用户,并且正在快速增长。第二百万用户的增长耗时是第一百万用户的一半。用户累计上传了超过 10 年的音频内容。起初面向创作者和出版商,ElevenLabs 现在正在适应从 AI Agent、伴侣、娱乐和游戏等各种用例。 由 AI 工具驱动的产品设计公司 Uizard 表示,截至 2023 年 7 月,其年度重复收入(ARR)达到 320 万美元,同比增长 13 倍。该公司在 4 月份实现了超过 100 万美元的年度重复收入,并在 3 个月内从 100 万美元增长到 300 万美元。
视频领域也是生成式人工智能的快速发展领域。总部位于伦敦的 Synthesia 成立于 2017 年,于 2020 年推出了以人工智能为核心的视频创作工具。该系统生成能够用于消费者和企业的多语言虚拟角色,并按照脚本执行动作。曾被认为是「边缘应用」的 Synthesia 现在被 44%的 Fortune 100 强企业用于学习与发展、营销、销售支持、信息安全和客户服务。自 2020 年推出以来,已经生成了超过 960 万个视频。
OpenAI’s ChatGPT is one of the fastest growing internet products[23]
在筹集 100 亿美元资金时,OpenAI 提出的收入预测遭到了很多怀疑。然而仅仅 12 个月后,如今 OpenAI 正在远远超过其目标。这种情况会持续多久?以及会付出什么代价?
Feeling the ChatGPT heat: education gets hit first and Chegg is fighting back
Chegg 是一家在纽约证券交易所上市的公司,专注于改善学生的学习和学业成果。然而,ChatGPT 的推出对该公司造成了严重冲击。在 2023 年 5 月,该公司表示:「在今年年初,我们在新用户增长方面没有看到 ChatGPT 对我们的明显影响,并且新注册用户的预期也得到了满足。」
然而,付费使用 Chegg 进行练习考试和获取作业反馈的学生转而使用 ChatGPT。结果,Chegg 的股价暴跌超过 40%。在 Chegg 于 2023 年 8 月的财报电话会议上[24],该公司表示:「我们已经转变了公司的方向,利用人工智能更好地服务学习者」。他们正在与 Scale AI 合作建立内部的语言模型(LLMs)[25]。
Feeling the ChatGPT heat: coding is next…and developers are loving it!
作为开发者在寻找编程问题解决方案时的事实上(在 AI 出现之前)的首选来源,Stack Overflow 对由 ChatGPT 生成的回答实施了禁令,并因 ChatGPT 的受欢迎程度而遭受了流量损失[26][27]。
Results are in: GitHub CoPilot drives significant productivity gains for developers
如果注定会发生,它终将会发生(不论需要多长时间)。GitHub 终于推出了他们的编码助手 CoPilot,并受到了极其积极的反响[28][29]。该系统使用了数十亿行代码进行训练。
在 2022 年 9 月,GitHub 对 95 名专业开发者进行了实验,随机将他们分成两组,并计时他们编写 JavaScript 的 HTTP 服务器所需的时间。实验结果显示,生产力显著提升[30]。 在 2023 年 6 月,GitHub 公布了来自 934,533 名 CoPilot 用户的数据。有趣的是,用户熟悉该工具之前,生产力略微下降,然后显著提高,而那些经验较少的用户获益最多(生产力提升约 32%)[31]。
ChatGPT drives productivity in (repetitive, boring?) writing
一项新的麻省理工学院研究支持了广为人知的智慧:ChatGPT 有助于写作。具体而言,对于"中级专业写作",研究表明,与对照组相比,使用 ChatGPT 的工作者完成任务所需的时间减少了 40%,输出质量提高了 18%[32]。
Certain less obvious GenAI use cases have also gained significant traction
我们注意到用户对与定制聊天机器人进行互动的浓厚兴趣。A16z 支持的 Character.AI 在推出其应用程序之前,进行了 1.5 亿美元的 A 轮融资,并报告了其网站每月 2 亿次访问量[33]。它们的用途很多是无害的[34],例如用作语法工具或者在同人小说社区中的使用,但我们也看到了商业和道德上的挑战。有报道称用户对他们的聊天机器人产生了情感依赖,公司在明确内容的受欢迎程度和对品牌的影响之间面临着权衡困境,还有一些极端内容的指责。
Text-to-image models: Competition intensifies and integrations abound
在 2022 年发布了 Stable Diffusion 后,Midjourney[35] 和 Stability[36] 仍在不断改进其模型,继续领先竞争对手。
虽然在文本到图像领域反应似乎较慢,但 OpenAI 发布了迄今为止最好的文本到图像模型 DALL-E 3[37]。
同时,还有新的参与者,例如 Ideogram[38],其创始人是 Google 的 Imagen 创建者,他们的模型具有拼字的能力。
与此同时,我们看到了无数的文本到图像模型与流行产品的整合,尤其是在 Adobe 的 Firefly[39]、Photoroom 甚至 Discord 上。
Midjourney 的收入在 2022 年 3 月已经达到了每月 100 万美元,预计将在 2023 年达到 2 亿美元的年收入[40]。其用户数量从去年同期的 200 万增长到 1480 万。值得注意的是,Midjourney 已经与 Discord 整合,用户可以在 Discord 服务器上生成图像。据 Discord 称,每个月有超过 3000 万人在其服务器上使用 AI 应用程序,创造超过 10 亿个独特的图像。
法国初创公司 Photoroom 是一家专注于照片编辑的公司,该公司表示,自从在二月引入生成式 AI 以来,公司的收入和用户数量在过去 6 个月翻了一番。
But GenAI’s wow effect is (so far) insufficient for users to stick around…
但是到目前为止,GenAI 的惊艳效果还不足以吸引用户留下来... 与 YouTube、Instagram、TikTok 或 WhatsApp 等最受欢迎的现有应用相比,ChatGPT、Runway 或 Character.ai 等 GenAI 应用的中位数用户留存率和每日活跃用户数较低[41]。
GenAI 与版权争议
2022 Prediction: A major user generated content site negotiates a commercial settlement with a start-up producing AI models (e.g. OpenAI) for training on their corpus
在 2022 年 10 月,领先的多媒体库提供商 Shutterstock 宣布将与 OpenAI 合作,在其平台上引入基于 DALL·E 的内容[42]。然后在 2023 年 7 月,两家公司签署了一项为期 6 年的内容许可协议[43],使 OpenAI 可以访问 Shutterstock 的图像、视频和音乐库以及相关元数据进行模型训练。此外,Shutterstock 将为其客户提供 AI 图像创建的赔偿[44]。该公司还与 Meta 签订了内容许可协议,支持 GenAI[45]。
这种支持 GenAI 的立场与 Shutterstock 的竞争对手 Getty Images 形成鲜明对比[46],后者对 GenAI 持强烈反对态度,如其对 Stability AI 于 2023 年 2 月提起的侵权诉讼所示[47]。
在 2023 年 7 月,OpenAI 和美联社(AP)签订了一项许可协议[48][49],部分获取美联社自 1985 年以来的新闻报道。与此同时,美联社将获得 OpenAI 的技术和产品专业知识,以探索生成应用。虽然美联社在生产环境还没有使用基于 LLM 的应用程序,但它已经利用 AI 系统创建自动化的公司盈利和体育赛事摘要。
US Courts set precedent for AI-generated content being unsuitable for copyright protection, but then another on fair use
美国法院为 AI 生成的内容是否适合获得版权保护设立了先例,但同时也就公平使用提出了另一种观点[50][51][52]。
美国哥伦比亚特区联邦地区法院重申了长期以来的原则,即版权保护需要人类作者。虽然可能会提起上诉,但重要的先例现在可能已经确立。
美国哥伦比亚特区联邦地区法院驳回了 Stephen Thaler 的主张,称 2012 年的图像《一个最近的天堂入口》(右侧图像)不值得获得版权保护。
然而,版权局已经设立了一个倡议,以研究 AI 对版权法的影响,并发布了新的版权指南,涵盖文学、视觉、视听和声音。指南规定任何艺术作品需要有人类作者,并且申请需要明确指出 AI 的使用情况。
对于提供者来说,更具挑战性的是,2023 年 5 月,在一起关于 1981 年普林斯肖像的版权案中,美国最高法院对“变革性”在公平使用中的解释进行了新的、更严格的解释。这可能会使用于模型训练数据的书籍和艺术作品的抓取行为在法律上更具风险。
But cases continue to be fought in multiple jurisdictions about copyright infringement
然而,有关版权侵权的案件在多个司法管辖区仍在进行中。
在英国和美国,涉及主要文本和图像生成的案件正在进行中。尽管这些公司声称他们从事公平使用或表达自由,但有迹象表明可能会出现麻烦。 在英国和美国,Getty Images 正在起诉 Stability,指控 Stability 从其收藏中复制了数百万张照片,更改或删除了版权信息,并指责 Stable Diffusion 生成的图像带有修改版的 Getty Images 水印。 OpenAI 和 Meta 面临诉讼,声称 ChatGPT 和 LLaMa 未经其同意使用其受版权保护的图书作为训练数据集。据称,《纽约时报》正在考虑对 OpenAI 提起类似诉讼。三位艺术家正在起诉 Stability、DeviantArt 和 Midjourney,指控他们使用他们的艺术作品训练图像生成器,创建了“侵权衍生作品”。 英国在版权法中有一个文本和数据挖掘例外,但这仅适用于非商业用途;扩大这个例外的计划已经搁置。欧盟也有类似的例外,但《AI 法案》规定,基础模型提供商必须提供用于训练模型的受版权保护材料摘要(这可能在技术上具有挑战性)。 微软已经采取措施向 Copilot 工具的用户保证,在任何版权索赔事件中,公司将承担任何法律风险[53]。
人工智能与人工
From labels to preferences
随着指令微调(instruction fine-tuning)和 RLHF 成为微调和对齐语言模型的默认方法,像 Scale AI 和 Surge HQ 这样提供标注服务的公司有望从 LLM(大型语言模型)的爆炸性流行中实现异常增长。这两家公司都拥有令人印象深刻的客户名单,包括人工智能初创公司、大型企业客户以及 LLM 研究领域的领先实验室。Scale AI 在 2021 年评估时的估值为 73 亿美元,当时尚未出现 Stable Diffusion 和 ChatGPT 的狂热潮。
Open source AI is on a tear at a time when incumbents push for closed source AI
Hugging Face 是一家成立已有 7 年的公司,已经牢固地成为了开源人工智能的交流平台,目前正在迎来重要的发展势头,社区争相保持人工智能模型和数据集对所有人的可访问性。仅仅在几个月内,已有超过 1,300 个模型被提交到他们的 Open LLM Leaderboard,仅在 2023 年 8 月就有超过 6 亿次模型下载。这些模型通过使用 Gradio 或 Streamlit 等工具构建的 Spaces 作为 Web 应用程序进行展示,从而实现了更广泛的可访问性和快速原型开发。Gradio 的月活跃用户数量从 2023 年 1 月的 12 万人增长到了 2023 年 8 月的 58 万人,增长了 5 倍。
Monolithic LLMs or specialised application-dependent LLMs?
Databricks 以 13 亿美元收购了 MosaicML[54],以帮助企业构建(很可能是微调)自己的 LLM。未来可能不再是一个知道一切的单一大模型,而是一组针对企业数据或特定任务进行训练的专门模型。
在收购之前,Mosaic 展示了令人印象深刻的工程成果,比如以不到 5 万美元的成本(相比原来的成本减少了 8 倍)从头开始训练 Stable Diffusion,并构建具有长上下文长度的先进 LLM。 这笔交易标志着生成式人工智能热潮的重要时刻。 Snowflake 采取了类似的战略:与 Azure 合作,为客户提供访问 OpenAI 模型的机会。
生物制药
Once ignored by major pharma companies, AI is moving front and center for some
曾经被主要制药公司忽视的人工智能如今正成为一些公司的核心关注领域。
mRNA 疫苗领导者 BioNTech 以 5 亿欧元收购了人工智能公司 InstaDeep[55] 赛诺菲 Sanofi 则全力以赴地投资于人工智能领域[56] 默克 Merck 与以人工智能为核心的药物公司 Exscientia 达成了总价值高达 6.74 亿美元的新协议[57] 阿斯利康 AstraZeneca 则与 Verge Genomics 达成了总价值高达 8.4 亿美元的合作协议[58]
NVIDIA continues its share price performance tear and blesses its partners too
在英伟达宣布向 Recursion Pharmaceuticals 投资 5000 万美元的当天,Recursion Pharmaceuticals 的股价暴涨 80%,创造了额外的 10 亿美元市值[59]。这样的反应显示了人工智能的热潮。
人才流动
DeepMind to Google DeepMind back to DeepMind and now to Google DeepMind…v2!
这家开创性的人工智能公司 DeepMind,通过与 Google Brain 的合并,如今正处于 Google 在生成式人工智能领域进行反击的前沿。
DeepSpeech 2: The early masters of scale
百度的硅谷 AI Lab 是另一个黄埔军校。在 2015 年,百度的硅谷人工智能实验室推出了一个完全基于深度学习的端到端语音识别系统 DeepSpeech 2[60],该论文的第一作者 Dario Amodei 即是目前 Anthropic 的 CEO。这项工作摒弃了手工构建的基于特征的流水线和大量的计算:
我们方法的关键是应用了高性能计算技术,使我们之前的系统加速了 7 倍...我们的系统在标准数据集上与人工工作者的转录相竞争。
同一实验室在 2017 年发表的一篇论文 Deep learning scaling is predictable, empirically[61]展示了 Scaling Law 的早期证据,这个规律现在支撑着我们今天所见和使用的大规模人工智能。许多 DeepSpeech 2 的作者后来成为了领先的机器学习公司的创始人或高管,领导着在语言建模和相关领域的大规模工作。
Attention is all you need… to build raise billions for your AI startup
那篇引入基于 Transformer 的神经网络的里程碑论文中,除了一位作者外,其他所有作者都离开了 Google,开始创办自己的初创公司。就像硅谷早期的仙童八叛逆[62] 和后来的 PayPal Mafia[63] 一样,Transformers Mafia 共同筹集了大量资金。
自动驾驶
GAIA-1 是 Wayve 为自动驾驶开发的一个拥有 90 亿参数的生成式世界模型。它利用视频、文本和行为输入来生成逼真的驾驶场景,并提供对自身车辆行为和场景特征的细粒度控制。它展示了令人印象深刻的泛化能力,可以处理训练集之外的自我代理行为,并通过文本实现对环境的可控性,使其成为训练和验证自动驾驶模型的强大神经仿真器。
Autonomous rides are now commercial (in California)
Waymo 和 Cruise 获准在旧金山推出全天候付费自动驾驶服务。此前,只有在有驾驶员监控车辆时才能提供付费乘车服务。
这对于自动驾驶来说是一个重要时刻。获得加利福尼亚公用事业委员会的批准是多年努力取得的一系列批准中的最后一步。Waymo 的首席执行官 Tekendra Mawakana 表示,这项许可证 「标志着我们在旧金山商业运营的真正开始」。 然而,关于无人驾驶出租车服务与卡车运输和物流之间的经济问题尚未解决。Waymo 在 7 月底暂停了他们的自动驾驶卡车服务,而其他公司(例如 Aurora)则将其置于机器人出租车之上。 前 Argo AI 的领导者创立了 Stack AV,一家从 Softbank 获得 10 亿美元 A 轮融资的自动驾驶卡车初创公司。
产业投资
“GenAI” is the new “new” thing: AI investments are stable vs. 2022, powered by GenAI
2023 年上半年,用于使用人工智能的初创公司的资金几乎与 2022 年上半年持平......如果没有资金涌入 GenAI,整体人工智能投资将较去年下降 40%,而所有初创公司的下降幅度为 54%[64][65]。
**Trillions of value: The combined enterprise value of private and public companies using AI
2021 年之后,上市公司的估值下跌了三分之一,但正在逐渐恢复,而私人市场的估值保持稳定,尚未见到明显下调[66][67]。值得注意的是,2023 年标普 500 指数的 50%增长是由 The Magnificent Seven 推动的:苹果、微软、英伟达、谷歌母公司 Alphabet、Meta、特斯拉和亚马逊作为人工智能加速的关键推动者和受益者。
**
US AI companies absorb 70% of global private capital in 2023, up from 55% in 2022
2023 年,美国的人工智能公司吸收了全球私人资本的 70%,较 2022 年的 55%有所增加[68]。
与此同时,私人美国和英国的人工智能公司的资金持续稳定,而欧洲的人工智能公司资金下降了超过 70%。
The US continues to lead by number of AI unicorns, followed by China and the UK
2022 年以来的趋势延续:美国的独角兽数量从 292 增长到 315,总企业价值从 4.6 万亿美元增长到 5.9 万亿美元[69][70][71]。英国新增了 3 个独角兽,但累计企业价值从 2070 亿美元回落至 1550 亿美元。
Enterprise software, fintech and healthcare are the most invested AI categories globally
企业软件、金融科技和医疗保健是全球投资最多的人工智能领域[72][73][74][75][76]。
Although IPOs dried up in 2023, the M&A market continues to stay strong
尽管 2023 年的首次公开募股(IPO)市场活动减少,但并购市场继续保持强劲。
除了几个特殊目的收购公司(SPACs)(例如 Arrival、Roadzen、Triller)之外,公开市场活动并不多,与 2022 年的 98 个相比。然而,有几起重大收购案,包括 MosaicML + Databricks(13 亿美元)、Casetext + Thomson Reuters(6.5 亿美元)和 InstaDeep + BioNTech(5 亿欧元)。
24% of all corporate VC investments went into AI companies in 2023
2023 年,所有公司风险投资(VC)投资的 24%流向了人工智能公司。
在 2023 年,企业将投资重点重新聚焦于 GenAI。他们将对非人工智能公司的投资削减了 50%,而人工智能领域的投资保持大致稳定(2022 年为 290 亿美元,2023 年为 220 亿美元)。
2023 sees a massive acceleration in GenAI funding
GenAI 公司正在吸引大量资本,在科技估值下滑的背景,专注于生成式人工智能应用(包括视频、文本和编码)的人工智能初创企业从风险投资和企业投资者那里筹集了超过 180 亿美元[77]。
2022 Prediction: NVIDIA forms a strategic relationship with an AGI organization
2022 预测:NVIDIA 与一个 AGI 组织建立战略关系。与建立这样的关系不同,NVIDIA 在人工智能领域采取了多管齐下的策略,其中包括:
对私营和上市的以人工智能为核心的公司进行投资 支持专门的 GPU 云服务提供商 拓展新的行业垂直领域
Check out those GenAI round GPU bills sizes: $18B invested in 2023 alone!
看一下那些 GenAI 轮次(GPU 费用)的规模:仅在 2023 年就投资了 180 亿美元!
超大规模融资轮次成为头条新闻,主要由 foundation model 的公司通过出售股权筹集资金,用于购买云计算资源来训练大规模系统。然而,这一趋势可能会出现转变:CoreWeave 筹集了 23 亿美元的债务资金(而非股权),用于购买其所需的 GPU 设备。
A handful of corporates were at the center of some of the highest profile AI fundraises
在一些最高知名度的人工智能筹资活动中,只有少数几家公司处于核心地位。
GenAI companies raised 33% larger Seeds and 130% larger As than all startups in 2023
在 2023 年,与所有初创公司相比,GenAI 公司的种子轮融资规模增长了 33%,A 轮融资规模增长了 130%。
当全球的关注都放在你身上时,计算力和人才并不便宜。
编者总结与展望
在 Industry 这篇我们看到了在过去一年中巨额资金已经或者正在涌入这个行业。和中国一样,美国在各个产业的投资也并不是很繁荣,绝大部分的资金都进入到了生成式 AI 这个方向。
需要注意的是,在 2015 年到 2017 年那一波人工智能浪潮中,中美在产业投资的规模上是基本等同的。然而,这一次,中国的投资规模大大小于美国。一方面,这源于中美地缘政治风险,大量美元基金退出国内,另一方面也因为上一波 AI 浪潮的火热实际落地产出不符合预期,整体投资也偏保守。
美国激进的投资令人惊讶,也令人羡慕。也许这就是他们为何总能做出突破性创新的成果的部分原因。尽管中美关系遇冷,作为追赶者的我们依然可以有后发者优势,只要我们不闭门自嗨。看看这一次,会有怎样的故事呢?
关于作者
魏后民,本科毕业于北京大学,在字节跳动 AML 从事大规模机器学习系统相关工作。过去曾在腾讯和 Hulu 工作,对 AI Infra 和科技创投感兴趣。欢迎加我的微信 Houmin_Wei 与我交流,麻烦备注 【称呼-公司/学校-职位-来意】。如果你也关注这一波 AI 浪潮,希望和来自字节、腾讯、百度、阿里以及一线大模型创业公司的同学一起交流,欢迎扫码进群。
参考资料
https://www.stateof.ai/ ↩︎
State of AI Report 2023, Nathan Benaich, https://docs.google.com/presentation/d/156WpBF_rGvf4Ecg19oM1fyR51g4FAmHV3Zs0WLukrLQ/preview?slide=id.g24daeb7f4f0_0_3373 ↩︎
https://nvidianews.nvidia.com/news/nvidia-announces-financial-results-for-second-quarter-fiscal-2024 ↩︎
https://app.koyfin.com/share/bc78c9e929 ↩︎
CoreWeave, https://www.coreweave.com/blog/coreweave-nvidia#:~:text=We%20have%20over%2045%2C000%20high ,on%2Ddemand%20in%20our%20fleet. ↩︎
https://www.oracle.com/news/announcement/oracle-to-deliver-powerful-and-secure-generative-ai-service-for-business-2023-06-13/ ↩︎
https://inflection.ai/inflection-ai-announces-1-3-billion-of-funding ↩︎
https://techcrunch.com/2023/04/06/anthropics-5b-4-year-plan-to-take-on-openai/ ↩︎
https://imbue.com/company/introducing-imbue/ ↩︎
https://www.ft.com/content/c93d2a76-16f3-4585-af61-86667c5090ba ↩︎
https://www.cerebras.net/press-release/cerebras-and-g42-unveil-worlds-largest-supercomputer-for-ai-training-with-4-exaflops-to-fuel-a-new-era-of-innovation ↩︎
https://cloud.google.com/blog/products/compute/introducing-a3-supercomputers-with-nvidia-h100-gpus ↩︎
https://digitalisationworld.com/news/65928/deepl-deploys-largest-nvidia-dgx-h100-superpod-in-europe ↩︎
https://s3.fr-par.scw.cloud/iliad-strapi/DP_iliad_IA_260923_7643390cfb.pdf ↩︎
https://www.ft.com/content/c7e9cfa9-3f68-47d3-92fc-7cf85bcb73b3 ↩︎
https://www.theverge.com/2023/7/19/23800854/tesla-driverless-dojo-supercomputers-production ↩︎
https://atscaleconference.com/events/meta-ai-infra-scale/ ↩︎
US weighs tougher restrictions on AI chip exports to China, https://www.ft.com/content/a6c6b769-349e-440f-a55b-c92371d00dd9 ↩︎
https://www.theregister.com/2023/08/31/nvidia_asml_trade/ ↩︎
Focus: Inside China's underground market for high-end Nvidia AI chips, https://www.reuters.com/technology/inside-chinas-underground-market-high-end-nvidia-ai-chips-2023-06-19/ ↩︎
https://www.nasdaq.com/articles/nasdaq-welcomes-arm-the-company-at-the-heart-of-the-semiconductor-revolution ↩︎
https://techcrunch.com/2023/07/12/voice-cloning-platform-resemble-ai-lands-8m/ ↩︎
How popular is ChatGPT? Part 2: slower growth than Pokémon GO, https://aiimpacts.org/how-popular-is-chatgpt-part-2-slower-growth-than-pokemon-go/ ↩︎
https://s21.q4cdn.com/596622263/files/doc_financials/2023/q2/Q2-23-Chegg-Investor-Deck-FINAL.pdf ↩︎
https://www.wired.com/story/chegg-embraced-ai-chatgpt-ate-its-lunch-anyway/ ↩︎
Stack Overflow is ChatGPT Casualty: Traffic Down 14% in March, https://www.similarweb.com/blog/insights/ai-news/stack-overflow-chatgpt/ ↩︎
https://www.linkedin.com/posts/andreretterath_death-by-llm-stack-overflow-is-a-chatgpt-activity-7099639964405006336-niEQ/?utm_source=share&utm_medium=member_desktop ↩︎
https://github.blog/2022-06-21-github-copilot-is-generally-available-to-all-developers/ ↩︎
https://github.blog/2023-08-03-introducing-code-referencing-for-github-copilot/ ↩︎
https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/ ↩︎
https://github.blog/2023-06-27-the-economic-impact-of-the-ai-powered-developer-lifecycle-and-lessons-from-github-copilot/ ↩︎
Experimental evidence on the productivity effects of generative artificial intelligence, https://www.science.org/doi/10.1126/science.adh2586 ↩︎
https://techcrunch.com/2023/05/31/character-ai-the-a16z-backed-chatbot-startup-tops-1-7m-installs-in-first-week/ ↩︎
https://www.elegantthemes.com/blog/business/character-ai ↩︎
https://docs.midjourney.com/docs/model-versions ↩︎
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement ↩︎
https://openai.com/dall-e-3 ↩︎
https://ideogram.ai ↩︎
https://news.adobe.com/news/news-details/2023/Adobe-Releases-New-Firefly-Generative-AI-Models-and-Web-App-Integrates-Firefly-Into-Creative-Cloud-and-Adobe-Express/default.aspx ↩︎
https://www.theinformation.com/articles/discords-midjourney-deal-could-supercharge-its-revenue ↩︎
https://www.sequoiacap.com/article/generative-ai-act-two/ ↩︎
https://www.shutterstock.com/zh/press/20435 ↩︎
https://investor.shutterstock.com/news-releases/news-release-details/shutterstock-expands-partnership-openai-signs-new-six-year ↩︎
https://investor.shutterstock.com/news-releases/news-release-details/shutterstock-offers-enterprise-customers-indemnification-ai ↩︎
https://www.prnewswire.com/news-releases/shutterstock-expands-long-standing-relationship-with-meta-301719769.html ↩︎
https://www.theverge.com/2023/2/6/23587393/ai-art-copyright-lawsuit-getty-images-stable-diffusion ↩︎
https://fingfx.thomsonreuters.com/gfx/legaldocs/byvrlkmwnve/GETTY%20IMAGES%20AI%20LAWSUIT%20complaint.pdf ↩︎
ChatGPT-maker OpenAI signs deal with AP to license news stories, https://apnews.com/article/openai-chatgpt-associated-press-ap-f86f84c5bcc2f3b98074b38521f5f75a ↩︎
AP, Open AI agree to share select news content and technology in new collaboration, https://www.ap.org/press-releases/2023/ap-open-ai-agree-to-share-select-news-content-and-technology-in-new-collaboration ↩︎
https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence#:~:text=AI%2Dgenerated%20content%20that%20is,the%20%E2%80%9CMaterial%20Excluded%E2%80%9D%20heading ↩︎
https://www.copyright.gov/newsnet/2023/1004.html ↩︎
https://www.wired.co.uk/article/andy-warhol-fair-use-prince-generative-ai ↩︎
https://blogs.microsoft.com/on-the-issues/2023/09/07/copilot-copyright-commitment-ai-legal-concerns/#:~:text=Specifically%2C%20if%20a%20third%20party,used%20the%20guardrails%20and%20content ↩︎
Databricks Signs Definitive Agreement to Acquire MosaicML, a Leading Generative AI Platform, https://www.databricks.com/company/newsroom/press-releases/databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform ↩︎
https://www.instadeep.com/2023/07/biontech-completes-acquisition-of-instadeep/ ↩︎
https://www.sanofi.com/en/media-room/press-releases/2023/2023-06-13-12-00-00-2687072 ↩︎
https://investors.exscientia.ai/press-releases/press-release-details/2023/Exscientia-Announces-AI-Drug-Discovery-Collaboration-with-Merck-KGaA-Darmstadt-Germany/default.aspx ↩︎
https://www.pharmaceutical-technology.com/news/alexion-verge-drug-deal/ ↩︎
https://www.wsj.com/livecoverage/stock-market-today-cpi-report-inflation-07-12-2023/card/recursion-pharmaceuticals-stock-surges-on-nvidia-investment-NOO9JYnMdSYsLFlJMXSS ↩︎
Deep Speech 2: End-to-End Speech Recognition in English and Mandarin, https://arxiv.org/abs/1512.02595 ↩︎
Deep Learning Scaling is Predictable, Empirically, https://arxiv.org/abs/1712.00409 ↩︎
https://en.wikipedia.org/wiki/Traitorous_eight ↩︎
https://en.wikipedia.org/wiki/PayPal_Mafia ↩︎
https://datawrapper.dwcdn.net/Yv21C/3/ ↩︎
https://datawrapper.dwcdn.net/PgFO7/4/ ↩︎
https://datawrapper.dwcdn.net/G1mvO/3/ ↩︎
https://datawrapper.dwcdn.net/aZLnp/4/ ↩︎
https://www.datawrapper.de/_/KH89L/ ↩︎
Cumulative: https://datawrapper.dwcdn.net/lPXPr/2/ ↩︎
Unicorns by country 2023: https://datawrapper.dwcdn.net/LWFda/3/ ↩︎
Enterprise Value, https://www.datawrapper.de/_/Onpdh/ ↩︎
https://www.datawrapper.de/_/0pK1K/ ↩︎
https://www.datawrapper.de/_/qZKKd/ ↩︎
https://datawrapper.dwcdn.net/1Yv8K/5/ ↩︎
https://datawrapper.dwcdn.net/nd7ah/6/ ↩︎
https://datawrapper.dwcdn.net/caSXi/5/ ↩︎
https://www.datawrapper.de/_/5Q5fp/ ↩︎