AI芯片领域新旧势力的博弈:投资、扩张与监管的复杂局面
Groq确认完成6.4亿美元D轮融资,Cerebras Systems计划IPO。Intel计划通过裁员15%等方式削减开支,目标是到2025年减少100亿美元成本。NVIDIA因涉嫌垄断行为正接受美国政府调查,并将其Blackwell GPU的批量交付时间推迟一个季度。
AI芯片行业:喜忧参半
根据即将发布的Futurum Intelligence报告,2023年数据中心用于AI训练和推理的处理器和加速器芯片厂商收入预计为380亿美元,到2028年将增长至1380亿美元。厂商在这个快速增长的市场中举措得当与否至关重要,换言之,这个市场存在巨大的盈亏空间。
新兴公司如Cerebras Systems和Groq抓住了AI专用硬件的需求和优势,但它们需要大量资金推动制造和云部署增长。NVIDIA作为GPU巨头,尽管取得巨大成功,但其快速扩张是否压制了竞争?美国政府已开展调查,考虑到近期Google垄断案的判决,这一问题不容忽视。Intel作为众所周知的半导体公司,显然在推进AI加速器方面遇到了障碍。
没有任何公司大到不会失败,也没有任何公司成长得快到无需重组,无论是主动还是被动。尽管市场快速增长,但它将经历多年的成熟过程,这为市场调整提供了充足时间。
Cerebras Systems欲成为上市的AI芯片公司
Cerebras Systems采取了与大多数厂商截然不同的策略,将通常分布在多个机架集群中的AI处理能力整合到单个机架的晶圆级AI优化芯片上。他们的最新产品CS-3在一个机架中集成了90万个核心和44GB内存,互连带宽高达214PB/s。
该公司声称,与GPU集群相比,CS-3在大幅减少占地面积的同时,提供了数量级更高的处理能力,且能耗显著降低。
可持续性是AI加速器及其所在大型数据中心面临的一个重要而复杂的问题。一方面,如果能以更低的能耗完成相同或更多的工作,就能减少热量和其他副效应的产生。另一方面,如果在某个领域或某种生成式AI应用中降低了能耗,节省的能量可能会用于更多的处理任务。在考虑能量使用时,建议从假设总能耗有限的前提出发,然后在此限制范围内评估可实现的目标和需要权衡的因素。除了加速器半导体外,还必须关注其他基础设施元素,如HDD和SSD在存储方面的可持续性因素。成本也是这一方程中的一个变量。
Cerebras尚未公布拟议IPO的具体细节。约三年前,该公司通过2.5亿美元的F轮融资获得了40亿美元的估值,因此我们可能不会看到低于这一估值的IPO定价。
Groq融资额翻倍
AI处理可简单分为两个过程:用数百万到数十亿的输入训练模型,然后用该模型进行推理,以回答查询或提示。与使用通用CPU或GPU不同,用户可采用专为训练和推理设计制造的AI加速器。例如,Amazon开发了用于这些目的的Tranium和Inferentia芯片,并在AWS上提供。想必你已猜到这些芯片各自用于哪个任务了吧!
Groq专注于推理。虽然训练一个深度学习或生成式AI模型可能需要数周时间,但模型用户期望能迅速获得答案。Groq构建了其所谓的语言处理单元(LPU),专注于加速线性代数这一学科中的数学运算。线性代数处理数字信息向量的变换,涉及数千维的矩阵操作。Groq的LPU设计区别于GPU之处在于,它消除了由于获取指令或访问内存中所需数据的延迟而导致的芯片瓶颈。
8月5日,Groq宣布完成6.4亿美元的D轮融资,公司估值达到28亿美元。此前2021年4月的C轮融资中,公司筹集了3亿美元,估值为11亿美元。迄今为止,公司总共筹集了略超10亿美元。
目前Groq最需要的是收入。在报告中,Groq在评估的18家厂商中收入排名第17位。虽然他们的LPU架构非常有吸引力,但现在他们需要全力争夺推理应用市场,尤其是对抗市场领导者NVIDIA。
Intel正面临AI芯片市场表现不佳的困境
Intel一直感受到来自NVIDIA、AMD、Arm厂商和专用“XPU”AI加速器制造商的压力。公司宣布将裁员15%,并暂停派发股息。截至8月8日收盘时,公司股价为20.49美元/股,自年初以来已下跌27.31美元。显然,必须做出诸多改变。
8月1日,Intel CEO Pat Gelsinger在给员工的信中表示:
在信的后半部分,Gelsinger概述了公司正在采取的总体行动:削减运营成本,简化产品组合,减少复杂性,降低资本和其他成本,并暂停派发股息。这些措施大多直接来自标准商学院教材,但暂停股息的举措表明,财务状况需要采取强有力的应对。
Intel可以并且将会反弹,但它将成为一家不同的公司。今年3月,Intel和美国商务部宣布,根据2022年《芯片与科学法案》(Chips and Science Act),Intel将获得高达85亿美元的资金支持。这是对Intel的一种信任投票,尽管有所保留,表明Intel可以在美国设计、制造并大规模销售先进的半导体,包括AI芯片。
当公司处于这种境地时,问题不仅仅是基层员工未能执行领导层的完美战略。战略必须改变,而Intel已经概述了其变革计划。将有1.5万人离开公司,他们将切身感受到这种变化和牺牲。领导层也必须以自己的方式承担相应影响。
NVIDIA面临联邦调查和出货延迟
NVIDIA近年来取得了巨大成功,成为仅次于Apple和Microsoft的第三大市值公司。然而,它是否发展过快,在市场上占据了主导地位?是否采取了反竞争措施?在NVIDIA宣布计划收购以色列公司Run:ai后,美国司法部启动了对该公司的反垄断调查。
8月6日,美国一名法官裁定Google因其搜索业务及与Apple等公司的交易构成垄断行为。受此鼓舞,司法部在追查NVIDIA等大型高盈利公司时将更有信心,力图弄清它们如何达到现有地位,是否一切合规。这最终将成为一个法律问题,而非评论家的意见。无论结果如何,这项调查及可能随之而来的诉讼都将耗时良久。
NVIDIA在3月的公司大会上发布了Blackwell GPU,宣称其能耗和成本比前代产品减少多达25倍。从超大规模数据中心运营商到数据中心管理者,再到企业IT经理,许多人都对此感兴趣。不幸的是,许多人可能需要等待几个月,才能等到新芯片和封装的大规模出货。
这几乎不会带来太大影响。目前,云端和本地的AI应用加速器容量充足。大多数这些应用仍处于开发阶段,尚未投入生产,特别是针对生成式AI的用例。此次延迟只是一个小波折,不会对AI应用的创新产生不利影响。
分析师结论
预计2028年云端和数据中心AI加速器市场将增长至1380亿美元,年复合增长率接近30%。由于大量投资的存在,当前的战略举措和决策变得尤为敏感。失去或赢得一个超大规模客户或几个大企业级客户,厂商就可能在市场中挣扎或大获成功。处于这一市场的厂商必须冷静下来,全面考虑行业内的竞争情报来做出决策。
此外,计算机行业具有周期性,因此厂商必须依靠其领导者和第三方的经验,进行清晰且诚实的分析,以了解其当前所处的位置,以及为了实现目标需要采取的行动。换言之,它需要依靠人类智能来进行预测性和指导性分析。
Source:AI Chipsets in Context: Good and Bad News for Vendors; Bob Sutor; August 9, 2024
---【本文完】---
近期受欢迎的文章:
更多交流,可添加本人微信
(请附姓名/单位/关注领域)