其他
英伟达离市值泡沫还有三道防线
英伟达再次带来超出预期的财报,2024财年营收609亿美元,相较上一财年的270亿美元倍增还多,尤其是第四季财报,所有的指标都超预期。接下去的一年,它还能不能再次兑现营收翻番的预期?这得看它能不能进一步降低推理成本,不仅自己大口吃肉,开发者也要能够喝上汤。生成式人工智能正处于一个“临界点”,全球各大公司、行业及国家的需求,均呈现爆炸式增长。数据中心是英伟达的核心业务,占营收80%以上,人工智能又贡献了数据中心的40%。在财报电话会上,黄仁勋豪言,生成式人工智能开启了一个全新的投资周期,下一个万亿美元的人工智能生成工厂基础设施,预示着一个全新应用领域的开端。但生成式人工智能的应用仍处于“原始汤”的状态。美国红杉资本今年开春的调门小了不少,认为人工智能驱动的应用,将与SaaS等传统应用很不同。那些利用AI快速推出简单产品的团队,将在2024年遭遇重置。Transformers八子之一的Jakub Uszkoreit,现在的AI生物技术公司Inceptive的创始人,就表示大家过早地从探索阶段跳到了开发阶段。除了大模型性能,以及深度结合应用场景,提供真实的附加值,大模型及其应用的开发,如今还有几个探索方向。一个正在探索的方向,是提升推理实时性。最近的一个例子就是Groq,被视为世界上最快的大模型,比GPT-4快18倍,测试中曾破纪录达到每秒吞吐500 tokens。这得益于它自研的LPU(语言处理单元),能利用 SRAM(静态随机存储芯片) 进行数据处理,不用像传统的HBM(高带宽内存)那样,频繁的加载传输大量数据。慢悠悠地吐出答案,影响用户体验;用Sora预制一部影片,卖给所有人,与将Sora嵌入游戏,让它实时生成不同玩家不同选择导致的不同剧情走向,是不一样的用户体验与商业模式。另一个探索的方向,是降低推理的成本。越来越多初创企业开始接入大模型的API,售卖AI赋能的服务,但很多处于亏本赚吆喝的阶段,先把活跃用户圈起来,向投资人证明自己将是下一个杀手级应用,然后用融到的钱买更多的算力。这又回到了传统互联网企业买流量的商业模式,而且问题更严重。传统互联网企业买流量,花掉了40%-50%的钱,新兴的AI初创企业正在花掉60%-75%的钱买算力。如果只考虑推理速度,Groq正在挑战英伟达的地位。要让英伟达的H100,勉强跟上Groq的吞吐速度,就要付出比Groq高40%的单位成本。但问题在于,Groq本身提供的延迟优化的服务价格太贵,相比付出近10倍的成本,市场更愿意再等等。等大模型吐出更准确的答案,等推理成本继续下降。