查看原文
其他

“云巨头+大模型”结盟,火拼算力新战场

元帅 高佳 飞哥说AI 2023-11-09

文 | 元帅

编辑 | 高佳

AI 狂飙的时代,越来越多公司在为算力烦恼。
生成式 AI 让开发者对 AI 性能的需求激增。行业对于算力的渴望,成就了万亿美元的半导体巨头英伟达;算力是否足够的争论,也让英伟达一直是 AI 领域的话题主角。
这同样也成就了诸多云服务提供商,面向需要大量算力的客户,提供高性能计算资源的租赁服务。
业内不禁调侃,大模型自身卖不上价格,最后都是卖云卖卡卖算力的赚钱。
这背后,云巨头的火药味越来越浓了!
因此,我们看到这样一个趋势,云服务提供商和 AI 初创公司都在寻求尖端技术和强大计算能力。
作为云计算领域未来的主要客户,大模型和 AI 应用公司已成为各大云巨头竞相争取的对象。
今年,谷歌、微软、亚马逊、甲骨文和英伟达纷纷采取相似的行动,通过战略投资来锁定算力客户。
微软 Azure 与 OpenAI 建立了合作关系,而谷歌也在内部开发强大的生成技术。亚马逊选择与 Anthropic 建立合作伙伴关系也不足为奇。
最终,云服务将涉及到公司如何去利用 AI,以及技术供应商如何从中获利。获胜者不仅将主导未来市场,还有可能成为史上最富裕的公司。
在大模型“军备赛”的初级阶段,微软毫无疑问是跑在最前面的少数。
而今天的大模型正成为云厂商增长放缓的“大救星”,竞争在微软、谷歌及亚马逊等云巨头之间更显激烈,云厂商竞争的重点已风云诡谲。
本文将重点讨论以下几点疑问:
1、海外几大云巨头竞争的第一个关键点,即是对外战略投资,抢 AI 算力客户和 AI 项目。微软联手 OpenAI 作为绝佳范本,开启了大模型和战投牵手的先河,引得其他巨头竞相模仿,如亚马逊选择与Anthropic 结盟。那么,这种捆绑方式能否继续产生微软+OpenAI 的效应,顺利打开市场?
2、大模型时代来临以后,对云服务商而言,今天最稀缺的资源就是算力,或者说是 AI 芯片。巨头都不想为英伟达打工了,纷纷投资最底层的基础设施——AI 加速芯片,也成为今天云厂商竞争的另一个重点,问题是能否持续下去?
3、从抢夺 AI 算力客户、开发大模型到研发 AI 专用芯片,几大巨头打响了云赛道新一轮战争,竞争格局将如何呈现?

 

01.破局



上一波 AI 浪潮,掀起过一场革命:机器学习越来越高效,尤其是在深度学习进步的推动下,它已经为计算机视觉、语音识别、自然语言处理等方面带来了飞速的发展。
当时,亚马逊、谷歌和微软这样的科技巨头一直致力于将人脸识别和语音转换等功能添加到他们各自的云服务中。
在 21 世纪第二个十年的早期,谷歌、Meta、微软都押注重兵于上,而亚马逊已经落后,并没有大力发展 AI 相关技术,后来才意识到该项需求的迫切性。到 2018 年,媒体关于“AI 领域中,谁是云巨头赢家”的讨论就开始了。
亚马逊在 AI 领域并未有太多的媒体声量,但凭借着自身在云市场 40% 的市场份额,公司希望将自身的这种云优势带到 AI 领域中。
从那时起,云与 AI 的结合愈发紧密,AI 即服务(AIaaS)也从最初的概念变成了现实,科技巨头都在大举进军云服务领域,投入巨资建设云平台,包括亚马逊、谷歌和微软在内的巨头都希望能够主导云AI领域中的业务。
此前,Alexa、Siri 以及其他数字助手的出现,没有为科技巨头带来更多可观的收入。不过,他们找到了另一条商业化道路,不断去创造底层技术与开发工具。
跟云计算传统的企业级市场不同,新兴的AI应用开发是一片全新的蓝海,像谷歌云平台托管使用 TensorFlow 构建的应用程序,而亚马逊云服务 AWS 已经为 AI 开发人员和应用程序托管市场提供服务。
谷歌一开始取得了一些先发优势。公司自 2015 年发布了 TensorFlow 并加以开源,这是一套曾被谷歌内部专家用以创建机器学习工具的软件框架。同期,亚马逊和微软也具有了与谷歌相类似的技术,二者甚至于 2017 年联手创建了 Gluon,这是一个开源深度学习库,旨在让机器学习更加容易使用。
三巨头均致力于让机器学习更加易用,以便让 AI 新手也能对该技术进行操作与使用。这也是亚马逊创建 SageMaker 的原因之一,但也因为过于执着于自己干 AI,错过了投资 OpenAI 的先机。
与其他科技公司布局 AI 不同的地方在于,微软 AI 有了云服务的助攻,跑出了一条差异化的道路。
随着 ChatGPT 走红,微软的云业务成为最大受益者。如果说 OpenAI 开发的聊天应用 ChatGPT 是一个带操作系统属性的超级应用,那么微软云服务 Azure 就是运行该应用的计算机。
在全球科技巨头中,微软对生成式AI的投入最大,标志性的事件是5年前对 OpenAI 的投资,为其旗下产品的模型训练提供了全方位的云服务支持。
作为OpenAI 的重要投资者,眼下已有了收获,微软正将 GPT 技术融入其云服务、Windows、办公套件和搜索引擎 Bing 等全线产品。
按道理来说,在过去的十年中,IaaS 和 PaaS 一直由亚马逊的 AWS 云服务主导。2018 年,亚马逊的市场份额为 47%,而微软为 15%。三年后,微软的份额为 24%,亚马逊的份额降至 32%。
AWS 的客户主要是那些没有利润或只是勉强盈利的小企业,更容易受到经济放缓的影响。大企业通常选择 Azure,因为微软签署的 Azure 合同创下了超过 1 亿美元和超过 10 亿美元的纪录。 
因此,全球经济放缓的大环境下,这也不难理解亚马逊为何正面临着 10 年来最慢的收入增长。自 2022 年起,亚马逊云业务的增长势头逐渐减弱,2021 年云同比增长 22%,而 2022 年仅有 9%;在其今年发布的第一季度和第二季度财报中,亚马逊云的同比增长分别仅为 16% 和 12%,这是自成立以来最低的季度同比增速。
反之,大模型业务的快速发展,Azure 迅速成为微软的核心收入来源。微软CEO 纳德拉之前表示,当前微软的主要驱动力在于微软云,包括公共云服务和微软365 等云端服务。显然,微软“云计算为先、移动为先”的战略部署发挥了作用。
亚马逊一味的跟随战略,显然会让自身战略陷入被动地位。原本是云计算市场“一哥”的亚马逊的市场份额,被微软等强大的竞争对手一点点蚕食,以至于亚马逊总裁兼 CEO Andy Jassy 在今年初的股东信中袒露,2023 年为近期记忆中“最艰难的一年”。

从挑战者到被挑战者,亚马逊头座角色转变的背后,AIGC 为云计算提供了增量市场,但亚马逊一开始并没有抓住 AI 浪潮的先机。



02.奇袭‍



微软联手 OpenAI 作为绝佳范本,开启了大模型和战投牵手的先河,引得其他巨头竞相模仿。


可以说,大模型初创明星公司,都是科技巨头想排兵布阵抢夺的香饽饽。
为了改变被动局面,就在上个月,亚马逊也相中了 Anthropic,反手就初步投资了 12.5 亿美元购买 Anthropic 的少数股权,未来还将对 Anthropic 的投资增加至 40 亿美元。
AWS 负责人不忘解释,亚马逊与 Anthropic 的合作与“微软 - OpenAI ”不同,并不是一份排他的协议。
然而,AWS 还是靠大额投资从谷歌手中抢到大客户,成为 Anthropic “关键任务负载”的主要云提供商,此前承担这个角色的是谷歌。
面对微软去年的直接挑衅,谷歌明显表现出来比亚马逊更为积极,采取防御模式迅速投资了 3 亿美元给 ChatGPT 的对手 Anthropic。
Anthropic 是之前OpenAI 的创始团队成员自己出来做的公司,也是 OpenAI 的头号对手。今年年初,Anthropic 表示将首选使用 Google Cloud 云服务和 TPU 芯片训练模型。
事实上,亚马逊本可以不这么被动,早在5年前,大模型“当红炸子鸡” OpenAI 曾向亚马逊示好,寻求云计算资源支持,但是惨遭拒绝。
不过翻看此前报道,Anthropic 在 2021 年已经是亚马逊的客户,但后者云资源不是第一选择。那么,这次通过投资势必将加深合作,官方公告中能看出,亚马逊和对方还有一个新目标,那就是加速开发自研的AI芯片。
大模型依赖于强大的计算资源来进行训练和生成输出,云主机、GPU (图形处理单元)和 TPU(专用芯片)才真正构成了生成式人工智能基础架构栈的基础。
当下,芯片是通用大模型的命门。计算成本是扩展这些模型的主要制约之一,而芯片短缺通过限制供应推高了成本。
为了降低计算成本,云巨头不满足于与英伟达合作,和平共处不会永远持续下去,也会变成竞争对手。
早年间,亚马逊和谷歌在内的大型云提供商,都在积极研发自家的芯片,更适合人工智能。眼下投身 AI 浪潮时,下场设计自己的处理器更为积极,对英伟达的霸主地位发起围攻。
2016 年,谷歌自研芯片 TPU 问世,该款芯片能为深度学习模型执行矩阵运算,随后相继推出了 AI 芯片 TPU v3 、TPU v4。亚马逊则是最早涉足自研芯片的云厂商,2018 年推出自研AI推理芯片 Inferentia;今年年初,性能更强的Inferentia 2 发布。
除了加快自研芯片和大模型的开发节奏,亚马逊在全球市场重新调整排兵布阵,最近大中华区换帅,终于吹响了反攻的号角。
目前全球智能化跑的最快的两个国家,中国紧随着美国身后,已经成为不能失守的“战场”。这也不难理解头部云厂商为了保市场份额,不得不降价,竞争异常激烈。

对于亚马逊来说,AI 是一场硬仗,也是不能输的战争。



03.混战


看到了这一趋势,一直在芯片布局中处于落后地位的微软,今年 4 月份被曝光已经开始在芯片战略上选择自研芯片。
跟谷歌、亚马逊早早布局芯片相比,这也是微软唯一的短板。
最近,微软和 OpenAI 宣布了各自的造芯计划,彻底证实了自研芯片的事实。据知情人士报道,微软计划在下个月的年度开发者大会上,推出首款为人工智能设计的芯片。
未来,随着云巨头自研芯片战略的持续,跟英伟达的竞争关系会越来越紧密,在竞争格局中的位置也会逐步接近、交叉、融合。
云的作用越来越复杂,它不再仅仅像一个大型外置硬盘驱动器。它充满了需要不同芯片架构的新功能。在某些情况下,这意味着重新利用现有技术。英伟达的云业务建立在其 GPU 之上,这是用于使计算机动画栩栩如生的专用芯片。
具有讽刺意味的是,对于硬件企业来说,云芯片的另一大块战利品可能最终落入提供最好软件的公司手中。
英伟达广受欢迎的编程语言 CUDA 已经使开发人员更容易提高其芯片的性能,而面向开发者的 CUDA 开发系统也被看作是英伟达最大的护城河,如同苹果的 IOS 系统一样。
没有人会对 AI 袖手旁观,因此 AI 这个赛道将愈发拥挤,竞争也将更加残酷与激烈,新玩家们也都在虎视眈眈。
初创公司们凭借灵活性和专业性,使其能够在 AI 基础设施领域找到一席之地,在性能和成本效益方面具有竞争优势,更适用于 AI 应用。
同胃口庞大的硅谷巨头们要自研芯片不同,新玩家们与英伟达不存在利益冲突,也能拿到更多的大批最新的 AI 芯片,甚至顶级云巨头也会分流供应。
当然,云巨头竞争的核心不是单纯的云主机、芯片本身,而是基于此背后的生态圈。大模型的生态繁荣,也是科技巨头最关心的事情。
从今年 4 月起,亚马逊云科技结合自身定位并基于真实用户需求出发,正式宣布进军生成式 AI 市场,为一切想要利用生成式AI技术加速或创新业务的企业提供服务。
4 月 13 日,亚马逊云服务 AWS 发布了自研大模型 Titan,以及可通过API(应用编程接口)调用 Titan 和第三方模型的云服务 Bedrock。
在短短的 4 个月期间,亚马逊云科技已推出了各类底座资源,从基础模型到算力支撑,从私人数据存储到高效开发工具应有尽有。
谷歌云势在必得,在 AI 生态上已早先一步。谷歌云在 5 月 10 日的谷歌开发者大会上更新了 2021 年发布的 AI 平台 Vertex AI,使开发者可以部署和调优大模型。
谷歌云首席执行官 Thomas Kurian 8 月底在年度 Next 大会上称,目前行业中超 50% 的 AI 初创公司,以及超过 70% 的生成式 AI 独角兽都是谷歌云的客户,其中包括 AI21、Anthropic、Cohere、Runway 和 Typeface 等。

可见,微软的抢跑,让亚马逊、谷歌压力倍增,对 AI 初创公司势在必得。


04.尾声


不得不承认的事实是,大模型是影响下一阶段市场格局的关键因素,这不仅是一场技术竞争,更是一次关于排名和未来可能性的争夺战。

对于那些领先级的云 AI 供应商来说,云 AI 将有可能为他们带来前所未有的发展机遇与潜力。不管是哪家供应商在 AI 领域走在了前列,它所形成的统治格局都很难被打破。
传统云巨头和不断涌现的新玩家们在 AI 上战得火热,如今浪潮初起,一场全新领域里的王者之争才刚刚拉开序幕。
正如 A16Z 此前 AI 专题讨论的那样,从长远来看,我们可能过分关注了哪些模型用于哪些用例的问题,当下仍处于建立将支持未来AI应用浪潮的基础设施和架构的早期阶段。

言外之意,在这场云计算战争中,早期的焦点在于争夺强大的计算能力和战略投资。然而,从长远来看,大模型仍将成为决定市场竞争胜负的关键因素。


当下的技术与商业演进远未到终局,真正的变革甚至还未正式开始,只要在牌桌大家都有机会。



相关阅读:


OpenAI 自研芯片的三个猜想


AI+元宇宙,Meta 翻身稳了?


大模型下半场,关于Agent的几个疑问


从机器人模型 RT-2 看多模态、Agent、3D视频生成以及自动驾驶


这一次,AI创业公司怎么玩?



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存