其他
ChatGPT引发人工智能浪潮,苹果、亚马逊、Meta、谷歌、微软、英伟达,谁能占据上风? |【经纬低调分享】
The following article is from 海外独角兽 Author 拾象
ChatGPT的横空出世,引发了人工智能浪潮。
今天分享的这篇文章,来自Ben Thompson,他是美国知名科技评论作者,多年来对 FAANG 和其他科技公司进行了很多追踪和分析。最近他从颠覆式创新的角度,分析了苹果、亚马逊、Meta、谷歌、微软、英伟达等科技巨头们在大模型和 AI 时代的优势和挑战。
在Thompson看来,人工智能未来会成为一种基础设施,带给这个世界更多惊喜,处于产业链更上游的英伟达和台积电很可能成为最大赢家。
同时,机会也可能来自那些最在乎确定性的行业,因为这些行业的传统公司预计很难给予基于概率统计的人工智能技术以充足的投资,正如当年柯达不会给予基于数字图像的数码相机技术以充足的投资一样,但也同当年数字技术一样,人工智能技术在飞速发展。以下,Enjoy:
作者:Ben Thompson
编译:Johnson、penny排版:Lydia
由于大模型对算力、人才、数据有极高的需求,因此虽然新一代 AI 应用可能来自创业公司和开源社区,但大公司在这一波科技浪潮中捕获价值的能力不容忽视。
Ben Thompson 是美国知名科技评论作者,多年来对 FAANG 和其他科技公司进行了很多追踪和分析。最近他从颠覆式创新的角度,分析了科技巨头们在大模型和 AI 时代的优势和挑战。
如果要寻找新时代的苹果和微软,就需要更深入理解当下新技术与旧巨头相遇碰撞出的火花。因此我们对 Ben Thompon 的观点进行编译,并对五大科技巨头的布局补充说明。
2022 年苹果从开源世界收到了一份令人难以置信的礼物:Stable Diffusion,这个模型未来有望集成进 iPhone 手机,开启 APP Store 新一轮繁荣。
与苹果面向消费者的业务相反,亚马逊会通过 AWS 收到许多云端推理的订单,但短期会有 GPU 算力不足的焦虑,长期则面临推理成本久居不下,和下游公司自建数据中心的巨大变量。
Meta 应该加大对 GPU 数据中心的投资,从长期来看,无论是对于加深自身的广告业务的护城河,还是将社交媒体和集成式 VR 设备作为生成式 AI 技术的入口而言,都会有极大的帮助。
对于 Google 而言,这家曾发明了 Transformer 模型的伟大企业和当年的柯达遭遇了同样的困境,后者也是颠覆式技术数码相机的发明者。因为聊天机器人无需用户点击,这颠覆了传统的按点击量付费的搜索 - 广告商业模式。
不过,未来无法精准预测,曾经被认为是颠覆式创新受害者典型代表的微软,如今反而借助云计算等技术抵达新的浪潮之巅,同时,在生成式 AI 的新一轮技术革命中,微软处在一个最好的生态位置,也正通过 Bing 结合 ChatGPT 的方式成为新的颠覆者。
人工智能未来会成为一种基础设施,带给这个世界更多惊喜,但对单个公司影响力有限,处于产业链更上游的英伟达和台积电很可能成为最大赢家;同时机会也可能来自那些最在乎确定性的行业,因为该行业的传统公司预计很难给予基于概率统计的人工智能技术以充足的投资,正如当年柯达不会给予基于数字图像的数码相机技术以充足的投资一样,但也同当年数字技术一样,人工智能技术在飞速发展。
👇
01 苹果02 亚马逊03 Meta04 谷歌05 微软06 英伟达
颠覆性技术为市场带来了与以往截然不同的价值主张。一般来说,颠覆性技术在主流市场上的表现不如成熟产品。但它们有一些局部的,边缘的(一般是新的)客户看重的其他特点。一般情况下,基于颠覆性技术的产品更便宜,更简单,更小,使用起来更方便。
互补品是指两种商品必须组合在一起才能满足需要。例如,在相机价格不变时,如果作为其互补品的胶卷的价格大幅度上涨,则人们对相机的需求也会减少;胶卷价格下降,人们对相机的需求则会相应增加。
开源代码依旧需要遵守经济规律,我们在 Eazel、ArsDigita、之前知名的 VA Linux 公司和其他许多公司中看到了这一点。但是许多非常大的上市公司,纵然负有使股东价值最大化的责任,但它们正在投入大量资金支持开源软件,通常是通过支付大量的程序员团队来进行工作。
这可以用“互补原则”作为解释:在经济学中,当一个产品的互补品的价格下降时,对该产品的需求就会增加。一般来说,一个公司的战略利益是让它的补充产品的价格尽可能地低,理论上可持续的最低价格是 "商业价格"——即有一群竞争对手饱和式竞争后的产生的价格。因此,聪明的公司试图让它产品的互补品商品化,增加自己的产品的需求,赚取更多的利润。
目前移动端设备显存要低于笔记本电脑一个数量级,综合技术进步,预计图像生成模型 1-2 年后能集成进入手机终端,且体验良好。
Stable Diffusion 在任何应用程序中的一个关键问题是模型在哪里运行,在应用程序中,相比于基于服务器的方法,在设备上部署 Stable Diffusion 模型更有优势,原因有三条:首先,这能够更好地保护终端用户的隐私,因为用户向模型输入的任何数据都会留在用户的设备上;其次,在初始下载后,用户不需要互联网连接就可以使用该模型;最后,在本地部署这个模型使开发者能够减少或消除他们的服务器相关成本...
为 Stable Diffusion 优化 Core ML 并简化模型转换,使开发者更容易以保护隐私和经济可行的方式将这项技术纳入他们的应用程序,同时在苹果设备上获得最佳性能。该版本包括一个 Python 包,用于使用 diffusers 和 coremltools 将 Stable Diffusion 模型从 PyTorch 转换到 Core ML,以及一个 Swift 包,用于部署这些模型。
在过去两年半里,类似 GPT-3 等模型的训练成本下降了 80% 以上,目前仅需要 140 万美元(首次训练开销约为 1200 亿美元),高性能大语言模型的训练成本将进一步降低。
亚马逊在这一领域的前景将取决于若干因素:首先最明显的是这些产品最终在现实世界中的实用性如何,除此之外,苹果直接在终端生成 AI 也会对亚马逊产生重大影响。好在亚马逊本身就是一个芯片制造商:虽然它迄今为止的大部分努力都集中在其 Graviton CPU 上,但它可以为 Stable Diffusion 等模型建立的专用硬件,并在价格上竞争,同时 AWS 和 NVIDIA 建立了良好的合作伙伴关系。
注:AWS Graviton 是由 AWS 设计的基于 ARM 架构的 64 位CPU。第一代于 2018 年推出的,第二代产品于2019年12月推出,已在AWS EC2 实例中得到广泛应用,产品目前已迭代至第三代。
更有挑战的是:人工智能的挑战之一是推理要花钱,换句话说,不同于传统软件,用人工智能做东西有边际成本。
我认为在开发人工智能产品时边际成本问题被大大低估了。
虽然云服务一直都有成本,但 AIGC 可能会使它难以实现 product-market fit ,我并不认为 ChatGPT 对终端用户是免费的,并可以由 OpenAI 的一家公司提供,实际上背后还有 Azure 的支持,OpenAI 不仅建立了自己的模型,还与微软达成了计算能力的优惠协议,这并不是一个偶然,长远来看,或许 AWS 不得不廉价出售 GPU 算力,才会刺激更加繁荣的生成式应用。
当然,随着时间的推移,这些成本应该会下降:模型会随着芯片的进步变得更有效,而市场上需求的繁荣会给云服务带来应有的规模回报。不过,除了上述苹果在设备端推理的可能性之外,AWS 长期同样会受到全栈集成的模型供应商的影响,这一切都是不确定的。
注:对于模型供应商而言,AI 计算的需求不同于传统上所说的“云计算”:AI 训练一般会占满物理机,并不要求特别强的虚拟化,需要更高的性能和带宽,同时很多任务是离线的。
3
不过,ATT(苹果的透明跟踪技术)的长期解决方案是建立概率模型,不仅要弄清楚客户目标,还要了解哪些广告转化了,哪些没有。这些概率模型将由大规模的 GPU 数据中心建立,一张 Nvidia 显卡成本为五位数,如果是过去那样的确定性的广告模型,Meta 并不需要投资更多的 GPU ,但技术在进步,Meta 需要面对全新的时代,在客户定位和转化率层面投入更多。
此外,基于概率模型的算法对网络飞轮的持续增长至关重要:从互联网中推荐内容比只从你的朋友和家人那里推荐内容要困难许多,特别 Meta 打算不仅推荐视频,还推荐所有类型的媒体,并将其与你关心的内容穿插在一起,这种情况下,人工智能模型也将是关键,而建立这些模型需要花费大量资金购买设备。
长远看,关于显卡的投资能得到丰富回报:首先,更精准的客群定位和转化率可以帮助 Meta 重启收入增长,其次,一旦这些人工智能数据中心建成,后续只需要支付维护和升级成本,这远低于其建造成本;第三,这种大规模投资是其他竞争对手无法做到的,除了谷歌(不巧的是,谷歌的资本支出也将上升)。
ATT(苹果的透明跟踪技术) 对 Meta 的伤害比任何其他公司都大,因为后者是美国市场投放第一大平台,但从长远来看,它会加深 Meta 的护城河:自建 AI 数据中心这种水平的投资对于像 Snap 或 Twitter 或数字广告领域的任何失败的竞争者来说根本不可行,一方面是 Meta 的广告算法水平会和其他竞争对手(谷歌除外)拉开差距,另一方面是由于自建数据中心它的费用又可以大大降低,到最后广告商往往别无他选。
注:2021年 4 月 26 日,苹果“应用追踪透明” (App Tracking Transparency,简称 ATT) 隐私采集许可新政正式实施,用户可以有权利自主选择是否被应用开发者追踪的自主权利,即模糊归因了广告的投放效果。
苹果政策发布当日,Facebook 股价应声下跌 4.6%。
• 2022年 1 月发布语音生成模型 Data2vec,该模型可以以相同的方式学习语音,视觉和文本,并于2022 年发布 Data2Vec2.0,大大提高了其训练和推理速度;
• 2022年 5 月发布开源的语言生成模型 OPT(Open Pre-trained Transformer),同 GPT3 一样使用了 1750 亿参数,并于2022年 12月 发布其更新版本 OPT-IML,还将为非商业研究用途免费开放;
• 2022年 7 月发布图片生成模型 Make-A-Scene;
• 2022年 9 月发布视频生成模型 Make-A-Video;
• 2023年 1 月发布首个 4D 场景生成模型 Make-A-Video3D,直接从文本描述中生成 3D 动态场景;
在 2022 财年报告上,扎克伯格说,Meta计划将新技术集成到几乎所有产品中,例如生成图像,视频,头像和 3D 资产,营销人员可以使用生成式人工智能来帮助他们的付费帖子提供书面副本或创建图像和视频,从 2022 年 Q3 季度财报至今,Meta 股价已经翻了一番(如下图所示):
从技术储备层面讲,谷歌是领先于 OpenAI 的,只不过很多前沿进展没有和业务结合:
• 生成模型端:
▫ 对话模型 LaMDA;▫ 目前最大的参数量(5400亿)通用语言生成模型 PaLM; Ⅰ. 2022年8月,PaLM-saycan,具身机器人,基于机器人动作序列数据集; Ⅱ. 2022年12月,Med-PaLM,医疗机器人,基于医疗领域数据集; Ⅲ.(正在开发)PaLM-Coder 2,代码生成工具;▫ 图像生成模型 Imagen;▫ 音乐生成模型 MusicLM。
• AI 系统端:
▫ 大模型训练系统 Pathway 平台;▫ 自研 Tensorflow 和 Jax 框架;▫ 谷歌云和 TPU 芯片。
同时 Google 于 2022 年底向 OpenAI 竞争对手 Anthropic 投资 3 亿美元,投资条款类似微软投资 OpenAI,包括要求 Anthropic 使用谷歌云的算力,以及从 Pytorch 切换至 JAX 框架。Anthropic 团队主要来自 OpenAI,自称“是一家人工智能安全和研究公司,致力于构建可靠、可解释和可操纵的人工智能系统”,近期内测了一款名为 Claude 的智能聊天机器人,据称在多项指标上优于 Chat GPT。
2 月 8 日,谷歌在 Google presents : Live from Paris 大会上首次展出 Bard ,但整场发布会没有过多关于 Bard 的内容,还在展示的 Demo 中犯了事实性错误,当日股价下跌 3%,作为对比,微软股价上涨 6% 。
一年以后苹果 iOS 6 则首次以 Siri 的名义引入了助手的概念,你第一次可以(理论上)通过语音进行计算,起初它的效果并不好(可以说现在也是如此),但它对计算机和谷歌的具体影响是深远的:语音交互扩大了计算的范围,尽管有一定限制,但它把你的眼睛和双手从设备中解放出来。AI 助手必须比搜索结果页面更加积极主动,仅仅提供可能的答案是不够的,相反,它们需要给出正确答案。
这是谷歌技术的一个可喜的转变,从一开始,搜索引擎就包括一个 "我感觉很幸运 "的按钮,谷歌创始人拉里-佩奇对搜索引擎能够提供你想要的确切结果如此有信心,虽然昨天的谷歌助理演示是有剧本的,但它在涉及上下文感知时候,比市场上的其他助理更惊艳,延申开来,当涉及到作为其助手基础的 AI 技术时,谷歌是公认的领导者。
不过,一个企业不仅仅是技术问题,特别是在涉及到 AI 助手时,谷歌有两个重大缺陷:首先,该公司缺少一个终端的入口 :助手只有在可用的情况下才有用,对于数以亿计的 iOS 用户来说,这意味着下载和使用一个单独的应用程序(或者建立像 Facebook 那样的体验,用户会愿意花大量的时间)。其次,如果用户不必从搜索结果中进行选择,便没有机会点击广告,这对于 Google 现有商业模式有很大冲击。
• 2022年,微软计划对 OpenAI 追加 100 亿美元的投资,这笔资金还包括其它风险投资机构:
▫ 投资后微软将获得 OpenAI 的 75% 利润,直到它收回投资,在这之后微软将获得 OpenAI 49%,其他投资者获得另外 49% 的股份,OpenAI 的非营利性母公司获得 2% 的股份。
▫ 盈利后的 OpenAI 的利润分配将按照以下四个阶段进行:
第—阶段将优先保证埃隆马斯克、彼得泰尔、雷德霍夫曼等首批投资者收回初始资本;
在第二阶段,微软将有权获得 OpenAl 的利润,直至收回其 130 亿美元投资;
第三阶段,在 OpenAI 的利润达到 920 亿美元后,微软在该公司的持股比例将下降到 49% , 剩余 49% 的利润由其他风险投资者和 OpenAI 的员工分享;
第四阶段,在利润达到 1,500 亿美元后,微软和其他风险投资者的股份将无偿转让给 OpenAI 的非营利基金。
关于搜索成本的计算:
• 理论层面目前推算单次搜索成本为 0.5 美分,谷歌日均 10 亿次搜索,目前市场占有率 91%,引入聊天机器人后可能会使成本提高 1-2 倍,大概占 Google 年营收 15%--25%;
• 未来通过模型蒸馏、系统优化、芯片提升等三个维度的技术进步,该成本有望每半年下降一半以上;
• 但 Bing 本次的演示表明实际产品中的搜索成本并不是简单的一次搜索和一次生成的成本相加,而是有机的结合,具可靠信息:本次演示的 Bing 的搜索成本比 Google 高 2 个数量级。
• 我们可以通过 VS code 订阅 Github Copliot 产品辅助编程;(VScode 和 Github 均为微软旗下产品);• 可以使用集成了 ChatGPT 的搜索引擎;• 在终端零成在本地享受集成了生成模型的 Windows 系统和 Office 套件;• 可以在 Azure 云服务上调用 GPT 和 DALL-E 系列;• 可以在 Teams 上享受 ChatGPT 助理的辅助办公。
重要的是,增加新的功能,与微软的订阅商业模式完全相符,令人感慨的是,这家公司曾被认为是颠覆式创新受害者的典型代表,但现在来看,它们反而借助颠覆式技术抵达了更高的平台。
过去十年微软的股价上涨 9 倍,标普 500 指数上涨约 4 倍,而曾经的颠覆式创新者 Google 上涨仅 4 倍。
• 市占率常年稳定在 80% 附近,据 Top500.Org 数据显示:英伟达 GPU 产品在全球 Top 500 超算中心的渗透率逐年提高,由 2013H1 的 72.2% 提升至 2021H2 的 90.3%,研究文献中引用英伟达 GPU 的次数是顶级AI芯片初创公司总和的 90 倍;
• 同时其 CUDA 生态开发开发者在过去两年翻了三倍到接近 350 万,形成了强大的软件生态护城河,并不会担心来自谷歌 TPU 等专用 ASIC 芯片的竞争;
• 目前人工智能领域的算力需求约每 3.5 个月翻一倍,导致其芯片常年供不应求,即使最新一代 H100 芯片已经发布,上一代芯片 A100 市场价较发布初期依旧有所上涨,这在硬件端是极不寻常的事情;
• 继摩尔定律后,英伟达 CEO 黄仁勋提出黄氏定律:每 12 个月 GPU 性能翻一倍,且不受物理制程约束。
不过,摩根斯坦利最近的报告认为:
长期训练用硬件的增长速度会比较平稳,正在开发的语言模型大小预计不会更快增长。
另外,推理成本是一个高估的数字,市面上的计算都是基于 A100 的成本进行推测,但 A100 不是推理专用芯片。Azure 在云产品中建议推理工作应该运行在 Nvidia T4 上,硬件成本比 A100 低 80%,功率效率更高,所以预计每次推理成本未来会迅速降低。
由于英伟达没有在推理端垄断,这指向了一个新的兵家必争之地——更具性价比的新型架构 AI 推理芯片,AMD、Intel 和创业公司都有机会。推理市场可能比训练市场更具前景。
关于人工智能的潜在影响,还有很多东西要写,但这篇文章已经够长了,从新公司的角度来看,OpenAI 显然是最有趣的:OpenAI 有可能成为所有其他人工智能公司赖以生存的平台,这将最终意味着 OpenAI 之外的人工智能的经济价值可能相当有限。
2.《创新者的窘境》http://claytonchristensen.com/books/the-innovators-dilemma/3.广告业务的护城河https://abovethecrowd.com/2011/03/24/freight-train-that-is-android/4.《战略信条》https://www.joelonsoftware.com/2002/06/12/strategy-letter-v/5.Stable Diffusion 可在 Iphone 上运行https://stratechery.com/2022/lensa-and-stable-diffusion-stable-diffusion-and-apple-silicon-open-questions/6.苹果公司模型优化
https://machinelearning.apple.com/research/stable-diffusion-coreml-apple-silicon7.Stability AI 的创始人兼首席执行官 Emad Mostaque 发言 https://twitter.com/EMostaque/status/15638706741118320668.Meta Mythhttps://stratechery.com/2022/meta-myths/9.自研 VR 设备芯片https://stratechery.com/2022/metas-chip-decision-horizon-worlds-platform-fees-metas-missing-metaverse-strategy/10.上层 AI 软件工具https://www.reuters.com/technology/meta-launches-ai-software-tools-help-speed-up-work-blog-2022-10-03/11.算法的终局是 AIGChttps://stratechery.com/2022/instagram-tiktok-and-the-three-trends/12.Metaverse 访谈https://stratechery.com/2022/dall-e-the-metaverse-and-zero-marginal-content/13.谷歌和战略的局限性https://stratechery.com/2016/google-and-the-limits-of-strategy/14.谷歌的缺陷:终端入口https://stratechery.com/2016/googles-go-to-market-gap/
15.谷歌的未来https://stratechery.com/2014/peak-google/
https://stratechery.com/2019/the-google-squeeze/16.微软独家云供应商https://www.theinformation.com/articles/why-openai-spent-barely-a-dime-on-microsofts-cloud-after-1-billion-deal17.The Information 最新报道https://www.theinformation.com/articles/ghost-writer-microsoft-looks-to-add-openais-chatbot-technology-to-word-email18.英伟达人工智能生态系统https://stratechery.com/2022/nvidia-in-the-valley/19.Top500.Org20.纳特-弗里德曼在 Stratechery 的采访https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-chatgpt-and-the-near-term-future-of-ai/21.Riffusionhttps://arstechnica.com/information-technology/2022/12/riffusions-ai-generates-music-from-text-using-visual-sonograms/22.文本是通用的界面https://scale.com/blog/text-universal-interfacehttps://stratechery.com/2022/the-ai-unbundling/23.其他参考链接https://mp.weixin.qq.com/s/cvzlLPg0cNMtybvfbNqmSQhttps://stratechery.com/2023/ai-and-the-big-five/https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/https://sunyan.substack.com/p/the-economics-of-large-language-modelshttps://mp.weixin.qq.com/s/oM0V0MymMbanJddzABYDDQhttps://stratechery.com/2022/meta-myths/https://aws.amazon.com/cn/free/machine-learning/
也许你还想看:
经纬2022年终盘点:乐观者前行,follow the white rabbit
经纬张颖:2023,不只克服困难而是习惯困难
ChatGPT之父Sam Altman:大型AI企业,将诞生于哪些领域?