查看原文
其他

三个基础假设

西装和帽衫 Suits and Hoodies 2023-03-28

大模型太热了,不能免俗地再写一篇...

1. 开源模型会大大降低准入门槛

 WHAT  在接下去半年到一年的时间当中,开源模型会接近甚至超越闭源模型的效果。除了头部的少数几个闭源模型服务之外,一旦这样的开源模型出现,社区的兴趣会全面转向基于开源模型的二次开发。

 WHY  前面10年的深度学习发展告诉我们,AI 领域,开源模型持续处于主导地位。以 AIGC 为例子,最开始大家看到的是闭源的 Imagen、DALL-E 等模型,效果很好,“但是你只能干看着羡慕”。Stable Diffusion (SD) 的开源一下子扭转了这个状态,基于模型的直接应用,以及进一步的算法创新,几乎都在SD上而不是其他闭源模型上。这使得早期这些闭源模型陷入“起个大早,连晚集都没赶上”的窘境,比如谷歌趋势显示的 DALL-E 和 SD 的比较:

 HOW  对于企业和创业公司而言,不应该单纯投入到“自研闭源模型”中去,而应该使用“打”或者“跟”的策略:以开源为宗旨建设模型,争取自己的模型成为社区引导者地位,或者充分利用社区开源模型,跟进应用开发。

 AND?  在开源模型的基础上,我们可以引出下一条:

2. 应用为王,模型为辅

 WHAT  对于语言类和图片类应用而言,今天的模型已经可以解锁很多应用,product market fit 的瓶颈目前在于应用创新,而不是继续“提升模型的精度”。

 WHY  OpenAI 在算法能力上做不到的,现实地说,今天其他企业,尤其国内的企业也很难做到(这里不要相信内部团队吹牛,说效果超过国际一流竞品 - 注意,最近是绩效季)。但是,有两个趋势很明显:第一,OpenAI API之上对各种应用场景的尝试,广度空间远未饱和;第二,现有开源的模型的质量,对不少应用来说已经足够了,“我们只是缺市场策略”。这里是我自己尝试的一个辅助创作的例子:用一个手绘的线稿来生成彩绘的结果:

虽然没有到理想状态,但是对于有想法的产品经理来说,这应该已经有很大想象空间。

 HOW  对于投入大量资金训练模型的企业而言,应该思考上面的第一点:如果一下子出来一个像 Stable Diffusion 这样的开源高质量模型,我去哪里收回以百万甚至千万计的自研模型训练成本?所以,除了极少数笃定要以算法取胜的企业和研究机构,大部分企业应该把第一优先级定为“提供易于集成的模型服务给业务应用部门”:谁能激发应用部门的能动性,并开始去尝试更多的 go to market 场景,谁就能更快地实现落地。这个过程中自研模型能起到一定作用,但不是必要条件。

 AND?  那么,怎么迅速给业务部门提供这样的服务?

3. 企业市场需要新的平台服务

 WHAT  今天逐渐显示出来的一个共识是,AI 上层粘性业务有很强的溢价能力。根据不具名的信息来源,JasperAI 这样的公司,付给 OpenAI 的推理成本只占其营收的 10% 左右。也就是说,一个产品化、规模化的平台服务的基础,可以助力应用获取高达 90% 的毛利率。

 WHY  部署模型依然很难。今天我们看到的不少情况是“算法科学家做工程”。在模型训练阶段,这样的方法并无不可:高性能训练基础设施,今天除了少数顽固派之外,已经成为标配(可以参见上一篇文章)。但是,在部署阶段,怎么将一个服务“多快好省”的部署起来,目前并没有很好的自动化方案,尽管人们已经看到了它的潜力:例如,根据阿里云在 2022 年云栖大会上公开的数据,PAI 平台化的服务能给研究部门的 AI 算法应用效率提高 6 倍以上。更延展开去,如何在有限的资源下,提供十倍甚至百倍的流量支持,这将成为未来平台的核心竞争力。

 HOW  今天很多企业的策略是“先抢到足够多的GPU卡再说”。这个策略充其量只能说是 loss leader strategy 的一个变体。认真的企业应该开始思考选择优秀的 SaaS 软件平台服务商,采纳一个具有弹性、高效率、可观测性、免运维的 AI 平台服务。这个领域会类似数据时代的云数仓,早期 web 时代的中间件、微服务一样,成为一个新的千亿美元市场。

 "Infrastructure vendors are likely the biggest winners in this market so far." 

- Andreessen Horowitz, "Who Owns the Generative AI Platform?"

 AND?  没有了,太忙了,只写那么多。

== Credits ==
题图:Unsplash
    https://unsplash.com/@michaelrausch
手绘线稿:all rights reserved @myclover0527
线稿效果图:ControlNet


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存