人工智能的「资本游戏」
撰文:王杰夫 何昕晔 陆彦君
表格整理:王杰夫 徐弢 杨秋秋 陆彦君
制图:徐春萌 车玲玲 程星|编辑:吴洋洋
Key Points
模型层的投资在ChatGPT发布之前就结束了;
中美两国的GenAI都形成了双寡头格局:美国是OpenAI和Anthropic,中国是Minimax和智谱;
大模型周边有一个「杀伤区」,当模型的能力变强,(对应用层的)杀伤区就会变大;
模型层和应用层的分工被市场接受——推动这种转变的不是技术本身,而是投资技术的人;
GenAI技术浪潮的最大赞助人并不是那些每次出手不超过1亿美元的VC,而是位于硅谷的大公司;
模型层要解决两个核心问题:好用、便宜。美国解决了第一点,尚未解决第二点,而中国两个都没有解决。
「大模型的投资其实在ChatGPT发布前就已经结束了。」云启资本合伙人陈昱在见完公司一位出资者(LP)后对《新皮层》说。说这句话的时候,陈昱显得轻松,他所在的机构就是那个精准踩中游戏节奏的幸运儿。2021年,云启资本参与了MiniMax的天使轮融资,后者现在估值约12亿美元,为目前中国估值最高的生成式AI独角兽,由来自商汤的通用智能技术前负责人闫俊杰创立。估值紧随MiniMax的是智谱AI、百川智能和零一万物,目前资本市场对这3家初创公司的估值都是10亿美元,3家公司的创始团队分别来自清华大学、搜狗和创新工场。
不是所有投资人都像陈昱这么幸运,在生成式AI(GenAI)浪潮兴起前夜,不早也不晚,遇到了从商汤出来的创业者。线性资本也曾在ChatGPT发布后寻找过模型层的投资标的,最终都因价格过高而放弃。这家投资机构目前把主要投资放到了应用层。
模型层和应用层是生成式AI领域逐渐形成的上下游。这个概念最初由OpenAI在2022年年底提出,当时,这家公司发布了著名的聊天机器人ChatGPT,让用户可以像微信聊天一样与AI对话,向AI请教问题或者干脆将它当作倾诉对象。不过,OpenAI真正想向市场推销的并不是这个聊天机器人,而是它背后的模型——最初是GPT-3.5,2023年3月进化到GPT-4。在OpenAI构想的商业模式里,OpenAI提供智力(即模型),其他公司基于这个智力平台创造上层应用,从而将模型本身变成一个基座、一个平台,以及一个超级AI。最终,应用层公司从它们俘获的用户那里收取使用费或获得广告费,而OpenAI这样的模型公司通过向应用层公司收取使用模型的订阅费。
这种分工很容易理解,但在ChatGPT发布后的那半年(也就是2023年上半年),它并不怎么被创业者接受,因为他们发现:这跟互联网和移动互联网时代的创业不同,互联网作为一种底层技术不会冲到前台把应用层的活也干了,它只是一种通信技术;生成式AI就不同了,随着模型越来越强大,这个智力怪兽会不断吃掉原本属于应用层的创业项目,就像模型周边有一个「杀伤区」,当模型的能力变强,杀伤区就会变大。
Jasper就是前车之鉴,这家公司是2022年的明星AI公司,它基于OpenAI的GPT-3模型构建了一个AI文本生成工具,主要向传媒营销从业者提供创意内容生成服务。发现这个需求旺盛的细分市场后,Jasper 2022年的年度经常性收入(ARR)相比2021年翻了一番,达到8000万美元,并且公司成立18个月后就获得了15亿美元估值。然而这个增长神话随着ChatGPT的推出戛然而止。2023年9月有媒体爆出,Jasper已经降低收入预期并开始裁员,两位创始人也相继辞职。
然而经过2023年的博弈,到了ChatGPT发布一周年的节点,这种模型层和应用层的分工又转而被市场接受——推动这种转变的不是技术本身,而是投资技术的人。
模型层:资本游戏残酷,时机更残酷
陈昱眼中,在中国,除了MiniMax与智谱,其他在大模型层面的创业公司几乎都命运难料,尤其是那些ChatGPT爆红之后才匆忙组建的公司,例如王小川的百川智能、岂凡超的深言科技,以及王慧文的光年之外(注:已被美团收购)。
他给出的理由很简单,大模型是极度烧钱的生意,技术巨头可以靠其他业务输血坚持,创业公司则必须融到足够多的钱才有可能活下来,而每个市场上的钱能养活的大模型创业公司,很难超过两个。
事实的确如此。从成本看,训练一个大模型需要支付高昂的研发人员工资(平均年薪接近百万美元),购买并清洗训练所需的数据(越来越稀缺),承担每天数十万美元的电费以及更为昂贵的算力费用。以OpenAI训练GPT-4为例,上述开销算下来大约是6700万美元——这还仅仅是训练的费用。当GPT-4这样的大模型训练完毕,如果想让用户使用它,例如让ChatGPT为程序员生成代码,专业的表述就是用GPT-4做推理,OpenAI还需要支付算力成本,据估算这项成本超过100万美元/天。「想要做大模型创业,没有上亿美元根本上不了牌桌。」陈昱说。
此外,风险投资机构(VC)也不愿意在一个细分市场中押注两个以上的项目,因为「再多的话,资本就无法退出」。团购市场中的点评与美团、外卖市场中的美团与饿了么、打车市场中的滴滴和快的……这些行业都经历过「百团大战」,最后能让资本安全退出的只有「两家公司」模式,市场已一再验证过这一点。
百川智能的投资者名单似乎也在说明资本市场的态度,其中只出现了阿里巴巴、腾讯、小米等大公司型的投资者,而没有一家VC机构在列。
市场之所以「选中」MiniMax和智谱,原因之一是这两家公司都创立得够早,但又不是过早。它们都是在ChatGPT发布前一两年创立的,其中MiniMax创立于2021年年底,智谱再早一点,创立于2019年。根据智谱CEO张鹏和投资了MiniMax的陈昱对《新皮层》的说法,智谱和MiniMax都是在看到了OpenAI发布的GPT-3后认识到市场机遇的,那时是2020年,比ChatGPT的发布早两年。
时机对于投资者来说同样残酷。「投资的窗口期很短,最多6个月,像是智谱、MiniMax这些公司早在大家还没发现之前就已经被投掉了。」陈昱说。无论是创业者还是VC机构,一旦错过了投融资的窗口期,后面的道路就会变得艰难,后面加入的创业公司很难拿到下一轮融资,而VC公司想投资智谱和MiniMax,成本也比之前高得多。
像MiniMax与智谱这样的双寡头局面不仅存在于中国的大模型市场,在美国同样如此——只不过它们背后站着的都是技术大公司。美国生成式AI的两大寡头,一家是微软支持的OpenAI,另一家是Google与亚马逊支持的Anthropic,前者目前估值860亿美元,后者的估值为184亿美元。其他AI独角兽的市场估值都在百亿美元以下,和它们差了一个数量级。
在硅谷,生成式AI激起了比在中国丰富得多的泡沫。2023年年初ChatGPT发布后,OpenAI的估值上涨到290亿美元,到了2023年11月,其估值已膨胀到了860亿美元,成长3倍。仅一个月后,它寻求新一轮融资时提出的估值又上涨了,达到1000亿美元——作为对照,目前阿里巴巴的市值不到2000亿美元。
不过这些泡沫与没有真正了解资本心思的创业项目越来越无缘。相比估值不断膨胀的OpenAI,融资金额曾一度领先的Inflection AI(以下简称「Inflection」)自2023年7月完成13亿美元的融资后已经很久没有新的融资消息传出。这家由DeepMind联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)创立的大模型公司同样有着明星投资者名单,例如比尔·盖茨和Google前首席执行官埃里克·施密特(Eric Schmidt)。当资本和技术巨头们都已经选定了合作伙伴,留给其他模型公司的钱就不多了。
和中国市场一样,在资本作出选择之后,其他创业项目无论是自研模型还是使用开源的第三方模型,要么被降低估值,要么开始被按照应用层的项目估值——这类项目的估值相较于模型层通常会小一个数量级。主打AI社交的Character的遭遇大概就是如此。这家公司让用户可以像制作比萨一样制作属于自己的AI并与之聊天,有人在这个平台上为自己的已故亲人创建AI,也有的人把爱因斯坦或伊丽莎白女王的数据输入从而创造出AI版爱因斯坦和AI版女王。这家公司试图在2023年9月以50亿美元的估值融资,但直到现在仍未能兑现这笔融资,其估值因此停留在了上一轮融资时的12亿美元。
在模型层,中美两国市场都形成了双寡头格局,不过区别仍然存在,其中最大的差异就是两个市场的模型能力。相较于一年前的预期,陈昱对国内模型的进展感到失望。他认为模型要解决两个核心问题:好用、便宜。美国解决了第一点,尚未解决第二点,而中国两个都没有解决。
应用:到海外去
当模型层创业成为「资本的游戏」和大公司的阵地后,更多的VC机构将目光放在了产业链更下游。
「上半年大家都处于一个上头的阶段,很多钱都投给了那些对于资金需求量更大的公司(大模型创业公司),下半年不少应用层的公司逐渐被注意到。」线性资本投资副总裁白则人告诉《新皮层》。线性资本前两年已经投资了一些与生成式AI相关的初创企业,目前该领域仍然是线性资本的重点投资方向。
然而对于应用层创业公司,大部分投资机构的态度同样谨慎。原因是即便市场被资本的运转逻辑强行分成了上游和下游,模型能力的提升对于下游应用的吞没威胁仍然存在。于是,被一个无所不能的大模型吞噬几乎成了每个应用层创业者的梦魇,尤其当山姆·阿尔特曼(Sam Altman)在2023年11月举办的OpenAI开发者大会上推出GPTs和GPT Store,让用户可以通过上传数据定制一个独一无二的聊天机器人,并可以选择将它发布到公开市场上——就像每个开发者在苹果或安卓应用商店中所做的那样——这种担心达到了顶峰。
「我不仅当时担心,直到现在还担心。」心识宇宙创始人陶芳波对《新皮层》说,「但这是一个开放的世界,如果你的东西真的被别人做了,说明你价值分层的判断没有做好,最后你也只能认输。」
MindOS是陶芳波公司的核心产品,这是一个让每个用户都能创建智能体(Agent)的平台,创建出来的智能体可以协助用户的工作和生活,例如查询并总结邮件、安排项目日程并跟踪进度等等。GPTs现在还没有MindOS智能体那么高的自由度,但包括陶芳波在内的所有人都不知道未来它可能发展成什么样子。「现在(应用层)创业最难的点就是不确定性,过去做一个应用,至少两三年是确定的,但现在连两三个月都不确定。对于创业团队来说,在变化中找到PMF(Product-Market Fit,产品-市场最佳契合点)的压力很大。」陶芳波说。
对于应用层创业公司如何寻找确定性,并在此基础上建立壁垒,几位风险投资人的答案非常统一,那就是数据。
丰元资本创始人李强对《新皮层》称,「生成式AI时代真正的门槛是数据的积累,如果你只是用爬虫到网上去爬别人的数据,那么别人一拳头就能把你撂倒。只有你的产品和服务做得足够好,用户不断在你的平台上互动,这样产生的数据才有着巨大价值,也是大模型公司最缺乏的东西。」
李强2012年在硅谷创办了专注于华人创业者在种子轮和A轮阶段的融资需求的丰元资本,并一直保持每年30至40个项目的投资节奏。2023年在生成式AI热潮下他看的项目比往年多了不少,但丰元资本最终投的项目数量并没有变,除非对方是有数据积累优势的公司,他才会考虑投资。
2023年,中国的生成式AI领域看起来热闹,但除了短暂爆红的妙鸭相机,没有诞生一款足够有影响力的AI应用。模型「杀伤区」的存在不足以解释这一现象,陈昱认为造成这种状况的原因不是创业者担心模型太强,而是模型不够「好用」。他看到的一个现象是,中国并不缺擅长在应用环节找到PMF的创业者,但他们中的不少人选择了面向海外用户创业,因为在海外市场,他们可以基于更「好用」的模型比如OpenAI的GPT开发上层应用。
「AI应用创业的一点优势在于,只要你的产品可以带给用户沉浸式的体验,那么从产品上线第一天起你就可以向用户收费。」陈启凡告诉《新皮层》,他正在研发一款类似Character·AI的应用,通过生成式AI技术「复活」哈利·波特、雷电将军(出自游戏《原神》)这些受欢迎的角色,让用户可以全方位与它们互动。这款应用基于非国产模型,并面向海外市场。
尚晏仪是另一位想拓展美国市场的中国创业者。他创立的StellarRover曾推出名为iMean的智能引导机器人,因为绝大部分办公软件的引导都是文字式的,新手用户很难理解,iMean的浏览器插件可以根据场景判断用户可能卡在了使用软件的哪一步,从而调出相关的程序引导用户完成工作。实现这种功能需要模型有很好的推理能力。
一些手握资金的人直接跑到海外去寻找项目了。2023年年初,投资人王超与二十多位朋友共同在硅谷成立了一家叫Metropolis DAO的公司,专门投资包括生成式AI在内的新型创业项目。其投资对象包括AI项目Pika,这家公司由来自斯坦福大学人工智能实验室的两位华人郭文景和孟晨琳联合创立,目前估值2亿美元。GitHub前首席执行官奈特·弗里德曼(Nat Friedman)也是Pika的投资者之一,他声称,之所以在Runway、Stability AI、Adobe等巨头之外还投资了Pika,看中的是两位创始人的「速度」。弗里德曼曾在一个夏天的下午建议创始团队开发一个将文本嵌入视频的路径,次日凌晨3点,他收到短信,称该功能已准备就绪。「目前无论哪家产品的PMF都还不够,新团队依然有充足的机会。」王超在Pika宣布完成5500万美元融资时在社交媒体上写道。
陈昱身处国内市场,不过他告诉《新皮层》,他大概会花80%的时间看国内创业者的项目,但最终,他愿意投资的项目中有80%面向海外市场——这些项目要么是在国内创立但面向海外市场,要么直接是在海外创立的。
大公司助推
VC机构是生成式AI的积极参与者,但这股技术浪潮的最大出资者并不是这些每次出手不超过1亿美元的VC,而是位于硅谷的大公司,它们常常一出手就是数十亿美元——硅谷的两家模型寡头OpenAI和Anthropic就是这么诞生的。
这些投资一方面是防御性的,目的是为了绑定最有潜力的大模型:微软绑定了OpenAI,亚马逊和Google绑定了Anthropic。而在国内,除了与阿里巴巴一样投资了智谱和百川智能,腾讯还投资了MiniMax、深言科技等模型公司。
同时,这么做的另一意图是在高度不确定的技术变革中寻求一种具有确定性的生意——云计算。这些大公司的每次投资都是对云计算客户的锁定,就像OpenAI需要微软的Azure,Anthropic此前一直使用着最大投资者Google的云服务,等到2023年9月得知亚马逊要向自己投资40亿美元时,作为交易条件,Anthropic把最主要的云服务供应商由Google换成了亚马逊。
于是,几乎所有技术巨头都建立了模型平台:上面有自研的模型、投资的模型、开源的模型。反正不论这些模型是哪家公司以何种技术训练出来的,最终把它交付到客户手上的都是云计算巨头。
大公司出手在某种程度上促进了生成式AI的发展,OpenAI的最强模型GPT-4就是微软的钱烧出来的,Anthropic也在复制这一模式,它计划建立一个能力比当今最强大的AI还要再强10倍的模型,并为此在2023年融了至少60亿美元,出资者都是大公司。
与之相比,中国模型公司获得的资金大概小了两个数量级。以获得最多大公司投资的百川智能为例,根据它2023年10月17日宣布的数字,其A1轮融资总共只获得了3亿美元,投资者包括阿里巴巴、腾讯、小米等一众大公司。
投资者对《新皮层》称,并不是这些大公司不愿给出更多资金,而是这些大公司本身的盈利能力在大幅下滑。比如阿里巴巴,2021年其电商净利润下滑了10%,整个公司也在2023年启动了拆分,各业务板块须自负盈亏。
而自2020年以来实施的反垄断、「防止资本无序扩张」,使得包括阿里巴巴和腾讯在内的大公司出手谨慎,所投创业项目断崖式下降。以腾讯为例,IT桔子的数据显示,2016年腾讯向创业市场投出的资金比市面上排名前五的VC机构投的加起来还多。然而2023年,腾讯投资的项目总数只有37个,约为高峰时的1/10。市场上曾形成to BAT的创业风潮,但当大公司不再是「接盘者」,想要投资创业项目的VC机构也会变得更谨慎。
「资金越多,能投入的资源越多,能尝试的方法就越多,能动用的人也越多,最后出来的效果就会越好。」智谱CEO张鹏对《新皮层》说,这种资金水平与模型智能水平之间的正比关系已经形成,中国初创公司无法获得同等规模的资金支持,唯一的选择就是「更聚焦」。
这种聚焦在2023年还勉强可行,到2024年就会更具挑战。根据陈昱提供的数据,大模型的推理成本比训练成本更高,以MiniMax为例,二者之间的成本比例差不多是10∶1。这意味着当生成式AI进入商业化阶段(这正是2024年的行业主题),创业项目消耗钱的速度会比2023年单纯训练模型时更快。2023年没有融到足够多钱的公司,到了2024年会更艰难。而没有足够的资金,模型的好用性就无法提升,模型不好用就没有造血能力,不能造血就无法优化模型——总之,「从模型到赚钱」的飞轮将无法转动起来。
在模型能力更强的市场,出海项目当然还要面对「杀伤区」的怪兽。暂时不需要面对这头怪兽对国内创业者来说像是一道护身符,不过,这算不上什么竞争优势,只会让市场的发展更缓慢。
陈昱和白则人都预计,2024年市场上除了会出现更强大的模型,包含视频理解和生成在内的多模态模型将更加成熟,此外,端侧AI也将变得更流行——意思是大模型这种庞然大物会找到一种方式,从庞大的数据中心「走」出来,进入每个普通人的电脑和智能手机,Google和苹果都已经在开发这样的技术。
一切的想象最终都会回到模型本身,不好用的模型只会让市场差距越来越大。
应采访对象要求,文中陈启凡为化名
-END-
Vision Pro第一批测评来了,惊艳但现在可能还不值得买