独家|通用大模型创业潮,首战即将终结
文 | 于丽丽、何丽芯
编辑 | 刘旌
迅雷不及掩耳。
Minimax是目前大模型创业潮中估值最高的创业公司。除此之外,受到一级市场投资人关注的大模型公司还包括:王慧文的光年之外、智谱AI、杨植麟的新公司、沈向洋的新公司等。
除光年之外被《晚点LatePost》报道正在启动第二轮融资、投前估值约10亿美金外,据我们多方了解,其他公司的融资“也基本都有基金commit了”。
其中,Minimax和智谱AI分别成立于2021年和2019年,突出优势是“起跑早,已经有相对成熟的大模型产品出来”,因而其估值相对更领先。
多位投资人表示,目前大模型创业的估值体系主要来自做成这件事需要的金额,以及团队量级。
大模型产业链,可分为提供算力的基础层、模型层和应用层。目前创业公司机会主要集中在模型层和应用层。其中大模型又分为像OpenAI 一样提供API调取服务的通用大模型和基于开源大模型做微调的、差异化大模型。
一位投资人告诉我们,如果是做前一类的大模型,起步就需要5000万美金。而如果想在市场有一定声量,则需尽快拿到亿美金级融资。而另一家投资机构合伙人告诉「暗涌Waves」,通用大模型创业,依赖重资源和强资金。无论投资人,还是创业者,都会是一个“少数人的游戏”。
多位投资人向「暗涌waves」表示,尽管多家公司的交易还在具体流程中,但市场普遍认为,面向通用大模型创业的窗口期已基本关闭,其首轮资本军备赛也基本接近尾声。
在一家美元基金投AI的合伙人看来,创业公司的机会往往在于大厂形成共识前入场。一旦大厂形成共识,除非王慧文量级的旗帜型选手,抑或后期有超强产品sense——可以定义超级产品者,否则很难以小搏大。而对VC们来说,尽管仍然有人因为相信这是比移动互联网大十倍的机会,所以对估值上限容忍度很高,但多数投资人认为,“头部的肯定已经跟不动,其他的也要再观望下”。
距离GPT4发布不过二十余天,中国的通用大模型创业已将迎来第一个赛点。
上牌桌的人
任何一次创投浪潮兴起之初时涌现的领先者,未必是最后的冠军。在千团大战、共享出行时代,这一点已被数次证明。但很多人认为,鉴于大模型创业更高的技术门槛、以及不会更低的资金和资源需求,后来者居上、或者说源自无名之辈的故事可能性较低。
多位投资机构合伙人告诉「暗涌Waves」,尽管如今大模型创业看起来风起云涌,但实际上牌桌的不到10家,入局的VC机构也凤毛麟角,基本集中在美元基金。
这些公司大致可分为两个派别:来自AI公司、大厂的创业派,以及来自高校、研究机构的学院派。
在估值上跑得最快的是一直颇具神秘感的Minimax。它的核心团队成员主要来自商汤科技、中科院、Uber等公司的AI团队。
除此外,互联网创业派还有王慧文的光年之外、搜狗创始人王小川的五季智能,前快手AI技术研发的核心人物李岩的元石科技、前京东AI掌门人周伯文的衔远科技,以及李开复的Project AI 2.0等。
其中声量最大的当属光年之外。在真格、源码等基金入局后,「暗涌Waves」了解到,王兴、五源等个人和机构也参与其最新一轮投资中。
王小川的故事就更独特一些。2021年,卸任搜狗CEO后,王小川一度沉迷在生命科学和医学领域,并投出了小鹿中医、DeepCare、热心肠研究院等多家医疗公司。去年年中,他还在研究智能枕头,但在2023年春节后,他火速决定奔赴大模型创业。
除此之外,还有原担任京东集团副总裁、加拿大工程院外籍院士梅涛创办的智象未来。目前智象未来已经光速完成阿尔法公社领投、多位中科大知名企业家、AI大专家组团跟投的种子轮投资。
在“学院派”大模型创业者中,清华系一骑绝尘:出现了唐杰参与的智谱AI,杨植麟参与的循环智能、而岂凡超的深言科技,以及曾国洋的面壁智能,则是前不久王慧文试图收购的两家公司。
概括来说,清华系的NLP创业者主要来自三个脉络:唐杰和李涓子带队的知识工程实验室(KEG)、孙茂松带队的自然语言处理与社会人文计算实验室(THUNLP)以及朱小燕和其学生黄民烈带队的交互式人工智能(CoAI)课题组。
在唐杰和李涓子这支脉络下,诞生了智谱AI。GPT4发布同一天,唐杰在微博宣布:基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测。而唐杰的学生,曾参与过华为“盘古”大模型研发的杨植麟,他的新公司同样炙手可热。
在「暗涌Waves」的采访中,有投资人将杨植麟形容为:“有世界级科学家的视野,以及对技术路线的独特嗅觉”。知情人士对我们表示,金沙江、今日资本、Coatue等机构均对杨植麟的新公司表现出投资意向,甚至陆奇个人也将参与其中。
在国内最早开展 NLP 研究的自然语言处理与社会人文计算实验室(THUNLP)这条脉络下,则诞生了孙茂松、刘知远、深言科技的岂凡超以及面壁智能的曾国洋等人。
其中,孙茂松、刘知远团队研发的CPM模型,是智源研究院「悟道·文源」的前身。而深言科技的岂凡超以及面壁智能的曾国洋则是前不久王慧文试图收购的两家公司。
在交互式人工智能(CoAI)课题组脉络下,朱小燕的学生黄民烈创立的聆心智能,在2022年就推出首个产品AI乌托邦,继去年年底完成包括智谱AI在内的数千万元天使+轮融资后,前不久又宣布完成Pre-A轮融资。
除高校外,登上中国大模型创业牌桌的,还包括一些来自非营利性AI科研机构,尤其是在相关领域有深度积累的IDEA(粤港澳大湾区数字经济学院)和北京智源人工智能研究院的创业者。
其中,呼声最高的,当属由IDEA研究院创始人沈向洋担任顾问,IDEA认知计算与自然语言研究中心负责人张家兴创立的新公司。在微软押注OpenAI的GPT模型之后的2019年11月,微软人工智能最高负责人沈向洋宣布离开微软。而他在微软通用人工智能模型的最后一个作品是聊天机器人小冰。
除此外,还有来自西湖大学工学院的蓝振忠打造的西湖心辰,来自微软亚洲研究院周明打造的澜舟科技,其中前者前不久也完成新一轮数百万美元的Pre-A轮融资。投资方包括百度风投、凯泰资本和西湖教育基金会可持续发展平台。
路径与终局
对通用大模型创业公司来说,短期压力主要来自Chatgpt4的发布和大厂的围追堵截。
继百度发布文心一言后,腾讯正在加速推进大模型“混元”,阿里则将在4月的云峰会上发布大模型进展,也有消息传出,4月华为将发布对标CHATGPT的盘古大模型,而6月,积累了大量c端图片和视频数据的字节跳动也要发布自己的大模型。事实上,不久前的3月22日,原阿里M6大模型的前带头人杨红霞也已加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。
在一家美元基金投AI的合伙人看来,创业公司的机会除了在大厂形成共识前入场外,还需要以非共识的方式破局。
在他看来,尽管目前OpenAI更多把自己定义成一个底层的提供模型服务的公司,但在已有“ChatGPT”这个MVP(最小可行性产品)后,它很可能既做模型去覆盖很多垂直场景,也做一个C端产品,重新定义交互,拿到新的C端流量入口。
如果这件事发生,就意味着创业公司可以在新场景的抢夺中,击破大厂目前的既有强势场景优势,甚至出现创业公司和很多不同领域小巨头合作的可能。
事实上,很多创业公司也开始放弃只做提供API服务的通用大模型方向,开始基于自己训练的大模型、或开源模型,甚至小模型,去创造自己的场景,并去做应用类产品。
3月22日,王慧文在即刻发文招聘产品经理。而几天后,原搜狗输入法产品经理,被称为“搜狗输入法之父”的马占凯宣布加入。之前有投资人认为,这或许是GPT4发布以及大厂进击后,王慧文对团队方向的调整。而据《晚点 LatePost》报道,王慧文创立的光年之外,搜狗前CEO王小川的新公司,都选择同时做大模型和基于模型的应用。
当然,创业公司方向的选择往往也与融资数额相关。华创资本投资人张金对暗涌Waves表示,做通用大模型的成本过高,一些拿钱少的公司很可能在后续中基于开源做有数据积累和用户场景的小模型和其应用。
而如果OpenAI最终没有这样一个C端产品出现,一家美元基金投AI的合伙人,认为大厂与创业公司的竞争就会是另一种局面:要么出局,要么被收购兼并,要么就在细分领域小而美。
除场景外,创业公司与大厂的竞争主要来自数据、算法、算力几个维度。在上述投资人看来,因为数据的核心不是数据量,而是数据质量和工程化的能力,加上算法也能逐步追平,因此在数据和算法方面,创业公司和大厂并非不可一战。
至于算力的抢夺以及成本的持续增高,他认为这将是大厂和创业公司共同的难题。
通常来说,1万枚英伟达A100芯片是做好大模型的算力门槛,而处理1800亿个参数的GPT3.5大模型,需要的GPU芯片数量可能是2万枚。这是很多人认为只有云厂商才有资格下场大模型创业的原因之一。
但事实上,国内云厂商拥有的GPU也主要是中低性能产品。在A100GPU被美国受限后,很多公司不得不使用“阉割版”的替代 A800。后者的数据因为传输速率低,内存小,所以必然会影响到训练速度。
而随着军备竞赛升级,创业公司能否抢到也是问题。有投资人告诉「暗涌Waves」,因为A100成为稀缺品,市面的价格开始水涨船高,从官方的1万美元一枚,约合人民币7万,涨到8、9万,甚至10万一枚。
而对大厂来说,在后边的从千卡到万卡转变中,也要面对整个系统架构的巨大挑战。何况除了算力成本,还有硬件采购成本、运营成本以及短期内商业化的困难等等。一位在硅谷观察颇久的美元基金投资人告诉「暗涌Waves」,“除非百亿美金公司,否则很难跟进这个游戏。”
拾象是一家定位于全球科技投资的基金,也参与了部分海外大语言模型项目的投资。创始人广密表示,短期内这场AI竞赛还将迎来几个赛点:在模型层,关键节点之一即已上牌桌的选手第一轮融资官宣,意味着大模型首轮融资窗口期告一段落;其二,国内第一个能力达到GPT3.5能力的自研大模型推出,并先占领开发者心智和生态。而在应用层,关键节点则是“第一个杀手级应用出现”,比如某个AI Native的应用快速做出千万级别的活跃用户。
至于这场游戏的终局,大部分投资人认为“肯定是两三家的寡头竞争”。而上述美元基金投AI的合伙人则认为,拉到10年,它会比云计算行业的集中度更高,“中国市场可能就剩四五家”,但其中会出现至少一家“从底层芯片到C端应用甚至是硬件机器人”完全打通AGI的“千亿美金公司”。
图片来源 |IC Photo
排版|杜梦