查看原文
其他

AI独角兽|④Cohere:陨落边缘

陆彦君、吴洋洋 新皮层NewNewThing 2024-03-08

「为什么是这些初创公司价值10亿美元」


撰文:陆彦君、吴洋洋

编辑:吴洋洋

Key Points


作为作者之一发表《Attention is All You Need》时,Cohere创始人Aidan Gomez只有20岁;


Cohere并不打算直接服务C端用户,而是只服务B端;


Llama被迫开源后,训练生成式语言模型的门槛已经从一个大型研究机构下降到一个人、一个晚上和一台强大的笔记本电脑;


8位论文作者中,Aidan Gomez最早看到生成式AI商机,但他没有最早意识到危机;


Cohere在7月推出了面向B端客户的对话式机器人Coral,一个月后,OpenAI也推出了ChatGPT企业版;


如果OpenAI都疲于对抗开源的力量,Cohere可以吗?


Cohere估计很快要从独角兽队伍里滑落了。

6月9日,Cohere宣布在C轮融资中筹集了2.7亿美元,投资者包括英伟达、甲骨文、Salesforce等,估值21亿至22亿美元。这一估值相较于媒体早些时候报道的60亿美元缩水了一大半,而且,去年10月就说要投资它的Google仍然没有出现。 

到了8月25日,Cohere的早期投资者之一老虎环球基金(Tiger Global Management)又被爆出要出售持有的2.1%股份,售价约为6300万美元。这是个几乎没有溢价的成本价格,2021年12月投资Cohere时,老虎环球基金的初始投资金额就是6270万美元。

Google应该不会再出现了。 

相较5月,Cohere在独角兽中的排名下降了两位。

年初,位于多伦多的生成式AI初创公司Cohere还是资本追逐的对象。其创始人Aidan Gomez既有Google Brain的工作经历,还是那篇开启大模型时代的著名论文《Attention is All You Need》的8位作者之一。并且,这家公司2019年就创立了,在ChatGPT横空出世的2022年11月,它的大模型差不多第二天就可以推向市场。只是,与OpenAI既向企业客户提供API,也通过ChatGPT向公众提供服务不同,Cohere只服务于企业客户,为它们提供定制化的模型部署。

Cohere所践行的商业模型在今年3月之前还被广泛认可。那时候,大语言模型(Large Language Models,LLMs)被认为是只有少数公司才能掌握的高门槛技术,「大模型公司提供基础模型,其他公司基于这一模型开发下游应用」一度成为行业共识。

但经历了今年上半年的混战,生成式AI领域的市场格局和人们对于这一技术可以如何应用的想象已经彻底变了。只是Cohere不愿接受一点。


光辉的起点

Google抛弃了Cohere,但Cohere 3位创始人曾在Google的人工智能团队Google Brain写过代码的历史难以被抹去。 

早在2017年2月,Aidan Gomez就开始在Google Brain做实习生,那时候,他还是多伦多大学的学生。在那里,他一边写代码,一边参与了《Attention is All You Need》的写作。那时,领导Google Brain的还是因深度学习获得图灵奖的「深度学习三巨头」之一Geoffrey Hinton。

Nick Frosst那个时间也在Google Brain,跟着Hinton工作,主要研究方向是神经网络。和Aidan Gomez一样,Nick Frosst同样毕业于多伦多大学,不过他2015年就毕业了。正在Hinton的实验室里,他认识了后来一起创业的Gomez。

Transformer论文的主体工作是在3个月内完成的,期间,所有人都住在办公室。Aidan Gomez第一次参与这样正式的学术研究,以至于当时他以为所有的学术研究都是这样的强度。某天凌晨3点,他们把Transformer论文提交给NeurIPS后,论文一作Ashish Vaswani对他说:「This is gonna be huge」(这会是个重磅),但Gomez并没有意识到它有多重要,更没有预测到,一个生成式AI的时代就要开始。那一年,他只有20岁。


2019年OpenAI发布了GPT-2,这一次,他终于意识到了Transformer的力量。这个架构是Google发明的,但Google的技术路径始终是「双向预测」,而不是像GPT那样「只预测下一个词(token)」——这是一种单向预测。它意味着,模型可以开始做一件价值无限的事——写。

「Google的每个产品团队都在采用这种架构来解决语言问题,他们看到的改进成果是疯狂的,绝对难以置信。」Aidan Gomez的大学同学,同时也是他上一个创业项目For.ai的合伙人Ivan Zhang在知道了GPT-2发布后Google内部发生的事之后曾这样说。

Aidan Gomez同样对此感到兴奋。当时,他还不知道要做什么样的产品,而且他已经在剑桥大学完成注册,开始攻读计算机科学博士学位了,但是想到「让计算机理解语言并与我们交谈」,他就想丢下所有手上工作开始创业。于是2019年,GPT-2发布后没多久,他和Ivan Zhang再次创业了,同时拉上了在Google Brain认识的Nick Frosst。

新公司的名字叫作Cohere。联合创始人们为公司确立的商业模式不同于OpenAI,他们并不打算直接服务C端用户,而是只服务B端。

Aidan Gomez不是当时共同完成Transformer论文的作者中最早意识到其价值的人,但他是最有行动力的。论文二作Noam Shazeer和论文四作Jakob Uszkoreit都在Google工作到2021年,才分别离职创立Character AI和Inceptive AI。论文七作Lukasz Kaiser也在这一年离开Google,加入OpenAI担任研究员。而论文一作,同时也是最早意识到Transformer重要性的Ashish Vaswani,直到2022年才离开Google,作为首席科学家参与创办了Adept,一同创立这家公司的还有论文三作Niki Parmar。

从左至右分别为:Ivan Zhang、Aidan Gomez和Nick Frosst。

这些作者很晚才离开Google可能与他们的工作履历有关,他们不少都在这家AI人才最密集的硅谷大公司工作了10年左右。Aidan Gomez是作者中唯一的实习生。

在Google Brain实习的经历、Transformer作者之一的光环,都让Cohere的早期融资之路十分顺遂。

其首轮融资中就出现了一大批人工智能领域的领军人物——Hinton、李飞飞、深度学习学者Pieter Abbeel和Uber首席科学家Raquel Urtasun都在其中。


开源冲击

然而,最早看到商机的Aidan Gomez没有最早意识到危机。

3月初,开源社区Hugging Face上出现了一个真正有能力的基础模型——被泄露的LLaMA(后更名为Llama)。它是Facebook母公司Meta开发的第一代大语言模型,没有指令调整,也没有「基于人类反馈的强化学习」(Reinforcement Learning from Human Feedback,RLHF),后者被认为是GPT-3.5优于GPT-3最重要的原因。尽管如此,社区里的开发者立刻明白了他们所看到的东西的重要性。

大量新模型随之而来。仅仅一周之后,3月13日,斯坦福大学就发布了一个基于LLaMA 7B微调的模型Alpaca,这个模型只训练了3小时,就有比肩GPT-3.5的性能。而且它只有70亿个参数,大小是GPT-3.5(1750亿个参数)的1/25。

Alpaca(羊驼)出现两天后,GPT-4发布。

5月4日,一份号称泄漏的Google内部文件声称「Google没有护城河,OpenAI也没有」,两家公司在大模型领域的共同点在于:模型都是闭源的。这份文件列举了Llama泄漏以来开源社区里的模型大爆炸,「许多新想法来自普通人,训练模型的门槛已经从一个大型研究机构下降到一个人、一个晚上和一台强大的笔记本电脑。」。

对于原来被Cohere视为主要客户的B端企业用户来说,这大大降低了企业在公司内部部署一个私有模型的门槛,并且,这是免费的。

Llama的开源成了LLM(大语言模型)的「Stable Diffusion时刻」,Stable Diffusion是图像生成式模型,2022年位于伦敦的初创公司Stability AI将其在Github上开源,之后全球诞生了大量文生图公司。

在前述内部文件里,作者分析了开源模型的优势——对闭源模型来说就是威胁:开源会形成一种众包式的创新,从而使模型更加快速地优化。这种众包式创新已经使开源的Stable Diffusion模型的表现优于OpenAI的DALL·E模型,后者没有开源,也至今没多少人提及。活跃在文生图市场的Stability、Midjourney、Runway等公司所使用的模型都是Stable Diffusion。

「LLM是否会发生同样的事情还有待观察,但广泛的结构要素是相同的。」文章作者说,OpenAI对Google来说已经不重要了,因为它犯了与Google一样的错误——选择闭源。

如果OpenAI难以对抗开源的力量,Cohere可以吗?


绕不开的OpenAI

资本市场上Cohere估值的变化已经回答了上述问题。

5月开展B轮融资时,Cohere的估值还是独角兽榜单上仅次于OpenAI和Anthropic的第三名,前两名的明星产品分别是ChatGPT和Claude。但融资完成后不到一个月,也就是6月,就有一家叫Inflection的公司以高达40亿美元的估值(差不多是Cohere的两倍)取代了它。和仍然位于榜单前两名的OpenAI和Anthropic相似,Inflection除了有自研的基础大模型,也有一款面向C端的聊天机器人——Pi,主打情感陪伴。

难以确认Google是否在上述有关「闭源模型没有护城河」的所谓内部文件泄露时就决定不再投资Cohere了,它作出这个决定的时间也可能更早。

但Cohere并不打算改变其商业模式,相较于其他闭源模型,「我们不受任何大型云服务提供商的控制,对于我们的客户来说,这是一个关键的战略优势。」Aidan Gomez在6月接受采访时说,客户可以将自己的模型和数据存储在他们想存储的任何地方,而不必是Cohere的服务器上。

相较于开源模型,Gomez坚信技术壁垒的存在。「我越来越意识到,Cohere所做的系统与人类承担的最复杂的工程项目一样复杂,比如火箭工程。它由大量不同部件和传感器组成,如果一个团队搞砸了一根头发,火箭就会爆炸。这就是构建这些模型的经验。」这一席话同样是他在今年6月接受采访时说的。

而且,他也不信任开源模型的安全性,「你最好希望你已经充分减少了模型的滥用,因为你不知道它的用途——你也不知道谁在使用它」。模型滥用对社会对威胁性自然存在,但它不是企业采购时会考虑的层面。

Cohere推出的第一个生成式AI应用Coral,不过仍然只面向B端。

在B端市场,Cohere的确凭借独立于技术大厂的身份获得了一些客户。6月19日,企业软件公司甲骨文发文称,将与Cohere合作为下游客户提供「原生生成式AI服务」,帮助客户实现端到端业务流程的自动化。7月18日,咨询机构麦肯锡宣布与Cohere合作,为企业客户提供AI解决方案。

然而,这种B端生意需要庞大的销售团队,这就是为什么OpenAI要与微软结盟,也是为什么阿里巴巴、腾讯、百度都将大模型与云计算业务放在一起管理的原因。早在2018年,微软的销售代表就超过了4万人,而Cohere的团队至今不到200人。

7月26日,Cohere推出了为客户定制模型之外的新产品线——Coral,这是一个面向企业用户的聊天机器人, 基于Cohere的Command大语言模型微调,旨在帮助员工更快地查找公司内部信息并获得答案。Cohere引用麦肯锡的一份报告称,公司人每天有1/5的时间都是在寻找信息,而Coral可以纠正这一趋势。

更加「开箱即用」的Coral有助于降低B端用户获得Cohere服务的门槛,不过,一个月后,8月29日,OpenAI就推出了ChatGPT的企业版,它想要攻克的目标市场与Coral完全相同。


公司档案/Cohere:


创立时间:

2019年

创始人:

创始人兼CEO:Aidan Gomez

创始人兼CTO:Ivan Zhang

联合创始人:Nick Fross


核心产品:

·Command模型

·Coral:面向企业的聊天机器人,与ChatGPT企业版类似。

融资历程:

  • 2021年9月,获得4000万美元A轮融资;

  • 2022年2月,获得1.59亿美元B轮融资,投资方包括Geoffrey Hinton、李飞飞、Pieter Abbeel,还有知名基金Tiger Global Mangerment、Index Venture等;

  • 2023年5月,获得2.5亿美元B+轮融资,估值20亿美元;

  • 2023年6月,获得甲骨文、英伟达等2.7亿美元C轮融资,估值为21亿美元至22亿美元。

估值:

21亿至22亿美元


-END-

若想了解更多当日资讯,请点击阅读往期智能晚报

智能晚报|OpenAI可能11月发布GPT-Vision,并考虑开发新模型Gobi;Bard支持插件功能;智谱成新晋独角兽...

若想了解头条新闻,请点击阅读往期

大公司|iPhone 15和Apple Watch都没有大创新,不过都有Vision Pro的影子

我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。 

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。




与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

 

喜欢就关注我们吧,记得设为星标」

继续滑动看下一个

AI独角兽|④Cohere:陨落边缘

陆彦君、吴洋洋 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存