查看原文
其他

Cohere:三个年轻创始人创造的AI独角兽

渣大米 石麻笔记 2023-10-09

前段时间看到一个图,截止目前全球13家生成式AI领域的独角兽公司,Cohere以20亿美金的估值位列榜单第三名,甚至排在了Transformer一作Ashish的Adept和二作Noam的Character.ai之前。Cohere的创始团队又是何方神圣,在做了一些了解之后,我是有点惊讶。很少写单个公司的文章,之前只有一篇介绍Salesforce的万字长文(Salesforce:SaaS开拓者),今天这篇文章来讲讲Cohere这家在国内并没有很多人讨论的大模型独角兽公司。

团队

Cohere由三个多伦多大学的校友于2019年在加拿大成立,三个创始人都非常年轻(90后)。

Aidan Gomez是Cohere的CEO,于2018年毕业于多伦多大学计算科学专业(95后,还不到30岁),2018年至今在剑桥大学攻读计算机科学博士学位。他在20172月开始在Google Brain做实习生,也是在这期间他以实习生的身份参与到了“Attention is All you Need”这篇论文的创作中,非常幸运的成为Transformer这个划时代模型的八个创作者之一。

Ivan Zhang是Cohere的联合创始人及CTO,他在读多伦多大学本科的时候辍学,2017年创立了FOR.ai现在叫Cohere For AI),一个独立的AI研究机构。

Nick Frosst,2015年毕业于多伦多大学计算机科学专业。在Google Brain期间是Geoffrey Hinton多伦多的Brain团队成员,主要研究方向是神经网络。

在Transformer项目期间,Aidan作为实习生参与其中,他的贡献主要在软件。在他参与的时候,Google Brain内部已经有一些资深研究员包括Ashish、Noam和Jakob致力于推动自回归模型在文本领域的应用。自回归模型在语音领域的应用非常受欢迎,但当时并没有人把它用在文本领域。

Transformer的主体工作是在三个月内完成的,这期间大家都住在办公室,Aidan在一次采访中说,Transformer是他第一次参与到正式的学术研究,他以为所有的学术研究都是这样的强度。他还提到:在某天晚上的凌晨3点,他们把Transformer这篇论文提交给NeurIPS,提交之后Ashish对Aidan说了一句话“This is gonna be huge”,Aidan并没有意识到Transformer未来会改变什么,但他说作为论文的一作Ashish很清楚Transformer这个模型将对AI产生多么大的影响。

Aidan提到的Ashish、Noam和Jakob是Transformer的核心作者,他们也在后面陆续离开了Google创立自己的公司。

Ashish Vaswani:是Transformer这篇论文的一作,他作为首席科学家参与创办了Adept(20224月成立),并于2022年底离开Adept,成立EssentialAI。

Noam Shazeer:在Google工作了20多年,他在2021年离开Google创立Character.AI

Jakob Uszkoreit2021年离开google创立Inceptive,一家AI+生命科学公司。他被认为是发明 Transformer 架构的幕后推手,在Google工作了13年,组建了Google助手的语言理解团队。

融资

Cohere在2021年9月获得4000万美元A轮融资2022年2月获得1.59亿美元B轮融资,投资方包括AI领域资深学者深度学习三巨头之一Geoffrey Hinton、李飞飞、Pieter Abbeel,还有知名基金Tiger Global,Index Venture等。20235月获得2.5 亿美元的融资估值达到20亿美元,投资方包括Salesforce Ventures,英伟达,Inovia Capital和Index Ventures等。这三个小伙子可以吸引Geoffrey Hinton、李飞飞、Pieter Abbeel这种学术大牛,还有英伟达,真的是非常让人吃惊。

产品

Cohere的主要业务是给用户提供应用大语言模型的API,可以帮助用户创建针对客户特有的使用场景和独有数据的大模型。Cohere可以提供生成语言模型(generative language model,如GPT2和GPT3直接生成文字)和表示模型(reprensentation language model,如BERT,生成Embedding向量


Generate(生成)
使用可扩展、经济实惠的生成型人工智能工具编写产品描述、博客文章和营销文案等。如下图所示,输出的结果是自然语言文本。


EMBED
可以提供英语及其他100多种语言的Embedding模型。Embedding是将人类语言转换成数字向量,具体可以参考关于大模型的一些Basics这篇文章。Embed模式下,输入字符串,输出的是数值向量。

Summarize(总结)
大语言模型在文本生成方面具有突破意义。历史上第一次出现软件生成的语言可以和人类媲美,这也使得文本总结这样的功能成为可能。

Classify(分类)
分类是语言模型的基本功能,开发者可以在Cohere的语言模型基础上构建分类器,以实现意图识别、情感分类等功能。

Semantic Similarity(语义相似性)
客服每天会面对很多重复的问题,语言模型可以用来筛选相似的问题并匹配FAQ中的答案。

因为Cohere并没有类似ChatGPT这样的对话Agent,所以我也没有机会去体验他的产品,也没法对产品本身做出更多评价。欢迎对Cohere有了解的朋友在评论区留言,可以说说为什么Cohere会获得这么多学术界大牛和产业界巨头的青睐。

References:

https://docs.cohere.com/docs/the-cohere-platform

https://www.youtube.com/watch?v=ooBt_di8DLs

https://mp.weixin.qq.com/s/xfdlHLFeIiN9htyaWFl8PA



原创不易

快来戳一下”关注“给些鼓励吧!

欢迎“点赞”“打赏”“在看”三连!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存