从伦敦开车到中国,1人AI公司背后的幕后英雄:Replicate
在人工智能领域的竞争中,任何人都可以修改和使用代码的开源模型正在赶上私有模型。开源模型变得越来越大(Meta 的 Llama 2 经过 700 亿个参数的训练),甚至在执行特定任务方面比 ChatGPT 更好。随着人们对开源人工智能工具的兴趣日益浓厚,现在是成为一家托管和运行开源软件的初创公司的黄金时机。
Replicate 的平台上有25,000 个开源 AI 模型,被 200 万软件开发人员用来访问和修改,诞生超过 200 万个软件,其中不乏我们曾经介绍过的1人团队,百万营收的AI套壳公司。
今年,当流行的开源模型(例如文本到图像模型 Stable Diffusion 2.0 和 Meta 的大型语言模型 Llama 2)添加到其库中时,Replicate 出现了海量增长。在 OpenAI 的领导层在 11 月底经历风波时,该平台的流量也出现了上升。点击底部左下角阅读原文。
一、创立故事
在计算领域,其实很少有新的基础构件,应用程序本质上都是网络、存储和计算的某种组合。但是像Stable Diffusion和ChatGPT这样的视觉或语言大模型却真的代表了一个全新的基础构件。将这些大模型整合到软件中,开发者可以实现包括文本,视觉,语音等多模态内容的生成,这在以前是一件不可能的事情。
大模型的能力毋庸置疑非常强大,但是普通软件开发者将AI大规模运行到生产环境中时,仍面临一系列难题:如何托管模型,模型出问题时该怎么办,以及如何随着时间推移构建模型的差异化——针对大模型的清晰抽象和简单工具还没有诞生。
Replicate的两位联合创始人Ben Firshman(CEO)和Andreas Jansson(CTO)想要解决这个问题,他们发现需要一个平台,让软件开发人员能够在当今最大的开源模型(例如 Meta 的 Llama 2 和 Stable Diffusion)进入主流之前更轻松地使用最新的 AI 模型。
Ben Firshman是一位连续创业者,Replicate是他第4次创业,他在Docker担任产品总监时设计了Docker Compose,现在这个工具被数百万开发者使用,他对开发者体验有着超乎寻常的理解力。
以下是一个他的职业发展时间表,其中包括他在2017年开始环游世界,从伦敦开车到中国的经历。
2008 - 2011:Firshman 在华威大学学习计算机科学
2008 年 6 月 - 2008 年 8 月:Google 暑期代码课程学生,他为 Django 构建了一个搜索 API
2009 年 12 月至 2010 年 1 月:卫报集团的开发人员,在那里他建立了卫报的世界政府数据网站。
2010年3月至2010年10月:The Boar(沃里克大学校园报纸)主编
2010 年 8 月 - 2011 年 5 月:Guardian Group 的开发人员,为卫报的 iPad 设计和构建了一种新型发布系统(并获奖)
2011 年 1 月 - 2012 年 3 月:Firshman 与他人共同创立了 Epio,“Heroku for Python”
2011 年 8 月 - 2012 年 3 月:Lanyrd 开发人员
2012 年 3 月 - 2012 年 5 月:Firshman 作为开发人员加入 This Is My Jam 并构建了他们的 Spotify 应用程序
2012年5月至2013年5月:他与他人共同创立了写作反馈工具Poetica Ltd
2013 年 7 月 - 2014 年 1 月:政府数字服务(Government Digital Service)开发人员
2013年5月-2014年6月:他创立了Orchard(一个容器EC2),并创建了Fig,后来被Docker收购并演变成Docker Compose
2014年6月-2016年12月:Firshman加入Docker, Inc担任产品经理,后来成为产品管理总监,领导Docker开源项目的开发和管理
2017年1月至2018年12月:他暂时离开科技行业环游世界,骑自行车穿越欧洲和印度,并从伦敦开车到中国
在路上,他建立了 arXiv Vanity,将学术论文转化为网页
2019 年 10 月至今:Firshman 创立 Replicate
Andreas Jansson,2012年从伦敦城市大学取得计算机科学学士,工作几年后,2020年从同一所大学取得音乐信息学博士学位。曾担任Spotify的高级机器学习工程师,他具备大规模部署AI模型的经验,并从0设计过创新的AI工具。
2023年,Replicate打造了12人组成的团队,为用户提供除了在开源生态系统中使用最好的模型,还允许公司运行自己的定制模型,它会自动打包、优化并部署这些模型——将过程从几周缩短到几分钟,并减少用户对IT基础设施团队帮助的需求。
Firshman在谈到创业初衷时这样说:
Replicate的种子轮和A轮投资人,红杉资本合伙人Stephanie Zhan则表示:
二、公司产品
Replicate的核心产品理念是,所有开源AI模型都应该能在一个地方找到,并且易于使用。开发者应该能在没有任何机器学习工作、托管设置的情况下,立即启动并运行大语言模型。将几个模型组合成一个管道应该很容易。并且,当应用程序规模扩大时,开发者应该能够使用简单的工具进行微调并托管自己的模型。
Replicate的产品是一个开源的AI模型托管云平台,它的几个主要功能是:
1、现有大模型的整合与引入
企业用户可以使用几行代码就在平台上运行机器学习模型,而无需了解任何机器学习的工作原理。
针对需求相对简单的用户,Replicate提供了上千个不同的AI模型在线使用或者简便地导入到自己的程序中,包括语言模型、视频创作与编辑、超分辨率、图像修复、图片转文字、文字转图像等六大功能,最火爆的模型已经被在线使用了超过9000万次。
针对需求更高的深度用户,他们可以借助Replicate的模型库以及Next.js和Vercel等工具开发自己的项目。截止目前,已经有很多AI工程师使用Replicate来制作自己的项目,例如将开源基础大模型进行特定方向的微调,其中优秀项目包括roomGPT、 Scribble Diffusion等。
2、帮助用户部署人工智能大模型
部署人工智能大模型模型的传统方法是,开发人员必须先将模型及其支撑组件手动打包到软件容器中,然后再部署。Replicate 开发了一种名为Cog的开源工具,简化了这项任务。
Cog目前内嵌在Replicate的云平台中,用户可以通过比以往更少的定制化工作来配置容器。用户在云平台仅通过几行代码就能运行特定的AI模型,整个过程只需要几分钟,与以前的部署方法相比是指数级的下降。
Replicate不仅提供了云平台,还给出了非常详细的模型部署教程。目前,cog在GitHub上获得了超过5千多颗星。
3、快速扩展人工智能模型规模
对于中小企业,大规模部署机器学习模型不止会遇到cog解决的部署问题,同样关键的问题是如何扩大其规模以达到商用标准。在扩大规模的时候,要处理的问题涵盖API服务器、依赖关系、模型权重、CUDA、GPU、批处理等。
当用户在Replicate平台上部署机器学习模型,平台可以从硬件和软件两个层面帮助其扩展规模。
软件上,用户既可以使用现成的开源模型,也可以大规模部署自定义私有模型——只要使用Cog定义的模型,Replicate都可以自动为其生成可扩展的API服务器,并部署在大型GPU集群上。
当用户部署的模型获得大量流量时,Replicate会自动扩展模型以满足需求。如果部署的模型没有获得任何流量,replicate就会将规模缩减至零,并且不会向用户收取任何费用。
硬件上,Replicate目前提供七种不同级别的硬件设施以供用户部署其模型,平台会以秒级别的精度计算用户的部署时间并计费。此外,平台还支持对于合规性、安全性或对SLA(服务等级协议)有特定需求的企业级客户提供定制软硬件解决方案。
三、市场格局
1、公司客户
Replicate帮助开发人员运行人工智能模型并对模型进行训练。如果您想制作人工智能头像应用程序,您可以使用 Replicate 上提供的模型之一来为您生成图像。如果想要训练自己的模型来微调输出,也可以使用 Replicate 来做到这一点。
公司拥有超过 200 万开发人员(其中 3 万是付费客户)和超过 25,000 个可供您使用的 AI 模型。他们从图像开始,但现在拥有包括视频、音频和文本在内的一切模型。在其 30,000 名付费客户中,有 Buzzfeed、Getty 旗下的 Unsplash 等公司,以及 Character AI 和 Labelbox 等初创公司。
许多开发人员将 Replicate 用于他们的副业项目,但副业项目可以变成价值数百万美元的公司。就像Pieter Levels 和 Danny Postma一样。
Pieter Levels 在他的 PhotoAI.com 网站上使用 Replicate。并且每年能赚好几百万。
Danny Postma 在他的 Headshotpro.com 网站上使用 Replicate。每年赚取超过 100 万美元。
Replicate 还帮助开发者构建自主机器人、实时绘图应用程序和语言模型命令行界面。
此外,大公司也是Replicate的客户,大公司内的小项目也可以发展成为真正的产品。
免费高质量照片分享平台Unsplash 使用 BLIP 为其目录中的所有图像添加标签。
BuzzFeed 正在……将您的宠物变成毛绒玩具。
Character AI、Labelbox 和数千家其他企业正在 Replicate 上部署模型。
2、商业模式
当你在 Replicate 上使用模型时,需要为其处理您的请求的时间付费。Replicate 根据模型运行的时间向开发人员收费,每小时 36 美分到 20 美元不等。通过与 NVIDIA(也是公司的投资人) 合作,提供不同大小和功能的 GPU,并与 Coreweave 和 Google Cloud 等多家云提供商合作。
3、竞争对手
Replicate 并不是唯一一家提供计算资源来运行开源模型的初创公司。竞争来自于诸如Together AI(最近筹集了1.025亿美元A轮融资)、45亿美元Hugging Face和OctoML(估值8.5亿美元)、CentML(AI周报025)、Modular(AI周报016)等初创公司,以及英伟达、谷歌、亚马逊和微软等科技巨头,也提供类似的产品来在云上运行和定制机器学习模型。
2016年成立于法国,获得2.35亿美元的新资金,由 Salesforce 领投,谷歌、亚马逊、英伟达、英特尔、AMD、高通、IBM和Sound Ventures等公司参与,估值提高至45亿美元后,这超过了其年收入的100多倍。它现在跃居第五位最有价值的生成人工智能独角兽(见图)。Salesforce 之前通过 Salesforce Ventures 投资的人工智能企业,包括 Anthropic 和 Cohere。
Clément Delangue是公司创始人,是一位法国企业家,也是Hugging Face的首席执行官。自2022年以来,Hugging Face一直得到Sequoia的支持。他之前参与了Moodstocks,这是一家为计算机视觉构建机器学习的初创公司,后来被Google收购。Delangue还是自然语言处理领域的知名研究者,在Google Scholar上有超过5500次引用。他曾接受过多次采访,包括在YouTube的"On the DL"系列中的一次,以及在Fast Company的"2023年最具创意的人"名单中的介绍。
Together(AI周报030)
2022年成立于美国加州门洛帕克,提供领先的开源生成式人工智能模型和一个使人工智能无处不在、任何人都可以使用的云平台,完成1.025亿美元融资,投资方为Kleiner Perkins、Nvidia和Emergence Capital。Together 构建了一个用于运行、训练和微调模型的云平台,联合创始人声称该平台以比主要供应商(例如 Google Cloud、AWS、Azure)更低的价格提供可扩展的计算。
Vipul Ved Prakash,公司创始人。软件工程师和互联网企业家。他是反垃圾邮件公司Cloudmark和社交媒体搜索公司Topsy的联合创始人。2013年,Topsy被苹果公司收购,后来他成为苹果公司的高级总监。他与Ce Chang、Chris Re 和 Percy Liang 共同创立公司。
四、公司估值
2023 年 2 月 21 日,从 a16z、Y Combinator、红杉资本和天使投资人那里筹集了 1780 万美元的 A 轮融资。
2023 年 12 月 5 日,在 Andreessen Horowitz 领投的 B 轮融资中筹集了 4000 万美元,参与方包括 Nvidia 的风险投资部门 NVentures、Heavybit、Sequoia 和 Y Combinator。本轮融资对这家位于旧金山的初创公司的估值为 3.5 亿美元,使 Replicate 的总资金达到约 5800 万美元。
一个反对开源模型的论点是存在一系列安全风险:它们可以被用于恶意目的,比如制造网络钓鱼和生物攻击,但开源倡导者认为,模型代码的透明性意味着它将面临更多审查,这最终将使模型更安全。Replicate已经在一定程度上解决了这个问题,通过检测和限制模型生成有害内容的过滤器。但由于检测器容易错误地标记安全内容为不安全,它们可以被禁用。
然而,在 Replicate 平台上,对开源模型的需求明显增加,该平台是可以生成和编辑音乐、视频、文本和图像的模型的所在地。一种“面部修复”(https://replicate.com/tencentarc/gfpgan)人工智能模型可以将模糊的老照片转换为清晰的图像,已被使用约 6000 万次。另一种可以在两秒内换脸(http://face-swap/)人工智能模型已经运行了近 3000 万次。部分原因是大型开源人工智能模型可以通过自定义数据训练来针对特定用例进行微调,从而使它们更便宜、使用速度更快。
Ben Firshman说道。
"其实,我们可以做更有趣的创意工作。"
在读的您,如果对此话题感兴趣,欢迎联系凯瑞(pkcapital2023),与一群志同道合的小伙伴一起探讨。
AI公司
+
OpenAI:人工智能突破的前沿丨员工名册丨董事会丨营销团队丨GPT Store丨投资人 Sam Altman 丨科技狂人萨姆奥特曼丨马斯克、奥特曼和OpenAI秘史丨Sam Altman 的地产生意经丨微软与 OpenAI 合作内幕丨Sam Altman 的地产生意经
Anthropic丨Amazon丨DoNotPay丨Google丨Hugging Face丨Midjourney丨Neuralink丨Replite丨Scale AI丨Shein丨Stability AI丨Vannevar Labs丨Zapier
AI行业
+
AI写作工具丨AI编程工具丨AI客服工具丨AI法律工具丨AI视频工具丨AI搜索工具丨AI合成数据丨AI企业服务丨AI Agent代理丨AI个人助手丨AI生产力工具丨LLMOps市场地图丨AI创始人背景大揭秘丨全球高增长AI 50公司名单丨AI:即将到来的科技革命丨2023年企业生成式人工智能现状报告丨AI 正推动云计算的下一波增长丨旧金山湾区成为Gen AI早期赢家丨我们离实现通用人工智能(AGI)还有多远?丨巨头的AI战争:英伟达、微软、谷歌、亚马逊的战略与选择丨欧洲AI创业地图
AI创投
+
创业:
1人团队,百万营收的AI套壳丨如何从零打造一家AI驱动的公司?丨值得关注的人工智能初创公司丨如何在6个月内,通过AI月入6万美元?丨你的性格决定创业成败丨从互联网到生成式AI狂潮揭示了哪些不变的真理?丨 如何寻找和评估创业方向?丨CEO如何确定自己的薪水?丨如何分配股权和头衔?丨如何组建和召开创业公司董事会?丨SaaS 创始人收入运营(GTM)指南丨如何选择VC?丨写商业计划书(BP)丨AI+法律:创业机会地图
投资:
为什么说Gen AI拯救了风投界?丨全球顶尖VC投了哪些AI初创公司?丨AI炒作巅峰,中美创投赛道有何异同?丨如何评估AIGC初创公司的竞争优势?丨知名海外投资人谈AI新趋势丨做通才还是专才风险投资人?丨排名第一的风险投资公司,红杉资本如何做投资?丨如何及早识别独角兽创始人?丨风险投资公司如何避免7大陷阱?丨合伙人是怎么炼成的?丨高位接盘OpenAI,Thrive Capital是何来头?丨打动英伟达CEO黄仁勋的AI公司和创始人