查看原文
其他

从一个“仅为”$1Bn的开源数据库IPO,聊聊开源和infra的现在与未来

M小姐走四方 M小姐研习录 2022-08-29
这是一篇短文。因为长文憋了好久憋不动了哈哈。
结果还是写了老长,不要嫌弃我~

M小姐薛定谔更新来了来了!!感谢各位还不离不弃的小伙伴哪~

前段时间开源和infra人被Confluent IPO 还有一系列的mega rounds搞得很鸡冻(没错Confluent的分析我拖到现在也没写完),然而最近一个同样开源的NoSQL database,Couchbase, IPO定价才刚过$1Bn.(对比一下,竞争对手MongoDB 市值超过230亿美金!)

上市第一日(居然)上涨26%,但是在database这样风口正盛的大市场,仍然是不到15x PS的估值——要知道,现在美国二级市场SaaS公司虽然估值回调不少,但是对增长率>30%的高增长公司PS也将近30x。

这样的现状,不知道会不会让大家对待开源和infra稍微冷静一些。
IPO虽小,M小姐倒是觉得,是一个很好的契机,把Couchbase和更成功的竞争对手MongoDB做个对比,借此唠唠,什么是好的基础软件,什么是好的开源。


Couchbase做的事情也很好理解,就是MongoDB的直接竞争对手,也是一个开源的NoSQL数据库(这个开源有点勉强,后面会说到),与MongoDB一样是document oriented database。

老习惯,上目录,就从几个角度聊一聊:


  • 基本面:最火的赛道,最中庸的metrics

  • 产品的本质:技术和性能不是万能的

  • 开源的意义:开源不是freemium这么简单

  • 变革的决心:错过Cloud就错过了一个时代

  • 开源商业化:产品和社区决定了天花板







基本面:最火的赛道,最中庸的metrics


从商业基本面上看,Couchbase 2020年$100+M ARR 也就刚刚过了SaaS IPO的合格线,27% YOY growth,仅为110+%的NDR,这些指标都远没有达到市场对于一个高增长SaaS公司的期待。大家所熟知的Rule of 40, couchbase仅为20+。这个结果其实在一级市场就有反映,公司成立了近10年,8轮融资总共$251M,仍然没有成为unicorn,所以这个IPO也是上得有些勉强。


要知道,现在美国SaaS市场虽然整体估值比起2020年最疯狂的时候下调了不少,但是愈发明显的一个趋势是,二级市场的估值越来越像成长期投资,对成长给极高的溢价。下面是根据2020Q2最新数字总结的,美国二级市场SaaS公司运营指标的中位数(credit to Jamie Ball,链接在文末),大家就大概知道couchbase的经营指标在整体行业中是什么位置了。

可以看到,虽然couchbase gross margin接近90%,但是Growth rate, NDR这些指标,都勉强在中位数水平,显著低于投资人对于IPO阶段、$100M ARR 体量的公司的预期。这个不到10x PS的估值,也就不意外了。

因为最近开源和infra在中美都火得不要不要的,那么我们简单对比一下Couchbase和MongoDB两个开源的数据库,有几点思考,希望跟大家分享交流一下。





产品的本质:技术和性能不是万能的


有时候一些创业者说,我做了一个超级快的数据库,一定会有人用。

在infra中真的是这样吗?

要知道,真正能在纯性能上绝对高于所有竞争对手10x的革命性技术坦率来说是极少的。大家都知道benchmark就跟人工智能领域刷榜一样,总能找到最favor自己的场景或者做针对性的优化。Database虽然是底层产品,也是跟应用场景以及使用者/开发者的习惯息息相关。

任何产品的优化都不免要面临一些tradeoff, 对这些tradeoff的选择,本质就是对场景和用户的理解。比如最经典的数据库设计中要考虑的CAP (Consistency, Availability, Partition tolerance)问题。

noSQL数据库200多个,MongoDB作为后来居上者,现在在DB-engines 整体排名中高居第五,甚至碾压AWS,GCP等大厂。Couchbase在整体排名中仅为29名(要知道,底层软件相对来说头部比较集中,20名之外基本已经是边缘产品了,这也解释了为什么成立十年的couchbase收入仅有$100M出头)。即使在细分的document stores里,排名第4的couchbase 也明显被各种后来者超越。


Couchbase和之后合并进来的Membase都脱胎于Apache CouchDB,release的时间和MongoDB并无很大差异。在一开始,其实二者的绝对performance并没有这么大的差别。但是下面这个对比,可以看出一些设计思路上的差异。


但是MongoDB有几个设计,跟couchbase比起来未必是apple to apple的优劣,但是更符合用户的需要。

比如在CAP中,MongoDB明显的倾向CP,虽然牺牲了一些Availability,但是Scale更快。在当时(2010-2015年之间)数据量开始大规模增加,要开始考虑接受还比较新的NoSQL数据库的公司,遇到的痛点首先就是应对快速增长时,兼顾规模和效率。相比之下,Couchbase在replication 和mobile上的优势,在当时的环境下似乎有些鸡肋。

而且,虽然read, write都很快当然最好,但是对于分布式数据库的需求主要是业务,也就是数据使用侧的推动,MongoDB优先read性能,而不是试图做到两手都抓,反而适应当时的业务环境。

此外,MongoDB的Query更接近于大家熟悉的SQL,C++比Erlang更通用。这种一定程度上的熟悉性,非常符合一个新的、基于社区传播的产品易于上手的需要。让大家接受起来更容易。

除了技术之外,marketing也是不可忽视的一环。经过一系列重组的Couchbase (CouchOne, Membase两家公司来源于Apache CouchDB,合并为Couchbase…), branding越来越confusing. NoSQL彼时还算是新兴行业,本来就需要集中火力做市场教育,公司本身产生了很多不consistent的对外messaging,这真是早期发展的硬伤。

话说回来,能在产品和技术上做出这样的取舍,一部分原因来自于创始人的基因和出发点吧

MongoDB上市照片,中间是今年才离职的co-founder CTO  Eliot Horowitz,

他的右边是商业化大功臣 Dev Ittycheria


很多硅谷infra的创业者,都是原本自己是这个产品的使用者,感受到了产品本身的局限和痛点。这种一手的经验,而不是单纯的技术创新,是非常加分的出发点。MongoDB的创始人是基于自己原本的互联网广告公司DoubleClick(后来被Google收购)业务中使用tabular database的痛点,而产生了做NoSQL database的想法(这个故事感觉有点像百度出来的DorisDB哈哈)。而Couchbase一开始,更像是基于CouchDB的商业变现。虽然不是绝对,也对后来的一些产品选择有了直接间接的影响吧。

所以投资人这么关注why this, why you,还是很有理由的哈。





开源的意义:开源不是freemium这么简单

Couchbase虽然诞生于Apache社区的CouchDB,但是经历了重命名成CouchOne,又跟Membase合并等种种事件后,开源社区已经基本上荒废。S-1中的Go-to-market也完全没有提开源社区。所以可以认为,couchbase基本依赖传统自上而下的sales 。

然而MongoDB一开始就极其重视开源,借助社区力量形成了NoSQL RDMS的行业标准。这个活跃的社区不仅为MongoDB早期的商业版带来了高质低价(当然marketing也不便宜)的leads, 也成为日后Atlas (managed service)的基础。

这两种做法从数字上看也是非常明显。2020年的Sales & Marketing占收入比重,Couchbase高达70%,而MongoDB仅为50%左右。而2017年MongoDB上市的时候,这个数字也高达70+%,不到5年的变化相当显著。

Couchbase S-1:

MongoDB 2020年报:
当然,这个数字也不是可以做单一评判的指标。Snowflake去年上市的时候,这个数字甚至超过100%。但是当时公司ARR $500+M和收入增速高达120+%!所以按照现在美国二级市场对SaaS公司高成长性的偏好,这种利润换增长的方式,仍然被市场接受。相比之下,不到30% YoY growth的couchbase 就非常不讨好。

从资本效率的角度来看,两家创立时间差不多的公司,IPO之前,Couchbase总融资$251M, MongoDB $311M,但是2020年收入来看,后者是前者的5倍还多。资本效率的差距不可谓不大。

这里其实值得多说几句的是,开源的价值到底是什么?

很多人要么认为开源就是技术圈的理想主义,要么只是当做一个go-to-market的手段。M小姐看来,这都未免以偏概全,甚至有可能极大误导一个企业的开源战略。

在a16z那篇著名的开源实操文章,Open Source: From Community to Commercialization 中,这个模型其实总结得非常清晰。

这个flywheel右侧几种商业化模式,包括上一代的Redhat式的服务、大多数开源公司采用的open core, 和实现第二曲线增长的SaaS模式,都只是开源价值变现的结果。M小姐以为,开源核心的价值创造,来自于speed innovation. 因为有了(经过选择的)最优质客户的共同打磨,在各个真实场景的迅速测试,优秀人才的经验共享和共建,才能打造出有技术竞争力的产品,才能成就商业价值。

上周的PingCAP Devcon, CEO刘奇有一句话说的也是这个意思:
真实场景是最好的架构师。

而对于一个诞生于startup的infra产品而言,让自己的产品迅速在各个场景中经历打磨洗礼、升级换代的最有效的方式,就是开源。这也是开源最大的价值(如果不是之一)。

所以,衡量一个优质的开源项目/公司,核心是看这整个链路是否打通。没有社区共建的商业化,和没有真实场景的技术创新,都是片面的开源。





变革的决心:错过Cloud就错过了一个时代

Cloud 是大势所趋,虽然MongoDB和Couchbase,或者说绝大多数的开源infra公司,都是从卖企业版的open core模式起家,但是MongoDB借助SaaS业务实现第二曲线腾飞的自我革新,绝对是商业史上值得称道的经典。

MongoDB 2007年成立的时候,云计算还不知道在哪里。一开始的近十年时间,都是经典的Open core路线,给大客户卖商业版MongoDB Enterprise,公司自己manage 底层基础设施。

但是云计算方兴未艾的2016年,就推出了SaaS版本Atlas。

2017年上市的时候,这部分收入还不到当时MongoDB $100+M总收入的1%(没错啊,2017年MongoDB的收入就跟Couchbase现在的收入差不多了额)。而Couchbase直到2020年(!)才推出Couchbase Cloud,相差了5年之久!

要知道,现在MongoDB Atlas ARR都达到总收入近一半,超过$200M了,增速还高达40%,俨然成为了第二大业务支柱!成长速度绝对惊人。
这种SaaS服务现在听起来很顺理成章,但是对于当时已经围绕Open-core打造了一整套营销、sales和产品体系的MongoDB,SaaS这个关键的第二曲线对整个组织可谓是不小的挑战,也是对掌舵人战略眼光的考验。这个难度可以说对于需要同时攻克enterprise大客户和SMB的SaaS公司来说,是共同的挑战,可以单独一个专题来说了,今天暂且不表。

就说一个简单的点,看看下图两种产品的平均合同额,SaaS产品还不到企业版本的十分之一,就知道SaaS和Opencore模式面对的是完全不同的两个客户群体。但是稍微熟悉B2B sales的同学都知道,卖传统的软件跟organic 驱动的SaaS产品,光是对销售的激励方式都非常不一样,同时manage两种营销组织体系的坑真的不要太多。

M小姐想说的就是,这种企业业务、组织和文化层面的全面升级,值得让我们对MongoDB的管理层刮目相看。(这个要感谢的,就应该是2014年上任的CEO)

相比之下,Couchbase有两个现在看来可以说是弯路的决定。

一是花了很多精力做mobile平台的support, 后来被证明是一个比想象慢的多的市场。这个2014年launch以来就一直不温不火的需求仿佛是将公司拖入了尾大不掉的泥潭。Mobile的收入甚至都没有在S-1中单独披露,可以想象即使在今年也乏善可陈。中间这么多年增长乏力,不知是不是机会成本的原因,似乎并没有什么转变的意识。

更致命的,就是在云计算的时代到来的时候,公司没有及时转向SaaS模式。在SaaS模式已经成为几乎所有商业开源软件的标配的时候,Couchbase的SaaS收入也还几乎可以忽略。

看到这个巨大的差距,可以让大家从另一个角度理解,创业者所需具备的战略能力是怎样的。能支持各种mobile devices, edge computing 场景的NoSQL database, 不能不说是一个技术有亮点的功能。但是在市场印证上,在行业关键拐点的识别上,一两个大的判断,真的有可能带来公司天壤之别的发展。

为什么创始人要建立好组织,让组织和高管团队帮助自己脱离日常的运营细节,才能在必要的时候,跳脱出来,仰望星空,做重大的决定。Bezos就说,他一年只需要做2-3个决定,但是 Be right, a lot. 





开源商业化:产品和社区决定了天花板


看看Couchbase的商业化,也不能说就不成功。至少,很符合国内大家追求大客户的思路。

经过这么多年的发展,couchbase的大客户数据还是不错的


  1. 公司549个客户横跨50个国家(infra公司天生就要国际化呀)
  2. 23个客户ARR超过100万美元。这些客户自他们与Couchbase签订第一份合同以来,ARR增长了20x!
  3. 来自ARR超过50万美元的大客户的收入,占了总收入的56%

而且,刚开始的时候,很多人觉得NoSQL database还不适用于Mission critical的应用,现在,据称80%的Couchbase客户已经将他们的数据库用于部分或大部分业务的source of truth or system of record了。

然而!为什么couchbase的体量会比MongoDB小了这么多呢?这对于更多涌入的玩家,有什么启示?

当然,数据库这个池子是足够大(至少也是500亿美金,10+%增长率),AWS也是在宣扬Purpose built database, 所以百花齐放是必然。但是我们从权威的DB engines其实可以看到这个市场的几个特点:

首先,集中度相当高,头部效应明显。从下图DB engines的ranking不难看出,前5-6名跟其他玩家的差距相当大。没有挤进前5名,或者增速不够快,天花板都是不高的。

这个其实也不难理解,一方面,数据库是需要不断跟场景打磨的底层产品。越是头部,越是有更多的用户一起来不断提升产品的性能和适配场景。另一方面,底层产品的粘性足够高。都是至少120+%(对比一下,MongoDB 超过120%,Snowflake更是令人发指的145+%!)。所以couchbase 115%的NDR在一般SaaS中也许不错,这个品类中只能算中流。


此外,上图也可以看出,过去几年的数据库领域真是迎来数十年一遇的大变局。云计算+数据两大驱动力,无须赘述。很多2011年之后的数据库都得到了蓬勃发展,百舸争流,很多老牌玩家都在被超越

几大云厂商自不必说,渠道优势杠杠的,老牌的Casandra, IBM Cloudant, PostgreSQL, RavenDB, 等等,也都在这个大变局中地位开始摇摆。这个摇摆,就让大量的新势力得到了发展的空间。

第三,开源在这个变局中是一股关键的力量。2021年是Open source license 数据库全面超越commercial license数据库的关键一年。


有了云计算的推动,有了数据爆发驱动的场景和痛点,这个传统无比sticky的市场开始有契机来接纳还没那么完美,但是可以解决一两个关键问题的新的基础设施(比如当年被大家一边骂一边用的MongoDB,历史多么熟悉)。

正如前面所言,开源的意义是什么?这里又多了一点,就是跑马圈地,占领场景和心智的高地。

看看MongoDB 2017年S-1,项目开始到5M download,花了超过5年的时间。而上市的时候,虽然跟现在的Couchbase类似,年收入在$100M 上下,但是累计下载量已经超过3000万!这就意味着,这些社区里的公司,基本已经不大可能使用别的直接竞品(除非10x better?!)。



而这些公司的价值,从产品的角度而言,正如前文所提到的flywheel,他们所贡献的场景和contributor,让一个startup得以迅速测试这么多环境,是融资再多也很难买到的

从商业角度而言,不论是作为大企业客户的lead generation, 还是直接成为对于中小客户的freemium 模式,更是不可估量。这就是为什么在MongoDB Atlas launch不到两年的时间里,2018年客户数量就超过了3000!

对比一下,Couchbase依赖传统sales路线自上而下发展,2020年总用户数541个,YoY增速还不到10%。当然,Snowflake, datadog等也都是自上而下的大客户路线,仍然很成功。虽然不能一概而论,但是对于一个使用者更多元的市场,一个迭代速度要求更快的产品,开源相信是所有infra产品至少需要认真考虑的道路。

不过,知易行难。

一方面,这需要开源社区运营者有极大的耐心,在前期做产品的深耕和打磨。我很喜欢的一句话,来自熊飞总(啊我当然不是拍老板马屁!):

开源早期做好产品和社区(标杆用户),就是最好的商业化。

另一方面,底层软件的B2B市场,本身就容易有很多付费意愿很强的用户(大多数是传统企业用户)。买咨询买服务。初创公司太容易陷入尽快商业化,收割现金流的短视循环中。做商业化开源产品,要能够坚持长期主义,早期站稳地盘,中期设计商业化产品,后期发展多维度go-to-market, 其实对创始团队和组织的要求或许更高更多元。

当然,很多人也许还想要谈论MongoDB的license选择,是否帮助他们抵御了公有云厂商的冲击。这就可以另外开一个专题了。但是M小姐觉得,License选择在后期大规模商业化中自然有影响,但是很简单地说,大多数产品都没有能够对AWS自己的产品产生威胁的程度,杞人忧天个啥?

啊,说好了写一个短文,说好了只是M小姐的朋友圈小论文放不下,怎么又碎碎念成8000字了?!

总结一下:



  1. 商业基本面:现在开源和infra在中美两边都是红得发紫的赛道,但是Couchbase作为老牌玩家,从收入、增长率、retention等关键指标来看,在美国二级市场SaaS公司中,仅为中间偏下水平。因此PS和市值也不高。


  2. 产品方面:虽然两个直接竞争对手MongoDB和Couchbase 早期在性能上没有本质差异,但是即使是数据库这样的底层产品,更符合已经有明确需求的场景、更贴近现有用户的使用习惯,以及更清晰的marketing message,这些产品设计上的考量,对于产品的成功很多时候不比性能本身重要性低。


  3. 开源的意义:开源不只是一种go-to-market的方式。开源社区的核心价值在于集合所有开发者的力量更快迭代,在更多的场景中打磨产品,最终形成行业标准。没有社区共建的商业化,和没有真实场景的技术创新,都是片面的开源。


  4. 模式变革:MongoDB抓住云计算的机遇迅速转型,推出SaaS服务Atlas,形成二次增长曲线。这是对战略眼光和组织变革能力的极大考验。Couchbase没有及时从萎靡的mobile端需求中跳出来,2020年才开始做SaaS,可谓是错过了一个时代。


  5. 开源商业化:产品和社区决定了商业化的天花板。开源早期做好产品和社区(标杆用户),就是最好的商业化。MongoDB几千万的download量成为日后商业化成功和Atlas华丽进化的基础。



这是开源最好的时代,群雄逐鹿,亦是最有挑战的时代。


然后那啥,
M小姐低调小新闻~~~

硅谷游荡多年的M小姐今年也回到祖国怀抱,加入了这红红火火的投资阵营。
大家都问我为啥不在湾区好山好水好好待着。
其实想法很简单,看到国外这一波来势汹汹的变革,我很难相信,
未来5-10年,中国难道不会诞生自己的云计算生态?
中国互联网这么多极致的场景,怎么可能不诞生出世界级的基础软件公司?

不想隔岸观火,就一头扎进这乱世

所以嘛~~~欢迎小伙伴们在后台交流~有BP的砸过来,没有的也可以勾搭哈哈

Reference:
Couchbase s-1,MongoDB 10k
https://db-engines.com/en/system/Couchbase
https://cloudedjudgement.substack.com/p/clouded-judgement-71621
https://severalnines.com/database-blog/battle-nosql-databases-comparing-mongodb-and-couchdb
https://a16z.com/2019/10/04/commercializing-open-source/
https://www.moritzplassnig.com/saas-and-moving-downmarket-mongodbs-transformation/
https://medium.com/memory-leak/couchbases-s-1-analysis-sofa-so-good-%EF%B8%8F-eec65cb21d07
https://www.quora.com/What-is-the-difference-between-couchbase-and-mongodb
https://www.bvp.com/atlas/measuring-the-engagement-of-an-open-source-software-community


都看到这儿了,

不戳一下这么美丽的二维码关注一下?

点赞转发打赏三连发

我也没意见 :)


****原创不易,转载请注明出处****


写一篇文章可不容易,点个“在看” 鼓励一下M小姐呗 




往期回顾


Snowflake创纪录的SaaS IPO,你不能错过的万字深度解析


【硅谷笔记·深度版】Uber乱世布局,反Amazon联盟,视频行业转折点


你要合理地贪婪:经历两次金融危机的硅谷传奇给你的危机生存指南


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存