小红花数据库排行榜(2024年10月):崛起中的国产数据库
小红花数据库排行榜(2024年10月):崛起中的国产数据库
这是小红花技术领袖俱乐部旗下内容平台「小红花·文摘」首次发布数据库排行榜,前三名是PostgreSQL、MySQL和MongoDB。全文包括排行榜详情,排行依据及统计说明,解释与DB-Engines排行榜及墨天轮排行榜的不同之处,等。
10月标题:崛起中的国产数据库
首先来看排行榜的前20名:
名次 | 数据库 | 得分 |
1 | PostgreSQL | 68.87 |
2 | MySQL | 55.55 |
3 | MongoDB | 32.37 |
4 | Databricks | 18.76 |
5 | Redis | 18.39 |
6 | Spark | 8.09 |
7 | Oracle | 7.73 |
8 | GBase | 7.72 |
9 | Elastic Search | 6.62 |
10 | TiDB | 6.25 |
11 | Flink | 5.15 |
12 | GaussDB | 5.13 |
13 | SnowFlake | 4.41 |
14 | Sqlite | 4.39 |
15 | SQL Server | 4.05 |
16 | DynamoDB | 4.05 |
17 | MariaDB | 3.31 |
18 | RedShift | 2.94 |
19 | LevelDB | 2.58 |
20 | Neo4j | 1.84 |
从表中可见,与DB-Engines排行榜不同,其多年高居榜首的 Oracle 数据库在小红花数据库排行榜中位列第 7;PostgreSQL 和 MySQL 地位很牢靠,MongoDB 凭借在 NoSQL 领域的早发优势守住了江湖地位。出乎意料的是 GBase 排名靠前,甚至比老牌的开源数据库 TiDB 还领先一个身位,令人印象深刻。不管怎么说,这两个加上 GaussDB 闯进排行榜 20 强,为崛起中的国产数据库发出了最强音!
以上是2024年10月小红花数据库排行榜的全景图,往后排列的数据库是:Milvus、Cassandra、Hive、PostGIS、ClickHouse、TimescaleDB、Pinecone、YugabyteDB、DB2、Microsoft Access、BigQuery、OpenSearch、DuckDB,以及国产数据库OceanBase、TDSQL、达梦数据库和TuGraph等。
排行依据和统计说明
排行依据
小红花技术领袖俱乐部旗下内容平台「小红花·文摘」聚合全球(以中文、英文为主,基于AI进行摘要和翻译)开发者博客的准实时内容(延迟通常不超过1小时),目前每月内容数量接近1万篇,绝大部分内容为编程相关的硬核文章,通过分析文章涉及的数据库,并据此进行统计,可以反映各数据库的流行程度。
在尝试制作初步制作出排行榜的时候,跟 DB-Engines和墨天轮等其它数据库排行榜进行比对,发现各产品的流行度差异性、聚集度基本对得上,因此作为一个数据库流行度指标榜单是可信的。
统计说明
1、整体而言,小红花数据库排行榜就是统计时间范围之内各数据库相关的内容数量,在乘以针对不同数据库制定的系数之后,各数据库内容在总数量上的得分及排行。
2、考虑到小红花数据库排行榜刚刚开始制订,未来可能会有比较大的调整和修改,暂时不会公开算法和系数。
3、为确保尽可能地统计不同数据库,我们对数据库的别名也进行了归一化处理,如KingBase的统计包括人大金仓和金仓数据库、PostgreSQL包括了PG和PGSQL等。
特此说明。
与其它排行榜的不同之处
1、 首先是量的不同,等其它榜单大多统计不同数据库相关内容的总量,而小红花编程语言排行榜采用的数据是1个月维度内的新内容,能够快速反映数据库的流行度变化。
2、 然后是质的不同,因为小红花数据库排行榜大约有一半数据源是中文的,所以会和 DB-Engines 基于英文的统计和墨天轮基于中文的统计有比较大的差异。
3、 最后统计口径也有比较大的差异,DB-Engines 的统计包括内容总量,也包括用户简单动作(搜索、发Twitter等)的量,噪音比较大;而墨天轮则引入了资质、案例和论文等因素,厂商行为有较大影响。小红花数据库排行榜统计内容时间窗口短,选择噪音更少的博客内容,和真实世界的「体感」更为接近。
小结
整体来说,一个中文内容占比较大的数据库排行榜,对项目的技术方案选型是有参考意义的,这是小红花数据库排行榜的动力之源,也是以后继续编制的意义所在。接下来我们将在「小红花·文摘」开辟排行榜栏目以便发布相关信息和内容,同时也会发布在我们公众号,敬请关注。