查看原文
其他

产业调研:厂商视角看国产数据库发展趋势 | 国君计算机李沐华

盖国强 计算机文艺复兴 2022-11-05


产业调研系列


— 作者:盖国强 云和恩墨创始人兼总经理 —


核心要点

1、数据库从关系型数据库诞生,经历了三个时代。从商业时代到开源时代再到云数据库时代。

2、全球数据库技术四大灵感来源:集中式数据库奠基论文,谷歌分布式数据库论文,Mysql+Postgre。

3、金融行业国产数据库探索分为三个阶段,第一个阶段是用户在边缘和外围系统尝试。第二个阶段是用户开始在非关键核心系统采用。第三个阶段是用户选择在核心关键系统采用。过去前两个阶段探索历程基本完成,预计2024-2025年完成第三阶段,然后向全行业推广。

4、openGauss已经把PG的100多万行代码80%重写了,可以认为是全新的国产数据库,华为将它开源出来,自主检测出来有报告,它不会跟国际社区有关联,是安全可控的。


盖总:首先,数据库技术到今天已经发展到第三个时代,云数据库时代。回顾过去,从关系型数据库诞生,经历了三个时代。从商业时代到开源时代再到云数据库时代。


商业时代有Oracle、DB2,推动了商业软件蓬勃发展。第二个时代是Mysql推动了互联网技术发展,又推动了云数据库发展。云数据库还有两个分支,公有云和私有云。整体来看云数据库时代是对前两个时代的总结和演进。开源数据库开放源代码,社区共建,快速赢得了用户的采纳,支持了大部分免费的互联网应用。开源的问题是如何实现商业变现,云为开源数据库变现找到了出口,云改变了数据库行业的玩法。Gartner发布了2021年数据库份额报告,去年微软超越oracle,今年亚马逊也超越了oracle。中国三大云厂商跻身全球排行榜,阿里云、腾讯云和华为云。在云的大的概念之下,私有云和公有云会长期共存。


回到中国的数据库领域,我把中国数据库行业划分成四个流派,分别是学院派——起步最早,源于高校和科研院所,包括金仓、达梦等。第二个流派是互联网派,以阿里、腾讯为代表,以开源数据库迭代改进,满足自身需求,现在把数据库带入企业。第三个流派叫做创业派,这里面有一系列外企打磨过的专家,或者本土创业企业,通过积累和学习,再自主创业,这个流派里面有非常多国内数据库新兴企业,比如Pincap,巨杉,星环。第四个是国内ICT企业,他们通过投入也在进入细分市场,比如华为、中兴、浪潮,纷纷推出自己的数据库产品。这四大流派,恰好满足了四大魔力象限,分别是领导者、挑战者等等。这里面只有少数企业能够突围进入领导者象限。


纵观全球数据库技术发展,有四大灵感来源。第一个是1970年的关系型数据库奠基论文,关系型数据库开始蓬勃发展,主要是集中式产品。第二个是谷歌发表了一系列分布式技术相关的奠基论文。它是一家互联网企业,站点全球分布,数据中心也是跨地域的,这些基础特征使得它的探索面向分布式,催生了一系列分布式论文。除了这两大理论源泉,还有两大实践源泉,就是mysql和postgre,mysql引发了开源数据库浪潮,因为互联网兴起而风靡全球。第二个是postgre,现在叫做PG,最早回溯到70年代,mysql和PG的开源为很多后续数据库奠定了基础,现在很多数据库产品是围绕这两个开源产品进行研发迭代产生的。


我们看一看今天中国数据库的世界。墨天轮排行榜上有205个国产数据库参与排名,现在是百花齐放的时期。我总结为万象更新,中国数据库的时代正在到来,最近俄乌事件中,我们看到技术有国界,开源数据库也有国界,中国数据库必须自立自强,满足市场的需求。根据我们做的统计,关系型产品占到69%,其次是图和时序,超过20个。mysql和PG是很多国产数据库的缘起,分别有23和24个,加起来有近50个产品是基于开源数据库研发的。


虽然国内有这么多数据库产品,但是我们要认识到中国商业数据库市场全球占比依然很低。2020年中国GDP占全球17.4%,但是数据库占比只有5.2%,所以我们认为中国数据库市场有很大发展空间,到2025年规模将达到688亿。


数据库的国产化进程。首先我的判断是,不管是中国信创产业的发展,还是俄乌事件冲击,整个行业都在探索数据库国产化之路。中国国产数据库的自主探索已经到了什么阶段呢?我们认为国产数据库探索分为三个阶段,第一个阶段是用户在边缘和外围系统尝试。第二个阶段是用户开始在非关键核心系统采用。第三个阶段是用户选择在核心关键系统采用。过去前两个阶段探索历程基本完成,在边缘系统上已经很多国产数据库在运行,用户非核心关键系统中也已经进行了一到两年的尝试。


我认为决战时刻就要到来了,就是用户在典型核心系统中采用。一旦这一步验证成功,国产数据库将推向所有行业,迎来真正的爆发期,我个人判断会在2024-2025年到来。我在openGauss峰会上讲过,这是三年才能够见到成效的事情,从尝试到信任再到深入采用。十四五这个关键时期,这五年我认为是国产数据库从外围到核心到完全自主替代的历程,这是所有国产数据库厂商关键、核心,也是百年难遇的时间窗口。


最后简单介绍一下云和恩墨。我们把自己归入到新兴创业派里面,我们创立于2011年,经过了十几年发展,第一阶段是我们围绕着数据库服务进入市场,服务了国内1000多家企业级客户,为他们提供全栈的数据库服务支持。2.0时代是把我们的经验能力转化成了生态产品,从安装部署到运维再到智能运维产品,我们都做到了行业第一。3.0时代是我们跟华为合作,华为2020年开源了openGauss数据库,我们成为了它的首要合作伙伴,推出了商业发行版,过去两年中已经获得了大量客户的采用。云和恩墨围绕一千家客户提供服务,打磨自己的产品,能够为这个行业和时代带来一款易用的具备国产替代能力的核心数据库产品。


今天的国产数据库要想取得成功,核心是建立广泛的数据库生态。今天的中国数据库还在追赶和超越,谁能够赢得广泛的DBA群体支持,能够触达更多的客户需求,打磨和迭代产品,就能够取得最后的成功。


数据库领域全球来看只有oracle公司建立了广泛的生态,云和恩墨过去就是Oracle生态的重要参与者。第二位的DB2甚至Mysql都没有形成良好的社区生态,在数据库领域只有位居前列的产品才能够建立完整生态链,才能够在市场上游刃有余的生存下去。我们是跟华为共建生态社区,打造数据库领域第一品牌和生态,帮助用户实现商业数据库替代。


Q:华为在国产数据库发展过程中扮演一个什么角色?

我们自己做数据库的时候也做了很多思考,在中国怎么做数据库才能超越oracle。它的成功有几个要素,第一个是抓住了关系型数据库的萌芽期。第二个是建立了强大的先发规模优势,它有4000个研发人员,中国所有厂商加起来都没有4000个研发人员,中国还处于人才稀缺阶段,怎么才能后来居上,我认为唯一的一点就是开源,通过开源去汇聚人才,才有可能形成规模优势。假如华为投入1000人,云和恩墨投入200人,越来越多人加入,有可能快速聚集超过4000人的规模快速进行产品迭代和完善,这个也是为什么我们会毫不犹豫加入开源社区。


华为目前的战略是说,关键投入领域或者要破局领域在芯片和处理器,华为把数据库定义到计算产品线,开源了openEuler和openGauss,这两个发展起来,它的cpu生态才能起来。这是它为什么坚定开源,这个也写入了战略定位里面。华为定位是硬件开放,软件开源,使能伙伴。


有了华为,未来可能就有了中国的开源社区,过去大家在国外的开源社区做贡献,华为去年就提出来建设中国本土的根社区和根生态,往上可以有无限可能。


Q:目前国产数据库对于开源的依赖程度多高,如果断开开源社区有多大影响?

为什么我们说在中国建立根社区特别重要,开源软件方面,如果我们贡献的代码如果不能合入主分支,下次更新的时候你的代码要重写,这是特别痛苦的事情。根社区建设在国内,治理都是由国内企业参与,它是自主可控的。openGauss已经把PG的100多万行代码80%重写了,可以认为是全新的国产数据库,华为将它开源出来,自主检测出来有报告,它不会跟国际社区有关联,是安全可控的。


反过来mysql就会有很多问题,国内对于mysql的代码贡献非常有限,如果我们不在核心贡献代码,只是在外围修正,永远打造不了核心竞争力。过去我很痛心的一点是很多国产数据库在做低层次循环,或者重复劳动。很多厂商都是做的中间件能力,往内核逐步渗透,每个版本都要重新做一次,这是低层次循环。openGauss把华为过去十几年的积累开放出来,大家共同开发,有助于大家共同去攻克技术难关。


Q:2024年的爆发是从今年到2023年还是相对试点范围比较小,到2024年会有明显爆发过程,还是说这两年会有快速爬坡,爆发以后国产数据库市占率是什么状态?

我第一个判断,如果大家关注过国产信创或者金融信创,金融信创有明确的比例要求,这三步走在2024年就会达到,金融行业30%-50%国产化。一旦我们在金融行业关键系统上都实现了自主替代,大概率我们判断会向全行业推广,不需要再做什么论证了。2024-2025这两年我认为是关键的时点。国产数据库以前做了20多年,用户的心态是挑剔的,总认为国产数据库能力不够,不愿意用,但是到了2019年中美开始贸易摩擦,一部分用户开始看清楚国产自主可控的正确性。再到今年美国对俄罗斯的断供,所有人都看清楚这是大势,不可逆。从过去的被动到今天的主动,这是一个变化,会加速这个市场的推进。


第二个事情是市占率。这个也是我们在思考的一个事情,我先说我的观点,现在的国产数据库市场份额大概也就5%。用户的大部分投资都在硬件上,软件投资比较少,导致了中国数据库占比不高。到2025年,65%左右会在私有云和混合云下面,大概400亿,这其中国产数据库应该会达到50%以上。


Q:站在现在这个时点看华为高斯这条路线,技术上相较于之前这些体系,有无革命性进步?未来市场能够起来,是它能够开启新的技术路线,还是因为国产替代的政策?

Oracle的成功能不能复制,我认为它的根本是抓住了技术萌芽。今天还会不会有这样的机遇,会有,但是颠覆性技术还没有出现。除了颠覆还有关键性创新,比如谷歌做的一篇论文就是关键创新。国产数据库厂商要获得这个先机就是要在学术和人才上进行投入,他们要去洞察行业里面技术演进路线上的关键创新,才有可能具备区分于他人的核心竞争力。


Q:原先商业数据库和开源数据库,客户选型上考虑因素有无差异?

用户现在选择一个数据库会特别关注什么呢,我们的品牌是mogDB,我们定位就是安稳易用。数据库需求第一个是安全,越来越多数据存在数据库里面,泄露和篡改有很大风险,未来安全需求还会不断强化。第二个是稳定,用户数据库不能总出问题。过去商业数据库比如oracle和DB2展现出来的稳定性让用户印象深刻。第三个是易用,要让用户容易替代过去的产品。要适合不同的业务场景和数据类型,所以我们提炼四个字就是安稳易用,这是对于数据库内核来说的。跳出这个之外,生态就是最核心关键的,数据库生态非常庞大,包括底层的处理器、操作系统、中间件、客户的应用,开发商、ISV,这些都是数据库生态,只有获得了广泛生态才能够顺利发展。


合规声明:本文节选自国君计算机团队组织的行业专家电话会议,仅代表专家个人观点,属于公开资料,如需会议纪要全文请后台留言。


信创相关报告

1.如何研究一家信创公司?

2.操作系统的历史演进和国产化趋势(60页PPT)

3.东方通:生逢其时,国产春风一夜来(深度)

4.金山办公:确定性+可能性=高估值(深度)

5.神州数码:华为鲲鹏第一兵(深度)

6.中间件的国产化之路(深度)

7.中孚信息:防护、检查、监管三轮驱动,快速成长的保密安全领军(深度)

9.中国长城:ARM生态崛起的最大受益者(深度)

10.红帽:操作系统起家,云原生接棒,全球领军开源软件供应商(30页PPT)

11.为什么信创股票的走势都不忍直视?

12. 东方通:信创业绩兑现,验证成长逻辑(深度)

13. 关于华为鸿蒙的三个核心问题(深度)

14. 产业调研:撕开国产数据库皇帝的新衣

15. 一个在四季度能够带来超额收益的计算机细分子行业

16. 三谈东方通:中间件龙头要做操作系统了

17. 信创股票为何蠢蠢欲动

18. 金融信创到底多大市场空间?

19. 产业调研:银行信创专家如何看产业进程?

20. 信创行业极简研究框架

21. 科技有国界,放弃幻想准备战斗!

22. 对2022年信创行业节奏的判断

23. 从中移动信创PC大单看运营商信创进展

24. 产业调研:混沌初开的国产数据库市场

25. 产业调研:网络安全行业如何做信创?


  - end -  


欢迎加入产业交流群!

欢迎所有对计算机产业研究和投资感兴趣的盆友(包括云计算、网络安全、医疗IT、金融科技、人工智能、自动驾驶等)后台留言加入我们的产业交流群。我们的目标是建立系统的计算机产业研究框架,提高整个A股的IT行业研究水平,减少韭菜数量,普度众生。


法律声明

本订阅号发布内容仅代表作者个人看法,并不代表作者所属机构观点。涉及证券投资相关内容应以所属机构正式发布的研究报告内容为准。市场有风险,投资需谨慎。在任何情况下,本订阅号中信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。本订阅号运营团队不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。本订阅号所载内容为原创。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的,需明确注明出处,且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存