达梦再次拓展“朋友圈”,探寻国产数据库破局之道
数据智能产业创新服务媒体
——聚焦数智 · 改变商业
在近日举办的“聚势而生·梦启未来”2023达梦数字产业大会上,达梦和中建材、神州数码、中电金信、飞腾公司、麒麟软件、中国长城、奇安信等行业生态伙伴、国产基础软硬件厂商,以及来自金融、医疗、企业管理、交通、互联网等产业伙伴近40家企业,签订战略合作协议。达梦“朋友圈”再一次扩大的背后,是其势要打造自主可控的国产信创生态的雄心。
从达梦身上我们看到,数据库国产化替代正加速行进。
达梦是国产数据库头部厂商代表,经过四十余年的发展,达梦已经拥有了涵盖数据交换、数据存储与管理、数据治理到分析服务等数据全生命周期的产品。截至目前,已同上下游千余家厂商展开了全方位的合作,完成了6000多款产品兼容互认。
数据库是信息系统的核心软件,以其技术门槛之高、研发周期之长、工程要求之高而被誉为“基础软件皇冠上的明珠”。达梦能取得如此成绩,与“达梦人”在数据库领域四十余年如一日的坚守密不可分。
如今,在信创国产化纵深发展的浪潮中,这家本土数据库头部企业又将驶向何方?数字经济时代赋予的机会并不仅达梦一家独占,近些年众多“后起之秀”数据库厂商的涌入,加剧了行业竞争,达梦又将如何保持优势?
这其中,不仅是对达梦数据这家企业的聚焦,更是对中国数据库行业和信创国产替代进程的深度思考。
“雄关漫道真如铁,而今迈步从头越。”用来形容达梦“从零开始”摸索国产数据库之路颇为适合。
在中国数据库领域,达梦创始人冯裕才是最早期的研发者之一。
“创业起步非常艰难,基本处于‘没有经费,没有设备,没有人员’的三无状态,是我一个人的孤军奋战。为了翻译英文数据库文档资料,我啃字典翻了上千万字的英文资料。”冯裕才谈到。回忆最初的研究经历,1980年-1990年是其个人孤军奋战的十年,在此期间冯裕才开发了中国最早数据库原型汉字关系数据库CRDS,这也是中国最初、最原始的数据库。
1990年-2000年,达梦数据库与多媒体研究所成立,随后推出了数据库管理系统DM1、DM2,并在国内数据库领域积累了一定声望,在国产数据库领域开始崭露头角。在此期间,Oracle、Sybase、IBM等外资数据库企业纷纷进入中国市场 ,并逐步占据垄断地位。
2000年,达梦公司正式成立,从实验室走向市场,在全国各地的电子政务试点中得到应用。而在这一时期,国产数据库产品相继推出进入市场。
2010年-2020年,随着云计算和开源社区兴起,诞生了很多中国本土数据库公司,市场化竞争日益激烈。此时的达梦,在多年技术沉淀和长期的市场应用实践中,从众多厂商中脱颖而出,产品从电子政务试点开始进行全国推广,并在能源、公安、国土、民航、工商、信用等领域广泛应用。随着市占率的提升,达梦逐步进阶成为中国数据库领域的头部企业。
2021年以来,达梦公司实现快速发展,人员规模超过1300人,遍布全国30多个城市,除武汉总部以外,还在上海、北京、成都、苏州等地设有研发中心;2022年公司还在武汉启动了达梦中国数据库产业基地的建设。
回顾40余年发展历程,达梦作为国产数据库的探索先驱,四十年坚持走自主研发的道路实属不易,其国产数据库代码“从头写”所言非虚,正如冯裕才所说:“达梦的创业实践证明,自主创新是中国数字产业发展的必由之路。”
自主创新是达梦的底色与底气从当下视角来观察,达梦真正能够平滑替代国外数据库,并在40年的行业深耕中,成长为头部国产数据库厂商的内核正基于此。
一是坚持不开源,积累了1600万行核心源代码,每一行源代码都是100%独立研发。达梦目前已掌握数据管理与数据分析领域的核心前沿技术,拥有主要产品全部核心源代码的自主知识产权,打造了国产数据库领域为数不多的全自研产品。
二是坚持达梦特色,独创体系架构。以达梦DM8产品为例,达梦提出的创新性基于统一内核的多集群体系架构,通过基于状态机虚拟机执行器和指令系统实现不同集群在数据库内核的有机统一。这种技术完全独立于开源的PG或者MySQL体系,在国产乃至国际各类数据库体系架构中,达梦都是一个独创的体系。
三是以市场需求为导向。国产数据库想要提升市场份额,除了突破基础技术外,很重要的一点是迎合市场需求。过往达梦在集中式数据库表现良好,但近些年,在各个行业数智化升级的过程中,每天新增的海量数据,对数据库的数据存储、查询、分析都构成极大挑战。为此,达梦积极探索分布式路径,推出新一代分布式数据库DMDPC。
以福建移动为例,2021年,福建移动O域大数据分析系统上线,项目使用达梦新一代分布式数据库DMDPC,完全替代其原先使用的国外分布式数据库Teradata Aster。运行验证显示,系统表现十分稳定,且在95%以上的应用场景下运行效率高于之前。整个过程,代码迁移仅花了一个月左右的时间,并在一个月完成1000个以上应用系统的迁移。
如果总结客户从国外数据库平移到国内数据库的过程中的两大难点,一是成本,二是风险。如何平滑替代,让客户成本和风险降至最低?
对此,达梦通过周期性技术迭代去升级产品,衍生出大数据、云数据库等覆盖全生命周期的产品及服务支持,让其产品可以通过不同的部署形态来实现,进而满足客户多种需求。值得一提的是,达梦在设计内核时非常注重语言处理,对其他语言兼容性良好,通过高兼容性和迁移服务能保障多个核心业务系统的平滑替代。
四是自主可控带来的安全性。公司数据库产品为自主研发,不采用开源代码,代码安全性高,达到等保四级和EAL4+,是目前国产数据库中安全性较高的数据库产品。
当然,自主创新离不开人才的贡献。根据信通院数据,我国数据库企业从业技术人员不足2万人,员工数量平均约200人。最高2000人左右规模,其中21-50人左右规模企业占比最高。
目前,达梦共有员工1300余人,其中研发人员和技术服务人员占比超70%,这种人员配置放在全国范围来看也绝对是豪华版。想想看,达梦一家公司就吸纳了全国5%的数据库技术人才,面对竞争激烈的市场,达梦率先达到千人规模,构建一支稳定的精英团队,为公司持续发展提供不竭动力。
数字经济,百年不遇的机遇当前全球都在倡导数字经济,数字经济发展速度之快,辐射范围之广,远超政策规划。
信通院《中国数字经济发展研究报告(2023年)》报告显示,2022年,中国数字经济规模达到50.2万亿元,同比名义增长10.3%,已连续11年显著高于同期GDP名义增速,数字经济占GDP比重相当于第二产业占国民经济的比重,达到41.5%。
需要指出的是,信创是数十万亿规模数字经济的底层技术基础设施。近些年,在国外商用数据库产品存在潜在供应链风险的背景下,我国信创产业国产替代政策不断升级。
尤其是2022年以来,我国信创产业纵深发展,国产替代政策由此前的“党政信创”,向金融、电信、能源、交通、航空航天、教育、医疗等八大行业推进,预计未来还将向更多行业渗透,最终形成国产信创的全面布局。
而要实现这一目标,信创上下游产业链的重新研发对接、组装与适配是必过的一道坎。在信创产业链中,数据库厂商处于承上启下的位置,位置的特殊性就要求数据库厂商与芯片、服务器、存储、操作系统、中间件、信息安全、云平台、行业应用等厂商一起,携手打造自主可控的国产信创生态。只有共建国产品牌的生态体系,才能让其产品生根发芽,长成参天大树,最后结出累累硕果。
在这一点上,达梦想的更深。引用达梦数据总经理皮宇的观点,现阶段达梦要做三件事:
第一件事:强化生态繁荣
数据库与底层硬件密不可分,只有软硬件协同才能让数据库实现真正的安全可靠。“2022年我们发布了达梦数据库一体机(DAMENG PAI),这是我们经过两年多的研发,深度集成了达梦数据库运行所需的服务器、存储、网络、操作系统等全部组件,其中涉及到多个厂商以及各行各业ISV的合作,以兼容互认的方式打造我们的生态。”
“对于技术封锁,部分硬件性能不足的问题,达梦在未来也将采用技术手段,通过软件的方式来解决。但归根结底还是要将生态建设好。”
第二件事:以用促研,迭代升级
“我们有许多应用案例,软件用得越多发现的问题就越多,我们的产品迭代就会越快,赶超国外数据库厂商的脚步会更快一点。”
第三件事:推动产品出海
“我们也在积极的布局海外市场,先从身边的朋友圈做起,再慢慢扩大。”
在数字经济,信创纵深发展的要求下,数据库生态建设犹如点燃了助推器,预计未来国产品牌占比持续提升。根据信通院的预计,到 2025 年中国数据库市场总规模将达到 688 亿元,复合增速为 23.4%。目前,达梦数据库市占率已位居国内厂商前列,如今,在国产数据库逐梦路上,达梦实现了国产数据库从可用到能用,再到好用的飞跃,但完全替代国外数据库还需时间,达梦仍在路上。
作为全栈数据产品及解决方案的提供商,达梦若能把握行业大趋势,顺应国家战略需要,持续提供足够优质的产品来支撑中国数字经济的发展,必然会推动其自身壮大,成为国产数据库一颗闪耀之星。
文:木阳 / 数据猿