开源数据库风起云涌,openGauss 恰逢其时
自上世纪 60 年代首款企业级数据库产品诞生起,数据库已历经 60 年的发展迭代。当开源吞噬软件的今天,数据库迎来转折点:当查看国外数据库排名 DB-Engines 网站,和国内墨天轮最新数据库排行榜时,我们发现开源数据库已占据排名前五名半壁江山。
一个让人无法忽视的变革已然发生:开源为数据库创造了新的发展机遇,其中开源 17 个月,表现强劲的 openGauss 就是典型的例子。
2020 年 6 月,openGauss 数据库正式开源,作为国内首个使用木兰宽松许可证 v2 的 openGauss开源以来就广受开发者热议。在这一年多来,openGauss有哪些新发展?在中国开源大爆发趋势下,开源数据库的发展机遇在何方?对此,CSDN 专访到清华大学计算机系教授、副主任,openGauss 总架构师李国良,分享 openGauss 的实践心得,探索开源数据库的创新突破之道。
开源 17 个月,openGauss 势头强劲
自 2000 年以来,华为公司开始自研数据库,因此 openGauss 深度融合华为多年数据库的技术积累,凝结了数千名工程师的研发投入。openGauss 结合企业级场景需求,在企业核心交易系统和海量事务型场景上提供了灵活高效的解决方案。
据墨天轮 2021 年 10 月国产数据库排行榜显示,openGauss 位列Top3,成绩斐然:如今 openGauss 积累 2100+ 开发者,25600+ 用户,70+ 家企业签署企业贡献者协议(CLA),加入 openGauss 社区,12 家企业基于 openGauss 发布商业发行版,openGauss 在政府、金融、运营商、电力、安平等国计民生行业逐渐落地商用。为持续发力生态建设和人才培养,在刚结束的华为全联接 2021 大会上,openGauss 社区理事会正式成立,这标志着openGauss社区将不留余力地为建设数据库产业生态做贡献。
openGauss 四大技术优势
早在 openGauss 正式开源前,在华为内部已部署应用多年,有效支撑全球多个运营商和几十亿用户的基础通信服务。openGauss 经历华为公司的真实锤炼,形成以下四大技术优势:高性能、高可用、高安全、易运维四大技术优势。
在性能上,据数据显示,openGauss 的性能对比 MySQL 和 PostgreSQL 均大幅领先,约有高于 1 倍多的性能优势。李国良介绍道,openGauss 软硬件设计良好,融合当前硬件多核 NUMA 架构,并采用了 Numa-Aware 的数据结构。其提供的面向多核架构的并发控制技术,结合鲲鹏硬件优化,在 TPCC 测试中,Benchmark 达成性能 150 万 tpmc。
在高可用上,openGauss 支持主备同步,使得 RTO 在 10 秒可升主提供服务。在智能运维上,openGauss 利用 AI 进行智能参数调优和索引推荐,可减少 85% 的传统索引,且索引的推荐准确率达 90%。通过 AI 自动参数推荐,几秒内便推荐出最优参数,有效提高数据库性能。
基于Paxos分布式一致性协议的日志复制及选主框架。支持在线添加、删除节点,在线转让Leader能力。支持节点角色多样性,拥有高效流控算法。通过自仲裁、多数派选主能力摆脱第三方仲裁组件,极大缩短RTO时间,且可预防任何故障下的脑裂双主。支持节点同步、同异步混合部署的多集群部署模式。提升主备间节点日志复制效率,提升系统的最大吞吐能力。借助openGauss的DCF高可用组件,用户不仅可以免去系统脑裂的风险,还可以提升系统性能。
在安全性上,openGauss 支持全密态计算,在数据的传输、存储、计算等链路上,全程加密,有效守护数据安全。并通过访问控制、加密认证、数据库审计、动态数据脱敏、防篡改等安全技术,提供全方位的数据安全保护。
在开放性上,openGauss 是国内首个使用木兰宽松许可证 v2 的数据库,将内核能力全开放给开发者。
正是 openGauss 不断追求技术创新,融合软硬件技术、AI、安全等前沿技术,加快我国数据库产业的发展:如邮储银行今年全新升级的新核心系统,便是使用 openGauss 数据库做基础支撑。
openGauss 生态建设与人才培养
据中国信息通信研究院发布的《数据库发展研究报告(2021年)》显示,2020 年全球数据库市场规模为 671 亿美元,其中中国数据库市场规模为 35 亿美元,占全球 5.2%。预计到 2025 年,全球数据库市场规模达到 798 亿美元,中国的 IT 总支出将占全球 12.3%。中国数据库市场在全球占比将在 2025 年接近中国 IT 总指出在全球的占比,中国数据库市场总规模将达到 688 亿元。
我们观察到中国数据库仍有巨大的发展潜力,在谈及当下中国市场需要什么样的数据库时,李国良表示,一是存量市场的替换;二是应用创新,打造自身核心技术;三是需要共同新的生态和新的应用场景,才能做到百花齐放。
当前 openGauss 积极进行生态建设:通过打造系列技术课程学习,全方位解读 openGauss 设计和使用,让更多人了解 openGauss 底层技术。推出相关的数据库认证,培养高质量数据库人才。同时成立 openGauss 社区理事会,由 18 家主流的 DBV、关键行业客户、高校学术机构组成,共同将 openGauss 打造成更好的企业级开源数据库,建设“共建、共享、共治”的 openGauss 开源社区,促进全球数据库生态发展。
技术发展离不开人才的培养,在数据库专业人才的投入上,华为推出《CCF-华为数据库创新研究计划》,资助国内科研院的教师在数据库领域开展创新研究。李国良作为该计划的委员之一,表示其最终目标是为了技术创新,一是将高校的前沿研究技术落地到 openGauss,赋能千行百业;二是高校能有效地了解真实企业核心需求,及时开展相关研究,再将技术反哺社区,充分促进数据库产学研融合。
目前 openGauss 已走进 72 所高校,未来三年 openGauss 将扩大到全国 500 所高校,通过开课、联合科研创新等形式,积极为产业界培养10 万高质量 DBA,50 万专业数据库人才。
未来展望
李国良强调,openGauss 致力于为我国基础软件的建设服务,希望给社会各行业提供灵活高性能的数据库解决方案,另外通过生态建设,让学生、开发者、DBA 等各角色均能上手使用。如今 openGauss 在金融、政府、电力、能源等行业落地应用,下一步将会进军工业制造等更多行业,从而辐射千行百业,同时积极携手生态伙伴、高校企业共同建设 openGauss 生态。
最后,作为一名 20 年数据库技术老兵,李国良语重心长地总结这一路走来的心路历程:“在从事数据库的过程中,我们可能会遇到很多人,听到很多不同的声音。我最大的体会便是‘坚持’,坚信只要踏踏实实去做一件事,一定能取得成功。研发数据库和‘熊掰棒子’故事一样,假如掰一个换一个的话,可能最后没有任何收获。这便是传统数据库遇到的最大问题,一些人可能中间换了很多路线,最后什么也没有成功。但我们只要认准一条路,并坚持走下去,成功指日可待。”
嘉宾简介:李国良,清华大学计算机系教授、副主任,openGauss 总架构师,计算机学会数据库专委会副主任。数据库领域顶级会议SIGMOD 2021大会主席、VLDB 2021 Demo主席、ICDE 2022 Industry主席、VLDB 青年贡献奖获得者、IEEE TCDE杰出新人奖获得者。在数据库领域三大会议SIGMOD、VLDB、ICDE发表论文150余篇,他引1万余次。
看完文章觉得不过瘾?
福利来了,立即点击阅读原文或下方链接,观看“企业级开源数据库 openGauss”技术论坛精彩回顾,openGauss 社区多位技术专家详解 openGauss 的基础特性及案例应用、内核性能与架构设计实践,以及在技术实战之外,如何抓住企业级开源数据库的发展机遇:https://live.csdn.net/room/csdnlive2/tg0Y717J