深度盘点丨华为云数据库布局及研发路线图
“华为是个可怕的对手,一旦下定决心做某件事,鲜有做不成的。”这句在圈内少有达成共识的话,也正在一步一步得到应验。
很多人或许以为,华为的优势并非软件而是硬件,但其实在数据库软件领域,华为也玩得风生水起。
9月18-20日,2019华为全联接大会在上海世博中心举办。会上,笔者又一次采访到了华为云数据库服务总经理苏光牛,对华为云数据库研发路线图有了更清晰的认识。
3个新品+2个解决方案
此次HC大会上,华为云总计发布了3款数据库新品,分别是多模NoSQL数据库GeminiDB、云原生分布式数据库TaurusDB和频繁曝光的GaussDB数据库全新上云,以及2个解决方案,分别是MySQL云灾备及RDS for MCS解决方案。
事实上,GeminiDB、TaurusDB、GaussDB这三个名字并不陌生。GeminiDB 早在今年7月份就开始定向邀测,此次发布是正式公测,线上可以直接申请。TaurusDB目前是公测阶段,会上展示了测试结果。
而GuassDB全新上云,实际是高斯100(内部代号)上云,苏光牛表示,云上版本是完整的,不会做删减,还会针对云上的特点,对运维、安全方面进行增强,目前开始邀测。
MySQL云灾备DRS解决方案,该方案上半年刚荣获了2019年度DTCC最佳创新解决方案奖,此前笔者文章有过介绍,这里就不再敖述,有兴趣的朋友可以自行搜索。
至于RDS for MCS解决方案,据苏光牛介绍,既具备虚机的隔离性,又保持了容器的优势,在提供云盘可靠性的同时,性能也得到提升。性能提升是因为采用Extend buffer pool方案,结合华为容器和100us云盘技术,实现超越本地云盘性能1+倍。在苏光牛看来,RDS for MCS解决方案与GeminiDB类似,都是独此一家,极具竞争力。
完备的数据库版图
众所周知,数据库市场主要分为了以下几个板块:
1、OLTP数据库,
2、OLAP数据库
3、NoSQL数据库
4、工具生态类产品
而前三种又可以分为托管(即第三方的商业数据库和开源数据库)和自研数据库产品。
在OLTP板块,华为云托管产品有MySQL、PostgreSQL、SQL Server,自研方面有TaurusDB,TaurusDB定位MySQL生态,而GuassDB(高斯100),定位在于与鲲鹏产业生态结合,并高度兼容更多传统数据库的接口和语法。
在OLAP板块,华为云有自研的DWS(即高斯200),据苏光牛介绍,目前有300多家商用客户,如上海德邦、广联达、国家开放大学等。
在NoSQL板块,华为云托管的有Redis、Memchache等,自研方面有GeminiDB。而多模的GeminiDB毫无疑问是华为云的重点。
工具类产品,华为云有数据复制服务DRS、数据管理服务DAS、数据安全服务DBSS等。苏光牛表示,这个版块,华为云的重点是数据同步、数据迁移,这部分核心在线迁移和预检查功能,而数据管理服务也是发力重点,目的是为了让客户更专注业务而不是数据。
综上所述,华为云数据库在四大板块均有布局,尤其在NoSQL板块,竞争对手较为薄弱,这方面华为云优势明显。
其次,目前主流数据库产品,包括Oracle、MySQL、SQL Server等,基本上都是支持X86架构的,而华为GaussDB数据库对于异构计算的支持,无疑是一个巨大优势,这意味着,GaussDB不仅针对传统服务器市场,还包括未来5G和IOT带来的更多计算场景,潜力巨大,这也是此次HC大会,鲲鹏产业生态吸引众多厂商云集的核心原因。
而此次发布的GeminiDB、TaurusDB、GaussDB,凸显的是华为云在自研数据库产品方面的加强,以及多元、多模、性能的整体特征。而这些特征与华为对云数据库未来的趋势判断有着直接关系。
多元化、高性能、安全可信的研发路线
在进行数据库研发时,华为云都会考虑哪些方面的因素,遵循怎样的路线图?据苏光牛介绍,总结下来有以下有6个方面,而这6个方面就是华为云对未来数据库趋势的判断。
1、多元;多元化的算力是云数据库未来趋势之一,苏光牛表示,未来不可能只有一个X86,会有Kunpeng处理器等ARM芯片,因此,作为底层的数据库,一定要能支持多元算力。
2、多模;是多个数据模型。通过一个融合的模型帮助用户更好的管理多个数据模型,而不是每种数据装一个数据库,这样徒增运维难度。
3、性能;数据库不谈性能那就是耍流氓,极致的性能,一直是华为云数据库研发团队永远需要考虑的问题。
4、超大容量;在性能的基础上考虑容量才更有意义。
5、安全可信;重要性不言而喻,华为无论是内部还是对外的产品,始终保持安全可信。
6、运维与AI结合;也就是”自治”,让运维变得更简单,进一步释放云服务的价值。
写在最后
数据库领域,华为看似新进者,实际是厚积薄发,胜在积累深厚。
过去30年,华为服务企业客户的经验和13年的数据库技术研发积累,为华为云数据库赢得了极佳的起跑位,并且,华为已经逐步构建起IT架构的底层生态,包括芯片,数据库、操作系统,这一点无比重要。
不过,数据库这种重要性堪比芯片、操作系统的基础软件,并非短期可成,需要庞大的用户使用反馈及漫长的时间去优化迭代,Oracle就是如此,因此,对于华为乃至华为云而言,长期的积累和好的起跑位并不代表能懈怠,未来还有很长的路要走。
附:HC大会,华为云数据库给出的新案例及相关数据。
GeminiDB+天地图
国家地理信息公共服务平台天地图是网络化地理信息共享与服务门户,集成了来自国家、省、市(县)以及相关专业部门、企事业单位的地理信息资源,但随着地理信息成果的极大丰富和地理信息集成服务能力的不足,以及日均API和服务调用超过4亿次的高需求,原有平台已不能满足此高要求。
天地图将全部44项在线业务迁移部署在华为云上,数据更新效率得到明显提升,原来需要15天才能完成的16TB全库数据恢复,现在2~3天就能完成;过去需要5小时才能完成的300GB数据迁移,现在1小时就能完成。
天地图原采用的是社区版的MongoDB,集群的shard主备阶段数据同步时,会触发备节点CPU100%,而采用GeminiDB后,因为GeminiDB基于华为最新一代DFV存储计算分离架构,DFV DDS集群每个shard写数据到存储池,不存在往备节点写数据的场景,因此避免备节点内存空消耗。
GeminiDB+锦江都城
对酒店业来说,对于云的核心需求是稳定和安全,对连锁酒店而言,PMS业务系统的迁移是一个⾼风险项⽬——涉及各种渠道、银⾏⽀付接口、酒店硬件设备和公安接口等多达几百项变更。一旦迁移开始,就不存在回滚的可能性。如果说第一次上云,锦江都城的IT团队经历的是大大小小的“战役”,那么,云迁移就是一场“生死战”。
华为云精准而迅速地找出了锦江都城的痛点,并根据其业务需求,对整个架构做了变动。据锦江都城信息中心IT总监凌晨回忆,迁移开始前的两个月,锦江都城的IT项目团队和华为云一起做了很多迁移准备的工作,甚至列了一个精确到每分钟的详细矩阵列表,本来计划了12小时的迁移时间,只用了1小时就完成了迁移。
凌晨表示,“第三方的数据库升级是最大的难点。”据了解,华为云根据实际情况对数据库进行了“大动刀”:不仅更换了基础设施,还优化了数据库与系统的连接,令运⾏效率、稳定性和响应速度都大幅提升。此前,锦江都城PMS系统的MySQL数据库版本是5.5,迁到华为云以后升级到了5.6。“这是许多软件公司都不得不放弃的事情,因为在迁移的同时做升级,是高风险高难度的。为完成此次迁移,华为派出数据库问题专家团队驻场”完成向华为云迁移后,锦江都城的系统负载实现了3/4的降幅,能维持在仅20%左右,基本上不存在资源压⼒和系统稳定性⽅面的隐患。
TaurusDB+安心保险
安心保险是全国首批创新型互联网保险公司,业务庞大,吞吐量很高,原有MySQL已经无法满足业务需求。
传统HA方案引入binlog,带来额外的IO成本,面临的挑战主要表现在半同步模式在极端场景可能丢数据,高可用OR高可靠,性能被binlog拖住。
因此,安信保险也曾在原有数据库架构上进行创新,比如对账系统解决高可用/高可靠问题,让丢失数据可找回,故障写入对账日志,切换后可继续。
其次,对健康险核心数据库分片,应对业务演进,实现海量存储,高性能,弹性扩容,预警等复杂化方案。
采用华为云TaurusDB方案后,因其基于计算存储分离架构,将数据持久化放入新一代存储中,数据多副本强一致,0丢失,计算节点故障秒级恢复,并提供7倍于原生MySQL的性能,业务透明扩展,安心保险3S内完成场景切换;存储3副本容错,单点故障0中断;支持跨AZ部署和跨Region容灾,安心保险面临的难题完美解决。
GaussDB+思普软件
思普软件是一家产品全生命周期解决方案供应商,其核心系统PLM从流程标准化、设计标准化、人员与知识管理标准化三个方面提供可持续改善的管理解决方案,同时提供全方位的数据安全保证解决方案,帮助制造企业建立属于自己的个性化产品开发体系。
此次思普软件携手华为云GaussDB将PLM系统迁移到云上,华为云为其量身打造了一套迁移方案:华为云GaussDB免运维、安全补丁及时更新,全自研自主可控,兼容Oracle数据库语法,支持多核高并发,智能优化器,支持两地三中心,支持快速闪回,数据不丢失,保证PLM的数据安全。
END
延伸阅读
Hadoop将死?Cloudera CEO怒怼Gartner
公众号
laoyubiji
老鱼,企业级老编一枚,采访过上百位CEO/CTO,你若有故事,欢迎联系!
欢迎订阅老鱼笔记
✬如果你喜欢这篇文章,欢迎分享到朋友圈✬
评论功能现已开启,灰常接受一切形式的吐槽和赞美☺