查看原文
其他

业内首家!浙江移动完成分布式数据库运维管理能力成熟度模型评估


近日,浙江移动参与并完成了中国信通院“可信数据库”分布式数据库运维管理能力成熟度模型首家评估工作。经过严格的材料审核,浙江移动获得第四级(稳健级)评估结果,达到同行业内领先水平,为同类型企业在数据库运维管理能力建设提供了参考示范。今天我们也邀请到浙江移动信息技术与数据管理部周勋老师与我们聊一聊浙江移动在持续提升分布式数据库运维管理能力过程中的相关经验与思考。



一、浙江移动数据库运维管理能力探索与实践

Q1:周老师,浙江移动为什么会参与本次评估,同时在评估过程中进行了哪些准备?


我们关注到中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)在不久前发布了《分布式数据库运维管理能力成熟度模型》(以下简称为“能力模型”)。能力模型围绕组织建设、流程制度、人员能力、技术工具四个方面发布了835项能力要求,能力要求覆盖范围广、技能程度深,我们对其内容进行了深入研究与对比,发现与浙江移动数据库运维管理体系契合度很高,能够为数据库运维管理体系后续演进提供思路,另一方面浙江移动数据库实践经验能够反哺能力模型迭代升级,为后续行业推广落地提供借鉴意义,因此浙江移动报名参加分布式数据库运维管理能力成熟度模型贯标评估。


在贯标评估筹备阶段,信息技术与数据管理部领导亲自挂帅,明确贯标工作组织架构、布局贯标工作安排,与委员会专家展开贯标评估技术交流,组织相关团队展开多次讨论与能力自测,准备贯标评估预计可达等级所需的资料,为贯标评估顺利开展做好了充分准备。





Q2:浙江移动的数据库运维管理能力建设过程中遇到了哪些挑战,又是如何应对的呢?


2018年起,浙江移动B域IT系统全面进入微服务架构云原生2.0时代,极大提升了对市场的支撑效率。云原生架构的持续演进,对传统运维造成了巨大挑战,以数据库为例,为了适配业务架构及特点,除了关系型数据库外,浙江移动还引入了文档、搜索、缓存、消息、图等多种类型数据库。业务系统复杂性的急剧增长及数据库产品的快速蔓延,也给DBA团队带来了多方面的挑战,如:故障界定更加复杂、原有运维平台不再适配、组织架构难以适应等。


为应对新架构的带来挑战,降低不确定性,减少熵增,浙江移动的数据库运维模式也进行了同步演进:从原来的人工、脚本、小工具运维方式,借助新技术(AIOps)和新理念(DevOps),转型到智慧运维新模式。





Q3:浙江移动的数据库运维管理能力最大的优势是什么?


浙江移动运维管理能力最大的优势,我认为是对管理理念的持续迭代,使之适配技术架构的演进,从而带动了组织架构、运维流程、运维工具等一系列演进。数据库运维管理体系升级是其中的一环,由自上而下传递式的指挥和控制、效率优先转变为通过敏捷迭代适应架构变化和创新、快速迭代。价值流动聚焦重点,持续反馈快速迭代,不断学习引入负熵,通过精益思想驱动运维管理体系进化。


其核心体现在以下三点:

1)目标导向快速迭代:所有团队围绕业务目标展开工作,摒弃局部最优避免内耗,排除浪费。

2)决策前移炮火延伸:深化决策体系,将决策权交给前线,缩短决策链;赋权前线呼唤专家、管理炮火。

3)敢于试错勇于创新:鼓励围绕业务价值的技术创新,不断迭代寻找全局最优解。





Q4:浙江移动在数据库运维方面的未来规划是什么?


对标汽车L0-L5自动化驾驶等级,浙江移动数据库运维能力大致处于L3到L4进阶水平,已在2020年完成了运维中台化能力的建设,通过中台能力支撑+前台个性化场景,在部分故障抵御、故障处理以及日常任务中已经实现无人化、或者白屏化能力,对数据库运维质量与效率带来了显著的提升。对于数据库运维未来的规划,一方面会继续践行运维数字化转型思路,通过机器代替人力,比特代替原子,持续提升运维效率;另一方面随着数据库产品不断出现,原来一库通吃的局面已经打破,业务创新对数据库的特性诉求不断变化,运维能力的宽度也需要随之拓展,形成一套体系适配所有数据库,一套平台纳管多种数据库的能力,这是数据库运维迭代的另一个方向。





Q5:感谢周老师的分享,针对本次评估周老师有什么建议?


浙江移动目前正在积极提升云原生架构下运维数字化运维能力,兼顾生产稳定性保障与运维数字化创新,以全面提升云原生全景观察能力、智能运维能力和数字员工体系,保障云原生架构下的系统稳定性和业务连续性。目前浙江移动已加入数据库应用创新实验室电信行业工作组,希望后续可与信通院加强合作交流,提升数据库运维标准,助力电信行业数字化运维转型,打造行业标杆。



二、《分布式数据库运维管理能力成熟度模型》标准简介

随着开源、分布式数据库的大量上线,数据库运维管理在数据库设计、运维工具使用及人员组织架构完善等方面遇到新挑战。一方面应用侧厂商在遴选服务商过程中面临缺乏可参考标准的困境,另一方面企业内部也需明确了解运维管理团队能力情况。为了解决实际生产过程中的痛点难题,中国信息通信研究院数据库应用创新实验室依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)联合中移信息、联通(广东)产互、华泰证券、江苏电力、联通数科、联通软研院、云和恩墨、新炬网络、天道金科、科蓝软件、南大通用等近40家企业专家参与编制,历经6个月13次会议,讨论完成《分布式数据库运维管理能力成熟度评估模型》,为业界运维管理团队能力评估提供标准依据。该标准评价指标囊括组织建设、制度流程、人员能力和技术工具等维度,能力域根据业务类型划分为运维体系建设能力、规划实施能力、基础运维能力、数据库诊断优化能力、监控巡检能力、故障处理能力、数据库高可用与容灾能力、安全与合规能力八大能力域进行评估。评估结果分为初始级、可重复级、稳健级、量化管理级、优化级五个等级。


《分布式数据库运维管理能力成熟度模型》标准框架




数据库应用创新实验室简介



数据库是基础软件的重要一员,是支撑全球数字经济蓬勃发展的核心技术产品。为推动我国数据库产业国际地位从跟跑、并跑到领跑,2019年10月,中国信息通信研究院云计算与大数据研究所牵头,联合多家数据库企业、应用单位、系统集成商、数据库服务企业、硬件制造商,共同成立公益性免费社群数据库应用创新实验室(以下简称“实验室”),打造了中国数据库产业的“联合舰队”。实验室持续致力于推动我国数据库产业创新发展,以实际问题为导向,以合作共赢为目标,联合政、产、学、研、用等多方力量,协同推进数据库领域应用创新的相关工作。实验室将一直秉承开放理念,持续欢迎数据库领域各企业、各机构、各组织申请加入。





实验室联系人



刘老师13691032906liusiyuan@caict.ac.cn
马老师15596670369majiahui@caict.ac.cn





实验室成员单位




继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存