查看原文
其他

中国信通院云大所牛晓玲:XOps浪潮下,企业IT提质增效的新思考

牛晓玲 高效运维 2022-07-13

作者简介:
牛晓玲,中国信息通信研究院,云计算与大数据研究所审计与治理部,长期从事跟开发运维相关的研究工作,同时担任 DevOps 标准工作组组长以及 DevOps 国际标准的编辑人。在调查报告、行业最前沿的研究、白皮书、评估评测等相关工作有非常丰富的经验。

本文根据牛晓玲老师在 GNSEC 2022 全球下一代软件工程线上峰会演讲整理而成。

本次分享的内容主要有5个部分:

  1. XOps体系

  2. DevOps研运效能度量

  3. AIOps

  4. BizDevOps

  5. FinOps

1. Xops体系

XOps体系到底是什么?这由多方面因素来驱动:从市场方面来说,各大企业的产品迭代越来越频繁,用户也提出了更高的要求;从技术角度来说,容器、微服务、低代码、无代码、RPA,包括 AI 等技术的融入,不断在降低作业人员的技术门槛。

整体上看,在技术运营侧高阶实践方面,一定是向智能运维去延伸;DevOps 的总体落地成效,要关注研发效能的度量,这是一个发展趋势;从业务侧去进行延伸,企业目前越来越重视商业价值的全生命周期管理,所以提出了 BizDevOps 概念;继续往财务侧去延伸,成本对于企业来说也是非常重要的环节和部分,又提出了 FinOps 的理念,这些能力其实都是企业面向数字化转型需要具备的核心竞争力。

2. DevOps研运效能度量

什么是 DevOps 研运效能度量?国家十四五规划和2023远景纲要,鼓励加快数字化发展,建设数字中国的理念。对于企业来说,研发效能度量有三大难点:第一是度量难,第二是提升难,第三是考核难。面对这三个难点怎么去解决?

  1. 度量难。建议企业一定要有一套研发效能度量体系,比如价值流的分析,和代码健康度分析等;
  2. 提升难。怎么去提升?企业应着手建设工程能力体系,那么在工程能力体系下,以建设如工程能力的地图,包括功能的排行榜等,让内部的员工有更强烈的愿意去应用工程能力体系;
  3. 考核难。应当鼓励企业建设组织人才体系,其中包括工程师能力画像,工程师评价等。

为什么研发效能度量近两年受到大家的特别关注?主要有这四方面原因:

  1. 内部的业务驱动。随着组织发展越来越规模化,研发效能度量来说对于企业来说越来越重要,如何应对这种灵活多变的市场需求,这是第一个内因;
  2. 第二是技术驱动,谷仓效应对于企业的影响是越来越突出,基于协作流程的优化,打破流程中的谷仓,去除不必要等待,驱动价值快速流转,助力研发效能加快落地,也是一个非常重要的内因;
  3. 第一个外因是市场的驱动。现在竞争越发的激烈,市场需求趋于饱和,市场竞争日益激烈。企业需要在相同的时间、相同的资源下获得更多的成果这就要考虑到研发效能度量;
  4. 外部生态的驱动,软件研发运营中各个环节目前来说已经实现了全面数字化,这也为研发效能度量作了非常良好的前期准备。

对于研发效能度量,不同的企业认识也是不一样的,包括头部的一些互联网的公司、运营商、金融机构等,它们都对研发效能度量都有较为统一的认知,研发效能度量能够帮助企业去提质增效,同时能够让工程师有更多的时间,做更多有价值、有创新力的东西。

人技法合一才能更好的推动研发效能度量的落地。
  • ,主要指工程师能力相关的培养和建设;
  • ,要有研发效能度量的平台;
  • ,要有好的工程实践和管理实践来共同进行推动。

研发效能度量体系对于企业来说有三大价值:

  • 第一个是在基础能力层,对人和工具进行能力的提升;

  • 第二个是产品交付,要有过程性指标,以流动效率为核心,关注效率、产出和成本的平衡;

  • 第三个是业务价值层,业务目标是否实现,基于这样的价值,输出研发效能度量指标的地图。
举两个例子,第一是某大型金融机构建设的研发效能度量平台,该平台能够进行串联创意生成,包括需求设计、开发、测试、发布、运营,还有运维监控、需求反馈等等,形成了一个非常完善的软件价值交付闭环。这个平台为他们全行提供了一个精细化的研发效能管理的重要平台支撑。

第二是某大型头部互联网公司的研发效能平台实践,通过团队的全景、研发透视、效能洞察等仪表盘,建立了一个非常全面的研发效能体系。主要聚焦了三个方面:

  1. 价值流的效能洞察;
  2. 可以支持面向研发团队管理场景下的效能的全景展示;
  3. 可以支持产品研发迭代场景下的一个研发的透视。
这个平台为企业带来的价值非常大,对每年的提质增效和成本节约,都起到了非常大的助力作用。

中国信息通讯研究院在指导企业如何度量方面,输出了一套研发效能度量的模型标准,标准里面的内容分两个部分
  1. 对企业应该怎么样建设研发效能度量,给出了成熟度模型;
  2. 在整个建设过程中,工具应该有什么样的支撑,需要什么规范方面,给出了系统平台和工具部分。

首先看一下度量成熟度模型,从度量指标管理、数据管理、分析与决策以及运营改进四个维度对企业的研发效能度量体系建设提供规范性建议与指导。整个成熟度模型部分包含20个模块、100+项条目,并根据企业研发效能度量落地成熟度能力分为五个级别:初始级(一级)、基础级(二级)、全面级(三级)、优秀级(四级)和卓越级(五级)。目前已经有超30多家企业参与。

第二个就是研发效能度量模型系统平台和工具部分,从数据管理、度量分析管理、度量展现管理三个维度做出要求,覆盖敏捷开发场景、持续交付场景、技术运营场景、成本管理场景及组织与人员管理,助力企业整体研发效能提升,为企业在数字化转型浪潮中的研发度量提供重要抓手。整个系统平台和工具部分包含17个模块,160+项条目,并根据系统平台及工具满足的能力要求项数量将其分为三个级别:创新突破级(一级)、产业推广级(二级)、卓越引领级(三级),且三级为最高级。

研发运营一体化(DevOps)通用效能度量模型系统平台和工具已于2021年11月启动首批试评估工作,并于12 月 24 日在中国信息通信研究院主办的“2021 GOLF+ IT新治理领导力论坛”上由中国信息通信研究院云计算与大数据研究所所长何宝宏博士重磅公布评估结果,百度、平安银行、中兴通讯、极狐GitLab及禅道通过了评估。

3. AIOps

随着系统数量与业务规模持续性增长,运维数据的数量和种类在不断增长,运维的形态不断发展演进,手工运维 -> 流程化运维 -> 自动化运维 -> DevOps ->智能化运维。在人工智能等新技术的加持下,AIOps 的自动执行、分析与智能决策是企业级 DevOps 在运维(技术运营)侧的高阶实现。

智能化运维能够帮助企业进行多维度的智能分析和决策,帮助企业提升IT运维效能。包含这几个能力:首先能够汇聚多元的传统数据,捕获所有的数据集;第二是能够简化数据分析,支持企业对运维进行分析决策。从数据分析与处理的时间维度来看,它可以针对历史事件、当前事件和未来事件,能够覆盖到智能运维的知识积累,实时异常检测,故障预测和预防等应用场景。

根据对国内外30余种 AIOps 系统和工具功能调研,这些工具涵盖了目前已有的各个场景的实践内容:

  • 智能监控管理
  • 智能故障处理
  • 成本与容量管理
  • 智能用户体验管理
  • 智能安全运营
根据此结果以及与业内专家的深入交流讨论后,我们将目前 AIOps 技术架构抽象为数据层、智能计算层、应用场景层。AIOps 能力成熟度也是聚焦于运维应用场景中质量、成本、效率、安全四大领域的智能化技术应用能力。

云计算智能化运维(AIOps)能力成熟度模型 第1部分:通用能力要求》,此标准主要面向智能运维整体能力建设,为企业采用智能化方法对IT系统或平台开展运维相关工作提供参考及指导,关注AIOps整体能力建设。

针对智能化运维应用场景层能力,从感知、分析、决策、执行、知识更新五个维度进行级别划分,从L1级初始的智能化运维到L5级高度智能化运维。通过成熟度方式,给出一条从初级到高级的 AIOps 实践路径,来供大家参考。

第二个部分就是智能运维的系统和工具,这部分标准主要面向智能运维系统和工具能力,为IT运维的实施方使用或构建相关系统和工具进行评价和指导,可作为 AIOps 系统和工具功能的标准依据。主要分为:底层的数据管理、智能的计算引擎和上层应用场景能力。在场景中又分为质量、成本、效率和安全4大部分。这里分为三级能力成熟度,全面级、优秀级和卓越级,目前此标准已有近50家企业参与编写。

此外在2021年7月,由中国信息通信研究院牵头提出首个智能运维(AIOps)国际标准,在 ITU-T SG13 成功立项!代表了我们 AIOps 标准在国际领先,也是通过此种方式推进各方对智能运维能力体系架构达成共识,促进智能运维领域技术、应用的有效落地,持续推动国内外 AIOps 相关产业的健康有序发展。

在 AIOps 系统工具能力成熟度评估方面,截止去年12月,共有8家企业11个项目通过了评估,其中包括华泰证券通过了异常检测模块评估;浙江移动通过了异常检测等三个模块评估;还有广东移动、西骏数据、亚信科技、浪潮云、擎创科技和博睿数据,代表行业领先水平。

4. BizDevOps

BizDevOps 主要围绕业务商业价值实现,贯通IT、运维、业务三大职能部门,形成利益相关的全功能混编团队,并借助一体化作业流程,以及低技术门槛作业平台/工具,支撑对业务商业价值端到端的交付及生命周期管理,帮助企业持续满足转型对IT研发、传统运维、业务运营提出的更高诉求,实现研发、运维、运营能力的无缝连接及有效治理与协同发展,以敏捷应对商业模式、运营模式、管理模式等的变化,实现企业商业价值最大化。
那么主要涉及到5个方面:
  • 一是商业价值管理;

  • 二是应用及服务开发;

  • 三是客户成功运营;

  • 四是人员及文化转型;

  • 五是平台和工具的支撑能力。


分开来说,商业价值的管理是聚焦商业价值的正循环的治理,商业价值管理以企业业务发展结果为导向及出发点,对结果所带来的最终经济价值、效率价值、体验价值等开展监控、度量、分析、评估、验证、优化、沉淀等系列管理活动,更好指导、促进业务生产活动高效、高质开展与交付,支撑业务价值的可视与持续提升。应用及服务开发聚焦在自研产品级应用的开发、发布和运维环节,以敏捷响应开发需求为基础目标,构建可视开发、安全可信发布以及自运维的标准流程和服务治理体系,持续改善应用开发与自运维效率,以及软件发布质量,支撑企业商业目标的落地达成。

客户成功运营是指围绕业务商业价值的可持续性与最大化,运用专业化IT运营工具,针对所负责业务、应用、服务、客户、平台、资产等,持续开展监控、建模、分析、反馈、扩展、优化等体系化运营支撑活动,构建运营指标、运营视图并通过对四大核心对象的评估,打造运营部闭环,从而持续提升业务效果、客户感知、平台体验等,助力生命周期的延长与可运营性的提升。如果要建一套运营的指标,那么一张运营全景视图,两个运营的闭环,四大核心的对象,输出几个评估分析的模型,就形成了一体化的运维支的体系。

人员及文化转型是聚焦人才发展和组织文化的融合的治理。主要从三个方面入手:

首先构建要构建新型的作战团队,包括组织形态的内容、规模和绩效;第二是要构建新的人才闭环,对人才怎么进行培养和对外包管理等;第三是构建新的工作模式,企业内部应该以客户为中心,并包含一些创新协作的文化。

平台和工具方面聚焦IT对于“人、货、场”的统一的降维治理。构建低技术门槛的一体化开发平台及工具链是企业级BizDevOps治理的基础承载。通过低代码+AI+Cloud等技术的注智,不断降低一体化平台技术门槛,持续提升企业转型核心能力构建的效率,通过人、货及场三方面不断协作支撑研发、运营、运维的一体化作业。

5. FinOps

FinOps到底是什么?是把财务业务和IT整合的变革,是从财务的角度对资源投入的全过程管理,实现云成本的投入合理性以及这种实际效果的展现。其内涵主要包括三个方面:
第一是文化变革,要确保相关人员都了解 FinOps 的一些内涵,各方参与的期待和角色定位,从成本方面怎么去帮企业做出贡献。
第二是要具备非常强的团队协作能力,因为它涉及的部门比较多,要实现这种跨部门团队的合作、标准管理、提升沟通效率等等。
第三是能力建设,在财务方面要具备从预算的控制、成本分摊优化、核算的能力。从运营角度,要提供性能优化、架构优化、资源优化3大能力。

基于FinOps,在2020年年底的IT新治理领导力论坛上,已经成立了FinOps产业推进方阵;2021年7月份与 FinOps 发起方 Linux基金会成立战略合作关系;9月份举办了首期FinOps主题沙龙,希望通过 FinOps产业推进方阵,前瞻性的布局国内的产业生态,共促产业发展,目前成员单位已经近50家。

其中包含头部的互联网公司、运营商服务商等,说明大家对成本非常关注,希望有更多的企业能够参与和加入进来,一起共建共研。

2021年形成了一套面向云资源财务运营能力的通用成熟度模型标准。这部分是对企业的这种构建云资源财务运营能力平台进行指导和评价,从预算额度、成本感知和优化、归集以及辅助决算五大维度来进行展开的,从应用级一直到卓越级共分为三级。

从评估角度来说,目前完成了首批试评估的工作。阿里云和中软国际的平台通过了首批试评估的工作。

►►►

联系方式

DevOps 研发效能度量 & BizDevOps:

刘老师

13021060029

liuzhaowei@caict.ac.cn

智能化运维(AIOps)能力成熟度:

尚老师

13261081232

shangmengchen@caict.ac.cn

IT资源财务运营(FinOps):

吕老师

18620657903

lvfuxiao@caict.ac.cn

相关咨询可联系:

魏焕新

18500255645(同微信)

weihuanxin@greatops.net


近期好文

运维!你对数据要有敬畏之心~

“高效运维”公众号诚邀广大技术人员投稿,

投稿邮箱:jiachen@greatops.net,或添加联系人微信:greatops1118.
点个“在看”,一年不宕机

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存