查看原文
其他

运维思索:基础设施自动化落地

木讷大叔爱运维 木讷大叔爱运维 2022-07-13




读完需 4 分钟

速读需 2 分钟 



前言

前面《运维思索》系列文章已经将我们的自动化运维之路铺好,接下来我们要进入的是基础设施自动化落地。本文希望能够将《运维思索》系列与之前分享的一些文章进行有效的串联,让历史文章不再孤单,再次发挥余热。


串联

运维思考:运维管理与运维自动化一文中讲到了运维自动化的几个阶段:操作自动化>场景自动化>智能化,其在基础设施层的落地主要体现为:

  1. 操作自动化
    运维思索:操作系统配置规范化、自动化一文,基于配置规范结合ansible实现了部分功能的操作自动化:
    (1)操作系统配置初始化、用户配置自动化、安全配置自动化;
    (2)基础组件的自动化部署,如:java、nginx、中间件、python等;
    此阶段配置规范为核心,ansible、saltstack等自动化工具为辅助工具。

  2. 场景自动化
    基础设施层主要是网络设备、虚拟化集群、物理机等,通过cmdb、堡垒机、监控去管理,因此主要场景有:
    (1)服务器上架,需依次接入cmdb、堡垒机、监控等管理层服务;
    (2)服务器下架,需依次注销cmdb、堡垒机、监控等管理层服务;
    在服务器基数小的情况下,我们可以手动在各个平台注册主机;一旦需要批量上下架,工作量将会指数增长。因此我们需要这些场景自动化来为我们减负。

  3. 智能化
    在此阶段的智能化,我只能联想到故障自愈,与监控平台形成有效联动,实现故障的自动恢复。


在此我们主要介绍场景自动化。


场景自动化

传统的运维核心是以解决孤立的问题为目标,因此当云日趋成熟,让很多运维同学觉得要失业。因为云屏蔽了底层的基础设施,能够让企业将更多的精力放到业务上。转换下思路,运维在企业中是否就是扮演的‘云’的角色,我们要保证的是

  • 业务连续性

  • 资源的快速交付

  • 应用可靠性


因此我们要扮演好’云’的角色,此时就需要依赖操作自动化、场景自动化和智能化三者的互相配合。操作自动化是基础、场景自动化是关键、智能化是保障。因此我们就需要在关键处下手。


基础设施层大部分的工作在于服务器资源的交付,因此运维要保证资源的快速交付,此时就可以靠场景自动化来解决。

  1. 场景一
    基础设施资源一般通过cmdb、jumpserver、vsphere、监控等不同运维工具纳管,我们如何实现服务器资源的一站式交付?

  2. 场景二
    某个业务下架,我们如何从cmdb、jumpserver、vsphere、监控等运维工具中下架关联资产?

以上是两个非常常见的场景,我们该如何实现场景驱动呢?


最佳实践

对于运维来说,通过Web界面输入参数、一键执行实现整个场景的自动化交付,我认为就是最佳实践。

在此特借助蓝鲸标准运维实现了虚拟机交付,实现虚拟机创建、定制ip、jumpserver自动添加资产及用户推送、注册蓝鲸cmdb,发送邮件通知。


我们通过蓝鲸标准运维框架,定制了vsphere、jumpserver、cmdb三个原子,用于打通三个平台,实现了单台虚拟机交付在1.3 分钟左右。


1.订制场景流程


2.填写参数


3.一键执行


具体实现可参考以下文章:
腾讯蓝鲸实现vsphere虚拟机交付

蓝鲸实现vsphere虚拟机交付 -虚拟机管理(VSPHERE)

蓝鲸实现虚拟机交付-跳板机管理(JUMP)

蓝鲸实现虚拟机交付-配置平台(CMDB)


总结

基础设施的管理是运维工作的根本,如果管理混乱,那么上层应用也不好不到哪去。因此运维不管到哪,都要做好场景化的梳理,通过运维流程去定义,做可持续的自动化,保证团队中任何人都可以无缝交接。



运维思索:运维规范如何生成?

运维思索:如何纳管服务器实现统一登录

运维思索:操作系统安装规范化

滴滴夜莺:从监控告警系统向运维平台演化

集群外独立部署Prometheus+Grafana监控K8S全面解析



你与世界

只差一个

公众号




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存