查看原文
其他

OpenStack操作/运维人员整天干些啥?

2016-04-13 云头条

本文作者马特·菲舍尔(Matt Fischer)表示,OpenStack操作人员的日子总是带劲得很。他说:“从来不缺要修复的地方,不缺要改进的地方,也不缺要学习的地方,这就是我喜欢OpenStack的地方。”



本文最早出现在马特·菲舍尔的个人博客上。他是时代华纳有线公司(Time Warner Cable)的首席工程师,空闲之余还喜欢酿啤酒、爬山。


在我小时候,理查德·斯凯瑞(Richard Scarry)撰写的《忙忙碌碌镇》(What Do People Do All Day)是我爱不释手的作品之一。近日我在父母的房间又看到了这本书,当时在想怎样对过去几个月做的每件工作分门别类,结果就有了这篇文章:《操作/运维人员整天在做什么?》。


身为操作人员,意味着你势必什么事都能干一手,除非你是在一家规模非常大的提供商。于是,在过去六个月里,我接触过我们云的几乎每个部分,几乎无一例外的是,我学到了新知识,技能组合随之丰富起来(这也是我喜欢搞Openstack的地方之一。)


收集数据


在过去的六个月间,我解决了106个JIRA问题;回顾这些问题,很清楚地表明了我把工作时间都花在了哪里。我还做了上游审查和提交工作,stackalytics网站在这方面会提供详细的信息。使用这些信息,我就能表明哪些工作上用的时间最多、哪些工作上用的最少。


Puppet自动化


这些天来我把大多数部分花在了puppet模块和使用puppet配置服务上。其中一些工作包括如下:


  • 使用Keystone/Nova/等服务,修复/配置/启用新功能。

  • 将我们的puppet分支从Icehouse升级到master。

  • 配置构建服务器及其他基础设施(cobbler、puppet和程序包库等)

  • 配置/部署Icinga,或编写新的检查代码。

  • 重构和清理,比如将我们所有的keystone角色/用户迁移到YAML,那样它们就更容易添加。


Ansible


第二个是Ansible自动化。我们使用ansible来管理节点之间的依赖关系,另外驱动我们的部署。我们使用ansible的一个例子就是用来升级mysql,每次升级一个节点,并且在这么做的同时,管理节点之间的状态。在过去的六个月,我编写了ansible任务,以便:


  • 部署新的手工制作的ovs版本。

  • 将mysql从版本5.5实时升级到版本5.6。

  • 将openstack服务从I升级到J,或者从J升级到K。

  • 改进每周的部署流程。


杂项


其中一些任务并不出现在Jira中,但是它们确实占用了我相当长的时间。


  • 差旅/培训:Openstack配置和RabbitMQ 培训等。

  • 规划:Sprint规划、功能规划和扩容规划等。

  • 指导和导入:我们的业务壮大了很多,这项工作不可低估。我在不回答问题时,每天要做大概5至10次代码审查。

  • 为Openstack做好Ubuntu包装,有一些是我们自己发布的。

  • 类似MySQL/Galera DBA的工作。


待命/问题


每过几个月,我就要轮到一回待命一周,可能很空,也可能很忙,这取决于我们的监控和云的状况。无论情况好坏,待命通常是我们的任务。可是就算不待命,我也要处理问题;虽然我们尽了力,但有时还会有问题。如果你有足够节点,就会遇到各种故障。它们可能是硬件故障、内核问题,或者甚至只是软件故障,什么样的故障都有。对于我们看到的问题,我在这里可以写一整篇文章,不过在我看来软件方面突出的问题是ovs、mysql和rabbitmq。那些可能是我们软件架构中三种最复杂、最重要的部分,所以它们吸引了我的好多注意力。


上游社区


我认为社区是OpenStack的最大优点之一,于是我把仅剩不多的时间都花在了社区上。我经常参与IRC和邮寄列表讨论,作为操作人员和Puppet-Openstack社区的一员。我还审查代码,提交修正版,主要是为puppet-openstack,但有时也为Openstack本身。虽然这减慢了我提交到OpenStack本身的工作,不过赢得了第三次去温哥华领取ATC(Active Technical Contributors)表彰的机会,我认为参与其中很重要。


结束语


当初我为这份工作而接受面试时,表示过最初担心的问题之一是,我们在一年内搞好Openstack后,我们就完事了。事实远非如此。实际上,OpenStack操作人员的日子总是带劲得很。从来不缺要修复的地方,不缺要改进的地方,也不缺要学习的地方,这就是我喜欢OpenStack的地方。虽然Openstack的每个版本通常让系统更容易、更可靠,但它们也总是添加更多的周边功能,让我们忙个不停。


本文所列的这些工作是不是与其他平日从事的工作一致?欢迎留言!


云头条编译|未经授权谢绝转载


相关阅读:

OpenStack的问题:厨师太多了


欢迎加入交流,群主微信:aclood


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存