查看原文
其他

自动化运维——自动化部署系统构建及演变

2016-08-13 徐亮伟 运维之美

一、早期手动部署代码


  • 纯手动scp上传代码。

  • 纯手动登陆,git pull 或者svn update。

  • 纯手动xftp上传代码。

  • 开发发送压缩包,rz上传,解压部署代码。


缺点


  • 全程运维参与,占用大量时间。

  • 如果节点多,上线速度慢。

  • 人为失误多,目录管理混乱。

  • 回滚不及时,或者难以回退。


二、设计自动部署代码


流程设计,确定目标。


自动部署环境


  • 开发环境


开发者本地有自己的环境,运维配置公共开发环境,大家可共用的服务。例如:开发数据库MySQL,redis,Memcached等


  • 测试环境


功能测试以及性能测试。


  • 预生产环境


生产环境集群中的某一个节点,并且连接生产库。(不对外,不做破坏型操作。)


预生产环境由来


  • 数据库不一致,测试环境和生产环境数据库是不一样的。

  • 使用生产环境的联调接口;例如:支付接口。(电商业务)


  • 灰度环境


根据不同的区域进行划分分。(生产环境)


  • 生产环境


对用户提供服务的环境。


自动部署规划


前提


  • 已经有一个可以上线的代码在git仓库。

  • 我们现在要做10个集群节点的一键部署,秒级回滚。

  • 所有的web服务,都应该使用普通用户。(强烈建议)

  • 所有的web服务都不应该监听80端口,除了负载均衡。


那我们如何设计一套生产自动化部署系统。


  • 规划

  • 实现 

  • 总结和扩展(PDCA方法论) 

  • 生产环境应用


实现思路


  • 代码放置位置


  1. Git(首先)、Svn


  • 获取最新代码


  1. 获取最新分支

  2. 获取版本号

  3. 获取tag包


  • 差异解决


  1. 各个节点之间差异

  2. 代码仓库和实际的差异。配置文件是否放在代码仓库中。(配置单独进行存放,config.example)短信接口,支付,等敏感信息不让所有开发知道

  3. 统一的集群有10个节点。(Job节点 crontab.xml 配置文件不一样)


  • 项目名称如何设计


项目名称_环境名称_版本_分支_时间_某开发提交


  1. 测试: rainbow_test_v1.1.1_dev_2016-08-11_12:12_xuliangwei

  2. 生产: rainbow_pro_v1.1.1_master_2016-08-11_11:11_xuliangwei


  • 如何更新


  1. php,tomcat需要重启,重新软链接。


  • 如何测试


  1. 测试(关键的页面,API,后台等)

  2. 测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。


  • 记录日志


  1. 可以部署统计

  2. 成功多少次

  3. 失败多少次

  4. 回滚多少次


  • 多人同时执行脚本


  1. 防止多人操作导致重复上线失败。通过lock锁对文件进行控制。


  • 串行,并行


  1. 机器少的情况串行感觉不出什么。如果机器过多则会很慢。

  2. 分组部署并行部署,以及分组测试。

  3. 测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。


  • 部署服务器双机


  1. 防止部署系统down机,部署机代码丢失,误操作。


  • 如何执行


  1. shell执行

  2. web界面点击(自定义或jenkins)


  • 如何实现正常回退,以及紧急回退(回滚的必要性)


  1. 通过软链接的方式来实现代码秒级别回退。


自动部署难点


在大公司推进自动化部署上线,是有许多的难点,根据个人公司的不同,来选择不同的方法来进行推进。


自动化推进难点


  • 能力(个人能力,团队能力)

  • 责任(责任能否承担,敢于承担责任)

  • 公司流程、人员、组织架构。


可通过如下方法推进


  • 目标化沟通

  • 责任划分 

  • ITIL

  • 项目管理:PMBOOK


三、自动部署实践


整个集群自动化部署流程设计如下


可根据如下思路,结合公司实际业务来编写shell脚本或者Python。 


  • 获取最新代码

  • 编译(可选)

  • 配置文件(软连接或者拷贝)。

  • 打包(tar,加速传输)

  • 文件分发(Scp Rsync Salt)(不需要密码验证)

  • 将目标服务器移除集群(注释配置文件)

  • 解压

  • 防止webroot站点目录

  • scp差异文件(可能有一个节点配置文件不一样)

  • 重启Web服务

  • 测试


四、正常回退实践


  • 列出回滚版本 

  • 目标服务器移除集群 

  • 执行回滚 

  • 重启并测试 

  • 加入集群


五、紧急回退实践


  • 列出回滚版本(ls -l或find查出对应的历史版本)。 

  • 执行回滚操作(删除软链接,重建软链接)。 

  • 重启对应服务。


六、自动部署采坑


自动化部署php环境或者java环境的过程中,那么你一定遇到了如下的问题。


  • 如何应用到你的生产环境。

  • 回退到“上一个正常”版本。

  • 自动部署软连接的坑。

  1.  PHP如果开启Opcache,需要重启PHP,或者清理opcache

  2.  Java Tomcat是必须要重启,最好每次清理work,tmp缓存目录。


来源:徐亮伟架构师之路

原文:http://t.cn/RtOtIgm

版权:本文版权归原作者所有




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存