OpenStack Rocky:专注于裸机云管理,快速升级以及硬件加速
前言
2018年8月30日,第18个版OpenStack版本发布,旨在解决基础设施的新需求:由人工智能,机器学习,NFV和边缘计算等用户驱动,并提供增强的升级功能,并支持各种硬件架构,包括裸机管理服务。
Rocky是使用与部署最广泛的开源云基础架构软件openstack的第18版,它带来了数十种增强功能,是由实际的大量使用案例和用户反馈驱动前进的。其中两个最关键的亮点是对Ironic裸机管理的改进,以及openstack升级的改进。
为满足边缘计算,HA和AI的工作负载需求,Rocky在Queens版本基础上扩展了对GPU和容器的支持,Rocky不仅增加了多项新功能,同时也对诸多旧功能进行了优化。
Rocky的新功能
裸金属管理
BIOS设置的管理 : 当BIOS执行硬件初始化,并且具有许多配置选项时,可以在自定义时支持各种案例场景。通过管理bios选项,可以帮助用户获得更好的性能,方便快捷配置管理电源或启用SR-IOV或DPDK等技术。Ironic现在允许用户管理BIOS设置,支持NFV等用例并为用户提供更大的灵活性,大大降低了工作量。
"conductor groups":在Ironic中,"conductor"是使用驱动程序在硬件上执行操作的内容。Ironic引入了‘conductor-group’属性,可用于限制特定属性特征的节点。同时也允许用户基于物理区域位置隔离节点,减少网络跳点数以提高整体服务的安全性和性能。
RAMDisk部署接口:是Ironic中用于无盘部署的新接口。可以使高性能计算,批量实例上线等大规模部署场景能够拥有无盘节点。
容器管理
Magnum是一个使容器编排引擎及其资源在OpenStack中成为一流资源的项目,已经成为Rocky周期中的认证Kubernetes安装程序。通过这些一致性测试,用户可以确信Magnum可以按照预期与Kubernetes进行交互。
边缘/物联网
负载平衡项目Octavia增加了对UDP协议的支持。UDP是语音,视频和其他实时应用程序中常见的传输层协议。因此可以为边缘计算和物联网使用场景带来更佳的负载平衡能力。页面dashboard支持自动刷新负载均衡器状态。同时也允许第三方负载平衡驱动程序与Octavia v2 API集成。负载均衡池可以有备份成员,当池的所有成员都不可用时,备份可以提供响应。
高可用性
Masakari提供从故障中自动恢复来实现高可用功能,扩展其监控功能,包括实例的内部故障,例如挂起的操作系统,数据损坏或调度故障。可以通过QEMU Guest Agent支持内省实例的监控。同时使用人员现在可以自定义任务流和工作流来处理每种类型的故障通知。
高性能计算
Cyborg 项目为GPU,FPGA,DPDK,和SSD加速器等提供全生命周期管理。Cyborg在Rocky中为FPGA引入了一个新的REST API , 一种在机器学习,图像识别和其他HPC用例中的加速器,让用户可以动态地更改FPGA设备上加载的功能。
无服务
Rocky版本引入了1.0版本的Qinling,该功能作为一种FAAS服务项目。Qinling在OpenStack云之上提供无服务器功能,允许用户在不管理服务器,VM或容器的情况下在OpenStack云上运行功能,同时仍然可以连接到Keystone等其他OpenStack服务。
快进升级
Rocky版本还为OpenStack升级带来了改进。快速前向升级服务(FFU)是在Queens中作为测试版被openstack TripleO项目引入。通过了用户案例测试和开发周期的相应调整,FFU功能已准备好了未来黄金发展时间。FFU让使只要使用N-3发布版本的用户可以快速跳过中间版本来升级到最新版本。
Kuryr
Kuryr是容器框架网络和存储模型之间的桥梁,将OpenStack网络和存储进行抽象。在Active/Passive 模型中增加了对高可用性kuryr-controller的支持,在kuryr-controller丢失的情况下实现快速透明的恢复。添加了本地路由支持,通过Octavia Amphorae而不是iptables实现L7路由,为负载均衡器和服务提供更直接的路由。添加了对namespace隔离的支持,让用户隔离通过安全组实现的不同namespace中的pod和服务。添加了对CNI守护程序运行状况检查的支持,允许用户确认CNI守护程序的功能,然后针对cpu,内存等资源进行限制,增强性能,提高稳定性,并在需要时将其标记为不健康状态。
其他
其他部分Rocky也有了很大的改进,比如neutron支持端口转发,从而节省floating ip地址。可以支持从现有的ML2OVS TripleO平稳部署迁移到ML2OVN TripleO。libvirt驱动程序可以在不同类型的网络后端之间进行实时的迁移,比如,linuxbridge => OVS。对cinder备份功能进行了优化,从而改善了用户体验。更多功能还是需要看官网。
总结
如今,随着第18个版本发布,OpenStack核心项目更加稳定,周边项目发展依然迅速。在众多大型的软件开发及托管公司、成千上万社区贡献者的支持下,OpenStack的可管理性、弹性、可扩展性和用户体验的功能都得到不断发展,诸如边缘计算和NFV等新的元素在不断融入到OpenStack中,业界看到了一个更加集成和成熟的OpenStack。未来,云计算终会是主流,不管是公有云,私有云还是混合云,OpenStack都提供了一个开放,完善,稳定,功能齐全的最优解决方案。
当然,OpenStack依然避免不了安装复杂,对运维能力要求较高,默认页面不是很符合国人的习惯等问题,但瑕不掩瑜,这些问题后期终会一一解决。我们公司的几位研发兄弟重新开发了一套OpenStack前端,底层依然是原生的OpenStack,前端使用Django+vue,完全前后端分离,计费与监控是重新独立开发的,目前用户测试已经完全可用,内部的研发环境目前一直在使用,后期我们会完全开放出来,希望大家能都一起交流学习。
作者:祝祥 新钛云服运维架构师
十年运维经验,曾任刻通云运维工程师、微烛云和某互联网金融平台首席运维架构师。拥有OpenStack、CCIE、阿里云、ZStack等技术认证。有上万台云主机,PB级别分布式存储运维经验。熟悉各种虚拟化技术,软硬件,网络,容器编排等技术,拥有python开发经验。热爱各种开源技术。
版权声明:本文为新钛云服原创编译,谢绝转载,否则将追究法律责任!
精品好文:
Ceph BlueStore 与 FileStore:利用 Micron NVMe SSD 进行性能比较
OpenStack与ZStack深度对比:架构、部署、计算存储与网络、运维监控等
从盛大游戏G云COO到独自创业!2018中国财经峰会专访新钛云服CEO冯祯旺
新钛云服,打造最专业的Cloud MSP+,做企业业务和云之间的桥梁