整个IT系统生命周期内,运维占据80%以上的时间。来自CSDN的一份企业IT TCO调研显示,后期维护成本已经接近企业整体TCO支出的1/3,运维带给企业用户的价值可见一斑!为了帮助用户可以轻松完成对集群初始化的配置以及后续运维,XSKY XE2000 SDS一体机系列新一代核心系统XScalerOS设计了自动化安装引擎XScaler Navi【更多内容点击相关链接:“我这一杯咖啡还没喝完,你们就搞定了,优秀!”】。用户可以通过分步式点击鼠标简单操作,整体耗时30分钟左右即可完成整体集群的初始化安装和基础资源配置。
为了满足“轻松运维”的操作模式,日前XScaler Navi还新增了自动化「在线扩容」和「在线升级」两项功能。确保用户在后续运维过程中,可以通过简单几步界面化的操作,即可替代完成原先繁琐的命令行操作。
01结构优化
XScaler Navi此次进行了一次整体的结构优化,以确保后续可以稳定地为用户提供更多刚需的运维管理功能及良好的用户体验。重点优化如下:1、功能重组根据操作使用的频率考虑,新增功能首页入口。用户通过具体的URL地址会首先进入功能首页入口,并根据自己此次操作目的进入对应功能操作页。进入具体功能操作页后,可通过左侧导航栏切换不同功能入口。2、兼容升级兼容多个主流浏览器(如:Chrome、Firefox、Microsoft Edge、Safari等)及版本,确保用户尽可能在习惯的浏览器环境中,可以感受到操作流畅、界面清晰易读的用户体验。首页入口
02在线扩容
1、配置管理端口此步操作同「安装集群」一样,目的在于需要用户为本次扩容的节点配置管理IP和网关地址。配置管理端口2、授权验证完成步骤1后,用户需要正式进入「在线扩容」功能操作页,并输入预扩容的集群管理者账号和密码来进行授权验证。系统通过该步骤可以验证到当前集群账号信息是否正确,以及集群本身是否满足扩容条件。如验证失败,则会对应告知失败原因,并给予用户后续建议。授权验证3、检查集群运行状况为确保扩容不影响当前业务且确保业务本身处于正常,系统需要在集群正式扩容前为集群进行运行状况的检查。检查过程整体预计在1~2分钟。对于检查结果,界面会直观地告知用户是否通过。如果检查不通过,XScaler Navi会及时通知用户当前集群状态情况,需排查相关告警并恢复集群状态为正常后,才能进行在线扩容。检查集群运行状况4、选择新节点用户只需要选择本次要加入的节点即可完成本步的操作,如此简单的操作是基于背后完善的交互限制:实时扫描并展示与原集群节点同网段的节点列表,增加用户操作的有效性;
对集群内节点进行过滤,降低用户因误选而破坏集群;
对可加节点数进行操作限制,规避用户操作不符带来的扩容失败;
以“管理端口IP”进行升序排列,确保用户可以有序浏览信息,减少错看、漏看的情况。
选择新节点
5、配置新节点
XScaler Navi会根据默认的节点主机名规则、集群内节点的业务端口网段与新节点管理端口IP结合取值规则,对本次加入的节点进行自动配置。用户也可根据实际情况进行对应的修改。另外,用户也可根据当时的规划来选择新节点是否要直接加入到现有存储池中。
配置新节点6、诊断网络如何确保集群扩容过程中网络稳定、业务不中断是该功能的挑战之一。XScaler Navi为了确保集群扩容前后的网络规划能够正常融合,以及节点之间的网络链路健康,进行了一系列设计来应对这一挑战。多网络诊断:本次诊断分别针对业务网和管理网来执行。并通过多指标诊断来确保诊断范围覆盖全面、诊断结果准确。检查过程整体预计在1~2分钟;
结果有效反馈:每个集群的网络链路数量都会较多,为了提高用户的易读性和内容展示的有效性,XScaler Navi根据诊断健康和异常两种情况进行不同展示。当诊断健康,界面会直观告知用户诊断通过,可进行后续操作;当诊断异常,则会着重展示异常部分的链路信息;
链路异常定位:系统在网络链路异常情况下,可以提供具体且定位到链路的异常信息,方便用户直观地了解问题所在。此功能一定程度上,对于用户的运维排查效率和运维体验上,皆起到增强的作用。
网络诊断过程7、确认信息对之前配置的信息及检查结果进行最终检查,确定信息无误后,便可开始正式的扩容操作。8、扩容结果点击「扩容」后,界面会进行二次确认,确保操作的安全性和有效性。二次确认完成后,实时展示扩容执行的进度以及执行的具体步骤。也可通过「点击查看详细进度」来查看具体执行的日志信息,便于用户排查问题。在线扩容-扩容结果03在线升级
1、授权验证
此步与「在线扩容」作用类似。系统通过该步骤可以验证到当前集群管理者账号信息是否正确,以及集群本身是否满足升级条件。如验证失败,则会对应告知失败原因,并给予用户后续建议。
2、上传软件包
官方软件包会存在文件较大、上传耗时的情况。XScaler Navi考虑用户操作升级的场景,因此支持用户提前上传产品官方软件包,上传成功后的软件包将会自动保存,等待后续用户再次通过「在线升级」界面时,即可直接进行下一步着手升级操作。这样的操作流程则大大缩减用户在升级过程所消耗的时间。
在线升级-上传软件包3、检查集群运行状况为确保升级不影响当前业务且业务本身处于正常,系统需要在集群正式升级前为集群进行运行状况的检查。对于检查结果,界面会直观地告知用户是否通过。4、确认信息对之前配置的信息及检查结果进行最终检查,确定信息无误后,便可开始正式的升级操作。5、升级结果在线升级-升级结果点击「升级」后,界面会进行二次确认,确保操作的安全性和有效性。二次确认完成后,实时展示升级执行的进度以及执行的具体步骤。也可通过「点击查看详细进度」来查看具体执行的日志信息,便于用户排查问题。