运维工程师是保障云服务正常运行的幕后英雄,出色的运维工作离不开好用的运维工具的帮助。
在今年 9 月 5 日的百度云智大会上,百度智能云在行业首发了一款融合了大模型能力的的云服务器智能管理终端工具 SmartTerm。用户可以通过浏览器登录百度智能云的控制台,使用 SmartTerm 登录云服务器进行业务部署、运维排障等操作。SmartTerm 支持同时登录管理多实例、多客户端同时登录同一实例、横竖分屏使单实例或多实例展示在同一屏幕中,实现团队协作和个人工作效率的最大化。
视频 1 SmartTerm 产品整体介绍
不止于此,运维工程师还可以使用基于文心大模型的 AI 助手完成运维命令查询、复杂命令和脚本生成、命令报错处理等工作。在大模型的加持下,SmartTerm 可以有效降低运维工程师的工作复杂度,并提升业务效率。
故障诊断是运维工程师经常面对的工作,需要从成千上万行的日志中找到问题所在。这些日志的打印格式各式各样,运维工程师通常使用 Awk 者 Sed 对这些日志做统一处理,比如提取某类请求的关键字和耗时,生成特定形式的数据表格,再对这些数据表格进行分析判断找出故障点。这需要运维工程师对 Awk 或者 Sed 的命令有很强的理解和认知。实际应用中,Awk 或者 Sed 涉及的命令通常比较长,需要一段一段的敲入,比如:grep "GET http://xxx.baidu.com:80" /xxx/logs/xx.log | tee grep_output.txt|sed 's/baidu.com:80//g'| awk '{sum += $2} END {print "Sum of column 2: " sum}'
这类复杂的命令如果一不小心输错,则还需要额外地对这些命令进行排障。如果遇上不熟悉的命令,则有可能还需要请教同事或者去网上搜索相关方法。这让本来已经万分火急的故障诊断变得雪上加霜。
这个过程每延长一秒,就意味着故障会多存在一秒,业务就会多被影响一秒,这对运维同学是一件压力不小的事情。借助 SmartTerm 中的 AI 助手,运维人员只需要输入想要实现的业务目的文字描述,以上文对应代码意图为例,只需要输入:
保存日志中包含xx目录路径下的日志行(替换:baidu.com:80为空值)到文件,然后对文件第二列进行求和
AI 助手就会自动生成相应的 Awk 或者 Sed 命令,并一键导入至云服务器中。通过 SmartTerm 的智能化交互方式,所述即所得,缩短了从日志到排障数据的整理时间,做到了线上问题的快速定位。
视频3 Awk 命令生成
- 03 -
我们相信,智能化将成为未来运维工作的重要特性,帮助运维同学从复杂的命令交互中解脱出来,提升业务全生命周期运维工作的效率。随着文心系列大模型能力的不断增强,云服务器智能管理终端工具 SmartTerm 也将不断进化。现在 SmartTerm 已经上线,快来试试不一样的运维体验。- - - - - - - - - - END - - - - - - - - - - 传送门