查看原文
其他

如何快速有效的定位应用抖动问题?| 龙蜥技术

系统运维 SIG OpenAnolis龙蜥 2023-11-30

编者按:在服务器系统运行中,常见的问题包括服务器宕机、系统夯机、应用运行错误、性能抖动等,其中抖动问题是非常典型的容易出现且很难分析解决的问题。本文通过深入理解 Linux 应用运行过程的抖动原因,来协助系统及应用进行优化。同时介绍怎么 SysAK 工具对问题进行监控和诊断。整理自龙蜥大讲堂第 25 期精彩分享视频回放已上传至龙蜥官网(首页-动态-视频),欢迎查看!

再精良的系统也不是完美的,总会遇到不可预期的问题。在服务器系统运行中,常见的问题包括服务器宕机、系统夯机、应用运行错误、性能抖动等,其中抖动问题是非常典型的容易出现且很难分析解决的问题,其主要表现在瞬时发生、复现概率低,对业务运行产生比较大的影响的同时缺乏有效的分析手段。常规的运维解决思路之一就是增加各种各样的系统监控,但受限于监控的粒度和专业度,这些监控手段一般只能从系统运行的资源状态来推测出可用的资源利用率是否达到瓶颈等等,很难能从根本上提供有效的解决手段。

针对这类问题,SysAK 从系统底层的抖动根因出发,覆盖了影响应用抖动的常见干扰和瓶颈因素,开发了一系列工具,包括系统及应用的健康状态监控,以及对出现的问题进行根因诊断。

具体分享包括有以下几部分:

1、介绍应用常见抖动现象。

2、从 OS 原理角度去分析抖动的原因。

3、利用 SysAK 工具集分析问题。

4、常见抖动问题的处理建议。

对干扰和瓶颈的分类进行了详细介绍。

SysAK 本身是一个比较全的运维工具集,针对几个典型的抖动问题,分享了一些工具的使用场景和实际案例效果。

最后,根据作者的经验,也对一些常见抖动问题的提出了一些建议的解决方法,欢迎观看完整视频回放了解。

关于视频回放和课件获取 

【视频回放】:视频回访已上传至龙蜥官网(可阅读原文直达):https://openanolis.cn/video 查看。
【PPT课件获取】:关注微信公众号(OpenAnolis),回复“龙蜥课件” 即可获取。有任何疑问请随时咨询龙蜥助手—小龙(微信:openanolis_assis)
—— 完 ——
加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。欢迎开发者/用户加入龙蜥社区(OpenAnolis)交流,共同推进龙蜥社区的发展,一起打造一个活跃的、健康的开源操作系统生态!

关于龙蜥社区龙蜥社区(OpenAnolis)由企事业单位、高等院校、科研单位、非营利性组织、个人等在自愿、平等、开源、协作的基础上组成的非盈利性开源社区。龙蜥社区成立于 2020 年 9 月,旨在构建一个开源、中立、开放的Linux 上游发行版社区及创新平台。龙蜥社区成立的短期目标是开发龙蜥操作系统(Anolis OS)作为 CentOS 停服后的应对方案,构建一个兼容国际 Linux 主流厂商的社区发行版。中长期目标是探索打造一个面向未来的操作系统,建立统一的开源操作系统生态,孵化创新开源项目,繁荣开源生态。目前,Anolis OS 8.6 已发布,更多龙蜥自研特性,支持 X86_64 、RISC-V、Arm64、LoongArch 架构,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。欢迎下载:https://openanolis.cn/download加入我们,一起打造面向未来的开源操作系统!https://openanolis.cn往期精彩推荐1.龙蜥社区招募推广大使&体验官啦!| 人人都可以参与开源

2.入门即享受!coolbpf 硬核提升 BPF 开发效率

3.龙蜥下游发行版 Alinux 和 UOS 成为 OpenSCAP 官方首批支持的国内 OS

4.龙蜥社区开源 coolbpf,BPF 程序开发效率提升百倍

5.SysOM 案例解析:消失的内存都去哪了 !

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存