Linux实用监控脚本——使用 Shell检测进程 CPU 利用率
在对应用服务进行维护时,我们经常遇到由于 CPU 过高导致业务阻塞,造成业务中断的情况。CPU 过高可能由于业务量过负荷或者出现死循环等异常情况,通过脚本对业务进程 CPU 进行时时监控,可以在 CPU 利用率异常时及时通知维护人员,便于维护人员及时分析,定位,以及避免业务中断。 下面的函数可获得指定进程 ID 的进程 CPU 利用率。它有一个参数为进程 ID,它首先使用 ps 查找进程信息,同时通过「grep -v」过滤掉「%CPU」行,最后通过 awk 查找 CPU 利用百分比的整数部分(如果系统中有多个 CPU,CPU 利用率可以超过 100%)。 对业务进程 CPU 进行实时监控
下面的功能是通过上面的函数 GetCpu 获得此进程的 CPU 利用率,然后通过条件语句判断 CPU 利用率是否超过限制,如果超过 80%(可以根据实际情况进行调整),则输出告警,否则输出正常信息。 判断 CPU 利用率是否超过限制
示例演示: (1) 源程序(假设上面已经查询出 TestApp 的进程 ID 为 11426)
(2) 结果输出
(3) 结果分析 从上面的输出可见:TestApp 程序当前的 CPU 使用为 75%,是正常的,没有超过 80% 的告警限制。 作为 IT 运维工程师,对单个进程CPU利用率设置监控告警可以在一定程度上降低系统异常,保障业务稳定的运行。试想,如果拥有一个能够监控全局,实现业务告警风险提醒的运维协作工具呢?定能极大提升工作效率,加强团队运维保障能力! 【编辑推荐】
点赞 0 (编辑:52站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- windows-server-2008 – 更改Windows SID如何影响SQL Serve
- Linux的15个命令行别名,帮系统管理员提升工作效率!
- Windows 10与Windows 7各有所长,你明白你的电脑该装哪个操
- 在树莓派上安装Ubuntu MATE
- 使用strace查找Emacs启动阻塞的原因
- Windows 10新补丁KB4515384成噩梦:Bug接连不断
- 微软Windows11更新Alt+Tab UI毛玻璃横向排列,教你强制开启
- Windows 10系统,0xc00000e9黑屏代码如何修复?
- 开源的成长之痛:AWS们终成吸血鬼
- Windows 10 21H2即将面世 微软再推送可靠性补丁更新 KB4023