load average 过高, mount nfs 问题处理
2022-3-14
周末, 有一台服务器告警: 系统负载过高, 最高的时候都已经到 100 +, 以下是排查&处理的具体过程.
发现的问题/现象 #
uptime
显示 load average 都在70+
#
因为服务器是40核心, 原则上负载40是满负荷, 现在明显存在大量等待的任务. 继续往下分析进程, 看具体那个进程一直在堵塞.
ps -ef
执行到某一个进程就卡住了
#
命令执行如下:
...