Тестирую Zabbix в работе.
В какой то момент многие хосты стали выдавать такое сообщение.
Добавил ресурсов на Zabbix, не помогло.
top - 10:52:33 up 2:07, 1 user, load average: 3,50, 3,35, 3,29
Tasks: 178 total, 5 running, 173 sleeping, 0 stopped, 0 zombie
%Cpu(s): 34,7 us, 2,2 sy, 0,0 ni, 62,2 id, 0,4 wa, 0,0 hi, 0,5 si, 0,0 st
MiB Mem : 7977,7 total, 5787,4 free, 1251,4 used, 938,8 buff/cache
MiB Swap: 2045,0 total, 2045,0 free, 0,0 used. 6442,2 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1459 zabbix 20 0 378744 18372 4376 R 94,7 0,2 58:08.96 zabbix_server
1458 zabbix 20 0 379124 13216 4376 R 94,4 0,2 58:09.38 zabbix_server
1460 zabbix 20 0 374844 14376 4376 R 93,7 0,2 58:07.48 zabbix_server
1457 zabbix 20 0 744592 401352 22324 R 12,6 4,9 8:21.85 zabbix_server
550 mysql 20 0 4278268 362352 19336 S 1,0 4,4 2:43.45 mysqld
546 zabbix 20 0 26168 5684 4444 S 0,3 0,1 0:00.63 zabbix_agentd
620 www-data 20 0 231932 29748 21100 S 0,3 0,4 0:02.58 apache2
1430 zabbix 20 0 424280 83156 24252 S 0,3 1,0 0:02.09 zabbix_server
1443 zabbix 20 0 387480 23612 10392 S 0,3 0,3 0:00.07 zabbix_server
1469 root 20 0 11224 3912 3192 R 0,3 0,0 0:07.56 top
1 root 20 0 169440 10120 7860 S 0,0 0,1 0:01.63 systemd
2 root 20 0 0 0 0 S 0,0 0,0 0:00.00 kthreadd
3 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_gp
4 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_par_gp
6 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 kworker/0:0H-kblockd
8 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 mm_percpu_wq
9 root 20 0 0 0 0 S 0,0 0,0 0:00.04 ksoftirqd/0
10 root 20 0 0 0 0 I 0,0 0,0 0:08.65 rcu_sched
11 root 20 0 0 0 0 I 0,0 0,0 0:00.00 rcu_bh
12 root rt 0 0 0 0 S 0,0 0,0 0:00.02 migration/0
13 root 20 0 0 0 0 I 0,0 0,0 0:00.26 kworker/0:1-mm_percpu_wq
14 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/0
15 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/1
16 root rt 0 0 0 0 S 0,0 0,0 0:00.57 migration/1
17 root 20 0 0 0 0 S 0,0 0,0 0:00.02 ksoftirqd/1
Помогает перезапуск службы, но не надолго. То есть сами агенты не останавливаются.
Куда копать, подскажите?