LINUX.ORG.RU

Zabbix + Prometheus (exporter). Пропускаются данные

 , ,


0

2

Здравствуйте, товарищи!

Ubuntu 18. Zabbix 5.0 + Postgres. Разные экспортеры прометея. Период опроса 1 минута.

Проблема: периодически появляются «пропуски» в сборе метрик. Данные собираются, обрабатываются, но потом может быть пропуск в 3,5,7минут, срабатывает триггер nodata на отсутствие данных с экспортеров. Затем само собой снова восстанавливается. Сбор восстанавливается, значения появляются.

При этом порт экспортера доступен. Повесил доп.проверку http на код 200. Она не алармит, т.е. сам экспортер доступен. И в ручном режиме он отдает данные, а вот заббикс почему-то не собирает их.

В логах вижу по одному из серверов :

32180:20201207:151616.064 item «MYSERVER:apache_exporter.get» became not supported: Cannot perform request: Connection timed out after 3000 milliseconds

32174:20201207:152413.715 item «MYSERVER:apache_exporter.get» became supported

в 15:16 ошибка получения данных, в 15:24 успех. И на графиках появляются пропуски. Сетевая недоступность отклоняется. С этого сервера prometheus собирает метрики по хостам и через графану все отображается корректно. Связь с экспортерами не пропадает.

Сам сервер. 4 vCPU, 8GB RAM, 200Gb SSD. Очереди пусты. Самодиагноситка заббикса показывает, что он не перегружен. Запас по пулам есть. Ссылка на скрины: https://yadi.sk/d/TVfg29DS95nc5A?w=1

Кто-нибудь сталкивался с подобным? В чем может быть дело?


Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.