Всем добрый день. Пытаюсь уже несколько дней настроить алерт на down контейнера и все четно. Если использовать правило
absent(container_last_seen{container_label_com_docker_stack_namespace="prom-exp",container_label_com_docker_swarm_task_name=~"prom-exp.*"})
работает на ура, но нет информации о контейнере. Но если использовать (time() - container_last_seen{ container_label_com_docker_stack_namespace="prom-exp",container_label_com_docker_swarm_task_name=~"prom-exp_nginx-exp.*"}) > 20
правило не срабатывает или срабатывает 5 из 100 проверок. Просьба помочь или подсказать, как правильно настроить алерт.
Ответ на:
комментарий
от AnDoR
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Управление инцидентами на основании алертов prometheus (2024)
- Форум prometheus - посмотреть какие алерты привязаны к хосту (2019)
- Форум Prometheus, мониторинг запущенных docker контейнеров (2020)
- Форум Fail2ban-regex (регулярные выражения) (2023)
- Форум Prometheus (2021)
- Форум Посоветуйте тулзу для реагирования на алерты Prometheus и события systemd (2018)
- Форум prometheus (2012)
- Галерея Grafana + Prometheus (2020)
- Форум prometheus nginx (2019)
- Форум Мониторинг Prometheus (2020)