Доброго времени суток.
Страшная история на ночь: есть иерархическая сеть нод zabbix. https://www.zabbix.com/documentation/2.0/manual/distributed_monitoring/nodes
Месяц назад одна из нод поймала deadlock и полностью прекратила слать что-либо на центральную ноду.
Все проверки актуальности данных выполнялись, судя по всему, на удалённой ноде, чтобы разгрузить центральную. Центральная нода этот факт полностью проигнорировала.
Былинный отказ. Хорошо что zabbix работал в тестовом режиме, и проблему с железом на одном из серверов поймала основная система мониторинга + management module сервера.
Вопрос: можно ли в zabbix каким-либо способом мониторить состояние удалённых нод? Простые проверки типа коннекта к порту тут не помогут.
Или получается, что для мониторинга системы мониторинга zabbix нужно поднимать отдельную систему мониторинга, больше заслуживающую доверия ( например, более привычный мне xymon ? )?