LINUX.ORG.RU
ФорумAdmin

Простой мониторинг множества серверов

 ,


3

6

Привет, ЛОР. Такая ситуация, что серверов в моем распоряжении стало как-то слишком много и все они падают довольно сложно стало за всем следить.

Потыкал я мониторинги в целом — и какое-то они говно полное. У одного полный разбор состояния сервера с кучей графиков, но никакой сводной таблицы нет. Другой просто в целом слишком спартанский.

Вот как я вижу идеально подходящий мне мониторинг:

  • Одна таблица, полностью умещающаяся на экран. Одна строчка — один севрер.
  • Столбцы:
    • жив ли вообще сервер (uptime) или сколько времени он уже не жив
    • температура
    • количество доступных апдейтов
    • состояние выбранных определенных сервисов (с возможностью отобразить время работы, т.е. время с предыдущего падения)

И... всё. Я уже настолько отчаялся, что даже готов потрахаться с настройкой всего этого дела, а не взять всё уже готовенькое.

Есть ли что-то подобное?

★★★★★

nagios.x86_64 4.3.2-8.el7 epel

anonymous
()

Подписался и плюсанул вопрос.

Я уже настолько отчаялся, что даже готов потрахаться с настройкой всего этого дела, а не взять всё уже готовенькое.

Ну возьми grafana + influxdb + самописный агент на питоне.

intelfx ★★★★★
()

Напиши сам, там же одна страничка(по твоим словам), где под капотом вызов скрипта по snmp/whateveryoulike

zolden ★★★★★
()

а какие именно пробывал?

ving2
()

Под это описание вообще любая система мониторинга подходит. Но надо настраивать.

Black_Shadow ★★★★★
()
Последнее исправление: Black_Shadow (всего исправлений: 1)

Я бы использовал zabbix потому как всегда хочется добавить что-то новое а кастыльное решение рано или поздно треснет.

Но можете посмотреть связку collectd и скажем графану

jo_b1ack ★★★★★
()
Ответ на: комментарий от nikolnik

А что в забиксе такого что задолбаешься настраивать? Сделай шаблоны под нужные устройства(или скачай на шаре забикса) и готово... Не знаю что все так его боятся...

jo_b1ack ★★★★★
()

netdata, опционально Grafana и InfluxDB
Uptime можно мониторить сторонним сервисом.

количество доступных апдейтов
с возможностью отобразить время работы, т.е. время с предыдущего падения

На счет этих пунктов подсказать ничего не могу. Авто-обновление во все поля. И что-то падает только если заканчивается память.

anonymous_sama ★★★★★
()

Ну элементарно же всё

Одна строчка — один севрер.

На серверы раскидываешь скрипт, который выдает вот эту нужную тебе строку (для каждого сервера свою)

И главный скрипт

dsh -c -M -f servers.list /usr/local/bin/your_script.sh

Получишь таблицу с инфой и строку ошибки подкл. если сервер не доступен.

futurama ★★★★★
()

Бери сенсу, подключай только нужные чеки. И uchiwa, как морда.

Difrex ★★★★
()

Множество - это на один экран? Хм. Nagios/Icinga2

stave ★★★★★
()
Ответ на: комментарий от anonymous_sama

Авто-обновление во все поля

У меня оно везде, но только для секьюрити-апдейтов

derlafff ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.