LINUX.ORG.RU
ФорумAdmin

Как стильно, модно, молодежно мониторить сервера в 2018 году?

 , ,


2

3

Всем хорошего дня.

Увеличивается количество серверов на debian. Назначения различные. Настроены уведомления в телеграм и почту с помощью скриптов на python. Срабатывают при запуске события и сообщают затем результат его выполнения. Не очень удобно. Так как приходится проверять утром телегу и почту и вспоминать от каких серверов какие уведомления пришли, а какие нет. Логичнее было бы уведомлять только тогда, когда есть проблема. Но нужно тогда мониторить работает ли сервер вообще. А то выключенный сервер не отправит уведомление как и тот, на котором все хорошо.

Надеюсь тут я понятно объяснил. Так как я еще год-два назад имел лишь поверхностные знания и по сути учился по ходу работы, то с системами мониторинга по типу zabbix, я не сталкивался. Теперь же есть реальная необходимость. Перехожу к сути.

Расскажите, что сейчас из актуального софта можно развернуть для мониторинга debian-серверов, с возможностью отправки уведомлений и контроля доступности самих серверов. Желательно с возможностью настройки что именно мониторить.

Кроме zabbix. Про него я знаю. Но вдруг есть что-то еще интересное. Просто поделитесь своими мыслями и расскажите как сами мониторите свои сервера. Спасибо!=)


TICK stack, еще в идеале ELK в качестве централизованного логохранилища.

Если по босоте - то netdata.
Ну и тут недавно был тред с разбором этого вопроса.

Deleted
()
Ответ на: комментарий от Deleted

Если не затруднит, то ссылку на недавний разбор киньте.

kerby
() автор топика

Джва года хочу написать приблуду которая будет получать по email регулярные отчёты (от всяких там бекапных скриптов и тому подобного), проверять их регэкспами и слать мне сводный отчёт по этим отчётам (ну там список отчётов в которых проблем нет, список отчётов с отклонениями от шаблона, список не пришедших отчётов)

MrClon ★★★★★
()

prometheus+alertmanager+grafana. если данных много, можно еще в influx складывать.

и мониторинг и алертинг и красивая дашборда с любыми данными какими захочешь

Suicide_inc ★★
()
Последнее исправление: Suicide_inc (всего исправлений: 1)

netdata/node_exporter + Prometheus + Alertmanager + Grafana уже предлагали? А логи в ёлку.

intelfx ★★★★★
()
Последнее исправление: intelfx (всего исправлений: 1)

Вопрос вроде адекватный, зачем в названии темы какую-то подростковую заезженную глупость писать?

anonymous
()
Ответ на: комментарий от Deleted

Пистоны и прочие баши обычно высераются не очень machine friendly стэктрейсами и ворнингами. В особо замечательных случаях о проблеме меожет сигнализировать только одна строчка в stderr.
При таком раскладе надо либо перепиливать все скрипты так чтобы они перепроверяли каждое своё действие и выдавали machine friendly отчёты, либо проверять выхлоп (stdout+stderr) на отсутствие неожиданных вещей. Сейчас я делаю это нейросеткой (собственной, естественной :). Выхлоп генерится тоже по шаблону, так-что ресурсов на это требуется мизер, но автоматизировать всё-равно хочется. По идее проверить соответствие текста известному шаблону дело не хитрое

MrClon ★★★★★
()

Если дешево, сердито и без особых затрат на инфраструктуру - то logcheck. Делаешь syslog-сервер, заворачиваешь все свое хозяйство на него, пишешь пачку регекспов для отсечения ненужного, остальное прилетает к тебе на почту в виде регулярного сводного отчета. Стейты мониторить отрядом специально обученных баш-скриптов, которые так же будут срать в сислог из которого логчек будет тебе делать письма.

slowpony ★★★★★
()
Последнее исправление: slowpony (всего исправлений: 1)
Ответ на: комментарий от MrClon

тоже нейросетку хочу, но так лень всё это изучать. есть подобное чтоб наговнокодить по минимуму и прям вообще супер абстрактно от теории?
ну типа для детей 5 лет?

system-root ★★★★★
()
Ответ на: комментарий от system-root

Она у тебя уже есть (наверное), между ушей лежит (:
Только она масштабируется плохо, вот я и хочу её заменить регуляркой

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

хотя да. жопкой читаю. для этого нужно чтото придумывать

ggrn ★★★★★
()

В серверной сидишь и мониторишь - мне так один чел. на собеседовании говорил. Это надежнее, чем всякие системы мониторинга.

anonymous
()

zabbix, nagios, netxms, cacti, dude ... тут смотря что у тебя за серера и что ты хочешь мониторить

Deleted
()

Обрей голову и намажь зелёнкой.

anonymous
()

Zabbix. Просто, удобно, бесплатно. Шаблоны есть почти подо все на свете, а подо что нет - напишешь сам.

dpronyaev
()

Zabbix + PageDuty - доступность серверов/сервисов.
Graylog - мониторинг логов на события.

Mr_Alone ★★★★★
()

Был такой вопрос на собеседовании на сисадмина в известную ит-компанию:
Каждое утро с будильником в течении года вы получаете смс-ку - в кране есть горячая вода. Если вы однажды не получите такой смс-ки, что изменится в вашей жизни вообще?

Перефразирую: зачем вы мониторите <факт>?
Ответ на этот вопрос разделяет людей на администраторов и ит-мимо-крокодилов.

Подсказываю: администраторы стремятся сделать систему надёжной и в надёжной системе мониторят только ненадёжное железо и статистически важные факты.

Вообще на пальцах: мониторинг подбирают под задачи, конечный результат которых тоже хорошо бы озвучить.

Жж-мониторинг-стори: у меня раньше был целый комплекс мониторинга, я был фанатом мониторинга и конечно дрочил на мониторинг. У меня были и нагиос, и заббикс. Я пользовался почти всем, чем оброс еластик. Я с такими же фанатами мониторинга довёл почти до совершенства опенснмп. Несколько физических лог-серверов моей компании собирали всё что только можно придумать, рисовали красивые цветные графики и строили таблицы эффективности и прогнозы.
Но однажды я дорос до осознания простой вещи - мне пофиг на смс-ку про горячую воду - я всё равно буду мыть лицо и чистить зубы - настроенная система самодостаточна и ненуждается в мониторинге. Теперь я мониторю только предпродакшн в стресс-тестах, скрупулёзно пишу роли в ансибл на все возможные ситуации и меня не будят смс-ки очень важной, но по сути ненужной инфой. Да, я собираю статистику для аналитиков, но это частный случай мониторинга и это конкретные задачи.

Автор, тебе мониторинг зачем?

Ответ про модно молодёжно, но с другой стороны философии о приглядывании за системой: ansible & tower

bass ★★★★★
()
Ответ на: комментарий от bass

Ответ про модно молодёжно, но с другой стороны философии о приглядывании за системой: ansible & tower

Не взлетит. SNMP? Оверхед на ssh?

Mr_Alone ★★★★★
()
Ответ на: комментарий от bass

ты не дорос, а стал эгоцентричным.
завтра случится бас фактор и никто не сможет ответить на вопрос — это сервер начал тормозит или он всегда так работал.
вот дяденька как-то в интернетах сказал

Observability doesn't mean bundling metrics, logging, and traces in a single tool and calling it done. Observability is the degree to which you can easily ask questions and get great answers.

system-root ★★★★★
()
Ответ на: комментарий от bass

Ничего не понял. Ты рекомендуешь не мониторить прод или что ты имеешь ввиду?

v9lij ★★★★★
()
Ответ на: комментарий от Deleted

Слишком мало уровней. Надо ещё хотя бы два, и будет девопсненько.

AlexAT
()

В 99.9% случаев хватит Zabbix. Специфичные случаи решаются интеграцией специфики с таковым.

AlexAT
()
Ответ на: комментарий от bass

Каждое утро с будильником в течении года вы получаете смс-ку - в кране есть горячая вода. Если вы однажды не получите такой смс-ки, что изменится в вашей жизни вообще?

Глупый вопрос. Придуманный не очень умным hr.

Но раз вы заговорили про ту же воду

Но однажды я дорос до осознания простой вещи - мне пофиг на смс-ку про горячую воду - я всё равно буду мыть лицо и чистить зубы - настроенная система самодостаточна и ненуждается в мониторинге.

давайте посмотрим на эту же ситуацию со стороны «поставщиков» воды вам. Где-то, хз где, разорвало магистральную трубу диаметром под 1000, хлещет фонтан из под земли, а нам пох на мониторинг и то что давление упало, подождем пока пользователи не позвонят. Да и забыть про магистраль, можно и другое учудить, так что магистральный трубопровод будет жив, а у тебя в квартире на нижних этажах краны повышибает. И я это пишу только про воду. Не забываем про всякий газ и т.п.

anc ★★★★★
()

Что не день, то дежавю... Доколе на такой тупняк будут реагировать? Очередной «графоман с инициативой» задаёт вопрос, ответ на который есть уже даже в сраной википедии.

King_Carlo ★★★★★
()
Ответ на: комментарий от deep-purple

Если отчёт не пришёл в заданный временной интервал то в сводном отчёте будет инфа что отчёт не пришёл, значит что-то пошло не так.
Это не замена мониторилкам вроде nagios, которые будят админа посреди ночи через минуту после падения сервиса, это про другое

MrClon ★★★★★
()
Ответ на: комментарий от MrClon

Да, я вот об этом. Т.е. твоя тулза задумана только для твоего кейса.

deep-purple ★★★★★
()
Ответ на: комментарий от anc

Вопрос не очень умного эйчара ты конечно не понял и тебя понесло в дизастер-фантазии. Всего хорошего, проходите мимо.

bass ★★★★★
()

openitcockpit (+naemon)

Интерфейс для конфигурирования Nagios и Naemon (бесплатный) https://openitcockpit.io/

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.