LINUX.ORG.RU
решено ФорумAdmin

Nagios, Zabbix, Cacti

 , ,


0

2

Собственно вопросъ. Чем лучше мониторить, сравнительно, небольшую сеть? Есть железка внутри сети, зовется d link dgs 1210-48, и под ней порядка 30-35 пека. Над ней висят микротики, но они не учавствуют в процессе. Понятно, что может возникнуть вопрос «А что ты хочешь мониторить?», ответ будет абстрактен, но ёмок. Все - что возможно, максимально удобно и с вариантом доступной настройки. Пару дней убил на поднятие заббикса, справился. Итог: сервер есть, что-то сканирует ,какую-то часть сети видит и мониторит (а в частности ,определяет, по каким протоколам можно ломануться), но при этом, видит только оборудование, типа роутеров и серверов. Как впилить пачку юзеров, понять не могу. Мануалы раскуривать достаточно сложно, ибо пока ищешь ответ на один вопрос, находишь еще килограмм проблем, и сидишь уже не с одной задачей, а с 10-ю. Нагиос поставился за 5 минут, все поднялось, что с этим делать дальше, не имею представления. Универсального руководства не нашел (заметим, не мана или дефолт-faq), а нормального руководства для умеющих читать. Cacti встал так же легко, и так же как и нагиос - не понятен мне в дальнейшей эксплуатации. В итоге, есть 3 сервиса, которые запущены, но толку от них НЕТ. Собственно ,я не думаю, что найду тут самаритянина, который будет овер 9000 времени помогать и отвечать на вопросы, но если есть линки на достойные маны, буду благодарен. Заранее прошу «умников» особого склада ума, не писать вне темы или ересь, дабы самоутвердиться на фоне начинающего пользователя. Таких товарищей буду сливать в игнор и забывать - как звали. Всем, кому хочется поделиться опытом, милости прошу. Буду рад дельному совету.

Егор 3"Б" - «Как я провел лето» 20.08.2014



Последнее исправление: HardMgn (всего исправлений: 1)
Ответ на: комментарий от router

а вот там это отдельная вакансия,у заббикса на самом деле очень хитрый синтаксис, там реально можно много что сделать, если этим заниматься профессионально и не отвлекаясь на другие задачи.

erzent ☆☆
()
Ответ на: комментарий от router

Дело не в том, что zabbix много что может, а в том, что в дефолтной конфигурации он не может практически ничего. И когда дело доходит до реальных задач, в ход идёт тяжёлое велосипедостроение

router ★★★★★
()
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от router

только вот программист 1С получает 80 шт валяя дурака, и я знаю 5 бывших админов ушедших по этой причине в программисты 1С.

erzent ☆☆
()

Zabbix посложнее и помощнее, nagios попроще и легче, cacti первый раз слышу

Xegai ★★
()

В zabbix'е большего всего напрягает разрастание таблиц в БД.
Сейчас я обхожу эту проблему partition'гом, но при очередной итерации, мне приходит 100500 уведомлений о сработанных тригерах.

blackst0ne ★★★★★
()
Ответ на: комментарий от router

В zabbix это добавляется через одно место, поэтому я даже не буду писать как я это делал.


Расскажи, как делал.
Потому что добавление банальной проверки, слушается ли какой-либо порт на хосте, не представляет проблемы.

blackst0ne ★★★★★
()
Ответ на: комментарий от erzent


я не вижу смысла в системах мониторинга без нормального веб интерфейса, пилить под нагиос свой это тупость, нагиос хорош чтобы мониторить сетевое оборудование,сделал карту и зашёл, посмотрел всё ли на месте и всё.


В zabbix'е тоже есть карты.

blackst0ne ★★★★★
()
Ответ на: комментарий от erzent


в заббикс сложно поместить мониторинг свичей и коммутаторов за 400 рублей.


Как ты их собрался мониторить из не_zabbix?

blackst0ne ★★★★★
()
Ответ на: комментарий от blackst0ne

switch.cfg , группа хостов и общие сервисы. Нагиос нормально почему то их мониторит, и сразу говорит об их ошибках, патере пакетов, что часто говорит о скором выходе из строя, а заббикс у меня плевал на них, а вот циски нормально заббикс мониторит.

erzent ☆☆
()
Ответ на: комментарий от erzent


switch.cfg , группа хостов и общие сервисы. Нагиос нормально почему то их мониторит, и сразу говорит об их ошибках, патере пакетов, что часто говорит о скором выходе из строя, а заббикс у меня плевал на них, а вот циски нормально заббикс мониторит.


Не понял. Каким образом nagios забирает данные со свитча? snmp?

blackst0ne ★★★★★
()
Ответ на: комментарий от blackst0ne

Одной проверки - да. Мне гораздо интереснее, как добавить список процессов. Например, есть штук дцать серверов, на которых запущено по 1..5 инстансов оракл.

Мониторинг нескольких однотипных item'ов через универсальный шаблон

В результате в macros на уровне хоста перечислял список инстансов. Скрипт для discovery получал на вход этот макрос, и возвращал тот же самый список, но в zabbix'овом json. По которому из прототипов автоматически клепались item'ы и trigger'ы

                <discovery_rule>
[...]
                    <key>fake_discovery.pl[{$ORACLE_SIDS}]</key>
[...]
                    <item_prototypes>
                        <item_prototype>
[...]
                            <name>pmon count for &quot;{#ENTITY}&quot;</name>
[...]
                            <key>proc.num[ora_pmon_{#ENTITY}]</key>
[...]
                    <trigger_prototypes>
                        <trigger_prototype>
[...]
                            <expression>{Template DB Oracle simple:proc.num[ora_smon_{#ENTITY}].last(#1)}#1</expression>
                            <name>smon count for &quot;{#ENTITY}&quot; is not 1</name>

fake_discovery.pl: http://pastebin.com/8inE5k3z

router ★★★★★
()
Ответ на: комментарий от blackst0ne

В zabbix'е тоже есть карты.

Только делать их нужно опять же самостоятельно, либо извращаться через не самый логичный zabbix api.

Пределом моего велосипедостроения стал скрипт, поторый обновлял screen с IOPS'ами рейдгрупп массива. В средней колонке IOPS'ы одной конкретной рейдгруппы, в левой - IOPS'ы физических дисков, в правой - IOPS'ы логических томов.

Примерно в это время я окончательно понял что [не люблю] zabbix, поэтому так и не дописал автоматику ( чтобы скрипт мониторинга писал item с сериализованной структурой дисков, а на стороне сервера скрипт по этой структуре автоматически обновлял screen ).

router ★★★★★
()
Ответ на: комментарий от erzent

Нагиос нормально почему то их мониторит, и сразу говорит об их ошибках, патере пакетов, что часто говорит о скором выходе из строя, а заббикс у меня плевал на них

Твоя судьба - допиливать шаблоны zabbix.

В zabbix, после ненадёжности его мониторинга, мне больше всего выносила мозг такая его особенность. Если ты внёс изменения в шаблон, особенно в discovery, совсем не факт что эти изменения автоматически придут на хосты, привязанные к шаблону. Часто требовалось отрывать хост от шаблона с удалением всех данных ( теряя статистику, которая необходима ), заново привязывать шаблон, и только потом изменения придут на хост.

router ★★★★★
()
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от erzent

Держи что хочешь. На мой взгляд, система мониторинга должна быть одна. zabbix имеет смысл держать в дополнение к основной системе мониторинга, но не как систему мониторинга, а в качестве системы визуализации данных.

router ★★★★★
()
Ответ на: комментарий от router

как для этого нужно держать кактус, нагиос это карта сети+мониторинг сетевого оборудования,заббикс это состояние железа,состояние баз данных, состояние, состояние веб серверов в удобных комплексных экранах.

erzent ☆☆
()
Ответ на: комментарий от HardMgn

Причем, я уверен, что заббикс все это может, но реализация для меня - темный лес. По капле в час, пока не узнаешь - что будет, если...

Вот тут Вы правы. Это инструмент, но его надо использовать, а что бы его использовать надо знать что делаешь и что нужно. Т.е. к чему я, из коробки будет мало функциональности и это понятно, Нужны шаблоны к интересующим Вас сервисам.

Все что Вы желаете zabbix может, но его этому надо научить!

petav ★★★★★
()
Ответ на: комментарий от router

Только делать их нужно опять же самостоятельно, либо извращаться через не самый логичный zabbix api.


Согласен.
Автоматическое построение карты - это было бы очень круто.

blackst0ne ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.