LINUX.ORG.RU

Вышел Zabbix 4.0

 , , ,


4

3

Состоялся релиз свободной системы мониторинга с открытым исходным кодом Zabbix 4.0. Zabbix – универсальная система для мониторинга производительности и доступности серверов, инженерного и сетевого оборудования, приложений, баз данных, систем виртуализации, контейнеров, ИТ-сервисов, Web-сервисов.

Система реализует полный цикл от сбора данных, их парсинга, анализа получаемых значений, и заканчивая их хранением, визуализацией и рассылкой оповещений, используя правила эскалации. Представляет гибкие возможности расширения методов сбора и оповещений, а также возможности по автоматизации через API. Единый веб-интерфейс реализует централизованное управление конфигурациями мониторинга и распределение прав доступа различным группам пользователей. Код проекта распространяется под лицензией GPLv2.

Zabbix 4.0 - это LTS версия с пятилетней поддержкой. Рекомендуется для пользователей, которые ориентируются на надёжность и длинный цикл внедрения программных продуктов.

Основные улучшения версии 4.0:

  • Новый встроенный тип элемента данных “HTTP агент” для универсального сбора данных по протоколам Rest API, XML, SOAP, JSON RPC, Prometheus и неструктурированных данных
  • Управление пользовательскими правами просмотра проблем, основанное на тэгах
  • Улучшение общей производительности сервера и прокси в среднем на 10-20%
  • Существенное ускорение передачи данных при использовании прокси благодаря компрессии передаваемых данных
  • Новый расширенный виджет для графиков: выбор элементов по шаблону, отображение проблем, и много других усовершенствований
  • Идентификация пользователей позволяющая интегрироваться с single signon решениями
  • Полноэкранный режим киоска для всех страниц секции мониторинга
  • Поддержка удобного просмотра списка проблем в сжатом виде
  • Новый очень практичный селектор выбора периода времени
  • Официальная поддержка ElasticSearch как движка для хранения исторической информации
  • Возможность использования инвентарной информации в тегах проблем
  • Более гибкая работа с проблемами: возможность комментариев без действий, ручного изменения важности проблем
  • Возможность форсирования выполнения проверки или LLD правила из интерфейса
  • Поддержка управления обслуживания устройств с помощью тегов
  • Улучшенные встроенные дашборды, доступные при установке
  • Гибкий фильтр про тегам в списке проблем с дополнительными возможностями
  • Оптимизация интерфейса для людей с нарушениями зрения плюс две дополнительные высококонтрастные темы
  • Возможность поиска проблем по имени
  • Возможность изменить принадлежность устройства к шаблонам при повторной авторегистрации
  • Более сдержанный дизайн виджетов без показа времени обновления
  • Новая проверка vfs.dir.count на стороне агента для рекурсивного подсчёта количества файлов (и не только!) в директории
  • Дублирование собранных данных (значения метрик, проблемы) в локальную файловую систему в режиме реального времени
  • Поддержка условия “не соответствует регулярному выражению” для правил LLD
  • Возможность отправки одного емайл сообщения сразу нескольким получателям
  • Более развёрнутое сообщение об ошибке в случае проблем с доступностью базы данных
  • Разрешено использовать главные элементы данных (master items) для прототипов элементов данных
  • Удалена секция Мониторинг->Триггеры из интерфейса
  • Увеличен размер DNS имени устройств
  • Поддержка макросов вида $1-$9 помечена как устаревшая и будет удалена в версии 5.0

Для перехода с более ранних версий необходима лишь установка новых серверных бинарных файлов (сервер и прокси) и нового интерфейса. Zabbix автоматически проведёт процедуру апгрейда базы данных. Установка новых агентов не требуется.

С полным списком всех изменений вы можете ознакомиться в документации.

>>> Подробности



Проверено: Shaman007 ()
Последнее исправление: alexvl (всего исправлений: 1)
Ответ на: комментарий от splinoz

А как оно на нагрузках ?

Помню лет 7 назад на 500 хостах он тормозил конкретно так и пришлось nagios юзать, так там все летало ... и до сих пор летает а хостов уже намного больше.

mx__ ★★★★★
()
Ответ на: комментарий от mx__

Наверное кто-то сможет ответить по вопросам производительности на основе своего реального опыта, но мы смотрим на такое количество хостов как на маленькую инсталляцию - это даже далеко не средний уровень по нынешним возможностям продукта.

alexvl
() автор топика
Ответ на: комментарий от mx__

Я тут на Ютубе ролик видел... Щас поищу... Так там рассказывается, что Магнит мониторит все свои точки Заббиксом. Десятки тысяч точек(=групп узлов сети), сотни тысяч хостов... и 4 скрипта на перле, которые автоматизируют добавление-удаление-discovery новых точек.

А, вот видео: https://youtu.be/5hsYYA7P7II

P.S. Я так понял, что сам основатель Заббикса в треде. alexvl, мое почтение.

omgiafs
()
Ответ на: комментарий от alexvl

alexvl, Вам просто для информации. ФГУП «Российская телевизионная и радиовещательная сеть» (РТРС) в начале строительства сети цифрового телерадиовещания на территории России (строительство только-только завершается) для мониторинга сети использовало ваш продукт. И использует его сейчас, хотя он стал «неофициальным» средством мониторинга. Удобная штука для подобных дел, как оказалось :)

Правда, мониторинг не централизованный, а разрозненный, в каждой области свой сервак, и он никуда ничего не проксирует. Каждый филиал следит за своей кучей оборудования, разбросанной без преувеличения по всей стране. У вас тут опенсорс, бабла не распилишь, поэтому они перешли на DataMiner Cube от SkyLine communications :) Если бы хватило ума в вас вложиться, то и вам бы лучше сделали, и под себя систему подрихтовали, им там в основном надо перерывы вещания фиксировать и на их основе ведомости с протоколами составлять для расчётов с вещателями.

Так что гордитесь :) Даже гос.конторы Заббиксом пользуются :)

omgiafs
()
Ответ на: комментарий от omgiafs

Такие истории не в новинку, я к этому спокойно отношусь. Есть разница: делается ли что-то для галочки, либо по-настоящему с пользой для дела. Во втором случае кому-то необходимо взять на себя ответственность за решение, а это непросто.

alexvl
() автор топика

Новый встроенный тип элемента данных “HTTP агент” для универсального сбора данных по протоколам Rest API, XML, SOAP, JSON RPC, Prometheus и неструктурированных данных

Можно выкидывать grafana?

micronekodesu ★★★
()

Каковы его плюсы и минусы по сравнению с компонентами Elastic Stack? У Zabbix есть какие-то свои средства сбора данных из логов? Или он может заменить только Kibana?

olegd ★★★
()

Спасибо, отличный продукт!

А добавления фичи ZBXNEXT-599 когда можно ожидать, наконец?...

anonymous
()
Ответ на: комментарий от anonymous

Почти реализовали в 4.0! Решили отложить до лучших времён, чтобы не задерживать релиз.

alexvl
() автор топика

Блин, пока я крутил, вертел, изучал 3й, то уже успел выйти 4й. Чую так в продакшн я и не запущу его. :(

hanharr
()

интересно, так же всё плохо как в 3.4.0 или чему-то научились?

anonymous
()

Годно! К конференции приурочили? На ДевОпс дей в Риге неделю назад про 4 версию релизникто даже не сказал... но пяток ручек я стырил

WindowsXP ★★
()

Недавно пердолися, не осилил с 3.0 до 3.4 обновится. Так и не понял, что нужно делать, чтобы бд нормально обновилась, морда во всю плевалась ошибками из mysql, пришлось откатить. В итоге, вроде, на 3.2 остановился. Ручками наугад поправив базу и баг в скриптах, который проявлялся на php7 и который в 3.4 пофиксили, заработало.

alexvl, я же правильно понимаю, что сервис сам должен бд обновлять?

WitcherGeralt ★★
()

Так и не понял как fping интегрировать. Делал все строго по инструкции, в том числе права выставил и suid бит на fping

gobot ★★★★
()
Ответ на: комментарий от gobot

В наборе скриптов, который я нафигачил для установки (на случай, если кому-нибудь придётся повторить) из исходников, файл fix-fping.sh выглядит так:

ln -s $(which fping) /usr/sbin/fping
ln -s $(which fping6) /usr/sbin/fping6

Мб там пути к исполняемым файлам захардкожены. Не помню почему так.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)

Ооо я только обнову с 3.0.4 на 3.4 обкатывал на стенде, а тут уже и 4 подьехала, надо заценить

jo_b1ack ★★★★★
()

отборное г...цо. написано пыхерами. шаг влево, шаг вправо - валится. подходит только чудо-админам, которые нихрена не соображают в том, что они делают. все инструкции написаны для идиотов: «нажмите сюда, напишите это в этот файл».

anonymous
()

Тут некоторые жаловались, что заббикс не реализует подход «Infrastructure as code», как ему удаётся держаться на плаву без этой ценнейшей инновации?

Pyzia ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Всё верно - при запуске новой версии сервера он автоматически доводит базу данных до правильного состояния.

На самом деле, очень странно слышать о подобных проблемах. Такое бывает, когда пользователи неосторожно модифицируют структуру базы данных.

alexvl
() автор топика
Ответ на: комментарий от mx__

Несколько тысяч хостов (а может, и больше десятка тысяч) держит. Правда, коллеги alexvl помогают за бабло, в т.ч. патчами. Но держит. История за год, с каждого хоста, навскидку, в среднем ~60 метрик, ~15 триггеров.

Алсо, alexvl, есть какие-нибудь ломающие изменения по API? 3.4 нам крови попортил немало с переделанными дельтами :(

leave ★★★★★
()
Ответ на: комментарий от leave

Изменения в API в новых мажорных версиях всегда есть. Я ведь не знаю, какие методы вы используете. Внимательно читайте документацию. :)

alexvl
() автор топика
Ответ на: комментарий от alexvl

В 3.4 не все изменения были полностью отражены, к сожалению. Номер задачи в вашей джире могу завтра посмотреть ;)

leave ★★★★★
()

Хорошо, очень хорошо.

GPLv2 тоже неплохо (спасибо, что не v2+ и уж тем более v3).

alexvl, почему в новости 4.0, а на скриншоте — 4.2.0a1? Shaman007, это ж видно даже на превьюшке, лол.

r3lgar ★★★★★
()
Ответ на: комментарий от Pyzia

Потому что кому-то шашечки, а кому-то ехать

anonymous
()
Ответ на: комментарий от alexvl

К сожалению, при апгрейде они автоматически не появятся, как и новые шаблоны.

что-то мешает или добавить при апгрейде или положить скрипт для добавления?

anonymous
()
Ответ на: комментарий от gobot

Ну я же написал:

Мб там пути к исполняемым файлам захардкожены

Из твоих слов выходит, что нет.

Я не админ в принципе и не админю заббикс в частности, то был разовый квест, так что я вникал ровно до той степени, чтобы оно заработало.

WitcherGeralt ★★
()
Ответ на: комментарий от Pyzia

В связке с ансиблом задуманное реализуется очень даже легко. Вся инфраструктура может храниться и управляться через inventory-files.

kvaps
()
Ответ на: комментарий от kvaps

И всё-таки, это выглядит как костылёк, хотелось бы изкоробочного решения, а его нету.

Pyzia ★★★★★
()

Бяка какая выползла

slamd64 ★★★★★
()
Ответ на: комментарий от alexvl

как-то получилось, что я использую nagios.
но хочу выразить благодарность людям, делающим хороший продукт.
спасибо!

dada ★★★★★
()

Influxdb нативно, без костылей, умеет?

anonymous
()

Кто нибудь разобрался как можно с помощю zabix-proxy пробрасывать клиентов с шифрованием PSK?

anonymous
()

Насколько оно пересекается по функциональности и назначению с Telegraf? Имеет смысл только для группы серверов/воркстейшенов? Или для одинокого домашнего сервера с десятком контейнеров тоже подойдет?

totik
()

А я всё жду пока кто-нибудь запилит новость про релиз Mir 1.0,... наверное, не дождусь.

anonymous
()
Ответ на: комментарий от anonymous

Пропишите ключи и всё само заработает, не важно как мониторится с прокси или без.

alexvl
() автор топика

По сравнению с другими NMS, Zabbix - помойка метрик.

Odalist ★★★★★
()
Ответ на: комментарий от mx__

на эластике - не тестил пока. на постгре под ~5к хостов приходилось тюнить чтобы работало нормально

splinoz
()
Ответ на: комментарий от mx__

Почему-то никто об этом тут не сказал, но дело обычно не в количестве хостов. Количество получаемых метрик в секунду и длительность хранения истории гораздо больше скажет о нагрузке.

И в итоге обычно тормозит не сам заббикс, а БД под ним, и тюнить приходится именно базу. В большинстве случаев достаточно просто партиционировать таблицы истории - это даёт, пожалуй, самый большой выхлоп в отношении к затраченным усилиям.

Если ты собираешь несколько тысяч метрик в секунду и хранишь историю неделю - история распухает до нескольких сотен гигов. Тут уже без вариантов приходится накачивать сервер оперативкой, либо использовать SSD для самой базы или кеша.

melkor217 ★★★★★
()
Последнее исправление: melkor217 (всего исправлений: 1)

В последнее время замечаю, что многие программные поделия, имеющие в названии *LTS , будто бы специально поганятся разработчиками. Особенно визуально. Был же нормальный интерфейс в 3.4. Нет, надо сделать его ущербным, сломав красивые кнопочки на графиках.

xroft
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.