LINUX.ORG.RU
ФорумAdmin

Срабатывание тригера CPU idle Zabbix

 , ,


0

1

Здравствуйте!

Отслеживаю в Zabbix время простоя CPU условием

({Template OS Linux:system.cpu.util[,idle].avg(180)}<10 and {TRIGGER.VALUE}=0) or ({TRIGGER.VALUE}=1 and {Template OS Linux:system.cpu.util[,idle].avg(600)}>50)

Смысл: если в течении 3 минут простой процессора меньше 10% - тригер срабатывает и встает в 1.

Если проблема с процессором существует и тригер уже стоит в 1, то встать в 0 он может только при условии простоя более 50% за последние 10 минут.

И мне на почту постоянно приходит письмо что

Trigger: CPU Idle time very small on name.com
Trigger status: OK
Trigger severity: High
Trigger URL: 

Item values:

1. CPU idle time (name.com:system.cpu.util[,idle]): 0 %
2. CPU idle time (name.com:system.cpu.util[,idle]): 0 %
3. *UNKNOWN* (*UNKNOWN*:*UNKNOWN*): *UNKNOWN*

Original event ID: 74521
Тригер встает в «нет проблемы» если загруженность процессора 100%. Где у меня ошибка?



Последнее исправление: GreyDjin (всего исправлений: 1)

А эти условия:

течении 3 минут простой процессора меньше 10%

при условии простоя более 50% за последние 10 минут.

Точно не могут одновременно выполниться? Интервалы усреденения ведь разные.

mky ★★★★★
()
Ответ на: комментарий от mky

Как я себе представляю, должно отрабатывать это условие. Есть выражение А и В. Между ними или. С = А или В Значит, если какое-то из выражений 1, то С=1. Так работает обычная алгебра-логика... A = (cpu.idle < 10% (180sec)) and (проблемы нет)) В = (cpu.idle > 50% (3600sec)) and (проблема есть))

Поскрипел, подумал, сложно как-то.

Вот у меня процессор прыгает, за 3 часа, такой график https://s.mail.ru/9eLf/uXEEyz6mZ

И письма скопом начинают сыпаться именно когда CPU Idle = 0% Просто одно за другим письмо идет. Как от этого избавится?

GreyDjin
() автор топика
Ответ на: комментарий от GreyDjin

Как вы себе представляете среденее за последние N-секунд?

Обясняю на пальцах. Пусть отсчёт раз в 10 секунд. За 600 секунд 60 отсчётов. Перые 42 отсчёта по 100%, потом 18 отсчётов по 0%.

Среднее за последние 180 секунд: (18*0)/18 = 0%

Среднее за последние 600 секунд: (42*100 + 18*0 )/60 = 70%

Либо делайте обоих условиях одинаковый интервал осреденения, либо как-то так:

or ({TRIGGER.VALUE}=1 and {Template OS Linux:system.cpu.util[,idle].avg(180)}>50 and {Template OS Linux:system.cpu.util[,idle].avg(600)}>50)

А может можно что-то другое сочинить с двум триггерами...

mky ★★★★★
()
Последнее исправление: mky (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.