Добрый день. Мы в процессе перехода с nagios на prometheus (по некоторым причинам, не суть важно). В самом начале столкнулся с проблемой - в прометее вообще возможно посмотреть какие алерты привязаны к хосту (кроме как заглядывания в alerts.rules)? Сейчас конфиг нагиоса генерим через самописный скрипт, скрипт запускается в одной из частей роли ансибла (скрипт берет переменные yaml из host_vars для построения конфига) - нам это дает, что мы можем посмотреть какие проверки привязаны к хосту как в ансбиле, так и в веб-интрефейсе нагиоса. Yaml примерно такой:
nagios: [
"ssh", "exim", "user", "raid", "inode", "mem",
{"load": {args: ["28.0,24.0,20.0", "30.0,28.0,24.0"]}},
{certificate_port: {name: "Cert site", args: ["test.ru", 443, 15, 5], rare: 1}},
{disk: {name: "hdd-var", args: ["15%", "10%", "/dev/mapper/hdd-var"]}},
{disk: {name: "hdd-root",args: ["15%", "10%", "/dev/mapper/hdd-root"]}},
{smart: {name: "SMART sda", args: ["ata", "/dev/sda"]}},
{smart: {name: "SMART sdb", args: ["ata", "/dev/sdb"]}},
{smart: {name: "SMART sdc", args: ["ata", "/dev/sdc"]}},
{smart: {name: "SMART sdd", args: ["ata", "/dev/sdd"]}},
{mailq: {args: [5, 10]}}
]
В прометее хотим добится нечто такого же (просмотр всех проверок, привязанных к хосту), но уйти от этого костыля (питон скрипта, генерирующего конфиг). В веб-интерфейсе прометея на вкладке Alerts можно увидель только какие алерты сейчас «горят» на каких хостах, в PromSQL по запросу ALERTS_FOR_STATE выдает в принципе тоже самое. А хотелось бы посмотреть все проверки, даже если они в состоянии «green». Пока идея в том, что брать переменные из host_vars и другим питон-скриптом генерировать конфиг для alert.rules . Т.е. такая информация (о всех привязанных проверках) будет видна только на уровне ансибла. Может есть какой-то сторонний веб-интерфейс где данная проблема решена?