История изменений
Исправление Hanuken, (текущая версия) :
Есть два параметра, ограничивающие размер хранилища метрик, по времени хранения и по фактическому размеру. Их достаточно для того, чтобы на отдельном прометеусе не заваливаться метриками через какое-то время. На условно маленьких инсталляциях проблем нет совсем.
Сложности начинаются тогда, когда метрик действительно много и часть из них нужны на долгий срок, а часть нет. И тут не обойтись без разделения ролей прометеусов. При больших объёмах данных всё равно рано или поздно придётся сегментировать.
В целом получается удобная конструкция. На отдельных кусках инфраструктуры ставятся прометеусы для «сырых» данных, хранящие их всего час. Затем нужные данные по сегментам собираются другими прометеусами верхнего уровня, где уже агрегируются и отдаются в графаны, алерты и т.п. и хранятся очень долго (у меня три года, больше просто не требуется, хотя можно).
Исходная версия Hanuken, :
Есть два параметра, ограничивающие размер хранилища метрик, по времени хранения и по фактическому размеру. Их достаточно для того, чтобы на отдельном прометеусе не заваливаться метриками через какое-то время.
Проблема возникает тогда, когда часть метрик нужны на долгий срок, а часть нет. И тут не обойтись без разделения ролей прометеусов. При больших объёмах данных всё равно рано или поздно придётся сегментировать.
В целом получается удобная конструкция. На отдельных кусках инфраструктуры ставятся прометеусы для «сырых» данных, хранящие их всего час. Затем нужные данные по сегментам собираются другими прометеусами верхнего уровня, где уже агрегируются и отдаются в графаны, алерты и т.п. и хранятся очень долго (у меня три года, больше просто не требуется, хотя можно).