История изменений

Исправление vbr, 01.01.23 23:35 (текущая версия) :

А по какому конкретному алгоритму он должен эти метрики объединять?

В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.

Возможно, ты хочешь как-то эти метрики аггрегировать в одну?

Я не знаю, что я хочу. Undefined behaviour (что это значит на практике?) точно не хочу. Я только начал настраивать сбор метрик на практически пустом кластере из двух серверов и там уже кардиналити за 30 000 была. Я так понял, это очень много. Ну у меня прометеус на таких объёмах сразу 200 МБ отожрал. Что будет, когда там будет больше серверов и сервисов. Так не пойдёт. Поэтому решил дропать всё кроме того, что я понимаю.

Пока такой конфиг у меня


  - job_name: cadvisors
    scheme: https
    metrics_path: /metrics/cadvisor
    authorization:
      credentials_file: /var/run/secrets/kubernetes.io/serviceaccount/token
    tls_config:
      ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    kubernetes_sd_configs:
      - role: node
    metric_relabel_configs:
      - source_labels:
          - __name__
        regex: "container_cpu_usage_seconds_total|\
                container_fs_reads_bytes_total|\
                container_fs_writes_bytes_total|\
                container_memory_working_set_bytes"
        action: keep
      - source_labels:
          - __name__
          - container
        regex: "container_cpu_usage_seconds_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_fs_reads_bytes_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_fs_writes_bytes_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_memory_working_set_bytes;"
        action: drop

Тут я сначала делаю whitelist метрик и потом дополнительно дропаю некоторые метрики, которые не понимаю что означают.

Исправление vbr, 01.01.23 23:33:

А по какому конкретному алгоритму он должен эти метрики объединять?

В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.

Возможно, ты хочешь как-то эти метрики аггрегировать в одну?

Я не знаю, что я хочу. Я только начал настраивать сбор метрик на практически пустом кластере из двух серверов и там уже кардиналити за 30 000 была. Я так понял, это очень много. Ну у меня прометеус на таких объёмах сразу 200 МБ отожрал. Что будет, когда там будет больше серверов и сервисов. Так не пойдёт. Поэтому решил дропать всё кроме того, что я понимаю.

Пока такой конфиг у меня


  - job_name: cadvisors
    scheme: https
    metrics_path: /metrics/cadvisor
    authorization:
      credentials_file: /var/run/secrets/kubernetes.io/serviceaccount/token
    tls_config:
      ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    kubernetes_sd_configs:
      - role: node
    metric_relabel_configs:
      - source_labels:
          - __name__
        regex: "container_cpu_usage_seconds_total|\
                container_fs_reads_bytes_total|\
                container_fs_writes_bytes_total|\
                container_memory_working_set_bytes"
        action: keep
      - source_labels:
          - __name__
          - container
        regex: "container_cpu_usage_seconds_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_fs_reads_bytes_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_fs_writes_bytes_total;"
        action: drop
      - source_labels:
          - __name__
          - container
        regex: "container_memory_working_set_bytes;"
        action: drop

Исходная версия vbr, 01.01.23 23:29:

А по какому конкретному алгоритму он должен эти метрики объединять?

В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.