История изменений
Исправление vbr, (текущая версия) :
А по какому конкретному алгоритму он должен эти метрики объединять?
В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.
Возможно, ты хочешь как-то эти метрики аггрегировать в одну?
Я не знаю, что я хочу. Undefined behaviour (что это значит на практике?) точно не хочу. Я только начал настраивать сбор метрик на практически пустом кластере из двух серверов и там уже кардиналити за 30 000 была. Я так понял, это очень много. Ну у меня прометеус на таких объёмах сразу 200 МБ отожрал. Что будет, когда там будет больше серверов и сервисов. Так не пойдёт. Поэтому решил дропать всё кроме того, что я понимаю.
Пока такой конфиг у меня
- job_name: cadvisors
scheme: https
metrics_path: /metrics/cadvisor
authorization:
credentials_file: /var/run/secrets/kubernetes.io/serviceaccount/token
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
kubernetes_sd_configs:
- role: node
metric_relabel_configs:
- source_labels:
- __name__
regex: "container_cpu_usage_seconds_total|\
container_fs_reads_bytes_total|\
container_fs_writes_bytes_total|\
container_memory_working_set_bytes"
action: keep
- source_labels:
- __name__
- container
regex: "container_cpu_usage_seconds_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_fs_reads_bytes_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_fs_writes_bytes_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_memory_working_set_bytes;"
action: drop
Тут я сначала делаю whitelist метрик и потом дополнительно дропаю некоторые метрики, которые не понимаю что означают.
Исправление vbr, :
А по какому конкретному алгоритму он должен эти метрики объединять?
В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.
Возможно, ты хочешь как-то эти метрики аггрегировать в одну?
Я не знаю, что я хочу. Я только начал настраивать сбор метрик на практически пустом кластере из двух серверов и там уже кардиналити за 30 000 была. Я так понял, это очень много. Ну у меня прометеус на таких объёмах сразу 200 МБ отожрал. Что будет, когда там будет больше серверов и сервисов. Так не пойдёт. Поэтому решил дропать всё кроме того, что я понимаю.
Пока такой конфиг у меня
- job_name: cadvisors
scheme: https
metrics_path: /metrics/cadvisor
authorization:
credentials_file: /var/run/secrets/kubernetes.io/serviceaccount/token
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
kubernetes_sd_configs:
- role: node
metric_relabel_configs:
- source_labels:
- __name__
regex: "container_cpu_usage_seconds_total|\
container_fs_reads_bytes_total|\
container_fs_writes_bytes_total|\
container_memory_working_set_bytes"
action: keep
- source_labels:
- __name__
- container
regex: "container_cpu_usage_seconds_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_fs_reads_bytes_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_fs_writes_bytes_total;"
action: drop
- source_labels:
- __name__
- container
regex: "container_memory_working_set_bytes;"
action: drop
Тут я сначала делаю whitelist метрик и потом дополнительно дропаю некоторые метрики, которые не понимаю что означают.
Исходная версия vbr, :
А по какому конкретному алгоритму он должен эти метрики объединять?
В описываемом варианте просуммировать. Могут ли быть другие варианты - не знаю, я прометеус пока не понимаю.