Есть deployment например из 10 pod replicas, есть service, который обеспечивает распределение входящих соединений между pod’ами случайным образом. Если соединения длительные, то может так получиться, что какие-то поды, в какой-то момент будут больше нагружены, а какие-то меньше.
Вопрос, есть ли какие-то инструменты в k8s, которые бы выбирали из общего списка pod’ов менее загруженные и пробрасывали соединения именно к ним. Загрузку например можно определять по количеству одновременных соединений с этим подом или как-то еще. Ну то есть сделать умное распределение входящих соединений, а не случайное.