Вопрос про микросервисную архитектуру

development, микросервисы, проектирование

0

2

Я с микросервисами сталкивался мало, но у меня давно гложил такой момент о котором я сейчас вспомнил и решил задать про него вопрос экспертам по микросервисам с ЛОРа.

Допустим у вас есть микросервисное приложение. За внешнее взаимодействие с клиентами отвечает сервис с обработчиками запросов. Он принимает сообщения от клиентов и направляет их обработку целевым сервисам которые должны будут осуществить работу и сообщить о результате. Коммуникация между микросервисами происходит через Kafka.

Внимание вопрос, если у вас микросервис принимающий запросы от клиента динамически масштабирующий (т.е. в зависимости от загрузки добавляются/убираются его инстансы) то как поступать с SSE или Websocket соединениями, когда клиент подключившись к определенному инстансу ожидает ответ обработки? Т.е. результат работы целевого микросервиса должен быть доставлен на конкретный инстанс где висит соединение с клиентом.

Как в этом случае адресуют конкретный инстанс? Как именно в него доставить результат, а не случайному инстансу подписанному на получение событий из очереди сообщений?

P.S. Порекомендуйте литературу где, в том числе, есть ответ и на мой вопрос.

←	Подключение к Postgres из C

Стоит ли делать always_inline для простеньких функций?

→

Коммуникация между микросервисами происходит через Kafka.

P.S. Порекомендуйте литературу где, в том числе, есть ответ и на мой вопрос.

Документация Kafka.

raspopov ★
(14.03.25 17:46:32 MSK)

Я с такой проблемой не сталкивался, но предположу, что надо смотреть в сторону API Gateway и backends for frontends.

kaldeon ★
(14.03.25 18:50:14 MSK)

Как в этом случае адресуют конкретный инстанс? Как именно в него доставить результат, а не случайному инстансу подписанному на получение событий из очереди сообщений?

Это вряд ли будет случайный инстанс (кафка таки не месседж брокер), а один, который получит все сообщения.

Чтобы оно работало как ты хочешь есть два варианта. Первый - каждый инстанс садится на свой топик и каждое сообщение для которого ожидается ответ маркается именем этого топика, чтобы ответ кидали куда нужно. Второй - сделать доставку сообщения всем (емнип в кафке для этого надо сделать много хранилищ внутри одного топика) и фильтроаать ответы уже на клиенте.

ya-betmen ★★★★★
(14.03.25 19:09:57 MSK)

Ответ на: комментарий от ya-betmen 14.03.25 19:09:57 MSK

Для стабильной доставки нужному экземпляру сервиса юзается partition key.

А вот что делать, если клиент отвалится и подключится к другому инстансу фронта - вопрос более эротический.

anonymous
(14.03.25 19:24:14 MSK)

Ответ на: комментарий от ya-betmen 14.03.25 19:09:57 MSK

Как я хочу? А это разве не типовая ситуация? Ну типа стандартный подход который всем нужен.

Я открыл доку, понял про partition, про consumer group.

Вот какой-то кусок кода нашел, на зловещем JavaScript, но это ладно:

const consumer = new Kafka.KafkaConsumer({
  'group.id': 'kafka-consumer',
  'group.instance.id': 'kafka-consumer-<unique-instance-id>',
  'partition.assignment.strategy': 'range',
  'metadata.broker.list': 'localhost:9092',
}, {});

Вижу что тут динамически создают группу и в имя группы добавили инедтификатор инстанса.

Значит в случае какого-нибудь kubernates надо передать через переменную окружения POD_NAME и использовать его для создания consumer_group, после чего этот consumer_group передавать в сообщении к микросервису от которого ожидается ответ. Когда ответ будет готов микросервис отправит ответ используя consumer-group из полученного запроса.

Так?

Хот я тут какую-то чушь наверное написал, я пока не разобрался что такое group.instance.id и как оно фактически работает.

Aber ★★★★★
(14.03.25 19:47:56 MSK) автор топика
Последнее исправление: Aber 14.03.25 20:10:38 MSK (всего исправлений: 2)

Ответ на: комментарий от anonymous 14.03.25 19:24:14 MSK

Ну тут вроде как очевидно, все инстансы используют какой-нибудь хранилище, или настоящую субд как single point of truth, т.е. все состояния операций сохранять туда.

Если клиент пере-подключился то поискать там все что было запрошено и все результаты работы. Хотя да, результат то может быть еще не пришел. Тогда не знаю что делать :) Не опрашивать же с периодичностью N секунд ? или опрашивать? :)

Хотя может быть лучше тогда исходный сервис научить отвечать повторяющимися ответами на одинаковые запросы, т.е. если результат уже был получен для запроса, но пришел точно такой-же запрос опять то просто отдать готовый ответ без выполнения работы.

Таки-да, мне так нравится. Т.е. микросервис встречающий запросы клиента сохраняет статус запроса и его идентификатор (какой-нибудь случайный UID) в свое хранилище, ждет ответ от сервиса. Клиент отваливается и переподключается к другому инстансу, то другой инстанс поднимает из хранилища последнее состояние – запрос с его уникальным идентификатором, инстанс отправляет сообщение вновь и исходный микросервис должен просто ответить результатом не выполняя какую-либо работу, потому что идентификатор запроса не поменялся.

Aber ★★★★★
(14.03.25 20:09:34 MSK) автор топика
Последнее исправление: Aber 14.03.25 20:23:23 MSK (всего исправлений: 2)

Ответ на: комментарий от Aber 14.03.25 19:47:56 MSK

Если я правильно понял, то у тебя ответ должен прийти в конкретный конзюмер, а не просто в группу, не?

А это разве не типовая ситуация?

Она конечно типовая, но это если в детали не смотреть. Например у кого-то повторное получение сообщеньки это просто дубль в чятике, а у кого-то это двойная отправка платежа. Или при падении ноды кто-то может просто сказать юзеру "перелогинься, чувак", а кому-то надо держать на подхвате второй инстанс и перекидывать туда без обрыва сессии. И т.п.

ya-betmen ★★★★★
(14.03.25 20:36:41 MSK)

Ответ на: комментарий от ya-betmen 14.03.25 20:36:41 MSK

Я думал создать группы по количеству инстанстов, типа N групп на N инстанстов, и связать из 1 к 1 :) Я пока не разобрался, потому пишу наверное чушь.

Хотя конечно тогда вопрос а зачем тут kafka, если все можно делать прямыми запросами gRPC :)

Aber ★★★★★
(14.03.25 20:38:49 MSK) автор топика
Последнее исправление: Aber 14.03.25 20:39:33 MSK (всего исправлений: 1)

Ответ на: комментарий от Aber 14.03.25 19:47:56 MSK

динамически создают группу и в имя группы добавили инедтификатор инстанса

Это какой-то аутизм.

anonymous
(14.03.25 20:45:20 MSK)

Ответ на: комментарий от anonymous 14.03.25 20:45:20 MSK

Было бы круто если кто-то кинул поваренную книгу микроанархиста, где были бы типовые рецепты мекросервисаварения, что-нибудь хозяйкам на заметку чтоб самому не придумывать невкусные велосипеды.

Aber ★★★★★
(14.03.25 20:50:01 MSK) автор топика

Ответ на: комментарий от Aber 14.03.25 20:38:49 MSK

Хотя конечно тогда вопрос а зачем тут kafka, если все можно делать прямыми запросами gRPC :)

Вопрос "зачем тут кафка?" имеет смысл задавать почти всегда когда собираешь её использовать. Почти всегда ответ будет "нафиг не нужна".

Ответ "хочу галочку в резюме" тоже принимается.

ya-betmen ★★★★★
(14.03.25 20:58:48 MSK)
Последнее исправление: ya-betmen 14.03.25 20:59:04 MSK (всего исправлений: 1)

Ответ на: комментарий от ya-betmen 14.03.25 20:58:48 MSK

Да нафиг она мне нужна, работодатели требуют. Скачал какую-то Microservices Patterns With examples in Java by Chris Richardson, выглядит скучно. Хотелось бы что-то вроде GoF для микросервисов.

Aber ★★★★★
(14.03.25 21:14:00 MSK) автор топика

Ответ на: комментарий от Aber 14.03.25 20:50:01 MSK

microservices.io и книжко от автора (если скипать пиар его самописного велосипеда)

«высоконагруженные приложения» с хряком

anonymous
(14.03.25 21:30:29 MSK)

это называется обогащением или асинхронный RequestReply паттерн. тебе нужно научиться ловить именно свои сообщения, а отсекать чужие.

т.е. твой кейс.

браузер/мобилка сидит на инстансе А вебсокетом, он формирует ключ ID1, который отправляется в партицию 2 топика «запросы».
на «той стороне» есть процессоры твоего запроса. они должны считать ID1 из ключа твоего сообщения и не «просрать» его, а отправить результат ровно с таким же ID1 тебе.
твой инстанс А должен быть подключен к партиции 2 - консюмеры в кафке работают в консюмер-группах, поэтому ты делаешь каждому инстансу свою консюмер-группу, тогда он точно будет подключен к партиции 2 (ну и к другим тоже, но это не важно).
когда получаешь сообщение - отправляешь его ровно в тот вебсокет, из которого пришло сообщение с ID1 (да, тебе нужно где-то хранить соответствие)

мой опыт https://blog.bvn13.me/2022/08/13/request-reply-pattern-using-apache-kafka-or-how-not-to-loose-your-data.html

bvn13 ★★★★★
(14.03.25 21:39:13 MSK)
Последнее исправление: bvn13 14.03.25 21:39:24 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 14.03.25 21:30:29 MSK

Ок, спасибо, интересно.

Я вот тоже что-то интересное нашел https://learn.microsoft.com/en-us/azure/architecture/patterns/, буду просвещаться.

Aber ★★★★★
(14.03.25 21:39:44 MSK) автор топика

Ответ на: комментарий от anonymous 14.03.25 19:24:14 MSK

ретраи :) все корнер-кейсы должны быть заложены в архитектуру.

например, фронт при подключении должен «выбрать» именно конкретный (по хешу) бэк, к которому он подключался в прошлый раз.

или ответы прихранивать в БД, и отдавать при переподключении «к любому другому» бэкенду.

вариантов несколько.

bvn13 ★★★★★
(14.03.25 21:41:50 MSK)

Ответ на: комментарий от Aber 14.03.25 20:50:01 MSK

EIP - enterprise integration patterns + Построение высоконагруженных приложений (Кафка)

bvn13 ★★★★★
(14.03.25 21:43:12 MSK)

Ответ на: комментарий от bvn13 14.03.25 21:43:12 MSK

Вууух я теперь заряжен инфой, осталось осилить :) Спасибо.

Aber ★★★★★
(14.03.25 21:45:18 MSK) автор топика

Ответ на: комментарий от Aber 14.03.25 21:14:00 MSK

Да нафиг она мне нужна, работодатели требуют

Ну сделай через неё мониторинг, а данные как нормальный человек гоняй.

ya-betmen ★★★★★
(14.03.25 22:39:46 MSK)

Ответ на: комментарий от Aber 14.03.25 21:14:00 MSK

Читай, читай. Возможно заказчик хочет асихронную архитектуру, а для этого и обмен через кафку, а не через grpc. Там про это есть

cobold ★★★★★
(15.03.25 00:12:28 MSK)
Последнее исправление: cobold 15.03.25 00:12:45 MSK (всего исправлений: 1)

Ответ на: комментарий от bvn13 14.03.25 21:39:13 MSK

ты делаешь каждому инстансу свою консюмер-группу, тогда он точно будет подключен к партиции 2 (ну и к другим тоже, но это не важно).

Здорово масштабируется, правда?

anonymous
(15.03.25 00:47:02 MSK)

Ответ на: комментарий от Aber 14.03.25 21:14:00 MSK

Ричардсон - это классика классическая.

Бтв, в каком контексте требуют?

anonymous
(15.03.25 00:50:01 MSK)

Ответ на: комментарий от cobold 15.03.25 00:12:28 MSK

Возможно заказчик хочет асихронную архитектуру

Асинхронщина разная бывает, даже без очередей это реализуется при помощи разделения эндпоинтов на отправку запроса на обработку/отправку запроса на получение результата или отправку запроса на обработку/коллбэк с результатами. В случае наличия очередей просто упрощается масштабирование/повышается надежность/снижаются накладные расходы/снижается задержка получения результата/упрощается параллельная обработка одного сообщения.

anonymous
(15.03.25 02:37:29 MSK)

Сама постановка задачи неверная. У тебя не должно быть особого инстанса для конкретного клиента. Все инстансы должны быть способны обслужить любого клиента. Вебсокет должен мочь подключаться к любому серверу.

В целом лучше архитектуру планировать исходя из повторяющихся GET запросов, а не вебсокетов. Так проще.

vbr ★★★★★
(15.03.25 03:06:15 MSK)
Последнее исправление: vbr 15.03.25 03:22:12 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 15.03.25 00:47:02 MSK

отлично масштабируется, да

bvn13 ★★★★★
(15.03.25 17:28:34 MSK)

Ответ на: комментарий от bvn13 15.03.25 17:28:34 MSK

И что внутренний трафик при увеличении внешнего растёт квадратично - тоже збс, правда?

anonymous
(15.03.25 20:03:45 MSK)

результат работы целевого микросервиса должен быть доставлен на конкретный инстанс где висит соединение с клиентом

Инстанс в заголовок сообщения пихает уникальную консумер группу которую он слушает. Другие сервисы/инстансы отвечают в эту группу.

Можно также сделать на топиках, но это не так гибко и облака берут плату по топикам.

no-such-file ★★★★★
(15.03.25 20:15:51 MSK)
Последнее исправление: no-such-file 15.03.25 20:17:11 MSK (всего исправлений: 2)

Ответ на: комментарий от no-such-file 15.03.25 20:15:51 MSK

пихает уникальную консумер группу которую он слушает

прочитай, как работают группы консьюмеров, и не пиши чушь.

anonymous
(15.03.25 20:19:09 MSK)

Ответ на: комментарий от vbr 15.03.25 03:06:15 MSK

В целом лучше архитектуру планировать исходя из повторяющихся GET запросов, а не вебсокетов. Так проще.

А тогда CQRS как делать без подписки? Тупо долбить GET запросами в цикле?

no-such-file ★★★★★
(15.03.25 20:19:10 MSK)

Ответ на: комментарий от anonymous 15.03.25 20:19:09 MSK

Разжёвываю для анонимных дурачков: инстанс проверяет заголовок и скипает «не свои» сообщения.

no-such-file ★★★★★
(15.03.25 20:26:04 MSK)

Ответ на: комментарий от no-such-file 15.03.25 20:26:04 MSK

Это не так работает, господи. Нет никакой потребности вычитывать и скипать не свои сообщения, это делается, если уж так хочется кафку без промежуточного хранилища юзать, правильным раскладыванием сообщений по партициям.

anonymous
(15.03.25 20:29:36 MSK)

Ответ на: комментарий от anonymous 15.03.25 20:29:36 MSK

Это не так работает, господи

Работает, холоп.

раскладыванием сообщений по партициям

Это тут вообще никаким боком не влияет.

no-such-file ★★★★★
(15.03.25 20:30:41 MSK)
Последнее исправление: no-such-file 15.03.25 20:32:51 MSK (всего исправлений: 1)

Ответ на: комментарий от no-such-file 15.03.25 20:30:41 MSK

ищо раз: отказываясь от хоть какого-то роутинга сообщений через партиции и играя через создание личных консьюмеров, вы, во-первых, получаете квадратичное увеличение нагрузки на кафку при увеличении трафика, и, во-вторых, убиваете весь смысл масштабирования, потому что каждый фронт в итоге получает все сообщения, забивая себе канал.

Вообще, ситуация выглядит как «если нужно объяснять, значит, не нужно объяснять».

anonymous
(15.03.25 20:37:30 MSK)

Ответ на: комментарий от anonymous 15.03.25 20:37:30 MSK

отказываясь от хоть какого-то роутинга сообщений через партиции

Ты экономишь сотни денег.

убиваете весь смысл масштабирования

ТСу не нужно никакое мегамасштабирование. Ему и кафка-то не нужна по сути. Но раз уж надо как-то прикрутить, то так это будет работать.

no-such-file ★★★★★
(15.03.25 20:47:25 MSK)

Ответ на: комментарий от bvn13 14.03.25 21:39:13 MSK

Каждому инстансу по группе!

Это был отличный ответ, сегодня начитался блогов найденным по упомянутым кейвордам и всему что у тебя написано в блоге, завтра буду тыкать кафку :)

Я уже с ней сталкивался, но глубоко не копал, тыкал её мимоходом как какую-то очередную MQ, теперь буду погружаться по полной.

Aber ★★★★★
(16.03.25 00:43:38 MSK) автор топика

Ответ на: комментарий от anonymous 15.03.25 20:37:30 MSK

отказываясь от хоть какого-то роутинга сообщений через партиции и играя через создание личных консьюмеров,

Да там же каждое добавление/убавление партиций это stop-the-world пауза в группе. А завести группы ничего не стоит и любой группе можно отправить личное сообщение по идентификатору, я так понял. Завтра проверю.

Aber ★★★★★
(16.03.25 00:46:32 MSK) автор топика
Последнее исправление: Aber 16.03.25 00:48:39 MSK (всего исправлений: 1)

Ответ на: комментарий от Aber 16.03.25 00:46:32 MSK

любой группе можно отправить личное сообщение по идентификатору, я так понял Группы просто позволяют обрабатывать одно сообщение одновременно множеством групп потребителей. В твоем случае все инстансы получат сообщение «одновременно» и зная какие клиенты к ним подключены отфильтруют лишнее.

anonymous
(16.03.25 01:14:21 MSK)

Ответ на: комментарий от no-such-file 15.03.25 20:19:10 MSK

Клиент подключается к одному из серверов, передаёт ему идентификатор, который клиент хочет слушать. Сервер подключается к твоей базе данных вроде кафки и проксирует события клиенту. Сервер может быть любым, он просто прокси между клиентом и базой, проверяющий авторизацию и прочее. В каких-то случаях можно вообще готовый софт поставить для конкретно этой задачи.

По сути твоя задача заключается в том, чтобы все сложные решения переложить на кафку, например. Т.к. её писали умные люди и она написана условно говоря хорошо, скорей всего другие умные люди её настроили и запустили в облаке для тебя. А тебе остаётся только написать нужные прокладочки, добавляющие какие-то мелочи.

Самое главное это не начинать изобретать сложные архитектурно и алгоритмически штуки. Вся суть хорошего серверного софта в том, чтобы у него не было состояния. Чтобы любой твой сервис мог упасть и этого никто не заметил (в худшем случае несколько клиентов увидят 5xx и сделают запрос ещё раз). А состояние должно лежать в хороших базах.

Конечно кому-то и кафку надо изобретать, но, полагаю, в этой теме обсуждается не тот случай.

vbr ★★★★★
(16.03.25 04:29:24 MSK)
Последнее исправление: vbr 16.03.25 04:30:21 MSK (всего исправлений: 1)

Ответ на: комментарий от no-such-file 15.03.25 20:47:25 MSK

Ты экономишь сотни денег.

Нет, ты просто делаешь неработоспособную систему.

Но раз уж надо как-то прикрутить, то так это будет работать.

Зачем давать заведомо некорректные советы и оправдывать это тем, что у ТСа и так всё через жопу?

anonymous
(16.03.25 19:37:55 MSK)

Ответ на: комментарий от Aber 16.03.25 00:46:32 MSK

Да там же каждое добавление/убавление партиций это stop-the-world пауза в группе.

Там всё подряд stop-the-world, включая подключение новых консьюмеров. К группе это, кстати, вообше отношения не имеет.

Ну и как бы с чего вы взяли, что нужно динамически создавать партиции под инстансы фронта? Это безумие.

anonymous
(16.03.25 19:40:35 MSK)

Ответ на: комментарий от anonymous 16.03.25 19:37:55 MSK

Товарищ диванный иксперт, иди в жопу. Решение опробовано в продакшене с 1M пользователей онлайн.

no-such-file ★★★★★
(16.03.25 19:42:11 MSK)

Ответ на: комментарий от Aber 16.03.25 00:43:38 MSK

Это был отличный ответ Это была просто глупость от человека, который кафку только на ютубе видел и даже терминологией не владеет.

Ваша ситуация разруливается через отправку ответа в определённую партицию. Это не велосипед, это стандартная практика.

https://docs.spring.io/spring-kafka/reference/kafka/sending-messages.html#replying-template

anonymous
(16.03.25 19:43:54 MSK)

Ответ на: комментарий от anonymous 16.03.25 19:40:35 MSK

Там всё подряд stop-the-world, включая подключение новых консьюмеров

Почему? Добавление партиции требует ребаланс. А в случае добавления очередного слушателя в новой группе другие группы не затронуты, никакого ребаланса. Не так?

Ну и как бы с чего вы взяли, что нужно динамически создавать партиции под инстансы фронта? Это безумие.

Ну так динамический скейлниг при нагрузке больше обработчиков запросов, при отсутствии меньше.

Aber ★★★★★
(16.03.25 20:50:25 MSK) автор топика

Ответ на: комментарий от anonymous 16.03.25 19:40:35 MSK

включая подключение новых консьюмеров.

Из официальной доки:

Conceptually you can think of a consumer group as being a single logical subscriber that happens to be made up of multiple processes. As a multi-subscriber system, Kafka naturally supports having any number of consumer groups for a given topic without duplicating data (additional consumers are actually quite cheap).

Consumer Group -> single logical subscriber
Kafka naturally supports having any number of consumer groups
consumers are ... cheap

Aber ★★★★★
(16.03.25 21:22:35 MSK) автор топика
Последнее исправление: Aber 16.03.25 21:30:19 MSK (всего исправлений: 2)

Ответ на: комментарий от anonymous 16.03.25 19:43:54 MSK

Я видел такие решения. Короче я понял что есть несколько подходов, но с партициями страшнее :) Пока огромные нагрузки не грозят я смотреть в их сторону не буду.

Aber ★★★★★
(16.03.25 21:28:02 MSK) автор топика

то как поступать с SSE или Websocket соединениями, когда клиент подключившись к определенному инстансу ожидает ответ обработки

Делаешь broadcast через пабсаб/очередь/базу, все инстансы-апишки его слушают, смотрят кому он адресован (кидаешь в броадкасте id юзера или что-то такое), смотрят подключен ли к ним такой

Но вообще когда видишь микросервисы первый вопрос должен быть не как, а нахрена. Геморроя много, а плюсы есть далеко не всегда

upcFrost ★★★★★
(22.03.25 16:03:39 MSK)
Последнее исправление: upcFrost 22.03.25 16:04:00 MSK (всего исправлений: 1)

←	Подключение к Postgres из C

Development

Стоит ли делать always_inline для простеньких функций?

→

Похожие темы