Всем привет! Нужна помошь и подсказки по создании инфраструктуры трекинг системы.
Будет создаватся на основе облака хецнера. Входящих данных примерно 2-10млн/мес. Структуру накидали примерно такую:
- На входе 2 балансировщика хецнера (решили остановится на них, а не разворачивать свои) в разных локациях, которые распределяют запросы между одними и теми же виртуалками в разных локациях. 2 балансировщика для 2 ip. Приложения на них дергают инфу из запроса и пишут в PostgreSQL (тут чисто инсерты). Тут важна высокая доступность.
- PostgreSQL в виде нескольких виртуалок в разных локациях с мастерами за виртуалкой с PgBouncer. Дополнительно еще одна виртуалка с репликой базы для тяжелых селектов для админок. Тут важна высокая доступность.
- Отдельно еще 2 виртуалки в разных локациях за 1 балансировщиком хецнера для апдейтов и записи в базу (нагрузки на базу тут будет в 10-15 раз меньше). Тут важна почти высокая доступность.
- И еще 1 виртуалка для API и админок. В основном будет стучатся за данными в реплику PostgreSQL.
Нужно чтобы это все стабильно работало без отвалов и без проблем масштабировалось при росте нагрузки.
Вопросы:
- PgBouncer только один на одной виртуалке. Как можно обезопасится при его отвале?
- Насколько быстро синхронизируются мастера PostgreSQL и как часто? При каждом запросе синхронизируются или через какое-то время? Узкого места тут не будет? (мультимастер рассматривали в pro enterprise, но дорого)
- Как-то можно на вскидку прикинуть, сколько ресурсов нужно будет для виртуалок под 10млн инсертов в месяц (примерно 15 колонок в базе, данные будут хранится примерно за последний год)? Или тут только тестить?
- Может есть еще какие рекомендации? Или где есть явные грабли и узкие места?
P.S.: с PgBouncer не работал, с PostgreSQL на уровне поставил, настроил и забыл. Других хостеров и всякие куберы не предлагать. MongoDB рассматривали, но разрабы отказались из-за хреновой работы с джоинами.