Привет всем,
Я админю PostgreSQL с потоковой репликацией, и всегда использовал прямой доступ к дискам, в котором используются RAID-10, ну или на крайний случай RAID-1. Собственно, тоже самое касается др. stateful-сервисов, как: Elastic, MongoDB и других. Просто, использую, как правило встроенные механизмы репликации и сервисы реплицируются, где условная одна нода stateful-сервиса использует RAID-10 или RAID-1 для хранения своих данных.
РСУБД базы, в среднем, по 300 Гб юзаются у нас. Юзаем:
- материлиз. вьюхи
- хранимки
- tablespaces организованы опред. образом и др.
Эластик кластер, и вовсе, 5 терабайт держит округлено.
В чем суть моего вопроса?
Сейчас, маркетологи на удаленке топят за перевод на Ceph. Да-да, как смешно бы не звучало (хотя, может быть и не будет смешно для кого-то).
Основной их аргумент, что: в публичных облаках, типа Mail.Ru cloud, AWS и др. Давно хостят базы на дистрибутивных storages, будь то Ceph или AWS block storage и не фиг использовать эти ваши «дедовские способы», что мол время прошло.
Я думаю, что это будет очень медленно, т.к. к примеру если взять Elastic-кластер, допустим три или более нод, то получается картина, что запускается распределенное приложение на распределенной FS. Да и в целом, манагеры с маркетологами не очень понимают разницы между managed сервисами и unmanaged, сути их технической разницы.
И, у меня возникают следующие логические вопросы:
-
А, почему бы просто не позволить Elastic справиться с этим - с помощью собственных/встроенных механизмов по шардам и репликам, используя прямой доступ к дискам?
-
В чем такой кайф дать прослойку в виде Ceph, которую еще нужно уметь поддерживать? Ведь, это достаточно сложный инструмент. К тому же, увелич. вероятность «обсера», ибо если вылетит Цеф, то вылетит - всё, что на нем хостится.
Итого/вывод:
В целом, я могу добавить еще, что наши маркетологи и манагеры на удаленной работе давно бы всё перевели в облака, если бы их воля и не необходимость держать приватные данные юзеров на собственных машинах. По договорам у нас - нельзя хостить клиентские данные в облаках.
Почему, вообще, слушают менеджеров и маркетологов по данным вопросам? Я углубляться не буду и скажу проще, просто время такое, когда надо соблюдать soft skills, когда надо выслушивать не только технический персонал и когда маркетолог или манагер может означать больше, чем даже архитекор. В случае, если они приводят большой мешок с деньгами.
Может, я устарел и Ceph - не так уже и плох, и я не умею его готовить? Вполне возможно.
Если у кого-то был опыт с деплоем Ceph и хостингом реплицируемых stateful-сервисов на нем, то прошу поделиться впечатлениями и личным опытом в эксплуатации, спасибо.