Здравствуйте.
Собираюсь приступить к освоению и постройке вышеназванного. Появились общетеоретические вопросы.
Хочется следующего: 2-3-нодовый кластер, при выходе из строя одной из нод, должен перекинуть задачи этой ноды на остальные. Также, он должен позволять перекидывать задачи в штатном режиме, скажем, для обслуживания ноды.
Основной задачей предполагается работа с виртуальными машинами. Соответственно, хотелось бы возможности сделать копию рабочей виртуальной машины, обновить её содержимое и после проверки переключить на неё сетевые соединения. Т.о. простой сервисов, обслуживающихся виртуалкой, должен будет длиться ровно столько, сколько понадобится времени для этого действия.
Если я правильно понимаю, то pacemaker сможет реализовать первую часть задачи, kvm+libvirt — вторую. Так?
Ещё один вопрос для nnz : количество оборудования довольно ограничено, т.е. SAN на отдельных железках не сделать. Возможно ли ценой некоторого снижения надёжности/быстродействия создать на тех же машинках, на которых будет крутиться кластер, блочных устройств одинакового размера и синхронизировать их между собой, как вы и предлагаете практически повсюду, через iSCSI? Если же нет, то буду думать об организации отдельного хранилища, да.
И, наконец, вопрос общего содержания, если ответа на него нет, я пойму: если в виртуалках будут крутиться оффтопик с оффтопичным сиквелем, но невысокой нагрузкой, много ли при этом кушается ресурсов?