LINUX.ORG.RU
решено ФорумAdmin

Как правильно настроить HA на oVirt

 ,


1

1

Всем привет. Пытаюсь настроить HA на oVirt. Установил первый хост, на нём сделал hosted-engine --deploy, настроил всё, через веб добавил ещё 2 хоста. При добавлении хостов во вкладке hosted-engine ставил DEPLOY (в соотвествии с этой главой). Получилась такая конфигурация:

--== Host 1 status ==--

conf_on_shared_storage             : True
Status up-to-date                  : True
Hostname                           : vnode10
Host ID                            : 1
Engine status                      : {"health": "good", "vm": "up", "detail": "up"}
Score                              : 3400
stopped                            : False
Local maintenance                  : False
crc32                              : 6876e8dc
local_conf_timestamp               : 169870
Host timestamp                     : 169854
Extra metadata (valid at timestamp):
	metadata_parse_version=1
	metadata_feature_version=1
	timestamp=169854 (Mon Aug 14 12:54:30 2017)
	host-id=1
	score=3400
	vm_conf_refresh_time=169870 (Mon Aug 14 12:54:46 2017)
	conf_on_shared_storage=True
	maintenance=False
	state=EngineUp
	stopped=False


--== Host 2 status ==--

conf_on_shared_storage             : True
Status up-to-date                  : True
Hostname                           : vnode11
Host ID                            : 2
Engine status                      : {"reason": "vm not running on this host", "health": "bad", "vm": "down", "detail": "unknown"}
Score                              : 3400
stopped                            : False
Local maintenance                  : False
crc32                              : 19a3bb1c
local_conf_timestamp               : 400
Host timestamp                     : 385
Extra metadata (valid at timestamp):
	metadata_parse_version=1
	metadata_feature_version=1
	timestamp=385 (Mon Aug 14 12:54:44 2017)
	host-id=2
	score=3400
	vm_conf_refresh_time=400 (Mon Aug 14 12:55:00 2017)
	conf_on_shared_storage=True
	maintenance=False
	state=EngineDown
	stopped=False


--== Host 3 status ==--

conf_on_shared_storage             : True
Status up-to-date                  : True
Hostname                           : vnode13
Host ID                            : 3
Engine status                      : {"reason": "vm not running on this host", "health": "bad", "vm": "down", "detail": "unknown"}
Score                              : 3400
stopped                            : False
Local maintenance                  : False
crc32                              : 4e5f4f15
local_conf_timestamp               : 179854
Host timestamp                     : 179837
Extra metadata (valid at timestamp):
	metadata_parse_version=1
	metadata_feature_version=1
	timestamp=179837 (Mon Aug 14 12:54:40 2017)
	host-id=3
	score=3400
	vm_conf_refresh_time=179854 (Mon Aug 14 12:54:56 2017)
	conf_on_shared_storage=True
	maintenance=False
	state=EngineDown
	stopped=False

Создал 2 виртуальные машины закинул каждую на разный хост, итого 3 vm (hs + остальные). Я отключаю хост, на котором крутится hs, и после этого все виртуальные машины становятся недоступны. Я захожу на доступный хост и запускаю вручную там hosted-engine и после того, как он поднимается, автоматом поднимаются виртуальные машины. В связи с этим у меня есть пара вопросов:

  • Как сделать так, чтобы при падении hosted-engine не падали все vm?
  • Как сделать автомиграцию hosted-engine на доступную ноду?


Последнее исправление: nspickiy (всего исправлений: 1)

в нормальной ситуации отключение енжаина не ведет в выключению vm на хостах. Надо смотреть логи хостов, где отключаются vm. Перезагрузка енжаина - обычная практика, и все квм на хостах должны работать и не выгружаться.

anonymous
()
Ответ на: комментарий от nspickiy

чушь. без фенсинга не может быть нормального failover. Если убивать хост руками и нет power management, то можно, руками же, кликнуть правой кнопкой на отключенный хост и выбрать confirm host has been rebooted. Но лучше все таки нормально настроить кластер

dyasny ★★★★★
()
Ответ на: комментарий от dyasny

Нормально настроить это хорошо, но неужели без настроек питания failover не может работать? Вот я сейчас поднял всё по новой, из 2 хостов. Поднял тестовую виртуалку, захожу на хост отключаю hosted-engine и моя виртуалка тоже становится недоступной. Это нормально поведение?

ЗЫ. После vmware много чего не понятно

nspickiy
() автор топика
Ответ на: комментарий от nspickiy

power management используется как SBA - если хост падает, другие хосты отключают ему питание, чтоб быть уверенными что он не остался жив и не крутит виртуалки. Если два хоста одновременно поднимут одну и ту же VM это чревато испорченными дисками. Есть и дополнительные механизмы, но ни один из них не так надежен как классический stonith.

dyasny ★★★★★
()
Ответ на: комментарий от dyasny

Ок, я настроил power manager через ipmilan. На хосте крутится hosted-engine, я отключаю на хосте питание (выдергиваю кабель) и hosted-engine не поднимается автоматом на другое доступной ноде. При этом я заметил, что виртуалки на других хостах становятся не доступными, но когда всё восстанавливаешь их апптайм не меняется и подозреваю, что hosted-engine кладет с собой сеть.

nspickiy
() автор топика
Ответ на: комментарий от dyasny

Так же посмотрел логи agent.log. Всё останавливается на одной строчке

Host1:

MainThread::INFO::2017-08-23 12:38:05,785::hosted_engine::604::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_vdsm) Initializing VDSM
MainThread::INFO::2017-08-23 12:38:07,997::hosted_engine::630::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_storage_images) Connecting the storage
MainThread::INFO::2017-08-23 12:38:07,999::storage_server::219::ovirt_hosted_engine_ha.lib.storage_server.StorageServer::(connect_storage_server) Connecting storage server
MainThread::INFO::2017-08-23 12:38:10,181::storage_server::226::ovirt_hosted_engine_ha.lib.storage_server.StorageServer::(connect_storage_server) Connecting storage server
MainThread::INFO::2017-08-23 12:38:10,497::storage_server::233::ovirt_hosted_engine_ha.lib.storage_server.StorageServer::(connect_storage_server) Refreshing the storage domain
MainThread::INFO::2017-08-23 12:38:11,116::hosted_engine::657::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_storage_images) Preparing images
MainThread::INFO::2017-08-23 12:38:11,116::image::126::ovirt_hosted_engine_ha.lib.image.Image::(prepare_images) Preparing images
MainThread::INFO::2017-08-23 12:38:15,050::hosted_engine::660::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_storage_images) Refreshing vm.conf
MainThread::INFO::2017-08-23 12:38:15,050::config::485::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(refresh_vm_conf) Reloading vm.conf from the shared storage domain
MainThread::INFO::2017-08-23 12:38:15,050::config::412::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(_get_vm_conf_content_from_ovf_store) Trying to get a fresher copy of vm configuration from the OVF_STORE
MainThread::INFO::2017-08-23 12:38:17,475::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:5d2759b6-285e-4b2d-8a2d-c6f0e811c0ee, volUUID:8704da2f-d531-4cb6-a945-eea0404c28c6
MainThread::INFO::2017-08-23 12:38:17,835::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:b2f02dd7-f6c8-406b-844e-018dafb0442b, volUUID:cc3ebc77-5991-4157-a708-e20ade7f3ccd
MainThread::INFO::2017-08-23 12:38:18,375::ovf_store::112::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(getEngineVMOVF) Extracting Engine VM OVF from the OVF_STORE

Host2

MainThread::INFO::2017-08-23 12:28:25,216::image::126::ovirt_hosted_engine_ha.lib.image.Image::(prepare_images) Preparing images
MainThread::INFO::2017-08-23 12:28:29,138::hosted_engine::660::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(_initialize_storage_images) Refreshing vm.conf
MainThread::INFO::2017-08-23 12:28:29,138::config::485::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(refresh_vm_conf) Reloading vm.conf from the shared storage domain
MainThread::INFO::2017-08-23 12:28:29,138::config::412::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(_get_vm_conf_content_from_ovf_store) Trying to get a fresher copy of vm configuration from the OVF_STORE
MainThread::INFO::2017-08-23 12:28:31,574::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:5d2759b6-285e-4b2d-8a2d-c6f0e811c0ee, volUUID:8704da2f-d531-4cb6-a945-eea0404c28c6
MainThread::INFO::2017-08-23 12:28:31,937::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:b2f02dd7-f6c8-406b-844e-018dafb0442b, volUUID:cc3ebc77-5991-4157-a708-e20ade7f3ccd
MainThread::INFO::2017-08-23 12:28:32,479::ovf_store::112::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(getEngineVMOVF) Extracting Engine VM OVF from the OVF_STORE
MainThread::INFO::2017-08-23 12:38:01,832::ovf_store::119::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(getEngineVMOVF) OVF_STORE volume path: /rhev/data-center/mnt/blockSD/0a3d9d6a-1561-4a55-bbda-cc4e73bff0e8/images/b2f02dd7-f6c8-406b-844e-018dafb0442b/cc3ebc77-5991-4157-a708-e20ade7f3ccd
MainThread::INFO::2017-08-23 12:38:01,859::config::431::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(_get_vm_conf_content_from_ovf_store) Found an OVF for HE VM, trying to convert
MainThread::INFO::2017-08-23 12:38:01,861::config::436::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(_get_vm_conf_content_from_ovf_store) Got vm.conf from OVF_STORE
MainThread::INFO::2017-08-23 12:38:06,390::hosted_engine::453::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(start_monitoring) Current state EngineDown (score: 3400)
MainThread::INFO::2017-08-23 12:38:06,390::hosted_engine::458::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine::(start_monitoring) Best remote host vnode10.pi.local (id: 1, score: 3400)
MainThread::INFO::2017-08-23 12:38:16,454::config::485::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(refresh_vm_conf) Reloading vm.conf from the shared storage domain
MainThread::INFO::2017-08-23 12:38:16,455::config::412::ovirt_hosted_engine_ha.agent.hosted_engine.HostedEngine.config::(_get_vm_conf_content_from_ovf_store) Trying to get a fresher copy of vm configuration from the OVF_STORE
MainThread::INFO::2017-08-23 12:38:18,914::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:5d2759b6-285e-4b2d-8a2d-c6f0e811c0ee, volUUID:8704da2f-d531-4cb6-a945-eea0404c28c6
MainThread::INFO::2017-08-23 12:38:19,277::ovf_store::103::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(scan) Found OVF_STORE: imgUUID:b2f02dd7-f6c8-406b-844e-018dafb0442b, volUUID:cc3ebc77-5991-4157-a708-e20ade7f3ccd
MainThread::INFO::2017-08-23 12:38:19,818::ovf_store::112::ovirt_hosted_engine_ha.lib.ovf.ovf_store.OVFStore::(getEngineVMOVF) Extracting Engine VM OVF from the OVF_STORE

nspickiy
() автор топика
Ответ на: комментарий от nspickiy

ну, вроде уже разобрались что там с сетью было перемудрено

dyasny ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.