LINUX.ORG.RU
решено ФорумAdmin

Автостарт corosync на debian 9

 , , ,


0

2

При ручном старте коросинк работает, а вот при старте вместе с системой он так ругается:

Mar 21 17:03:42 [409] wiki1 corosync notice  [MAIN  ] Corosync Cluster Engine ('2.4.2'): started and ready to provide service.
Mar 21 17:03:42 [409] wiki1 corosync info    [MAIN  ] Corosync built-in features: dbus rdma monitoring watchdog augeas systemd upstart xmlconf qdevices qnetd snmp pie relro bindnow
Mar 21 17:03:42 [409] wiki1 corosync notice  [TOTEM ] Initializing transport (UDP/IP Unicast).
Mar 21 17:03:42 [409] wiki1 corosync notice  [TOTEM ] Initializing transmit/receive security (NSS) crypto: none hash: none
Mar 21 17:03:42 [409] wiki1 corosync notice  [TOTEM ] The network interface is down.
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync configuration map access [0]
Mar 21 17:03:42 [409] wiki1 corosync info    [QB    ] server name: cmap
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync configuration service [1]
Mar 21 17:03:42 [409] wiki1 corosync info    [QB    ] server name: cfg
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync cluster closed process group service v1.01 [2]
Mar 21 17:03:42 [409] wiki1 corosync info    [QB    ] server name: cpg
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync profile loading service [4]
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync resource monitoring service [6]
Mar 21 17:03:42 [409] wiki1 corosync warning [WD    ] No Watchdog /dev/watchdog, try modprobe <a watchdog>
Mar 21 17:03:42 [409] wiki1 corosync warning [WD    ] resource load_15min missing a recovery key.
Mar 21 17:03:42 [409] wiki1 corosync warning [WD    ] resource memory_used missing a recovery key.
Mar 21 17:03:42 [409] wiki1 corosync info    [WD    ] no resources configured.
Mar 21 17:03:42 [409] wiki1 corosync notice  [SERV  ] Service engine loaded: corosync watchdog service [7]
Mar 21 17:03:42 [409] wiki1 corosync notice  [QUORUM] Using quorum provider corosync_votequorum
Mar 21 17:03:42 [409] wiki1 corosync crit    [QUORUM] Quorum provider: corosync_votequorum failed to initialize.
Mar 21 17:03:42 [409] wiki1 corosync error   [SERV  ] Service engine 'corosync_quorum' failed to load for reason 'configuration error: nodelist or quorum.expected_votes must be configured!'
Mar 21 17:03:42 [409] wiki1 corosync error   [MAIN  ] Corosync Cluster Engine exiting with status 20 at service.c:356.

Куда копать ?

Deleted

Service engine 'corosync_quorum' failed to load for reason 'configuration error: nodelist or quorum.expected_votes must be configured!'

Какое слово непонятно?

systemd

Ну кто бы сомневался. Зови педрилу, пусть помогает.

anonymous
()
Ответ на: комментарий от anonymous

Какое слово непонятно?

Когда на нодах делаешь service corosync start, то всё магическим образом начинает работать. Поэтому непонятные слова я гуглить не стал.

Deleted
()
Ответ на: комментарий от Deleted

Это явный пример, как НЕ надо админить.

quorum.expected_votes must be configured

If the logs show something like:

[...] corosync[1647]: [QUORUM] Quorum provider: corosync_votequorum failed to initialize. corosync[1647]: [SERV ] Service engine 'corosync_quorum' failed to load for reason 'configuration error: nodelist or quorum.expected_votes must be configured!' [...]

Your hosts file entry for the corosync hostname and the one in ring0_addr from corosync.conf do not match or could not be resolved.

Fix them up and reboot/restart. If you need to change something in corosync.conf but have no write permissions see Write config when not quorate.

http://pve.proxmox.com/wiki/Separate_Cluster_Network

Glafir
()
Ответ на: комментарий от Yur4eg

Зачем мне что-то менять в конфиге коросинка, при том что после ручного запуска всё работает ?

Deleted
()
Ответ на: комментарий от Deleted

Попробуй тогда отредактировать юнит, хотя конечно лучше вырубить проверку кворума. vi /etc/systemd/system/ multi-user.target.wants/corosync.service

Например можно стартовать Corosync после запуска сетевой службы или того-же Pacemaker, вот пример:

[Unit]
Description=Corosync Cluster Engine
ConditionKernelCommandLine=!nocluster
Requires=network-online.target
After=network-online.target network.service   ;===== Добавить "network.service"
 
[Service]
ExecStart=/usr/share/corosync/corosync start
ExecStop=/usr/share/corosync/corosync stop
Type=forking
 
[Install]
WantedBy=multi-user.target

anonymous
()
Ответ на: комментарий от anonymous

Первое на что подумал - это на зависимости в юните. Зависимости от старта сети были прописаны.
Добавил network.service - не помогло.
Есть какой-то метод дебага запуска всех сервисов ?

Deleted
()
Ответ на: комментарий от anonymous

наобум сделал так
Requires=network-online.target mariadb.service php-fpm.service
After=network-online.target mariadb.service php-fpm.service
теперь стартует как положено.
но так неправильно, т.к. запуск мускуля должен происходить в зависимости от статуса нод.
как понять чего коросинк должен дождаться чтоб работать ?

Deleted
()
Ответ на: комментарий от Deleted

Есть какой-то метод дебага запуска всех сервисов ?

Попробуй передать при загрузке systemd.log_level=debug systemd.log_target=kmsg log_buf_len=1M

mandala ★★★★★
()
Ответ на: комментарий от mandala

Вот спасибо, увидел в списке запущенных сервисов dhcp-client и подумал посмотреть, а не забыл ли я статику прописать. Забыл.
Соответственно, коросинк не мог работать, пока адрес не получится от dhcp сервера.
Всем спасибо.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.