Привет, знатоки!
Есть у меня red hat cluster suite состоящий из 2-ух вируальных нод и их гипервизора KVM (Примерно это но «KVM host» один). Везде centos 6.9 . Кластер собран верно, cluster.conf везде идентичны, состояние кластера консистентное. Пытаюсь настроить fence_xvm. На гипервизоре установлен fence_virtd и настроен тоже верно. Команда, например, fence_xvm -a 225.0.0.12 -k /etc/cluster/fence_xvm.key -H node1 -o status
выдаёт корректный результат Status: ON
. Но команда fence_node node1 -vv
выдаёт ошибку
fence node1 dev 0.0 agent fence_xvm result: error from agent
agent args: nodename=node1 agent=fence_xvm key_file=/etc/cluster/fence_xvm.key multicast_address=225.0.0.12
fence node1 failed
Apr 7 19:45:31 node2 corosync[1568]: [TOTEM ] A processor failed, forming new configuration.
Apr 7 19:45:33 node2 corosync[1568]: [QUORUM] Members[1]: 2
Apr 7 19:45:33 node2 corosync[1568]: [TOTEM ] A processor joined or left the membership and a new membership was formed.
Apr 7 19:45:33 node2 corosync[1568]: [CPG ] chosen downlist: sender r(0) ip(100.64.1.2) ; members(old:2 left:1)
Apr 7 19:45:33 node2 corosync[1568]: [MAIN ] Completed service synchronization, ready to provide service.
Apr 7 19:45:33 node2 kernel: dlm: closing connection to node 1
Apr 7 19:45:33 node2 fenced[1639]: fencing node node1
Apr 7 19:45:33 node2 rgmanager[2060]: State change: node1 DOWN
Apr 7 19:45:33 node2 fence_xvm[3340]: No domain specified
Apr 7 19:45:33 node2 fenced[1639]: fence node1 dev 0.0 agent fence_xvm result: error from agent
Apr 7 19:45:33 node2 fenced[1639]: fence node1 failed
Apr 7 19:45:36 node2 fenced[1639]: fencing node node1
Apr 7 19:45:36 node2 fence_xvm[3360]: No domain specified
Apr 7 19:45:36 node2 fenced[1639]: fence node1 dev 0.0 agent fence_xvm result: error from agent
Apr 7 19:45:36 node2 fenced[1639]: fence node1 failed
Apr 7 19:45:39 node2 fenced[1639]: fencing node node1
Apr 7 19:45:39 node2 fence_xvm[3381]: No domain specified
Apr 7 19:45:39 node2 fenced[1639]: fence node1 dev 0.0 agent fence_xvm result: error from agent
Apr 7 19:45:39 node2 fenced[1639]: fence node1 failed
Apr 7 19:45:42 node2 fence_xvm[3402]: No domain specified
Apr 7 19:45:45 node2 fence_xvm[3422]: No domain specified
Apr 7 19:45:48 node2 fence_xvm[3443]: No domain specified
Apr 7 19:45:51 node2 fence_xvm[3462]: No domain specified
fence_node node1 -vv
tcpdump'ом трафика я не вижу ни на node1 , ни на супервизоре, в отличии от fence_xvm .Похожая проблема описана тут , там ребята рекомендовали вырубить selinux, я это сделал но ничего не помогло. Смотрел strace'ом чего он пытается делать - но ничего не понял. Что-то хочет получить от unix-сокета corosync.ipc , но, видимо, не получает желаемого. В общем я в отчаянии: ничего не могу нагуглить и ничего не понимаю. Может у кого-то есть какие-нибудь идеи? Уже несколько дней голову ломаю чего ему надо :(