Добрый день/вечер. Есть кластер под cman. В качестве fence стоит fence_imm (ибо IBM). Команды типа
fence_imm -A password -a 10.0.0.204 -p PASSW0RD -l USERID -o status
Getting status of IPMI:10.0.0.204...Chassis power = On
Done
Конфиг кластера:
[root@node03 ~]# cat /etc/cluster/cluster.conf
<?xml version="1.0"?>
<cluster config_version="105" name="clustername">
<clusternodes>
<clusternode name="nn01" nodeid="1">
<fence>
<method name="fence_node01">
<device name="IMMnn01"/>
</method>
</fence>
</clusternode>
<clusternode name="nn02" nodeid="2">
<fence>
<method name="fence_node02">
<device name="IMMnn02"/>
</method>
</fence>
</clusternode>
<clusternode name="nn03" nodeid="3">
<fence>
<method name="fence_node03">
<device name="IMMnn03"/>
</method>
</fence>
</clusternode>
</clusternodes>
<rm status_poll_interval="5">
<resources>
<script file="/etc/init.d/libvirtd" name="libvirtd"/>
</resources>
</rm>
<logging logfile="/var/log/logname.log"/>
<fencedevices>
<fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.202" login="USERID" name="IMMnn01" passwd="PASSW0RD" power_wait="20" timeout="20"/>
<fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.203" login="USERID" name="IMMnn02" passwd="PASSW0RD" power_wait="20" timeout="20"/>
<fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.204" login="USERID" name="IMMnn03" passwd="PASSW0RD" power_wait="20" timeout="20"/>
</fencedevices>
</cluster>
Так вот проблема: когда бутаем/выключаем одну железку, кворум пересобирается и исключает её:
[root@node02 cluster]# fence_tool ls
fence domain
member count 2
victim count 0
victim now 0
master nodeid 1
wait state none
members 1 2
[root@node02 cluster]# cman_tool status
Version: 6.2.0
Config Version: 105
Cluster Name: clustername
Cluster Id: 33146
Cluster Member: Yes
Cluster Generation: 2736
Membership state: Cluster-Member
Nodes: 2
Expected votes: 3
Total votes: 2
Node votes: 1
Quorum: 2
Active subsystems: 7
Flags:
Ports Bound: 0
Node name: nn02
Node ID: 2
Multicast addresses: 239.192.129.251
Node addresses: 10.100.100.2
Железка бутнулась и все. cman не стартует. Валится на «ожидании кворума». Но стоит только на одной из «живых» дернуть cman одновременно с «не живой», кворум собирается, cman стартует.
То-есть, fence отрабатывает. А вот unfence - нет :-)
Что не так сделано или это особенность этого fence метода?