Имеем:
- Два узла KVM: adam и eva
- Домен mt
- DRBD диск mt (подключен прямо в домен)
Задача: Заставить домен mt работать на узле adam, а в случае его падения подниматься на eva. После восстановления adam, аккуратно мигрировать на свое теплое местечко )))).
Делаю: Правлю crm и не могу добиться что бы мой домен стартовал, а диск в primary выставлялся. (Конечно доменов много, но хотя бы с одним разобраться). Домен кстате создается, но почему-то выключен, уверен из за того что состояние диска secondary.
Вот что я наконфигурировал:
crm(live)configure# show
node $id="75eef2e8-b0a3-4d3b-9151-1c52e0a6376c" eva \
attributes standby="on"
node $id="913444a3-a9f4-4f8d-8fb6-eb7595a35489" adam \
attributes standby="on"
primitive domain_mt ocf:heartbeat:VirtualDomain \
params config="/home/cluster/mt.domain" hypervisor="qemu:///system" \
meta allow-migrate="true" \
op start interval="0" timeout="120s" \
op stop interval="0" timeout="120s" \
op monitor interval="10" timeout="30" depth="0"
primitive drbd_mt ocf:linbit:drbd \
params drbd_resource="mt" \
op monitor interval="15s"
ms ms_drbd_mt drbd_mt \
meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"
colocation mt_on_drbd inf: domain_mt ms_drbd_mt:Master
order mt_after_drbd inf: ms_drbd_mt:promote domain_mt:start
property $id="cib-bootstrap-options" \
dc-version="1.0.9-unknown" \
cluster-infrastructure="Heartbeat" \
no-quorum-policy="ignore"
# nano /etc/heartbeat/ha.cf
debugfile /var/log/ha-debug
autojoin none
bcast eth0
warntime 3
deadtime 6
initdead 60
keepalive 1
node ADAM
node EVA
crm respawn
# tail ha-debug
Dec 28 20:06:46 ADAM crmd: [1014]: info: process_lrm_event: LRM operation drbd_mt:0_monitor_0 (call=2, rc=0, cib-update=9, confirmed=true) ok
Dec 28 20:06:47 ADAM attrd: [1013]: info: attrd_trigger_update: Sending flush op to all hosts for: probe_complete (true)
Dec 28 20:06:47 ADAM crmd: [1014]: info: do_lrm_rsc_op: Performing key=13:43:0:8a155f5c-3f41-4bfb-a557-a4f3d82974ce op=drbd_mt:0_monitor_15000 )
Dec 28 20:06:47 ADAM lrmd: [1011]: info: rsc:drbd_mt:0:4: monitor
Dec 28 20:06:47 ADAM attrd: [1013]: info: attrd_perform_update: Sent update 15: probe_complete=true
Dec 28 20:06:47 ADAM attrd: [1013]: info: attrd_trigger_update: Sending flush op to all hosts for: probe_complete (true)
Dec 28 20:06:47 ADAM attrd: [1013]: info: attrd_perform_update: Sent update 18: probe_complete=true
Dec 28 20:06:47 ADAM crmd: [1014]: info: process_lrm_event: LRM operation drbd_mt:0_monitor_15000 (call=4, rc=0, cib-update=10, confirmed=false) ok
Dec 28 20:16:39 ADAM cib: [1010]: info: cib_stats: Processed 85 operations (352.00us average, 0% utilization) in the last 10min
Dec 28 20:26:39 ADAM cib: [1010]: info: cib_stats: Processed 39 operations (0.00us average, 0% utilization) in the last 10min
# crm_mon
============
Last updated: Tue Dec 28 21:06:33 2010
Stack: Heartbeat
Current DC: eva (75eef2e8-b0a3-4d3b-9151-1c52e0a6376c) - partition with quorum
Version: 1.0.9-unknown
2 Nodes configured, unknown expected votes
2 Resources configured.
============
Node eva (75eef2e8-b0a3-4d3b-9151-1c52e0a6376c): standby
Node adam (913444a3-a9f4-4f8d-8fb6-eb7595a35489): standby
Master/Slave Set: ms_drbd_mt
Slaves: [ eva adam ]
domain_mt (ocf::heartbeat:VirtualDomain): Started adam FAILED
Failed actions:
drbd_mt_monitor_0 (node=eva, call=2, rc=6, status=complete): not configured
domain_mt_monitor_0 (node=adam, call=3, rc=1, status=complete): unknown error