LINUX.ORG.RU
ФорумAdmin

corosync/pacemaker и lxc

 , , , ,


0

2

sup лор! Есть одна тян кластер:

  • OS: Debian 11 (И debian 10 тоже)
  • Kernel: 5.10.0-15-amd64
  • Env: resource-agents 1:4.7.0-1~bpo10+1, pacemaker 2.0.5-2, corosync 3.1.2-2, lxc 1:4.0.6-2

добавляю новый lxc-контейнер в кластер

lxc-start -n front-2.fr
pcs resource create front-2.fr ocf:heartbeat:lxc config=/mnt/cluster_volumes/lxc2/front-2.fr/config container=front-2.fr
всё норм, всё работает, потом через пять минут хочу удалить всё это дело, пишу
pcs resource remove front-2.fr --force
и получаю ошибку и последующий фенсинг с миграцией
lxc(front-2.fr)[2103391]: ERROR: LXC container name not set!
Если верить /usr/lib/ocf/resource.d/heartbeat/lxc ошибка эта возникает из-за того, что переменная OCF_RESKEY_container пустая/не задана или просто не передаётся скрипту.

Собсно возникает это только на кластерах с большими аптаймами. Например после фенсинга и ребута можно сколько угодно добавлять/удалять ресурсы и всё будет работать как часы до какого-то определённого момента. Вряд ли кто-то с этим сталкивался (я один такой счастливчик) но мб кто-то сможет дать совет как это дальше можно дебажить?