LINUX.ORG.RU

[DRBD] Вопрос о упавшей ноде.

 


0

1

Привет! Настроил тут связку DRBD + Heatbeat возник вопрос.

При падении Primary ноды Heatbeat все перемонтирует на Secondary ноду делая ее Primary. При поднятии упавшей ноды статус DRBD становится Secondary/Secondary . До тех порт пока не укажешь руками drbdadm primary r0 и не смонтируешь устройсво drbd0 руками. Как можно это попоброть штатными средствами DRBD и HB, делая процесс восстановления полностью автономным.

DRBD:

global { usage-count yes; }
common { syncer { rate 100M; } }
resource cluster {
        protocol C;
        startup {

        }
        disk {
                on-io-error   detach;
        }
        net {
        }
        on node1.hcz.ru {
                device    /dev/drbd0;
                disk      /dev/sda5;
                address   192.168.0.2:7789;
                meta-disk internal;
        }
        on node2.hcz.ru {
                device    /dev/drbd0;
                disk      /dev/sda5;
                address   192.168.0.3:7789;
                meta-disk internal;
        }
}

HB

node1.hc.ru IPaddr::81.111.111.111/22 drbddisk::cluster \
Filesystem::/dev/drbd0::/vz::ext3::



Последнее исправление: addicted (всего исправлений: 2)

Собрать DRBD в режиме Master-Master с каким-нибудь OCFS2 поверх. Heartbeat выкинуть.

BigAlex ★★★
()
Ответ на: комментарий от AEP

Таки _теорема_? Вроде больше похоже на принцип (в смысле ограничение не жесткое) типа «проектного треугольника».

n01r ★★
()
Ответ на: комментарий от n01r

Таки теорема, так как существует доказательство (ищите его сами в google).

А смысл такой: как процесс автовосстановления убедится, что падала именно нода, а не сетка между нодами? В последнем случае, каждая нода посчитает себя первичной (а другую ноду - мертвой), и возможна ситуация, когда каждая из них примет и обработает команду на запись. Тогда процесс восстановления сведется к выбрасыванию данных с одной из нод, но априори непонятно, с какой именно.

AEP ★★★★★
()
Ответ на: комментарий от AEP

Пока не натыкался на ссылочку, где C, A, P были бы формализованы в той мере, чтобы считать «доказательство» достаточно строгим и рассматривать CAP как теорему. Может быть поделитесь?

n01r ★★
()
Ответ на: комментарий от n01r

Ну настолько формально, наверное, нет. Вот хорошее введение: http://www.julianbrowne.com/article/viewer/brewers-cap-theorem , а вот более детальная статья, которая даже рассматривает, что может изменить введение таймеров: http://lpd.epfl.ch/sgilbert/pubs/BrewersConjecture-SigAct.pdf

Смысл доказательства везде один и тот же: распиливают систему на две части (как если бы упала сеть) и показывают, как она вынуждена нарушить требования.

AEP ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.