LINUX.ORG.RU
ФорумAdmin

Ceph, при падение одного из серверов, повисает работа массива.

 , , ,


0

1

Добрый день!
В качестве хранилища для OpenStack'a используем Ceph, но с ним есть одна проблема. При падении одного из серверов массива, он начинает ребилдится, что приводит к повисанию инстанций в OpenStack'e, они становятся недоступными. Вероятней всего, корневые разделы этих инстанций находятся на вышедшем из строя сервере. Насколько я знаю это не типичное поведение для ceph'a, не понятно просто в чем тогда заключается его отказоустойчивость. Кто-нибудь сталкивался с такими проблемами и как можно их разрешить? У нас для хранилища используется 7 серверов с 14 sas hdd и 4-мя ssd под журналирование. Релиз Hammer 0.94.5, osd_pool_default_size = 3. Так же еще планируем обновление на 12.2.4 LUMINOUS. Читал в доке, что можно обновляться при работающем массиве, но нужно ли делать обновление постепенно переходя с релиза на релиз или же можно с версии 0.94.5 обновится до 12.2.4?


Ответ на: комментарий от deadNightTiger

Да, паблик у нас идет на меди в 1Гбит, а кластер в 10G по оптике.

amkgi
() автор топика

У нас для хранилища используется 7 серверов с 14 sas hdd и 4-мя ssd под журналирование.

И какой общий объем данных? Занято/свободно? На каждый сервер 14 хдд и 4 ссд или всего? Утилизация дисков/сети во время ребилда?

stave ★★★★★
()
Ответ на: комментарий от stave

У нас 7 нод, в них 14 дисков по 900Гб. Общий объем 86Тб. Вот по времени утилизации дисков и сети, сейчас сказать не могу. Я не смотрел, просто после вылета одного сервера, около 3 часов идет ребилд. Последний раз заняло именно столько времени.

amkgi
() автор топика

А кто-нибудь может сказать, что-нибудь об обновлении?

amkgi
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.