LINUX.ORG.RU
ФорумAdmin

Что делали целых 20 лет линуксятники с RAID1?

 


0

5

Сегодня хочется публично поматерится, т.к. других слов просто не находится.

Предыистория.
Есть у меня один простенький дедик. Ввиду простоты использую на нем программный RAID1, большего и не требуется.
Лет 5 назад с трудом собрал его по совершенно идиотским инструкциям.
Идиотским - потому что ни одна из инструкций, рассыпаных в Инете, на друг друга не похожи, каждый «афтор» внес свою «посильную лепту» и в результате все эти инструкции описывают рутинную сборку одного и того же RAID1 по разному, и какая их них правильная - хз.
Но все же кое-как удалось собрать этот рейд, и 5 лет он честно проработал.

Для чего вообще я собрал этот рейд? Разумеется, надеясь, что он повысит отказоустойчивость сервера.

И вот, то, что когда-то должно было произойти, свершилось: недавно на одном диске SMART обнаружил BAD-блоки, как гарантии серверных дисков исполнилось 5 лет, на одном диске SMART обнаружил растущие BAD-блоки.
Решил поменять его на резервный ДО того, как он окончательно грохнется.
Сначала расцепил RAID, потом размонтировал разделы на битом диске, короче, сделал все по науке - если считать «наукой» эти опять же разные инструкции по этой процедуре.
Затем сменил битый диск, попытался загрузиться - а фиг вам!
Сначала вроде грузится, показывает загрузчик, а потом идет ругань на неправильный имидж.
Но этот же один исправный диск должен запуститься один, самостоятельно, вне зеркала!
Пришлось пока снова вернуться на битый диск.

Вопрос: и на кой тогда вообще этот программный RAID1 в Linux??
По идее, он должен повысить отказоустойчивость дисковой системы, причем - автоматически.
Но какое же тут повышение, если, во-первых, при отказе одного из дисков система тут же перестает работать,
а во-вторых, чтобы восстановить её работоспособность, нужен ручной труд, причем - квалифицированный?
По правильным инструкциям и т.д. Но по любому, автоматизма здесь - НЕТ!

Для сравнения: вспоминаю старые времена, когда имел дело еще с NT4.
И вот, уж тогда в этой системе, ныне называющейся древней, чтобы собрать зеркало, нужно было всего лишь кликнуть мышкой на нужном диске, откинуться на спинку стула и попивать кофеёк - потому что дальнейшая сборка происходила автоматически, и система при этом даже выполняла основные задачи, хотя и немного медленнее.
Если происходил сбой зеркала, вмешательство админа не требовалось -система его собирала автоматически!
Более того - если один из дисков склеил ласты, то система продолжала работать на одном!
И достаточно было сменить битый диск, как он автоматически собирался в зеркало!

NT4 была создана еще в далеком в 1996.
Сейчас 2016 год, и всего этого в «RAID1 от Linux» - до сих пор нет!
Спрашивается - что делали 20 (двадцать, Карл!) грёбаные линуксятники, именующие себя «разработчиками»?!
Не иначе, как х$м груши околачивали.

★★★★★
Ответ на: комментарий от NightOperator

Вот и твоя ошибка. В общем случае нет, не должен. Надо было выкинуть битый диск из зеркала, не «расцепляя» рейда, по алгоритму, который тебе выше дал BaBL. А ты решил выпендриться и получил себе проблему, т.ч. ССЗБ, наслаждайся теперь результатами ;)

Разумееется, я где-то ошибся, даже не берусь спорить. Иначе бы оно «ура, заработало».

Но потом меня заинтересовало другой вопрос - неужели за 5 лет, когда я плюясь и матерясь, запустил рейд уже не помню по каким мануалам, за это время не создали удобный менеджер управления рейдами?
И если судить по нашей дискуссии, так и есть - НЕ СОЗДАЛИ.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от darkduke

Спасибо за ссылки, ознакомлюсь.
Только Monit - это же не для рейдов, какой-то мониторинг процессов, что ли?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

удобный менеджер управления рейдами

Зачем?

anonymous
()
Ответ на: комментарий от chukcha

Но потом меня заинтересовало другой вопрос - неужели за 5 лет, когда я плюясь и матерясь, запустил рейд уже не помню по каким мануалам, за это время не создали удобный менеджер управления рейдами?

И если судить по нашей дискуссии, так и есть - НЕ СОЗДАЛИ.

Лично мне за 18 лет использования софтварных райдов он ни разу не надобился. Для ручной работы хватало документации и команд консоли, для автоматизации скриптов, дергающих команды по событиям, для мониторинга штатных средств мониторинга, для уведомления почты... Кстати для взрослых «железных» райдов все эти «менеджеры» есть, обычно кривые, тормозливые, неудобные и написанные «на отвали» корпоративным индусом на яве. И для работы они часто тащат с собой вебсервер и т.п. чушь. Обычно вменяемый админ смотрит на этот кошмар один раз, первый, а потом использует консольные утилиты. Так как их функционал богаче, интерфейс лаконичнее и не требует лишних сущностей типа веб сервера и проч. Если он не виндовый админ конечно.

Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 1)
Ответ на: комментарий от Jameson

Кстати для взрослых «железных» райдов все эти «менеджеры» есть, обычно кривые, тормозливые, неудобные и написанные «на отвали» корпоративным индусом на яве. И для работы они часто тащат с собой вебсервер и т.п. чушь.

Ну так в этом не же менеджеры виноваты, а криворукие индусы.
Кто мешал написать их прямыми, быстрыми и удобными?

Ок, такой вопрос, для самопросвещения:

Работает Soft RAID1 на mdadm.
Один из винтов ломается, рейд рассыпается.

Что при этом должно дальше происходить - система должна продолжать и дальше работать на уцелвшем винте?
Или система прекращает работать и ждет, пока прибежит админ с отверкой и прямыми руками и начнет шаманить с дисками и софтом?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Что при этом должно дальше происходить - система должна продолжать и дальше работать на уцелвшем винте? Или система прекращает работать и ждет, пока прибежит админ с отверкой и прямыми руками и начнет шаманить с дисками и софтом?

Да.

anonymous
()
Ответ на: комментарий от anonymous

Да - в смысле прибежит и начнет шаманить? Извините - а где же здесь тогда пресловутая отказусточивость??

chukcha ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Каких только esel здесь не носит.... Но это онанимусы, им по статусу положено.

Но меня реально интересует вопрос - что произойдет при отказе диска?

chukcha ★★★★★
() автор топика
Последнее исправление: chukcha (всего исправлений: 1)
Ответ на: комментарий от chukcha

Дело не в дерьме в карманах, а в том что ты не изучил должным образом того, чем решил пользоваться, а так же по видимому хочешь чтобы тебе дали не консультацию, а готовый рецепт, а это платная услуга.

torvn77 ★★★★★
()
Ответ на: комментарий от chukcha

Еслиб ты подумал над моими словами. то увидел бы в теме ответ на свой вопрос, но так как ты смотреть с такой позиции не хочешь, то и ответ тебе не виден :)

torvn77 ★★★★★
()
Ответ на: комментарий от torvn77

Похоже, и ты ничего не понял. Еще раз для особо: Мне - не нужен готовый рецепт.
Я нигде о нем здесь не просил, а то, что мне подсказывали, как исправить проблему, мне сейчас не нужно.
А когда понадобится - думаю, и сам справлюсь.

Меня в этой теме интересуют лишь глобальные вопросы:

1. Самый главный: Что сделали линуксятики за целых 20 лет по рейдам?
Для тех, кто не понял: почему за 20 лет не создали удобного консольного менеджера по управлению рейдами?
А вместо этого занимались Плазмами и прочимими рюшечками, которые по большому счет и нафиг не нужны - спокойно обхожусь без них и даже толком не знаю, что это - рюшечки да и только.

2. Что произойдет при выходе из строя одного из дисков зеркала - система остановится?

chukcha ★★★★★
() автор топика
Последнее исправление: chukcha (всего исправлений: 2)
Ответ на: комментарий от anonymous

Хочешь готовый продукт - плати.

Ок, тогда давайте платить за всё, что есть в Линуксе - там полно готовых продуктов ;)

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Плати. Пожертвования никто не запрещал.

anonymous
()
Ответ на: комментарий от chukcha

Но меня реально интересует вопрос - что произойдет при отказе диска?

RAID перейдёт в состояние degraded

anonymous
()
Ответ на: комментарий от chukcha

Ну так в этом не же менеджеры виноваты, а криворукие индусы.

Кто мешал написать их прямыми, быстрыми и удобными?

А они только «менеджерам» этого индуса и нужны. И тебе ещё. Остальному большинству специалистов они не нужны. Им нужна консольная утилитка, делающая то же самое, доступная по ssh и не привносящая в систему лишнего мусора.

Работает Soft RAID1 на mdadm. Один из винтов ломается, рейд рассыпается. Что при этом должно дальше происходить - система должна продолжать и дальше работать на уцелвшем винте?

Да. Осиль уже man mdadm, там есть всё что тебя интересует. Плюс тебе доков накидали. За тебя я твой райд настраивать не буду, разве что за деньги.

Твоя беда в том, что ты ждёшь от mdraid «автоматики». Её нет, это просто модуль ядра реализующий работу, а автоматика это уже юзерспейс. Есть утилита mdadm, твой основной инструмент и для мониторинга и для управления, всю автоматику ты должен сделать сам, используя mdadm в скриптах. Во «взрослых» райдах автоматика есть в их прошивке, но ты должен всё равно её настроить предварительно. По сути в случае mdraid ты из жёлудей и пластилина (mdadm) сооружаешь логику работы «прошивки» аппаратного райда сам.

Ничего сложного в этом нет, читай и учись.

Jameson ★★★★★
()
Ответ на: комментарий от chukcha

Mdadm вполне удобен и достаточен для управления рейдом и он предупреждает тебя от некоторых сценариев выстрела в ногу, а статистика в /proc/mdstat удобна для использования в самописных или готовых средствах мониторинга. Да, в некоторых случаях рейд может развалиться сам из-за неконсистентного состояния при записи на живые винты, но у тебя другой случай - ты самостоятельно развалил рейд в штатной ситуации (а ситуация именно штатная: remapы на одном из винтов в смарте - не повод выкидывать винт из рейда) и вывел его из под контроля md, а затем, не предприняв дополнительных действий, вполне ожидаемо не смог загрузиться с останков этого рейда. Так почему ты в этом случае ругаешь именно mdadm?

NightOperator ★★★
()
Ответ на: комментарий от chukcha

Или система прекращает работать и ждет, пока прибежит админ с отверкой и прямыми руками и начнет шаманить с дисками и софтом?

Чтобы этого не происходило используют hotspare диск. Гуголь по вопросу mdraid hotspare расскажет как. Заменить им отказавший можно руками, зайдя на сервер по ssh, а можно осилить скрипт, который сделает это по событию. Примеры опять таки гуглятся.

И да, ты таки задолбал. Инфы тебе дали более чем достаточно, либо осиливай её либо найми специалиста.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

система должна продолжать и дальше работать на уцелвшем винте?

Если возможно, ответь на этот вопрос просто - Да/Нет.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от Jameson

читай и учись
прошло пять лет

Это бесполезно. Он за 5 лет не сумел прочитать ман.

anonymous
()
Ответ на: комментарий от NightOperator

Так почему ты в этом случае ругаешь именно mdadm?

Потому что это тот инструмент, которым создавал рейд.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

ответь на этот вопрос просто - Да/Нет.

Да/Нет.

anonymous
()
Ответ на: комментарий от chukcha

ответь на этот вопрос просто

В Job.

anonymous
()
Ответ на: комментарий от chukcha

Если возможно, ответь на этот вопрос просто - Да/Нет.

Да, естественно. И никак иначе, разве что и он откажет.

Jameson ★★★★★
()
Ответ на: комментарий от NightOperator

Так почему ты в этом случае ругаешь именно mdadm?

Я не жду автоматики именно от mdraid. Если ее в нем нет - хусим.
Тогда я ищу тот инструмент, где она есть.
Но похоже, в Линуксе его для Soft RAID нет?
А есть прекрасные маны, конфиги, на которые ...ют все сознательные админы.

Интересно, что вы запоёте, когда ее таки сделают? А это обязательно сделают, софт не стоит на месте, и не одни индусы у руля.
Хватит ли у вас смелости признать, как до этого было дерьмово?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Потому что это тот инструмент, которым создавал рейд.

Ты если топором себе пальцы отчекрыжишь тоже топор обвинять будешь? Реально задолбал! Я такого тупняка давно не видел. Зачем ты бухтишь и мучаешься, забей уже и свали в более другую ОС, где порог вхождения пониже, «менеджеры» опять таки. Ну не дано тебе, трудно, раздражает, нет менеджеров, сплошь инженеры и много слов надо читать на вражеском языке, так не всем же быть профи в конце концов! Займись тем, что даётся, что умеешь.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Да, естественно. И никак иначе, разве что и он откажет.

Тогда ты этим перевернул мне сегодня все мое понимание отказоустойчивости данного рейда.
В моем понимании - в этом рейде её вообще нет.

В сухом остатке от вашего mdadm остется только удвоенная скорость чтения дисков (которая на данном дедике мне и нафиг не нужна).

chukcha ★★★★★
() автор топика
Ответ на: комментарий от Jameson

Реально задолбал!

*продолжает кормить*

anonymous
()
Ответ на: комментарий от chukcha

В-общем - всем спасибо, приятно было пообщаться, и окончательно уяснить, какое же фуфло - этот ваш знаменитый mdadm :)

chukcha ★★★★★
() автор топика
Ответ на: комментарий от dhameoelin

Надеюсь, ты не админ и не отвечаешь ни за что серьёзное.

Почему тебя волнует, за что он отвечает?

anonymous
()
Ответ на: комментарий от chukcha

Всегда пожалуйста. Ты не стесняйся, спрашивай по существу, когда надумаешь запилить что-то более автоматизированное и удобное или поучаствовать в развитии того же mdadm, добавив туда то, что не хватает тебе и при этом может быть полезно ещё кому-либо, тут всегда рады покорми^W посоветовать ;)

NightOperator ★★★
()
Ответ на: комментарий от Jameson

И да, ты таки задолбал. Инфы тебе дали более чем достаточно, либо осиливай её либо найми специалиста.

Чукча не читатель.

kernelpanic ★★★★★
()
Ответ на: комментарий от dhameoelin

Не пользуйся, кто тебя заставляет.

anonymous
()
Ответ на: комментарий от chukcha

Тогда ты этим перевернул мне сегодня все мое понимание отказоустойчивости данного рейда. В моем понимании - в этом рейде её вообще нет.

И в итоге ты вообще как оказалось не понимаешь зачем нужен райд. А ЧТО произойти должно по твоему? Сервер должен отказаться работать с деградировавшим райдом? А зачем такой обидчивый сервер нужен?

Логика такая - у нас нет райда, совсем. Сервер работает пока не сдохнет винт.

У нас есть райд1. Сервер работает. (самурай с мечом)

У нас сломался винт в райд1. Сервер РАБОТАЕТ, просто как бы без райда (райд деградировал, самурай без меча, идентичный самураю с мечом, просто он без меча)

Ты прибежал и заменил горелый винт, восстановил райд. Сервер РАБОТАЕТ (самурай снова с мечом)

Ты настроил автоматику и заранее предусмотрел запасной (hot spare) винт в своём райде. Скриптики отработали, дохлый винт отключился, лампочка его потухла, запасной подключился, райд восстановился. Ты допил чай и поехал забрать труп и вонзить новый винт и не забыл сделать его новым hotspare. А сервер всё это время РАБОТАЛ ШТАТНО и обслуживал людишек.

Обслуживание клиентов сервера в обоих случаях не прекращалось. Просто в случае с ручной заменой ты бежал туда как ошпареный (а вдруг и второй счас сдохнет, райда то уже нет, он degraded), а во втором случае поехал в удобное тебе время. (ну нет у тебя временно hotspare, ну и чёрт с ним, по времени уже не критично, райд восстановлен, страховка снова есть...)

Всё, хватит, уйди от меня, не могу больше, такой тупняк...

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Не понимаю зачем ты ему отвечал. Уже после «пять лет» в посте было ясно, что он - идиот или что-то похуже.

anonymous
()
Ответ на: комментарий от anonymous

Не понимаю зачем ты ему отвечал. Уже после «пять лет» в посте было ясно, что он - идиот или что-то похуже.

Да сам не знаю, помочь хотел. Загоню ка я его в игнор, вряд ли я от него что либо интересное впредь услышу\узнаю.

Jameson ★★★★★
()
Ответ на: комментарий от chukcha

Это на десктопах он занимает 1%, а на серверах 60% вместе с фряхой.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от chukcha

Заодно подумайте, почему Linux попрежнему занимает 1%

Подумал, что это хорошо. Представил 99% таких как ты на линуксе....

ashot ★★★★
()
Ответ на: комментарий от chukcha

Заодно подумайте, почему Linux попрежнему занимает 1%

facepalm.pcx

KRoN73 ★★★★★
()
Ответ на: комментарий от chukcha

Но вы не ответили на главный вопрос - см. название темы!

Он нормально работал все эти годы без всяких костылей. Представляешь ? В отличие от Windows. :-)

AS ★★★★★
()
Ответ на: комментарий от chukcha

как-то не стыкуется с вашим

Ты читать умеешь ? Речь про софтраид вообще. Если ты думаешь, что всякие Imtel Matrix, и виндовые недорейды ведут себя иначе, ты глубоко заблуждаешься. Это - общая проблема любых реализаций вне железа.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.