LINUX.ORG.RU
ФорумAdmin

Рассыпался Soft-Raid. Как починить?

 


0

2

При сбое питания впервые за несколько лет рассыпался Soft-Raid так, что не восстанавливается. Raid собирался по статье http://coreit.ru/kb/centos_raid_install/

При старте системы возникают следующие сообщение:

Welcome....
Запускается udev ... OK
Устанавливается имя узла.....
Проверяются файловые системы
/dev/md2 contains a file system with errors, check forced.
Directrory inode 36177175, block #10, offset 200: directory corrupted

/dev/md2: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
    (i.e., without -a or -p options)

Welcome....
Запускается udev ... OK
Устанавливается имя узла.....
Проверяются файловые системы
/dev/md2 contains a file system with errors, check forced.
Directrory inode 36177175, block #10, offset 200: directory corrupted

/dev/md2: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
    (i.e., without -a or -p options)

fsck в этот раз не помогает, т.к. не видит файловые системы - ругается на отсутствие /etc/fstab

Как быть?

★★★★★
Ответ на: комментарий от chukcha

Правда, я все равно ни хрена не понял, что я делал,

Ну вот, значит сегодня вздохни спокойно, а завтра же поэкспериментируй с mdadm в виртуалке на локалхосте. Попробуй сэмулировать отвал одного диска и восстановление, это будет тоже полезно знать заранее. Заодно посмотри, как это выглядит в /proc/mdstat и подумай, как сделать себе своевременное извещение о проблеме на боевом сервере.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от YAR

Ну вот странно, этот принудительный --scan собрал зеркало, а почему автоматом при старте оно не собралось?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Не знаю, надо знать особенности того live-cd, что ты используешь. Массив обычно собирается при старте ядра, еще до монтирования корневой ФС. Может тут модули для работы с массивом не подгружались, а уже в работающей системе при запуске mdadm они были подгружены. Не знаю, в общем.

YAR ★★★★★
()
Ответ на: комментарий от chukcha

а у тебя есть Я.Д.?

И у меня нет. Да ладно, не парься. :-) Вот если бы пришлось помогать втаскивать из образа md2, был бы другой разговор. ;-)

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от YAR

Не знаю, надо знать особенности того live-cd, что ты используешь.

А, значит я неполно сформулировал вопрос, еще раз:
- почему при старте проинсталлированной системы (веб-сервак) зеркало перестало собираться, а принудительно - собралось?
Нельзя ли эту принудиловку внедрить в стартовые сервисы?

И у меня нет. Да ладно, не парься. :-)

Видать, у всех настоящих админов только биткоины, что ли :-)
Что же, еще раз огромное вам всем спасибо! Без вас был бы полный аут.
Хоть свои контакты оставьте, что ли.

Вот если бы пришлось помогать втаскивать из образа md2, был бы другой разговор. ;-)

Тьфу-тьфу-тьфу! :)

chukcha ★★★★★
() автор топика
Последнее исправление: chukcha (всего исправлений: 1)
Ответ на: комментарий от chukcha

почему при старте проинсталлированной системы (веб-сервак) зеркало перестало собираться

Стоп, а чего ты решил, что оно перестало собираться?

а принудительно - собралось?

А разве ты это делал не с live-cd?

YAR ★★★★★
()
Ответ на: комментарий от YAR

Стоп, а чего ты решил, что оно перестало собираться?

Так вы сами и сказали :)) Запутали меня в конец, а теперь сами спрашиваете :)

А разве ты это делал не с live-cd?

Пробовал и с LiveCD, но потом вернулся к использоанию установочного диск раздела Rescue, мне он показался удобнее.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Так вы сами и сказали :))

Рассыпался Soft-Raid. Как починить? (комментарий)

Пробовал и с LiveCD, но потом вернулся к использоанию установочного диск раздела Rescue, мне он показался удобнее.

Ок, не так важно. Просто другой live-cd. Суть в том, что не с боевой системы.

YAR ★★★★★
()
Ответ на: комментарий от YAR

Я уже совсем отчаялся понять, кто кому здесь Рабинович :)

Т.е., из-за чего случилась эта авария -
- из-за того, что грохнулась ФС, и дальнейшая загрузка с самосборкой зеркала стала невозможной;
- или что грохнулось зеркало, а заодно и ФС, и дальнейшая загрузка с починкой ФС стала невозможной.

Или еще как-то?...

Но в любом случае оччччень не понравилось, что восстановление работоспособности не автоматическое :(

chukcha ★★★★★
() автор топика
Последнее исправление: chukcha (всего исправлений: 1)
Ответ на: комментарий от chukcha

Первый вариант. С зеркалом у тебя было все ок и оно в боевой системе собиралось. А вот с ФС был какой-то баг, который мешал грузиться.

Но в любом случае оччччень не понравилось, что восстановление работоспособности не автоматическое :(

А в Debian есть такое:

/etc/default/rcS
# automatically repair filesystems with inconsistencies during boot
FSCKFIX=yes

Но в любом случае стоит разобраться, почему случилась авария.

YAR ★★★★★
()
Последнее исправление: YAR (всего исправлений: 1)
Ответ на: комментарий от YAR

Но в любом случае стоит разобраться, почему случилась авария.

Так с самого начала это было ясно :)

При сбое питания

Оно внезапно отключилось.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Так с самого начала это было ясно :)

Я в более общей форме это имел в виду :). Сейчас - да, сбой питания, вызвавший достаточно серьезный сбой ФС, из-за которого та не смогла работать дальше и отремонтироваться «сама». Но в целом, включив ту опцию, что я показал выше, можно и не знать, что происходят сбои, что в итоге может привести к более серьезным проблемам и потере данных.

YAR ★★★★★
()
Ответ на: комментарий от chukcha

Т.е., из-за чего случилась эта авария -
- из-за того, что грохнулась ФС, и дальнейшая загрузка с
самосборкой зеркала стала невозможной;
- или что грохнулось зеркало, а заодно и ФС, и дальнейшая загрузка с починкой ФС стала невозможной.

«Нет» по обоим пунктам. Правильный ответ:

Из-за того, что грохнулась ФС, причём fsck посчитал, что проблема достаточно серьёзна и необходимо ручное вмешательство. Проблемы с RAID не было вообще. Точно так же было бы и с обычным разделом в такой же ситуации.

Что касается проблем со сборкой RAID, они были только из-за того, что на используемых Live CD и Resque CD не получилась автоматическая сборка, так как, при их подготовке, что-то не учли (или, даже, не собирались учесть). Эта проблема к самому RAID на боевом сервере отношения не имеет.

AS ★★★★★
()
Ответ на: комментарий от chukcha

Оно внезапно отключилось.

У меня была недавно похожая ситуация на старом сервере с аппаратным raid. Сервак пингуется, но на него нельзя зайти по ssh. Подключился по kvm - мертво. Никак не реагирует. Вырубили питание. Включили. Работало 2 БП, а стал 1. При загрузке паника ядра. Просто суперская ситуация!

andrew667 ★★★★★
()
Ответ на: комментарий от andrew667

У меня была недавно похожая ситуация на старом сервере с аппаратным raid.

Любопытно, как помогло разрулить эту ситуацию использование RAID?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от andrew667

Вот и я засомневался в своей истории в реальной полезности RAID.
То, что оно дублирует данные в real-time на разных дисках - это бесспорно.
Но быстро восстановить систему после серьезного сбоя - проблематично.
Здесь я имею в виду только реализацию Soft-Raid для Linux.
Потому что такой же Raid, который когда-то использовал еще в NT4 - это просто песня!
Настраивается в два клика мышкой, восстанавливается тоже лёгко, в-общем, мечта админа.

В отличии от линуксового - сплошная головоломка и чтение мандуалов.
Почему бы и его не сделать таким же простым и удобным для пользователя?

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Вот и я засомневался в своей истории в реальной полезности RAID.

Зря. Такие ситуации редко, но бывают. В остальном замена дисков не доставляет проблем. Еще, бывает, отказывает дисковый контроллер и системная плата.

Потому что такой же Raid, который когда-то использовал еще в NT4 - это просто песня!

ОС тут непричем.

P.S. Заметь, что тебе удалось подняться! В моем случае на аппаратном контроллере этого сделать не удалось.

andrew667 ★★★★★
()
Ответ на: комментарий от andrew667

Зря. Такие ситуации редко, но бывают.

Мне и одной такой хватило, чтобы начать пересматривать свое отношение в реальной полезности RAID.
Ведь он служит двум целям - спасению данных, причем быстрому спасению. Второго я здесь не обнаружил.
Хотя, конечно, мои знания, вернее, их отсутствие, сыграло свою роль.

ОС тут непричем.

Конечно, тут ни при чем, дело в менеджере RAID, его простоте и удобстве.
Хотя и тут этот же вопрос - зачем мне эти знания и чтения мануалов, если эту функцию может взять на себя умный менеджер RAID?
Пусть компьютер помнит и выполняет эту рутинную работу, для того он и придуман.

В моем случае на аппаратном контроллере этого сделать не удалось.

Разумеется, некоторые аппаратные контроллеры при своих плюсах имеет общеизвестный существенный минус - жесткая привязка к контроллеру, и если он грохнется, а подобного в запасе нет - данным каюк.
Поэтому в своем серваке осознанно выбирал именно софтовый Raid, чтобы не вляпаться.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от AS

Из-за того, что грохнулась ФС, причём fsck посчитал, что проблема достаточно серьёзна и необходимо ручное вмешательство. Проблемы с RAID не было вообще. Точно так же было бы и с обычным разделом в такой же ситуации.

AS, спасибо за грамотную формулировку - только после нее, кажется, я стал понимать, что же все таки случилось :))

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Пусть компьютер помнит и выполняет эту рутинную работу, для того он и придуман.

Тогда в случае проблем его надо заменить. Зачем возиться, если он неисправен?

andrew667 ★★★★★
()
Ответ на: комментарий от chukcha

Кого заменить, зачем? Не понял фразу...

Компьютер всвязи с неполадками.

andrew667 ★★★★★
()
Ответ на: комментарий от chukcha

То, что оно дублирует данные в real-time на разных дисках - это бесспорно.

Это не то. От повреждения ФС RAID не спасает. RAID - всего лишь защита от умирания HDD. И увеличение скорости, хотя с софт-раид это сомнительное утверждение.

AS ★★★★★
()
Ответ на: комментарий от andrew667

В моем случае на аппаратном контроллере этого сделать не удалось.

С аппаратным опасна только смерть контроллера и отсутствие запасного.

AS ★★★★★
()
Ответ на: комментарий от AS

Это не то. От повреждения ФС RAID не спасает. RAID - всего лишь защита от умирания HDD.

Так это я прекрасно понимаю, разве где-то я сказал не так?

Компьютер всвязи с неполадками.

Все равно не понял. Я лишь имел в виду то обстоятельство, что известная по указанной вначале реализация программного RAID-менеджера для Linux уж очень кондовая, на низком уровне, предполагающая определенные знания пользователя.
Которые предлагал переложить на компьютер, чтобы он сам их помнил и выполнял.
Ладно, забей :) Это пожелания вслух, а реально все равно в Линуксе никто не занимается совершенстованием труда админа, скорее придумают десяток новых, таких же неудобных технологий, чем усовершенсттвуют хоть одну старую - традиции, блин...

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

разве где-то я сказал не так ?

Показалось, что была надежда на защиту от повреждения ФС. Что же касается удобства, то тут лучше точно понимать, что делаешь. Я контроллеров всяких насмотрелся, mdadm - не худший вариант в плане интерфейса.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от AS

mdadm - не худший вариант в плане интерфейса.

Наверное, раз даже я сумел настроить с его помощью зеркало :)

Но если сравнивать с виндовым - тут полный абзац.
И дело даже не в том, что графика, такой же удобный интерфейс можно было бы сделать и в консоли.

Что же касается удобства, то тут лучше точно понимать, что делаешь.

Представь себе, в виндовом я понимал что делаю :) В отличии от линухового.

Впрочем, лучше помолчу, все равно окажусь неправ, раз пытаюсь обратить внимание, что в виндовсе тоже есть хорошие решения - на ЛОРе такого не любят :))

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

А md125 надо чекать?

Если это /boot и ты уже загрузился нормально без livecd, то его можно безболезненно отмонтировать(один хрен после загрузки в него читают/пишут в основном только при обновлении), прочекать и снова смонтировать

Pinkbyte ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.