LINUX.ORG.RU
ФорумAdmin

Проблема с софтварным рейдом


0

0

Недавно обнаружил, что у меня по каким-то причинам отвалился один из дисков в софтварном рейде. Добавил его обратно, как делал раньше. Он добавился как spare. По идее, я ожидал, что он перестроится и станет вторым активным диском. На практике, он перестраивается, но после завершения процесса статус диска по прежнему остается "spare rebuilding", а состояние рейда "active, degraded". В результате он перестраивается после каждой перезагрузки.

Почему так? Что делать?


Вывод mdadm -D в процессе восстановления:

/dev/md0:
Version : 00.90.03
Creation Time : Thu Aug 28 22:02:07 2008
Raid Level : raid1
Array Size : 83891328 (80.01 GiB 85.90 GB)
Used Dev Size : 83891328 (80.01 GiB 85.90 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Fri Oct 30 00:44:46 2009
State : active, degraded, recovering
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1

Rebuild Status : 4% complete

UUID : be9f29c0:c3ccc5b6:1de4bcd2:88e57e3e
Events : 0.95820

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
2 8 17 1 spare rebuilding /dev/sdb1

rlz
() автор топика
Ответ на: комментарий от rlz

Вывод mdadm -D после того, как восстановление, якобы, завершилось:

/dev/md0:
Version : 00.90.03
Creation Time : Thu Aug 28 22:02:07 2008
Raid Level : raid1
Array Size : 83891328 (80.01 GiB 85.90 GB)
Used Dev Size : 83891328 (80.01 GiB 85.90 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Fri Oct 30 09:15:03 2009
State : active, degraded
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1

UUID : be9f29c0:c3ccc5b6:1de4bcd2:88e57e3e
Events : 0.103770

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
2 8 17 1 spare rebuilding /dev/sdb1

rlz
() автор топика

Посмотри в dmesg.
Отключи и проверь винт.
Скинь инфу и пересоздай рэйд )

SlavikSS ★★
()

> Что делать?

mdadm /dev/md0 -f /dev/sdb1
mdadm --zero-superblock /dev/sdb1
mdadm /dev/md0 --add /dev/sdb1

no-dashi ★★★★★
()

> Что делать?

+Много к словам про "проверить диск". Не "добавлять обратно как раньше", а посмотреть что говорит smartctl, и погонять его через dd.

no-dashi ★★★★★
()
Ответ на: комментарий от no-dashi

> А когда она нае...тся, купи на последние деньги вазелина.

Так понимаю, делишься собственным опытом? Вазелин-то помог?

anonymous
()
Ответ на: комментарий от anonymous

> Так понимаю, делишься собственным опытом

Да вот как бы нет. Я же линуксоид, безZFSное быдло, никто мне не вышивает крестиком, бэкапы в онлайне не делает, копи-он-райт данные не пишет, контрольные суммы не считает, так что я резервные копии по-старинке на отдельный носитель делаю, посему вазелин раздал таким как ты

no-dashi ★★★★★
()
Ответ на: комментарий от rlz

cat /proc/mdstat - точно ребилдится? dmesg не ругается на винт?

azure ★★
()
Ответ на: комментарий от no-dashi

>> Так понимаю, делишься собственным опытом

> Да вот как бы нет.

Так как бы или нет?

> Я же линуксоид, безZFSное быдло, никто мне не вышивает крестиком, бэкапы в онлайне не делает, копи-он-райт данные не пишет, контрольные суммы не считает, так что я резервные копии по-старинке на отдельный носитель делаю, посему вазелин раздал таким как ты

Ну мне ты ниче не раздавал, тут ты чето конкретно путаешь. Да и вообще - раздавать не поторопился? а то вдруг какая Ext3+LVM накроется медным тазом, а бэкап не прочитается...

anonymous
()

Я уже нескольких людей видел которые частичтно потеряли свой контент(не весь, но корячились с битыми дисками долго) на серверах только потому что при деградации raid1 диск обратно добавляли.

Ну если тебе плевать на целостность данных то проще на одном диске сидеть а не второй битый обратно добавлять. И дешевле в два раза и нет ложной уверенности что "рейд от всех бед спасёт".

true_admin ★★★★★
()
Ответ на: комментарий от no-dashi

В общем, оказалось, что сломался диск, который был активен. В самом конце синхронизация обламывалась из-за того, что встречалась нечитаемая область.

Не понимаю, почему этот диск не помечался при этом как fail. Все данные при этом успешно читалисьб так как били размещены в других регионах, так что все закончилось благополучно.

rlz
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.