Проблема с софтварным рейдом

0

0

Недавно обнаружил, что у меня по каким-то причинам отвалился один из дисков в софтварном рейде. Добавил его обратно, как делал раньше. Он добавился как spare. По идее, я ожидал, что он перестроится и станет вторым активным диском. На практике, он перестраивается, но после завершения процесса статус диска по прежнему остается "spare rebuilding", а состояние рейда "active, degraded". В результате он перестраивается после каждой перезагрузки.

Почему так? Что делать?

Ссылка

←	Проблема с доступом к серверу

[взрыв мозга][all]Нестабильная работа Vlan

→

Вывод mdadm -D в процессе восстановления:

/dev/md0:
Version : 00.90.03
Creation Time : Thu Aug 28 22:02:07 2008
Raid Level : raid1
Array Size : 83891328 (80.01 GiB 85.90 GB)
Used Dev Size : 83891328 (80.01 GiB 85.90 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Fri Oct 30 00:44:46 2009
State : active, degraded, recovering
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1

Rebuild Status : 4% complete

UUID : be9f29c0:c3ccc5b6:1de4bcd2:88e57e3e
Events : 0.95820

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
2 8 17 1 spare rebuilding /dev/sdb1

rlz
(30.10.09 00:59:38 MSK) автор топика

Ответ на: комментарий от rlz 30.10.09 00:59:38 MSK

Вывод mdadm -D после того, как восстановление, якобы, завершилось:

/dev/md0:
Version : 00.90.03
Creation Time : Thu Aug 28 22:02:07 2008
Raid Level : raid1
Array Size : 83891328 (80.01 GiB 85.90 GB)
Used Dev Size : 83891328 (80.01 GiB 85.90 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Fri Oct 30 09:15:03 2009
State : active, degraded
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1

UUID : be9f29c0:c3ccc5b6:1de4bcd2:88e57e3e
Events : 0.103770

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
2 8 17 1 spare rebuilding /dev/sdb1

rlz
(30.10.09 09:18:27 MSK) автор топика

Ссылка

Посмотри в dmesg.
Отключи и проверь винт.
Скинь инфу и пересоздай рэйд )

SlavikSS ★★
(30.10.09 10:20:54 MSK)

Ссылка

Выкинь mdadm вместе с Linux. Возьми ZFS.

iZEN ★★★★★
(30.10.09 10:36:45 MSK)

> Что делать?

mdadm /dev/md0 -f /dev/sdb1
mdadm --zero-superblock /dev/sdb1
mdadm /dev/md0 --add /dev/sdb1

~~no-dashi~~ ★★★★★
(30.10.09 14:50:23 MSK)

Ссылка

Ответ на: комментарий от iZEN 30.10.09 10:36:45 MSK

> Возьми ZFS.

А когда она нае...тся, купи на последние деньги вазелина.

~~no-dashi~~ ★★★★★
(30.10.09 14:50:56 MSK)

> Что делать?

+Много к словам про "проверить диск". Не "добавлять обратно как раньше", а посмотреть что говорит smartctl, и погонять его через dd.

~~no-dashi~~ ★★★★★
(30.10.09 14:52:24 MSK)

Ответ на: комментарий от no-dashi 30.10.09 14:50:56 MSK

> А когда она нае...тся, купи на последние деньги вазелина.

Так понимаю, делишься собственным опытом? Вазелин-то помог?

anonymous
(30.10.09 16:25:54 MSK)

Ответ на: комментарий от anonymous 30.10.09 16:25:54 MSK

> Так понимаю, делишься собственным опытом

Да вот как бы нет. Я же линуксоид, безZFSное быдло, никто мне не вышивает крестиком, бэкапы в онлайне не делает, копи-он-райт данные не пишет, контрольные суммы не считает, так что я резервные копии по-старинке на отдельный носитель делаю, посему вазелин раздал таким как ты

~~no-dashi~~ ★★★★★
(30.10.09 17:12:40 MSK)

Ответ на: комментарий от rlz 30.10.09 00:59:38 MSK

cat /proc/mdstat - точно ребилдится? dmesg не ругается на винт?

azure ★★
(30.10.09 20:47:02 MSK)

Ссылка

Ответ на: комментарий от no-dashi 30.10.09 17:12:40 MSK

>> Так понимаю, делишься собственным опытом

> Да вот как бы нет.

Так как бы или нет?

> Я же линуксоид, безZFSное быдло, никто мне не вышивает крестиком, бэкапы в онлайне не делает, копи-он-райт данные не пишет, контрольные суммы не считает, так что я резервные копии по-старинке на отдельный носитель делаю, посему вазелин раздал таким как ты

Ну мне ты ниче не раздавал, тут ты чето конкретно путаешь. Да и вообще - раздавать не поторопился? а то вдруг какая Ext3+LVM накроется медным тазом, а бэкап не прочитается...

anonymous
(30.10.09 23:04:23 MSK)

Ссылка

Я уже нескольких людей видел которые частичтно потеряли свой контент(не весь, но корячились с битыми дисками долго) на серверах только потому что при деградации raid1 диск обратно добавляли.

Ну если тебе плевать на целостность данных то проще на одном диске сидеть а не второй битый обратно добавлять. И дешевле в два раза и нет ложной уверенности что "рейд от всех бед спасёт".

true_admin ★★★★★
(31.10.09 00:28:24 MSK)

Ссылка

Ответ на: комментарий от no-dashi 30.10.09 14:52:24 MSK

В общем, оказалось, что сломался диск, который был активен. В самом конце синхронизация обламывалась из-за того, что встречалась нечитаемая область.

Не понимаю, почему этот диск не помечался при этом как fail. Все данные при этом успешно читалисьб так как били размещены в других регионах, так что все закончилось благополучно.

rlz
(03.11.09 22:30:35 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Проблема с доступом к серверу

Admin

[взрыв мозга][all]Нестабильная работа Vlan

→

Похожие темы