Всем доброго времени суток.
В один прекрасный день, после перезагрузки развалился RAID6 состоящий из 8 дисков.
Немного информации:
Система, CentOS 6:
Linux Storagehost.local 2.6.32-504.12.2.el6.x86_64 #1 SMP Wed Mar 11 22:03:14 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
Всякое бывало, вылетали диски, тут все просто, заменил, добавил в массив, синхронизировались и все хорошо. А сейчас приходится взывать к помощи всемогущего all'a :). Один диск поменял свой статус на Spare, когда их в жизни в массиве не было.
Сейчас массив находится в таком состоянии :(
[root@Storagehost md10]# mdadm --detail /dev/md10
/dev/md10:
Version : 1.2
Creation Time : Fri Apr 11 06:26:46 2014
Raid Level : raid6
Used Dev Size : 976627712 (931.38 GiB 1000.07 GB)
Raid Devices : 8
Total Devices : 6
Persistence : Superblock is persistent
Update Time : Thu Mar 19 14:13:18 2015
State : active, FAILED, Not Started
Active Devices : 5
Working Devices : 6
Failed Devices : 0
Spare Devices : 1
Layout : left-symmetric
Chunk Size : 512K
Name : Storage.local:10
UUID : 93d9ca57:2cb945ba:3e1b4952:b172404c
Events : 24106
Number Major Minor RaidDevice State
0 8 145 0 active sync /dev/sdj1
2 0 0 2 removed
2 8 129 2 active sync /dev/sdi1
3 8 81 3 active sync /dev/sdf1
8 0 0 8 removed
10 0 0 10 removed
10 8 113 6 active sync /dev/sdh1
11 8 49 7 active sync /dev/sdd1
12 8 161 - spare /dev/sdk1
в логах что касается mdadm
dmesg | grep md
md: bind<sda1>
md: bind<sdf1>
md: bind<sdj1>
md: bind<sdk1>
md: bind<sdh1>
md: bind<sdi1>
md: bind<sdd1>
md: bind<sde1>
md: kicking non-fresh sde1 from array!
md: unbind<sde1>
md: export_rdev(sde1)
md: kicking non-fresh sda1 from array!
md: unbind<sda1>
md: export_rdev(sda1)
md: raid6 personality registered for level 6
md: raid5 personality registered for level 5
md: raid4 personality registered for level 4
md/raid:md10: device sdd1 operational as raid disk 7
md/raid:md10: device sdi1 operational as raid disk 2
md/raid:md10: device sdh1 operational as raid disk 6
md/raid:md10: device sdj1 operational as raid disk 0
md/raid:md10: device sdf1 operational as raid disk 3
md/raid:md10: allocated 0kB
md/raid:md10: not enough operational devices (3/8 failed)
md/raid:md10: failed to run raid set.
md: pers->run() failed ...
( mdadm --Examine всех дисков в массиве: )
В сети с такими проблемами редко кто сталкивается. Видел один только случай, когда в raid6 8 из 10 пометились как non fresh
mdadm --assemble --force /dev/md10 /dev/sd[adefhijk]1
не помогает, все остается без изменений.
Диски слить некуда, чтобы играться с ними. Поэтому все (впрочем как обычно) делается на живую. :(
Итак, народ толкните в нужном направлении, что можно сделать то? не верю, что не возможно поднять его.