LINUX.ORG.RU
ФорумAdmin

MegaRAID, вернуть диск в массив

 


0

2

контроллер AVAGO MegaRAID SAS 9361-8i

RAID6 из шести дисков, не доступно сейчас 3 диска диски в слотах 3 и 4 были ubad, сделал их good

вопрос теперь, как добавить ранее сконфигуренный диск в массив?

использую консольную утилиту storcli

подозреваю, что надо сделать storcli64 /cx/sx insert array=a row=b, но как то не уверен, что не сломается всё.

до этого на этом же массиве с подобной проблемой делал диск с ubad на good и после ребута сервера контроллер пометил его, как online, сейчас так не прокатывает

TOPOLOGY :
========

----------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT      Size PDC  PI SED DS3  FSpace TR 
----------------------------------------------------------------------------
 0 -   -   -        -   RAID6 OfLn  N  10.914 TB dflt N  N   dflt N      N  
 0 0   -   -        -   RAID6 Dgrd  N  10.914 TB dflt N  N   dflt N      N  
 0 0   0   252:2    8   DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 0 0   1   -        -   DRIVE Msng  -   2.728 TB -    -  -   -    -      N  
 0 0   2   -        -   DRIVE Msng  -   2.728 TB -    -  -   -    -      N  
 0 0   3   -        -   DRIVE Msng  -   2.728 TB -    -  -   -    -      N  
 0 0   4   252:6    12  DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 0 0   5   252:7    13  DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
-----------------------------------------------------------------------------------
EID:Slt DID State DG      Size Intf Med SED PI SeSz Model                  Sp Type 
-----------------------------------------------------------------------------------

252:2     8 Onln   0  2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0   U  -    
252:3     9 UGood  F  2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0   U  -    
252:4    10 UGood  F  2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0   U  -    
252:5    11 UBad   F  2.728 TB SATA HDD N   N  512B -                      U  -    
252:6    12 Onln   0  2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0   U  -    
252:7    13 Onln   0  2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0   U  -    
-----------------------------------------------------------------------------------


RAID6 из шести дисков, не доступно сейчас 3 диска диски в слотах 3 и 4 были ubad, сделал их good

Не стоит пытаться вернуть в массив сразу все вылетевшие диски. Безопаснее вернуть только один, тот, который вылетел последним. Что в логах контроллера? Как и когда произошел развал массива?

Serge10 ★★★★★
()
Ответ на: комментарий от Serge10

hotswap корзин нет, операции по замене дисков происходили при выключенном сервере. лог посмотрю завтра, т.к. сервер выключен

сначала вылетел диск из слот 5 - fail при замене проблемного диска после включения компьютера - fail стал диск из слота 4 и UGood в слоте 3 т.е. такая картина:

2 - onln
3 - good
4 - fail
5 - fail
6 - onln
7 - onln
вернули проблемный диск в слот 5 и после включения сервера диск из слот 3 стал optimal и массив заработал на 4-х дисках т.е. последний рабочий диск был в слоте 3:
2 - onln
3 - onln
4 - ubad
5 - ubad
6 - onln
7 - onln
потом подключил на горячую sata-диск к разъёму на плате и сервер завис на некоторое время, после отвисания отвалился raid, т.е. /dev/sdb начал сыпать I/O error

после ребута случилось вот так:

2 - ubad 0
3 - ubad -
4 - ubad F
5 - ubad F
6 - onln 0
7 - onln 0

а дальнейшие действия описал в посте

ещё кстате было большое количество перезагрузок, диски по не понятным причинам пропадали из видимости контроллера при загрузке сервера, приходилось выключать, проверять коннекты дисков к контролеру, сервер грузился то 5-ю, 4-я дисками, один раз только с двумя загрузился

ha-ha
() автор топика
Ответ на: комментарий от ha-ha

ещё кстате было большое количество перезагрузок, диски по не понятным причинам пропадали из видимости контроллера при загрузке сервера, приходилось выключать, проверять коннекты дисков к контролеру, сервер грузился то 5-ю, 4-я дисками, один раз только с двумя загрузился

А сами по себе диски живы? Пробовал подключать к другому контроллеру?

ИМХО, тут надо делать копии всех дисков по отдельности, на всякий случай. После копирования попытаться понять: это диски сыплются или сам контроллер.

Аппаратный RAID - это надёжно, говорили они…

Deleted
()
Ответ на: комментарий от anc

Бэкапы надеюсь есть?

Подозреваю, что вопрос риторический - если бы были бэкапы, автор темы уже пересобрал бы свой массив с нуля на новых дисках и восстановился бы, а не создавал бы это обсуждение...

Serge10 ★★★★★
()
Ответ на: комментарий от ha-ha

Вот эти 4 диска и стоит пытаться ввести в массив. И обратите внимание на дельный совет mironov_ivan - перед началом экспериментов снимите с помощью dd образы со всех дисков.

Serge10 ★★★★★
()
Ответ на: комментарий от Serge10

Только с gnu ddrescue, а то мало ли.

anonymous
()

Пофигизм поражает. При перезагрузке пропала пара дисков - пофиг, будем перезагружаться до тех пор, пока не появятся все диски. Вылетел диск - пофиг, пометим его снова как good.

И даже сейчас вопрос всего лишь стоит о том, как вернуть диск в массив.

То, как оно «работает» сейчас - это ппц просто. Этим пользоваться нельзя. Нужно либо разбирать всю эту систему нахрен или выяснять причины. Явно ведь что-то не так. Диски есть в списке совместимости контроллера? Кейс у вендора открыли? Прошивку обновляли?

bigbit ★★★★★
()
Ответ на: комментарий от Serge10

Подозреваю, что вопрос риторический

Отнюдь. Прочитайте все выше написанное ТС «как они прыгали». Начиная от: что там в реалии сейчас на этих дисках даже сложно представить. И заканчивая: зачем продолжать «мучать бессмысленными на угад действиями» ?
Шестой рэйд посыпался, замена одного предполагаемого сбойного диска привела к ещё большей проблеме. Все! останавливаемся. А не прыгаем на уже предполагаемо «мертвом» оборудовании.
Заменяем все что есть, раскатываем из бэкапов, а потом не спеша можно «развлекаться» на тестовом стенде.

anc ★★★★★
()
Ответ на: комментарий от anc

Заменяем все что есть, раскатываем из бэкапов, а потом не спеша можно «развлекаться» на тестовом стенде.

Я именно это и имел ввиду. Раз автор темы этого до сих пор не сделал, значит, бэкапов скорее всего просто нет :).

Serge10 ★★★★★
()
Ответ на: комментарий от Serge10

С другой стороны, слышал примеры поднятия raid0,5,6 для «нафиг чего-то не нужного» может у ТС и так. Т.е. потеря данных не страшна. Тогда наверное можно и «поразвлекаться».

anc ★★★★★
()
Ответ на: комментарий от anc

Другого контроллера пока нет На этих дисках и есть бекапы. Делаю копию дисков с помощью ddrescue.

ha-ha
() автор топика
Ответ на: комментарий от ha-ha

Если в единственном экземпляре. То тоже приятного мало. У меня в тех случаях когда бэкап один и наворачивается, очко начинает немного сжиматься :)

anc ★★★★★
()

удалось собрать массив обратно в degraded на 4-х дисках в слотах 2,3,6,7

последний рабочий диск был в слоте 3 FOREIGN

в биосе контроллера сделал clear foreign conf диск слот3 стал UGOOD

после перезагрузки контроллер сам не определили диск

загрузился в ОС, сделал, как изначально планировал:

storcli64 /c0/e252/s3 insert dg=0 array=0 row=1
диск перешел в состояние offline, сделал:
storcli64 /c0/e252/s3 set online
----------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT      Size PDC  PI SED DS3  FSpace TR 
----------------------------------------------------------------------------
 0 -   -   -        -   RAID6 Dgrd  N  10.914 TB dflt N  N   dflt N      N  
 0 0   -   -        -   RAID6 Dgrd  N  10.914 TB dflt N  N   dflt N      N  
 0 0   0   252:2    8   DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 0 0   1   252:3    9   DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 0 0   2   -        -   DRIVE Msng  -   2.728 TB -    -  -   -    -      N  
 0 0   3   -        -   DRIVE Msng  -   2.728 TB -    -  -   -    -      N  
 0 0   4   252:6    12  DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 0 0   5   252:7    13  DRIVE Onln  N   2.728 TB dflt N  N   dflt -      N  
 1 -   -   -        -   RAID1 Optl  N  465.25 GB dflt N  N   dflt N      N  
и появился блочный диск, смотировал его, данные получил.

ha-ha
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.