4 из 12 шпинделей - Seagate ST1000NM0011
8 из 12 шпинделей - Seagate ST1000NM0033
Все шпиндели разбиты на одинаковые разделы с помощью sfdisk
Небольшая предыстория. Было некоторое, другое, железо и были 4 шпинделя, которые ST1000NM0011. На тот момент было следующее «разбиение»:
/boot на RAID1 4 из 4
/ на RAID10 4 из 4
/storage на RAID5 4 из 4
Потом я заменил железо на указанное в шапке и добавил 8 шпинделей. На текущий момент картина «разбиения» выглядит следующим образом:
/boot на RAID1 4 из 12 + спейры
/ на RAID10 4 из 12 + спейры
/storage на RAID6 10 из 12 + 2 спейра
Сейчас я готовлюсь к переделке «корневого» массива на схему RAID10 на 10 из 12 + 2 спейра, но вопрос не в этом. У меня возникли проблемы с отвалами дисков и еще, кажется, назначение блочных устройств в системе «гуляет» от загрузки к загрузке.
Подробнее об «отвале». Скорее, это можно назвать залипанием. Конкретно сейчас речь идёт о /dev/sdg. Блочное устройство видно в системе. Лампочка активности в корзине горит постоянно. smartcl и shred сыпят ошибки на нём. От массива диск отваливается. В сислоге следующее
Dec 18 12:32:44 fxsrv kernel: [84182.232947] sd 0:0:6:0: [sdg] Unhandled error code
Dec 18 12:32:44 fxsrv kernel: [84182.232954] sd 0:0:6:0: [sdg] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Dec 18 12:32:44 fxsrv kernel: [84182.232961] sd 0:0:6:0: [sdg] CDB: Read(10): 28 00 00 00 00 00 00 00 20 00
Dec 18 12:32:44 fxsrv kernel: [84182.232974] end_request: I/O error, dev sdg, sector 0
Dec 18 12:32:44 fxsrv kernel: [84182.232981] Buffer I/O error on device sdg, logical block 0
Dec 18 12:32:44 fxsrv kernel: [84182.232990] Buffer I/O error on device sdg, logical block 1
Dec 18 12:32:44 fxsrv kernel: [84182.232995] Buffer I/O error on device sdg, logical block 2
Dec 18 12:32:44 fxsrv kernel: [84182.232999] Buffer I/O error on device sdg, logical block 3
Dec 18 12:32:44 fxsrv kernel: [84182.233061] sd 0:0:6:0: [sdg] Unhandled error code
Dec 18 12:32:44 fxsrv kernel: [84182.233068] sd 0:0:6:0: [sdg] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Dec 18 12:32:44 fxsrv kernel: [84182.233075] sd 0:0:6:0: [sdg] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00
Dec 18 12:32:44 fxsrv kernel: [84182.233089] end_request: I/O error, dev sdg, sector 0
Dec 18 12:32:44 fxsrv kernel: [84182.233095] Buffer I/O error on device sdg, logical block 0
Dec 18 12:32:44 fxsrv kernel: [84182.233188] sd 0:0:6:0: [sdg] Unhandled error code
Пока могу на 100% заявить, что перезагрузка хост-системы проблему устраняет. На текущий момент видел такое уже 3 раза точно. Куда копать? Это первый вопрос
Далее, есть второй вопрос. У корпуса в корзине, судя по всему, три строчки по 4 диска. Вероятно, есть прямая связь с количеством устройств, подключаемых одним sas-кабелем. На HBA 4 коннектора, по 4 диска на каждый. Подключено, соответственно, 3 из 4. Разветвителей SAS, как они там называются, нет. По крайней мере, я не ставил. Так вот, судя по активности индикаторов, корень системы живёт на первой строчке корзины. Потом у меня сбойнул /dev/sde и постоянно горел индикатор на первом слева винте средней строчки. То есть, вроде всё нормально, порядок «сверху вниз, слева направо». Сбойнул у меня этот sde и я принял решение ребутнуть машину. И тут, внимание, началось шоу. Сейчас вот сбойнул sdg и горит при этом индикатор на НИЖНЕЙ строчке винтов. НИЖНЕЙ!!! А ведь при указанном порядке это должен быть третий диск СРЕДНЕЙ полки, никак не нижней. Внимание, вопрос. Дебиан именует диски на постоянно основе или как получится? Я вот сейчас вспоминаю, как пытался пару лет назад поставить wheezy на рабочу машину, с котороый пишу, и не смог. Тогда я этого не смог. Потому что при каждой перезагрузке была чехарда со шпинделями. Убунта встала без вопросов, к слову. Так вы мне скажите, это что, нормальное поведение для дебиана? Или что? Как мне с этим жить? Что с этим делать? Это вообще нормально?
Направьте, пожалуйста.
Спасибо.
ЗЫ. LVM нет.