LINUX.ORG.RU

Разваливается массив на контроллере Marvel

 , , ,


0

1

Приветствую!

Купил себе недавно HPE Microserver Gen10, поставил 2 диска по 4ТБ в массив RAID 1 встроенным контроллером, накатил систему, софт. Всё работало нормально до вчерашнего вечера - скорость срезало до 200-300Кб/с. Перезагрузился - в статусе контроллера массив помечен как Degraded. При попытке собрать массив заново он разваливается на 1% rebuild'a. Диски новые, Seagate NAS серии. За потерю данных особо не беспокоюсь, есть бэкапы. Но что делать с дисками? Бежать за нормальным контроллером? Или mdadm? Или смотреть диски? По смарту оба диска проходят.

SMART:

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   071   064   044    Pre-fail  Always       -       12607411
  3 Spin_Up_Time            0x0003   095   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       23
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   078   060   045    Pre-fail  Always       -       66659907
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       457 (121 65 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       23
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   071   066   040    Old_age   Always       -       29 (Min/Max 27/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       361
194 Temperature_Celsius     0x0022   029   040   000    Old_age   Always       -       29 (0 25 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       354 (42 28 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       7104828078
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       2207875253

1 Raw_Read_Error_Rate 0x000f 071 064 044 Pre-fail Always - 12607411
7 Seek_Error_Rate 0x000f 078 060 045 Pre-fail Always - 66659907

По смарту оба диска проходят.

Чоправда? xD

Seagate

Выбрось и купи нормальные диски (рекомендовать ничего не буду, так как хуже Seagate не бывает).

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

Выбрось и купи нормальные диски

Охооххо. WD и Toshiba тоже самое, только в профиль.

Hg194
() автор топика
Ответ на: комментарий от Hg194

Для Seagate эти два ID могут иметь огромные значения. И это норма.

Соболезную.

WD и Toshiba тоже самое, только в профиль.

WD немного лучше.

А Toshiba никто в здравом уме покупать не станет.

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

А Toshiba никто в здравом уме покупать не станет.

Ой ладно, терпимые винты.

Hg194
() автор топика
Ответ на: комментарий от Deleted

Ещё один...

Все они одной крови.

Hg194
() автор топика

в массив RAID 1 встроенным контроллером

Ты конченный чтоли?
Софтверного режима мало?
Нахрена себе такой стул с пиками дроченными ставить, когда этот рейд посыпется

anonymous
()
Ответ на: комментарий от anonymous

собирать raid1 из проброшенных raid0 как-то костыльно выглядит.
а других вариантов и нетути.

Deleted
()
Ответ на: комментарий от anonymous

Просто так, не в массиве, диски через встроенный контроллер не видны в системе. Чтобы их система увидела, нужны костыли. А я не хотел. Теперь собственно посыпаю голову пеплом и со слезами на глазах готов выкинуть 13к за контроллер LSI.

Hg194
() автор топика
Ответ на: комментарий от Deleted

С дисковой корзины идёт толстый SFF кабель, а не обычные SATA. HBA под SFF в наших магазинах не видел.

Hg194
() автор топика
Ответ на: комментарий от mord0d

тошибы прекрасно по 10 лет ходят. в отличие от пластилиновых wd green/red (а теперь и blue) на 5400rpm, и в отличие от сигейтов 11-12-14 серий.

ну и самое главное - у тошиб (которые вообще-то хитачи в девичестве) контакты на плате золоченные, а не луженные, и на отмывке флюса с завода не экономили.

NiTr0 ★★★★★
()
Ответ на: комментарий от K39

Я уже говорил что даже вне массива через встроенный контроллер диски в системе без костылей не видны! Мне нужна хоть обычная затычка-hba pci-e с портом SAS, чтобы диски определилсь в системе и уже тогда накачу mdadm.

Hg194
() автор топика
Ответ на: комментарий от Hg194

уже говорил что даже вне массива через встроенный контроллер диски в системе без костылей не видны

Так может лучше тебе решать эту проблему? Куда диски подключены, просто сата-кабелями к плате? Что в биосе?

K39
()
Ответ на: комментарий от K39

Вся корзина подключена к материнской плате SAS кабелем. Через BIOS управлять корзиной никак нельзя, только через ROM контроллера. На данный момент я удалил массив и теперь диски в «свободном плавании». Костыль заключается в том, что без опции noapic в grub дисков не видно в системе, но если эту опцию включить, то частота процессора застынет на минимальной отметке в 1ГГц (при рабочей в 3.0ГГц). Это и не устраивает.

Hg194
() автор топика
Ответ на: комментарий от mord0d

WD немного лучше.

Итого: сигейт - дно, вд - немного лучше, тошибу в здравом уме никто покупать не будет. А что есть ещё?

anonymous
()
Ответ на: комментарий от K39

Алё, я как заменю кабели на обычные SATA если снять старые я физически не могу без повреждения корзины?

Hg194
() автор топика
Ответ на: комментарий от Hg194

Алё, я как заменю кабели на обычные SATA если снять старые я физически не могу без повреждения корзины?

А вытащить харды из корзины?

anonymous
()
Ответ на: комментарий от anonymous

Ну вытащить то конечно можно, только сигнальный разъём то всё равно в корзине намертво запаян.

Hg194
() автор топика
Ответ на: комментарий от Hg194

Такая хрень есть, паяльник называется. Очень помогает.

А ещё харды можно держать не в штатной корзине.

K39
()
Ответ на: комментарий от K39

Такая хрень есть, паяльник называется. Очень помогает.

Это будет с родни авгиевых конюшен.

А ещё харды можно держать не в штатной корзине.

Корзина не три копейки стоит.

Hg194
() автор топика
Ответ на: комментарий от Hg194

Ну вытащить то конечно можно, только сигнальный разъём то всё равно в корзине намертво запаян.

Я один такой, что за более чем 20 лет пользования компами подобной жести не видел?

anonymous
()
Ответ на: комментарий от K39

Тебе как лоху неисправную железку продали

Как раз таки исправную. Это в ляляксе всё как обычно. Под WinServer пашет как по маслу.

Hg194
() автор топика
Ответ на: комментарий от Hg194

Ну ставь винду тогда, тем более вопрос закрыт.

Хотя я беглым поиском в яндексе не обнаружил ситуаций, подобных твоей с линуксом.

K39
()
Ответ на: комментарий от K39

да, очень даже важно. вы никогда не видели платы wd/seagate, у которых половина платы блестит как у кота яйца, а на второй половине - все черное вплоть до прогнивания переходных отверстий? а сгнившие от флюса процы, которые оживлялись прогревом феном (ну прям как на фуджах)? а ведь массовое явление на wd было на tornado/tornado pmr. ну о такой мелочи как гниющие контакты к гермоблоку вообще молчу - классика же.

не, понятное дело что гарантию оно как-то отходит в 90% случаев. проблемы начинаются через 3-5 лет - потому можно и экономить на помывке платы, и дешевле, и покупатель за новым винтом быстрее побежит :)

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Ну конечно, это всё флюс, а не условия эксплуатации.

У меня дома валяется штук 50 винтов, и в мастерской столько же. Куда смотреть?

K39
()
Ответ на: комментарий от NiTr0

которые вообще-то хитачи в девичестве

Этого я не знал.

тошибы прекрасно по 10 лет ходят.

Вообще, если тошибу не шевелить, она живёт, но чтобы до десяти лет — это я сильно сомневаюсь. Я не видел ни одной, которая прожила бы больше шести лет. В основном дохнут от вибрации.

mord0d ★★★★★
()
Ответ на: комментарий от targitaj

Но сигейт и правда говно.

Я что-то слышал о том, что Hitachi купили (или что-то типа того) Seagate, но на качество это, очевидно, не повлияло.

Некоторое время назад у меня сдохла пачка сигейтов, половина из них была новой (меньше полугода с момента покупки, аптайма совсем ничего).

В гробу я видал сигейты.

mord0d ★★★★★
()
Ответ на: комментарий от Riniko

Они очень чувствительны к внешним факторам (температура, вибрация). И дохнут они непредсказуемо: могут постепенно уйти в ro, а могут резко сдохнуть, утащив за собой данные.

mord0d ★★★★★
()
Ответ на: комментарий от targitaj

Хитачи куплен wd.

А, вон как…

Хитачи и wd норм.

Hitachi за более чем пятнадцать лет показали себя прекрасно.

Недавно закупился WD Purple для бэкапов и шар (вместо сдохших Seagate), будем посмотреть.

mord0d ★★★★★
()
Ответ на: комментарий от mord0d

просто сигейты в отличие от других честно показывают данные параметры. или вы думаете что при такой плотности записи данные всегда читаются без ошибок (корректируемых)? :)

Rost ★★★★★
()
Ответ на: комментарий от Rost

корректируемых

Зачем логгировать корректируемые (точнее даже скорректированные) ошибки?

mord0d ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.