LINUX.ORG.RU
ФорумAdmin

SMART (Raw_Read_Error_Rate) у Hitachi за raid контроллером

 , , ,


0

2

Смотрю SMART на Hitachi HUA722010CLA330 под LSI MegaRAID SAS 2208.

Значение Raw_Read_Error_Rate у одного из дисков подозрительно велико, у второго — единица. Через некоторое время посмотрел опять — у второго внезапно выросло также. Но ещё через некоторое время значение упало до нуля сначала у первого а затем у второго. Наверно я чего-то не понимаю, мне казалось что это счётчик который может только расти. Вот здесь пишут что raw values вообще читать не следует, потому что There is no standard for them. Some vendors pack several values into the same 32 bit word too. This leads to scary but harmless raw values. https://forum.ovh.co.uk/showthread.php?7905-Smart-Raw_Read_Error_Rate

Мне уже следует напрячься или пока наоборот, можно расслабиться, и кому верить^W^W на что тогда вообще смотреть? Это особенности накопителя или возможны наводки контроллера?

И чтобы два раза не вставать, такой вопрос. Положим отказал накопитель. Мне нужно извлечь неисправный и заменить его. Как мне определить который извлекать? В случае mdadm я мог зажечь лампочку, например забивая нулями. Есть ли возможность в случае raid контроллера идентифицировать накопитель лампочкой?

★★★★★

Последнее исправление: sin_a (всего исправлений: 1)

Для LSI есть их фирменная консольная тулза под названием MegaCLI. С помощью нее точно также можно «подсветить» нужный бокс.

По своему опыту, мому сказать, что HGST/WD харды обычно правильную информацию отдают через SMART в отличие от например Seagate. Не знаю, кому больше доверять, но я бы прежде всего смотрел на то, что говорит MegaCLI о состоянии массива/хардов.

trancefer ★★
()
Ответ на: комментарий от trancefer

MegaCLI использую, но документацию по ней толком не читал, пока только в первом приближении сориентировался. Спасибо, если оно может зажечь лампочку то это решение.

Про raw значения по ссылке пишут что на них не следует смотреть вообще. И по тому, что я вижу, это похоже на правду. В моём случае это хитачи и судя по всему оно тоже отдаёт хаос, случайные значения.

А ждать пока массив рассыплется как то не очень хочется. Это уже последняя линия, за которой потеря данных. Посмотрим на смарт и будем менять по необходимости, пусть массиву будет хорошо.

sin_a ★★★★★
() автор топика
Ответ на: комментарий от sin_a

Рекомендую прочитать заранее, потому что, в случае замены диска, сначала нужно сообщить об этом контроллеру и запускать ребилд. Все это делается с помощью MegaCLI. Для получения информации от контроллера, раньше использовал эти скрипты: https://calomel.org/megacli_lsi_commands.html.

trancefer ★★
()
Ответ на: комментарий от trancefer

Да я уже понял что нет в жизни счастья и нет разницы между mdadm и этими платами. И там и здесь собирать, отключать, подключать, все дела... Нет бы на ящике загорелась красненькое — вынул, заменил, поморгало жёлтеньким и загорелось зелёненькое... Ну может оно хоть нагрузку ввода-вывода снижает при работе. Должна же быть хоть какая нибудь польза.

sin_a ★★★★★
() автор топика
Ответ на: комментарий от sin_a

Вот здесь Вы неправы, на мой взгляд. В случае краха диска и деградации массива, контроллер вам просигнализирует в том числе и визуально. Вручную «подсвечивать» нужно, если необходимо менять хард, при целом массиве. Тема холиварная, но я со своей колокольни предпочитаю именно аппаратные рейды. Софтварные — вещь применимая, но для весьма специфических задач.

trancefer ★★
()
Ответ на: комментарий от sin_a

Если нужен полный автоматизм — используйте hotspare харды.

trancefer ★★
()
Ответ на: комментарий от trancefer

В общем да, это предмет холивара, как например те же ленты против дисков для резервных копий. Насчёт подсветки, но диск в обычном лотке с одним индикатором. Всё что он сможет сделать — зажечь его непрерывно. Для нормальной сигнализации нужны разные цвета, но это наверно действительно другое железо.

Про сравнение, мне кажется интересным даёт ли что нибудь контроллер в плане производительности. В остальном, мне кажется, разница не так велика. Только в том, что разные действия совершать.

sin_a ★★★★★
() автор топика
Ответ на: комментарий от sin_a

Ну тут надо смотреть соотношение цены и производительности. Когда нужны космические значения IOPS лучше использовать софтварные рейды, понятное дело покупая эти значения нагрузкой на CPU.

trancefer ★★
()
Ответ на: комментарий от sin_a

Не знаю, что у вас за вендор, на банальных стоечных Supermicro есть отдельные световые индикаторы для индикации проблем.

trancefer ★★
()
Ответ на: комментарий от trancefer

Спасибо, это интересно. Про индикаторы, надо будет присмотреться что там есть. Вроде так на вид обычный стоечный корпус.

sin_a ★★★★★
() автор топика
Ответ на: комментарий от sin_a

Да я уже понял что нет в жизни счастья и нет разницы между mdadm и этими платами.

Однако разница есть. Причем не в пользу fakeraid, в случае выхода из строя контролера прийдется искать такой же.

anc ★★★★★
()
Ответ на: комментарий от anc

Ну да, это холивар и есть. Есть плюсы и минусы у того и другого. А в случае с зеркалом возможно диск из рейда можно будет прочитать (в случае с контроллером). Интересно было бы проверить.

И потом, это вроде не фейкрейд?

sin_a ★★★★★
() автор топика
Ответ на: комментарий от sin_a

И потом, это вроде не фейкрейд?

Простите, не гуглил, а сделал вывод на основании топика и комментариев :)

anc ★★★★★
()
Ответ на: комментарий от anc

На самом деле у меня есть подозрения что различия не такие заметные как можно ожидать... :)

sin_a ★★★★★
() автор топика
Ответ на: комментарий от anc

Всю жизнь слышу этот аргумент про потенциально дохлые контроллеры, но в живую никогда не видел. Для меня это сродни городской легенде. Впрочем от таких проблем защищает бекапирование/архивирование (да, спасибо К.О).

trancefer ★★
()
Ответ на: комментарий от trancefer

Дохлые контроллеры по цене 2 штуки баксов + батарейка за 500 баксов каждые год-два. Это довольно неприятно может быть, если внезапно они всё.

anonymous
()
Ответ на: комментарий от sin_a

Вот таки зря. Разница коллосальная. Хотя бы по тому что аппаратный рейд не грузит проц. Fakeraid — технологическое УГ, недостатки аппаратных и софтварных рейдов в одном флаконе за отсутствием каких-либо достоинств. Один лучших способов «выстрелить себе в ногу».

trancefer ★★
()
Ответ на: комментарий от trancefer

Всю жизнь слышу этот аргумент про потенциально дохлые контроллеры, но в живую никогда не видел.

А я видел, повезло что был точно такой же сервак который можно было использовать, в него харды и перекинули.

anc ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.