LINUX.ORG.RU

Помогите разобраться со SMART

 , ,


0

1

Есть мать M2N-MX SE с парой HDD WD2500AAJS. Крутится всё под Debian 6. Из винтов организован soft RAID 1. Сверху взгромоздил kvm и запихал туда FreeBSD 9.

При распаковке портов во фре всё очень тормозило. iotop в debian показывал запись в 400кБ/с и 99% IO, которое занимал процесс «jbd2/md4-8». Гугл сказал, что это что-то с журналами связано.

Посмотрел SMART и увидел непонятные мне ошибки. Что всё-таки с винтом? Если он вылетел, и нет ему замены, обязательно разбирать RAID?

cat /proc/mdstat
Personalities : [raid1]
md4 : active raid1 sda9[0] sdb9[1]
      228862840 blocks super 1.2 [2/2] [UU]

md3 : active raid1 sda8[0] sdb8[1]
      2927604 blocks super 1.2 [2/2] [UU]

md2 : active raid1 sda7[0] sdb7[1]
      9763768 blocks super 1.2 [2/2] [UU]

md1 : active raid1 sda6[0] sdb6[1]
      975860 blocks super 1.2 [2/2] [UU]

md0 : active raid1 sda5[0] sdb5[1]
      487412 blocks super 1.2 [2/2] [UU]

unused devices: <none>
uname -a
Linux maxim-server 3.2.0-0.bpo.4-amd64 #1 SMP Debian 3.2.35-2~bpo60+1 x86_64 GNU/Linux

http://pastebin.com/UYy7SRER SMART /dev/sda

http://pastebin.com/AsTH5p5Y SMART /dev/sdb

★★★★

Попробуй переподключить шлейф к sdb или заменить его совсем. Если не поможет - меняй диск.

cm26inc
()

И чего ты в смарте страшного нашёл?

Хм... да недоглядел вывод smartctl второго винта, действительно попробуй поменяй шлейф. А в самом смарте страшного нет ничего ошибок и перемещённых секторов невидно.

daemonpnz ★★★★★
()
Последнее исправление: daemonpnz (всего исправлений: 1)
Ответ на: комментарий от doctor-ua

А что за ошибки тогда в smart 2-го диска? И почему огромный IO, который занимает процесс журналирования (как я понял, синхронизация дисков в массиве)?

kma21 ★★★★
() автор топика
Ответ на: комментарий от kma21

вот на форумах читаю, что ATA Error Count: и так далее по тексту....большинство пишут, что проблемы со шлейфом.

у меня на одном из винтов ATA Error Count: 206.... при этом

Reallocated_Sector_Ct - 0

Current_Pending_Sector - 0

Reported_Uncorrect - 0

doctor-ua
()

SMART в порядке - ищите другие проблемы.

// b.

anonymous
()

После разборки сервака обнаружился плохо контактирующий кабель к одному из винтов. Заменил, теперь jbd2/md4-8 не сжирает весь IO. Дальше будем смотреть по нагрузке.

Всем спасибо за помощь!

И ещё вопрос, SMART никак подчистить от этих логов нельзя? Ну о произошедших ошибках.

kma21 ★★★★
() автор топика
Ответ на: комментарий от kma21

Для работы с данными SMART обычно есть утилиты от вендоров дисков, некоторые из них позволяют даже сбросить ошибки в них, но обычно это недокументированные возможности и ими точно не следует пользоваться без крайней необходимости, которой в этом случае и нет.

Если проблема все-таки обнаружилась в шлейфе, то следует оставить все как есть и пользоваться диском. Благо в его данных SMART ошибок не видно.

Следует помнить, что SMART - неоднозначная оценка работы диска, она не даст полной уверенности в том, что диск не выйдет из строя. А учитывая, что ошибки уже были, следует очень внимательно следить за работой этого диски и при первой же ошибке все-таки его заменить.

cm26inc
()
Ответ на: комментарий от cm26inc

Следует помнить, что SMART - неоднозначная оценка работы диска, она не даст полной уверенности в том, что диск не выйдет из строя. А учитывая, что ошибки уже были, следует очень внимательно следить за работой этого диски и при первой же ошибке все-таки его заменить.

+1

А также можно не ждать, а прямо сейчас добавить ещё один диск в резерв как «spare device». Благо, диски мелкие, так что добавить к ним можно и 250, и 320, и т.д. Видно их будет по команде «mdadm -D /dev/md0»

justAmoment ★★★★★
()
Ответ на: комментарий от kma21

сам очистится через некоторое время

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.