LINUX.ORG.RU

Вопрос по жесткому диску. Ошибки в S.M.A.R.T


0

2

Доброе время суток! 4 месяца назад было куплено 2 НЖМД WD WD2002FAEX, из которых был построен software-raid 1. Спустя 4 месяца не интенсивной работы 2-ой диск отвалился от raid. Я его отформаировал и снова подключил к raid. После синхронизации дисков несколько дней все работает нормально и не вызывает нареканий, но пугает отчет SMART:

root@ant-main-srvcs: smartctl --all /dev/sdb
Device Model:     WDC WD2002FAEX-007BA0
Serial Number:    WD-WMAY00970790
Firmware Version: 05.01D05
User Capacity:    2,000,398,934,016 bytes
... #skip ...
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   138   136   051    Pre-fail  Always       -       52696
  3 Spin_Up_Time            0x0027   253   253   021    Pre-fail  Always       -       8700
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       52
  5 Reallocated_Sector_Ct   0x0033   143   143   140    Pre-fail  Always       -       455
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       3499
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       50
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       30
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       21
194 Temperature_Celsius     0x0022   120   095   000    Old_age   Always       -       32
196 Reallocated_Event_Count 0x0032   001   001   000    Old_age   Always       -       454
197 Current_Pending_Sector  0x0032   199   196   000    Old_age   Always       -       651
198 Offline_Uncorrectable   0x0030   200   196   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   001   001   000    Old_age   Offline      -       46500
У второго диска все значения ошибок по нулям. Собственно вопрос - насколько серьезна ситуация с этим НЖМД и является ли отчет SMART поводом для обращения в СЦ? Пугают значения Reallocated_Sector_Ct, Reallocated_Event_Count и Multi_Zone_Error_Rate.


По-моему, тут уже говорили о том, что ты не можешь вообще никак интерпретировать сырые значения S.M.A.R.T. Просто забудь про них, их нет, как нет и документации на диск. Единственное, что ты можешь оценивать - значения из колонки value, а с ними, как я посмотрю, всё в порядке.

Lighting ★★★★★
()
Ответ на: комментарий от Lighting

Так я же написал какие значения меня волнуют. На Raw_Value я и не смотрю, а смотрю на колонки VALUE и THRESH.

Вывод «не беспокоющего меня» винта:

smartctl --all /dev/sda
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       4

А винт, который меня волнует:

smartctl --all /dev/sdb
  5 Reallocated_Sector_Ct   0x0033   143   143   140    Pre-fail  Always       -       455
196 Reallocated_Event_Count 0x0032   001   001   000    Old_age   Always       -       454
200 Multi_Zone_Error_Rate   0x0008   001   001   000    Old_age   Offline      -       46500

Исходя и документации - все эти значения из категории «больше - лучше»

mihbel
() автор топика
Ответ на: комментарий от mihbel

Исходя и документации - все эти значения из категории «больше - лучше»

А не наоборот, нэ? Впрочем, у разных производителей трактовка даже нормализованных значений разнится. Следи за предпоследним столбцом.

http://sourceforge.net/apps/trac/smartmontools/wiki/TocDoc

http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technol...

Параметр с ID 200, судя по всему, обновляется только при проведении тестов S.M.A.R.T., а не в реальном времени.

Lighting ★★★★★
()
Ответ на: комментарий от Lighting

По-моему, тут уже говорили о том, что ты не можешь вообще никак интерпретировать сырые значения S.M.A.R.T. Просто забудь про них, их нет, как нет и документации на диск. Единственное, что ты можешь оценивать - значения из колонки value, а с ними, как я посмотрю, всё в порядке.

Если я не залежался в криокамере, то raw value для 5, 196, 197, 198 всегда однозначно обозначали количество секторов.

aidaho ★★★★★
()
Ответ на: комментарий от aidaho

Вот я именно об этом и спрашивал. Является ли плохой smart поводом для обращения по гарантии? Ведь винт определяется и работает...

mihbel
() автор топика
Ответ на: комментарий от mihbel

Является ли плохой smart поводом для обращения по гарантии?

Да.

aidaho ★★★★★
()

5 Reallocated_Sector_Ct 0x0033 143 143 140 Pre-fail Always - 455

196 Reallocated_Event_Count 0x0032 001 001 000 Old_age Always - 454


Это настораживает

198 Offline_Uncorrectable 0x0030 200 196 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0



Хм, а тут вроде еще ничего...

Мой вердикт - хз, но что-то критичное я бы на таком винте хранить бы поостерегся...

Pinkbyte ★★★★★
()

Да, есть повод для обращения. Желательно, чтобы smartctl -H тоже показывал, что диску плохо — в этом случае СЦ вряд ли сможет отказать.

GotF ★★★★★
()
Ответ на: комментарий от GotF

хм.

smartctl -H /dev/sdb
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

mihbel
() автор топика
Ответ на: комментарий от backbone

Написал письмо в Розетку, где собственно эти винты и покупались, посмотрим что ответят.

Спасибо всем за ответы!

mihbel
() автор топика
Ответ на: комментарий от mihbel

Пока резервная зона не исчерпается (появятся offline uncorrectable), он наверняка будет рапортовать, что здоров.

GotF ★★★★★
()
Ответ на: комментарий от GotF

Всем спасибо за ответы!

Винт все-таки умер и собирается ехать в сервис.

mihbel
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.