LINUX.ORG.RU

Диагностика HDD

 , ,


0

1

Значится проявилась у меня проблема с жёстким диском на ноутбуке. Симптомы - система ушла в жёсткий фриз при отсутствии какой-либо серьёзной активности (браузер с парой вкладок), из фриза не вышла и была жёстко вырублена т.к. в консоль сыпала сообщениями о ATA read error. После перезагрузки опять же пошли ATA read error и система ест. не грузится.

Сейчас загрузился с флешки и стал тестить диск.

smartctl -l error /dev/sda говорит что было 5 ошибок. Прогон badblocks -v /dev/sda на 12.5% выдал 90 бедблоков.

Собственно помогите распарсить вывод smartctl -A /dev/sda

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   197   197   051    Pre-fail  Always       -       18725
  3 Spin_Up_Time            0x0027   174   173   021    Pre-fail  Always       -       2258
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1769
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       3672
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       779
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       132
193 Load_Cycle_Count        0x0032   193   193   000    Old_age   Always       -       23376
194 Temperature_Celsius     0x0022   102   095   000    Old_age   Always       -       45
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       36
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Что с пациентом?

★★★★★

197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 36

Возможно дохнет диск. Попробуй вычислить какие именно это блоки (badblocks должен показать) и записать в них что-нибудь при помощи dd. Если после записи Reallocated_Sector_Ct увеличится - диск дохнет. Если не увеличится и эти блоки начнут нормально читаться, значит просто по какой-то неведомой причине в данных блоках побились уже записанные данные...

Deleted
()

36 секторов помечено для перемещения.
сделай быкап, погоняй, если регрессий не будет - норм. температура немного завышена.

uspen ★★★★★
()
Ответ на: комментарий от Deleted

Хм, dd пишет, Reallocated_Sector_Ct не увеличился. Но за то время, что прошло с начала топика Raw_Read_Error_Rate стал 19021, а Reallocated_Event_Count 39.

Norgat ★★★★★
() автор топика
Ответ на: комментарий от Norgat

Хм, dd пишет, Reallocated_Sector_Ct не увеличился. Но за то время, что прошло с начала топика Raw_Read_Error_Rate стал 19021, а Reallocated_Event_Count 39.

Интересно. Не понятно: то-ли сектора аппаратно битые и контроллер их всё-таки переместил в другую область (Reallocated_Event_Count изменилось), то-ли они оказались нормальными и контроллер записал данные туда же (Reallocated_Sector_Ct не изменилось). И если изначально нечитаемых секторов было 36 штук, а Reallocated_Event_Count стало 39, то возможно количество бэд-блоков всё-таки растёт. А что за диск вообще?

Кстати, для seagate'ов постоянное увеличение Raw_Read_Error_Rate - это нормально.

Deleted
()
Ответ на: комментарий от Deleted

Western Digital Scorpio Blue WD5000BPVT

Вывод smartctl после прогона ночью smartctl -t offline

smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-23-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   197   196   051    Pre-fail  Always       -       19779
  3 Spin_Up_Time            0x0027   174   173   021    Pre-fail  Always       -       2258
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1770
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       3685
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       780
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       132
193 Load_Cycle_Count        0x0032   193   193   000    Old_age   Always       -       23377
194 Temperature_Celsius     0x0022   108   092   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       53
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       45
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       75
Norgat ★★★★★
() автор топика
Ответ на: комментарий от Deleted

Окей, это не трагедия, ноут ещё на гарантии. Вопрос в том, что мне сказать в сервисе для обоснования требования замены (куда ткнуть и т.п.)?

Norgat ★★★★★
() автор топика
Ответ на: комментарий от Norgat

Вопрос в том, что мне сказать в сервисе для обоснования требования замены (куда ткнуть и т.п.)?

Если сервис более-менее нормальный, то они знают что такое S.M.A.R.T. и как его посмотреть. Можешь распечатать вывод smartctl -a и показать им.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от Deleted

Видимо так и сделаю, спасибо за помощь.

Norgat ★★★★★
() автор топика
Ответ на: комментарий от Norgat

Бэд-сектора на винчестере. Хотят - пускай смарт смотрят, хотят - поверхность сканят. По возврату - посмотреть на reallocated sector count (не ноль - значит тупо заримэпили вылезшие сектора).

NiTr0 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.