LINUX.ORG.RU

Проблемы с винтом

 ,


0

3

Купил ReadyNAS Duo v2 для домашнего хранилища вместе с винтом WD Blue 3Tb (WDC WD30EZRZ-00Z5HB0). Всё время ставлю на него ОС через RAIDar - всё слетает и процесс начинается с нуля. Полез в логи, а там:

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD30EZRZ-00Z5HB0
Serial Number:    WD-WCC4N0ELX0T4
LU WWN Device Id: 5 0014ee 26294ef28
Firmware Version: 80.00A80
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ACS-2 (revision not indicated)
Local Time is:    Sun Apr  9 20:49:42 2017 PDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(39360) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 255) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x7035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   253   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   179   021    Pre-fail  Always       -       5933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       55
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       19
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       55
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       49
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       1097
194 Temperature_Celsius     0x0022   123   118   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%        19         -
# 2  Extended offline    Interrupted (host reset)      30%        19         -
# 3  Short offline       Completed without error       00%        12         -
# 4  Short offline       Completed without error       00%         6         -
# 5  Short offline       Completed without error       00%         0         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Тут вроде ничего катастрофического, но в dmesg.log:

Buffer I/O error on device sda, logical block 732566644
Buffer I/O error on device sda, logical block 732566645
sd 0:0:0:0: [sda] Unhandled error code
sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
end_request: I/O error, dev sda, sector 5860533152
Buffer I/O error on device sda, logical block 732566644
sd 0:0:0:0: [sda] Unhandled error code
sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
end_request: I/O error, dev sda, sector 2412792
Buffer I/O error on device sda, logical block 301599
Buffer I/O error on device sda, logical block 301600
sd 0:0:0:0: [sda] Unhandled error code
sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
end_request: I/O error, dev sda, sector 2412792
Buffer I/O error on device sda, logical block 301599
sd 0:0:0:0: [sda] Unhandled error code
sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
end_request: I/O error, dev sda, sector 2611192
Buffer I/O error on device sda, logical block 326399
Buffer I/O error on device sda, logical block 326400
Buffer I/O error on device sda, logical block 326401
Buffer I/O error on device sda, logical block 326402
...
raid0: looking at sda3
raid0:   comparing sda3(5851089664)
 with sda3(5851089664)
raid0:   END
raid0:   ==> UNIQUE
raid0: 1 zones
raid0: FINAL 1 zones
raid0: done.
raid0 : md_size is 5851089664 sectors.
******* md2 configuration *********
zone0=[sda3/]
        zone offset=0kb device offset=0kb size=2925544832kb
**********************************

md2: detected capacity change from 0 to 2995757907968
 md0: unknown partition table
kjournald starting.  Commit interval 5 seconds
EXT3 FS on md0, internal journal
EXT3-fs: mounted filesystem with ordered data mode.
 md1: unknown partition table
Adding 524268k swap on /dev/md1.  Priority:-1 extents:1 across:524268k 
 md2: unknown partition table
EXT4-fs (dm-0): barriers enabled
kjournald2 starting: pid 818, dev dm-0:8, commit interval 5 seconds
EXT4-fs (dm-0): internal journal on dm-0:8
EXT4-fs (dm-0): delayed allocation enabled
EXT4-fs: file extents enabled
EXT4-fs: mballoc enabled
EXT4-fs (dm-0): mounted filesystem with ordered data mode
EXT4-fs: mballoc: 0 blocks 0 reqs (0 success)
EXT4-fs: mballoc: 0 extents scanned, 0 goal hits, 0 2^N hits, 0 breaks, 0 lost
EXT4-fs: mballoc: 3 generated and it took 0
EXT4-fs: mballoc: 0 preallocated, 0 discarded
kjournald starting.  Commit interval 5 seconds
EXT3 FS on md0, internal journal
EXT3-fs: mounted filesystem with ordered data mode.
udevd version 125 started
Adding 524268k swap on /dev/md1.  Priority:-1 extents:1 across:524268k 
EXT4-fs (dm-0): barriers enabled
kjournald2 starting: pid 1707, dev dm-0:8, commit interval 5 seconds
EXT4-fs (dm-0): internal journal on dm-0:8
EXT4-fs: file extents enabled
EXT4-fs: mballoc enabled
EXT4-fs (dm-0): mounted filesystem with ordered data mode
EXT4-fs (dm-0): internal journal on dm-0:8

ну и все остальные логи (вроде system.log) забиты примерно тем же:

pr  9 20:49:06 nas-A0-46-3F kernel: end_request: I/O error, dev sda, sector 2412792
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 301599
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 301600
Apr  9 20:49:06 nas-A0-46-3F kernel: sd 0:0:0:0: [sda] Unhandled error code
Apr  9 20:49:06 nas-A0-46-3F kernel: sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
Apr  9 20:49:06 nas-A0-46-3F kernel: end_request: I/O error, dev sda, sector 2412792
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 301599
Apr  9 20:49:06 nas-A0-46-3F kernel: sd 0:0:0:0: [sda] Unhandled error code
Apr  9 20:49:06 nas-A0-46-3F kernel: sd 0:0:0:0: [sda] Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
Apr  9 20:49:06 nas-A0-46-3F kernel: end_request: I/O error, dev sda, sector 2611192
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 326399
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 326400
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 326401
Apr  9 20:49:06 nas-A0-46-3F kernel: Buffer I/O error on device sda, logical block 326402

Объясните что происходит. Если бы в smartctl были какие-либо проблемы, то вопросов бы не возникло. А так не могу понять - винту 3.14ц, или с NAS'ом что-то не то.

К стационарному компьютеру винч не имею возможности подключить, т.к. имею только ноутбук.

Если кому интересно - вот вообще все логи в архиве: https://wsend.net/3add150c59a2d3249e24ba0ae39f7d6c/System_log-pe4ka-20170408-... (77Кб)

Спасибо.

★★★★★

Судя по всему проблемы с контроллером. Подключил к системному блоку - в dmesg валятся ошибки, а cfdisk сегфолтится, dd при записи ругается на ошибку записи :(

soko1 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Это как сказать «не покупай красненькие компьютерчики, покупай беленькие». Всё от модели зависит (а не от производителя) и от случая.

soko1 ★★★★★
() автор топика

Вы не поверите, это какая-то мистика! Интуиция мне подсказала сделать erase all data из RAIDar, ждал часов 7. После чего ни одной ошибки в логах и система загружается и файлы сохраняются. Что это было - ума не приложу!

Подключал винчестер к другим компьютерам, fdisk/cfdisk/gdisk вылетали в segmentation fault, даже банальный `dd if=/dev/zero of=/dev/sda` выдавал ошибку ввода-вывода. Не понимаю что делает такое «Erase all data» на ReadyNAS Duo v2, но винчестер начал работать. Есть идеи, что могло произойти? С сервисным центром думаю есть смысл повременить и посмотреть как будет вести себя устройство дальше.

soko1 ★★★★★
() автор топика
Ответ на: комментарий от soko1

soko1

green == blue?
мне кажется мне просто не повезло. хотя хз.

Да, с недавних пор WD объединили Green и Blue в Blue. Т.ч. не удивляйтесь.

ravdinve
()
Ответ на: комментарий от soko1

А если подключить к компьютеру и сделать:

dd if=/dev/sda of=/dev/null

Напишите результат.

ravdinve
()
Ответ на: комментарий от ravdinve

Ага, понятно.

Напишите результат.

На днях поеду к человеку у которого есть системный блок, проверю и отпишу.

Меня больше интересует, не будут ли сейчас эти ошибки проявляться на тех компьютерах где ранее возникали ошибки при dd/fdisk. Если ошибок не будет, то это будет очень странно.

soko1 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.