LINUX.ORG.RU

Начали отваливаться два харда


0

2

С недавнего времени начали отваливаться два харда из четырёх, что несказанно обрадовало RAID5, сидящий на них.

В логах:

[77409.115321] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[77409.115327] ata3.00: failed command: SMART
[77409.115331] ata3.00: cmd b0/da:00:00:4f:c2/00:00:00:00:00/00 tag 0
[77409.115331]          res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[77409.115333] ata3.00: status: { DRDY }
[77409.115336] ata3: hard resetting link
[77410.184681] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[77410.186513] ata3.00: failed to get Identify Device Data, Emask 0x1
[77410.188390] ata3.00: failed to get Identify Device Data, Emask 0x1
[77410.188393] ata3.00: configured for UDMA/133
[77410.198675] ata3: EH complete
[77418.102093] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[77418.102098] ata3.00: failed command: SMART
[77418.102102] ata3.00: cmd b0/d1:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
[77418.102102]          res 40/00:ff:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[77418.102104] ata3.00: status: { DRDY }
[77418.102107] ata3: hard resetting link
[77418.102117] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[77418.102121] ata4.00: failed command: SMART
[77418.102124] ata4.00: cmd b0/d1:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
[77418.102124]          res 40/00:ff:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
[77418.102136] ata4.00: status: { DRDY }
[77418.102138] ata4: hard resetting link
[77419.069538] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 

Оно вот так может долго мучаться, а потом блочные устройства вообще пропадают из /dev...

В смарте видны ошибки ATA Bus, но более ничего. После выключения-включения всё заводится как надо и работает где-то сутки-двое, потом опять.

До этого с год пахало без проблем.

То, что отваливаются сразу два харда вызывает подозрения на БП (он тухлый на 200вт формата TFX) или бэкплейн (корпус mini-ITX с 4 хотсвап отсеками, на каждую пару винтов по бэкплейну). Хотя бэкплейн пассивный, чему там ломаться непонятно.

Ведро 3.7.1, мать на H67 чипсете, винты хитачи 7200 3тб ынтерпрайзные.

Ответ на: комментарий от haku

Как оказалось, это известный баг чипсетов H67 со степпингом B2, затрагивает только SATA2 порты (4 из 6 на плате), остальные 2 SATA3 не подвержены.

Там какой-то транзистор в PLL получает слишком дофига напряжения и со временем деградирует, в зависимости от температуры\нагрузки, что сначала приводит к периодическому отваливанию сата линка, а потом к полному его подыханию.

Штеуд там даже часть чипсетов отзывал, вроде как, а у меня уже и гарантия кончилась :( Хотя странно, что дохнут только два порта из четырёх.

В общем буду брать взамен P8H77-I, вторая такая уже у меня давно трудится без глюков во втором NAS/HTPC.

blind_oracle ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.