Купил HDD WD2500JB - 250GB Установил на Celeron 1300@1430Mhz (PCI 37,66) cipset: I815EP-B. * Обновлял Биос, для понимания винтов более 137GB Система RedHat 7.3 ядро 2.4.18-3 Форматанул без проверки бедов.
Все нормально работало, пока винт не заполнился до ~140GB. Начались сбои. =================================================================== Jun 4 00:50:13 servideo kernel: hdc: dma_intr: status=0x55 { DriveReady SeekComplete CorrectedError Err or } Jun 4 00:50:13 servideo kernel: hdc: dma_intr: error=0x84 { DriveStatusError BadCRC } Jun 4 00:50:13 servideo kernel: hdc: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } Jun 4 00:50:13 servideo last message repeated 2 times Jun 4 00:50:13 servideo kernel: ide1: reset: master: error (0x00?) Jun 4 00:50:13 servideo kernel: hdc: set_multmode: status=0x51 { DriveReady SeekComplete Error } Jun 4 00:50:13 servideo kernel: hdc: set_multmode: error=0x00 { } Jun 4 00:50:13 servideo kernel: hdc: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } Jun 4 00:50:13 servideo kernel: hdc: status error: status=0x58 { DriveReady SeekComplete DataRequest } Jun 4 00:50:13 servideo kernel: hdc: drive not ready for command Jun 4 00:50:13 servideo kernel: hdc: status error: status=0x58 { DriveReady SeekComplete DataRequest } Jun 4 00:50:13 servideo kernel: hdc: drive not ready for command Jun 4 00:50:13 servideo kernel: hdc: status error: status=0x58 { DriveReady SeekComplete DataRequest } Jun 4 00:50:13 servideo kernel: hdc: DMA disabled Jun 4 00:50:13 servideo kernel: hdc: drive not ready for command Jun 4 00:50:13 servideo kernel: t: I/O error, dev 16:01 (hdc), sector 295180216 Jun 4 00:50:13 servideo kernel: end_request: I/O error, dev 16:01 (hdc), sector 295180224 Jun 4 00:50:13 servideo kernel: end_request: I/O error, dev 16:01 (hdc), sector 295180232 Jun 4 00:50:13 servideo kernel: end_request: I/O error, dev 16:01 (hdc), sector 295180240 ... и.т.д ================================================================== Винчестер отвалился и попытки проверить или монтировать его были безуспешны. После перезагрузки и проверки (e2fsck -c -y -f /dev/hdc1) все сново стало OK! Через 3 дня повторение ситуации, через день страшный глюк, при проверке обнаружено 3 экрана BADов - потеря всей инфы. Перезагружаюсь, Форматирую, проверяю опять все ок. Тормознул систему до штатных 1300Mhz. Изменил стандартные настройки hdparm поставил multcount, UDMA4, I/O support = 1 (32-bit) а вот 48 битной поддержки я не нашел. :-( Посмотрел Smart вроде все параметры в норме. =================================================================== [root@servideo ide-smart-1.4]# ./ide-smart /dev/hdc Id= 1 Status=11 {Prefailure Online } Value=100 Threshold= 51 Passed Id= 3 Status= 7 {Prefailure Online } Value=129 Threshold= 21 Passed Id= 4 Status=50 {Advisory Online } Value=100 Threshold= 40 Passed Id= 5 Status=51 {Prefailure Online } Value=200 Threshold=140 Passed Id= 7 Status=11 {Prefailure Online } Value=200 Threshold= 51 Passed Id= 9 Status=50 {Advisory Online } Value=100 Threshold= 0 Passed Id= 10 Status=19 {Prefailure Online } Value=100 Threshold= 51 Passed Id= 11 Status=19 {Prefailure Online } Value=100 Threshold= 51 Passed Id= 12 Status=50 {Advisory Online } Value=100 Threshold= 0 Passed Id=194 Status=34 {Advisory Online } Value=110 Threshold= 0 Passed Id=196 Status=50 {Advisory Online } Value=200 Threshold= 0 Passed Id=197 Status=18 {Advisory Online } Value=200 Threshold= 0 Passed Id=198 Status=18 {Advisory Online } Value=200 Threshold= 0 Passed Id=199 Status=10 {Advisory Online } Value=200 Threshold= 0 Passed Id=200 Status= 9 {Prefailure OffLine} Value=200 Threshold= 51 Passed OffLineStatus=132 {Suspended}, AutoOffLine=Yes, OffLineTimeout=126 minutes OffLineCapability=123 {Immediate Auto SuspendOnCmd} SmartRevision=16, CheckSum=159, SmartCapability=3 {SaveOnStandBy AutoSave} ==================================================================
Ради эксперемента записал на него 240Gb информации (инфа читалась) и поставил проверятся badbloks. Утром посмотрел - HDD опять глюкнул в отчете о бедах с определенного значения и далее в порядке роста одни BAD блоки.
Спасайте братцы, как это лечить??? Как понять где грабли HDD/Материнка/Linux ???