LINUX.ORG.RU

Ошибка железа, отваливается клава.


0

1

Помогите, дорогие линуксоиды разобраться с проблемой. Использую slaсkware 13.37 на стоковом ядре, установленную на третий по счету жесткий диск. Установлена она на первом разделе. Само по себе это на загрузку не влияет. После некоторого времени работы рандомно отваливается клавиатура, иногда с залипанием клавиши, которая в данный момент была нажата. syslog выдает такую ошибку:

[ 2123.009045] ata5.01: qc timeout (cmd 0xa0)

[ 2123.009057] ata5.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen

[ 2123.009076] ata5.01: cmd a0/00:00:00:00:00/00:00:00:00:00/b0 tag 0

[ 2123.009077] res 51/24:03:00:00:00/00:00:00:00:00/b0 Emask 0x5 (timeout)

[ 2123.009080] ata5.01: status: { DRDY ERR }

[ 2128.210036] ata5.00: qc timeout (cmd 0xa0)

[ 2128.210041] ata5.00: TEST_UNIT_READY failed (err_mask=0x5)

[ 2133.412755] ata5.00: qc timeout (cmd 0xa0)

[ 2133.412760] ata5.00: TEST_UNIT_READY failed (err_mask=0x5)

[ 2133.412765] ata5.00: limiting speed to UDMA/66:PIO3

[ 2138.611036] ata5.00: qc timeout (cmd 0xa0)

[ 2138.611041] ata5.00: TEST_UNIT_READY failed (err_mask=0x5)

[ 2138.611043] ata5.00: disabled

[ 2138.611050] ata5.01: TEST_UNIT_READY failed (err_mask=0x40)

[ 2143.803029] ata5.01: qc timeout (cmd 0xa0)

[ 2143.803034] ata5.01: TEST_UNIT_READY failed (err_mask=0x5)

[ 2143.803037] ata5.01: limiting speed to MWDMA2:PIO3

[ 2148.996031] ata5.01: qc timeout (cmd 0xa0)

[ 2148.996037] ata5.01: TEST_UNIT_READY failed (err_mask=0x5)

[ 2148.996039] ata5.01: disabled

сама система установлена на /dev/sdc1 при этом используется дополнительная примонтированная файловая система /dev/sdc5 в том же формате в корне /lin . Могут ли быть ошибки связаны с ней? Пожалуйста, если можно, объясняйте развернуто, я пока что newbie в линуксе, очень хочется разобраться, понять, чтобы уже наконец нормально работала система :)



Последнее исправление: Kandelyabr (всего исправлений: 1)

Ты просил подробно. ОК.

[ 2123.009045] ata5.01: qc timeout (cmd 0xa0)

Не можем писать на диск. Таймаут.

[ 2123.009057] ata5.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen

Определили что диск завис.

[ 2123.009076] ata5.01: cmd a0/00:00:00:00:00/00:00:00:00:00/b0 tag 0

Пробуем перезапустить диск.

[ 2123.009077] res 51/24:03:00:00:00/00:00:00:00:00/b0 Emask 0x5 (timeout)

Команда перезапуска не прошла

[ 2123.009080] ata5.01: status: { DRDY ERR }

Сообщает статус - готовности нет, телеметрии нет.

Дальше в цикле безуспешные попытки сделать ресет потеряшке.

Jameson ★★★★★
()
Ответ на: комментарий от anonymous

Проверь ОЗУ для начала.

А почему не вентилятор? Почему монитор не протереть? Почему для начала не нажраться? У человека в логах видно что отвалился диск. Может сначала его проверить всё таки? Шлейфы кабели там... И если диск в норме - тогда уже искать возможные потусторонние стуки? Базара нет, глючная память может давать разные чудесные рандомные сбои, но тут то картина ясна.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

в логе messages выводятся такие сообщения

Jan 18 10:46:06 Edelweiss kernel: [ 1.400283] ata5.00: ATAPI: TSSTcorp CDDVDW SH-S202H, SB00, max UDMA/66

Jan 18 10:46:06 Edelweiss kernel: [ 1.400380] ata5.01: ATAPI: HL-DT-ST CD-ROM GCR-8522B, 1.00, max MWDMA2

Jan 18 10:46:06 Edelweiss kernel: [ 1.406213] ata5.00: configured for PIO4

Jan 18 10:46:06 Edelweiss kernel: [ 1.428214] ata5.01: configured for PIO4

Означает ли это, что в данном случае имеем дело с пишущим приводом DVD-RW? если да, как он мог отвалиться, даже не имея в своем составе носителя? и тем более мне непостижимо, какое влияние может оказываать отвал привода на клавиатуру? :) в чем зависимость? )

Kandelyabr
() автор топика
Ответ на: комментарий от Kandelyabr

Проблемы с клавиатурой скорее всего связаны с фризами всей системы в момент попыток ресета контроллера. Я что то не понял. У тебя два привода? TSSTcorp CDDVDW SH-S202H и HL-DT-ST CD-ROM GCR-8522B? Зачем? Нет ли между ними конфликтов master\slave? Отруби их совсем, физически, выдернув шлейфы, посмотри что будет. Глючный привод может вешать весь контроллер. Вообще вешать два привода с разными режимами на один шлейф (UDMA/66 и MWDMA2) есть плохая идея. Вообще два привода плохая идея :) Мусор должен лежать в шкафу, а не закрывать дырку в системнике :)

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Суть такова что ядро периодически опрашивает привод даже при отсутствии дисков. Похоже у тебя конфликтуют приводы, накрылся один из приводов, накрылись оба, ты сломал шлейф сильно его перегнув.

Jameson ★★★★★
()
Ответ на: комментарий от Kandelyabr

Клава на ps2 или usb? Могли пересечься прерывания. cat /proc/interrupts мне.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Ну у меня они 100500 лет на винде совместно проработали и жрать не просили, как говорится )

Похоже у тебя конфликтуют приводы, накрылся один из приводов, накрылись оба, ты сломал шлейф сильно его перегнув.

это типа что-то одно?

Kandelyabr
() автор топика
Ответ на: комментарий от Kandelyabr

Типа варианты. Не полируй мне мозг и вынь шлейф. Если всё пройдёт - методом исключения вычисляй больной привод.

100500 лет на винде совместно проработали и жрать не просили

Ничто не живёт вечно

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

bash-4.1# cat /proc/interrupts CPU0 CPU1 0: 125 4 IO-APIC-edge timer 1: 6 1389 IO-APIC-edge i8042 4: 0 1 IO-APIC-edge 6: 0 3 IO-APIC-edge floppy 7: 1 0 IO-APIC-edge parport0 8: 1 0 IO-APIC-edge rtc0 9: 0 0 IO-APIC-fasteoi acpi 14: 23 6487 IO-APIC-edge pata_amd 15: 0 0 IO-APIC-edge pata_amd 18: 59 33953 IO-APIC-fasteoi nvidia 19: 115 39930 IO-APIC-fasteoi eth0 21: 44 8601 IO-APIC-fasteoi ohci_hcd:usb2 22: 0 2 IO-APIC-fasteoi ehci_hcd:usb1 23: 230 137459 IO-APIC-fasteoi ahci, hda_intel 40: 0 0 PCI-MSI-edge PCIe PME 41: 0 0 PCI-MSI-edge PCIe PME 42: 0 0 PCI-MSI-edge PCIe PME 43: 0 0 PCI-MSI-edge PCIe PME NMI: 0 0 Non-maskable interrupts LOC: 278349 319632 Local timer interrupts SPU: 0 0 Spurious interrupts PMI: 0 0 Performance monitoring interrupts IWI: 0 0 IRQ work interrupts RES: 190428 175759 Rescheduling interrupts CAL: 353 4519 Function call interrupts TLB: 4172 1996 TLB shootdowns TRM: 0 0 Thermal event interrupts THR: 0 0 Threshold APIC interrupts MCE: 0 0 Machine check exceptions MCP: 3 3 Machine check polls ERR: 1 MIS: 0

клава ps/2

Kandelyabr
() автор топика
Ответ на: комментарий от Jameson
bash-4.1# cat /proc/interrupts
            CPU0       CPU1       
   0:        125          4   IO-APIC-edge      timer
   1:          6       1389   IO-APIC-edge      i8042
   4:          0          1   IO-APIC-edge    
   6:          0          3   IO-APIC-edge      floppy
   7:          1          0   IO-APIC-edge      parport0
   8:          1          0   IO-APIC-edge      rtc0
   9:          0          0   IO-APIC-fasteoi   acpi
  14:         23       6487   IO-APIC-edge      pata_amd
  15:          0          0   IO-APIC-edge      pata_amd
  18:         59      33953   IO-APIC-fasteoi   nvidia
  19:        115      39930   IO-APIC-fasteoi   eth0
  21:         44       8601   IO-APIC-fasteoi   ohci_hcd:usb2
  22:          0          2   IO-APIC-fasteoi   ehci_hcd:usb1
  23:        230     137459   IO-APIC-fasteoi   ahci, hda_intel
  40:          0          0   PCI-MSI-edge      PCIe PME
  41:          0          0   PCI-MSI-edge      PCIe PME
  42:          0          0   PCI-MSI-edge      PCIe PME
  43:          0          0   PCI-MSI-edge      PCIe PME
 NMI:          0          0   Non-maskable interrupts
 LOC:     278349     319632   Local timer interrupts
 SPU:          0          0   Spurious interrupts
 PMI:          0          0   Performance monitoring interrupts
 IWI:          0          0   IRQ work interrupts
 RES:     190428     175759   Rescheduling interrupts
 CAL:        353       4519   Function call interrupts
 TLB:       4172       1996   TLB shootdowns
 TRM:          0          0   Thermal event interrupts
 THR:          0          0   Threshold APIC interrupts
 MCE:          0          0   Machine check exceptions
 MCP:          3          3   Machine check polls
 ERR:          1
 MIS:          0

Kandelyabr
() автор топика
Ответ на: комментарий от Kandelyabr

Не пересекаюся прерывания, похоже вис ps2 контроллера при ресете дискового контроллера «фича» конкретно твоего аппарата. ЕМНИП ps2 весьма низкоуровнев и как то чуть ли не на таймер аж завязан. Не помню уже за давностью лет, usb клавы везде...

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

ну клава отвалилась, я вышел в консоль, отсоединил cd-rom и выполнил reset. сейчас пока работаю, полет нормальный, но надо бы подольше протестировать

Kandelyabr
() автор топика
Ответ на: комментарий от Kandelyabr

ну клава отвалилась, я вышел в консоль

В смысле? Раз вышел в консоль - значит не отвалилась?

отсоединил cd-rom и выполнил reset

Надеюсь, оба или хотя бы тот что на ata5.1 (HL-DT-ST CD-ROM GCR-8522B)? «Отсоединил и выполнил ресет» в смысле, ты на горячую шлейф дёргал что ли? Так можно контроллер убить, это тебе не sata.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

мышка же работает, я через меню завершил сеанс иксов. отсоединил именно этот ага. ну как на горячую, если уже ошибка эта вылезла, и написано disabled...

Kandelyabr
() автор топика
Ответ на: комментарий от Kandelyabr

мышка же работает, я через меню завершил сеанс иксов

Если после выхода в консоль клава работала - это не вис клавы :), это вис сессии иксов (частичный).

если уже ошибка эта вылезла, и написано disabled

Это не значит что с девайса снято питание. Это значит что ведро больше не будет с ним работать. PATA в отличие от SATA не имеет спецификации hotpug (горячее подключение\отключение). Есть реальный шанс убить однажды мать\девайс. Крики неких челов «я так 100 раз делал и ничо» не аргумент. На 101 может превратиться в тыкву.

Jameson ★★★★★
()
Ответ на: комментарий от Kandelyabr

ps2 контроллера это тоже касается есичо. Дергая клаву мышку на горячую можно мать окуклить внезапно.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

клава не реанимируется при выходе в консоль. ок,больше так делать не буду ) но чую я мне и так и так скоро уже мать менять

Kandelyabr
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.