LINUX.ORG.RU
ФорумAdmin

Проблема с SATA диском Maxtor


0

0

Привет всем!

Имеется проблема- случайные ошибки ввода/вывода на SATA диске Maxtor под RHEL4. Симптомы: делаю подряд несколько раз dd if=<файлик в 2 гига> of=/dev/null bs=1M и, иногда(не сказать чтоб часто), программулина отваливается с ошибкой ввода/вывода(в районе гига или 300 мегов, случайным образом), а зачастую проходит без ошибок. При ошибках в логах тишина. Никакой стабильной повторяемости ошибки. Винты совсем новые. На них стоит оракл, а он чуть что, насколько я знаю, при ошибках I/O отключается, но на моей системе еще ни разу этого не происходило. Ошибки я наблюдаю только при использовании dd. Краем уха слышал, что проблемы у Maxtor'а на интерфейсе, но не поручусь за достоверность. Может кто сталкивался с подобной ситуацией и как-то разрулил ее? Буду признателен за любую помощь.

P.S. В системе 2 диска макстор, одинаковые куски отрезаны и собраны в софтварный RAID1, на них система и бинарники оракула, остальная часть собрана в софтварный RAID0, на них файлы базы данных. Файловая система ext3. Делал dd на весь второй рейд-ошибок не было.

anonymous

> остальная часть собрана в софтварный RAID0, на них файлы базы данных.

Даже не думай так делать.

Deleted
()
Ответ на: комментарий от Deleted

>Даже не думай так делать.

Я ищу панацею, а не советов о том, как мне жить и что делать.

anonymous
()

Как у тебя прерывания разрулены? Случайно никто еще не сидит на том же прерывании, что и контроллер SATA?

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

>Как у тебя прерывания разрулены? Случайно никто еще не сидит на том же прерывании, что и контроллер SATA?

Действительно, там же сидит сетевуха и хаотический характер проблемы позволяет предположить, что в этом может порыться собака.

[root@ibmx306 proc]# cat /proc/interrupts
CPU0 CPU1
0: 571078179 607392708 IO-APIC-edge timer
1: 9 0 IO-APIC-edge i8042
8: 149 179 IO-APIC-edge rtc
9: 0 0 IO-APIC-level acpi
12: 67 0 IO-APIC-edge i8042
14: 31 0 IO-APIC-edge ide0
169: 0 0 IO-APIC-level uhci_hcd
177: 0 0 IO-APIC-level uhci_hcd
185: 0 0 IO-APIC-level ehci_hcd
193: 270871090 0 IO-APIC-level libata, eth0
NMI: 0 0
LOC: 1178582302 1178582301
ERR: 0
MIS: 0

Поискал инфу на тему как управлять прерываниями в PnP, однако внятного ничего не нашел. Но есть вторая сетевуха, которая незадействована, попробую на нее завтра переключиться. Если кто знает как по живому поменять прерывание у PCI-устройства, подскажите, пожалуйста.

P.S. Поможет это или нет не знаю, однако спасибо за наводку alt-x.

anonymous
()
Ответ на: комментарий от anonymous

>Поискал инфу на тему как управлять прерываниями в PnP, однако внятного ничего не нашел. Но есть вторая сетевуха, которая незадействована, попробую на нее завтра переключиться. Если кто знает как по живому поменять прерывание у PCI-устройства, подскажите, пожалуйста.

Конкретно в линуксе - по-моему никак: к моменту загрузки всё уже должно быть роздано. Некоторые матери позволяют это в биосе настроить. На остальных - только перетыканием карты из одного pci слота в другой. Ну и ACPI влиияет, само собой.

>P.S. Поможет это или нет не знаю, однако спасибо за наводку alt-x.

Да без проблем. Расскажешь тут, помогло, или нет.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

Увы, не помогло. Прогнал компрессию файлов на лету в /dev/null по всем файлам базы данных, а это порядка 40 файлов по 2 гига каждый, общим количеством 4 раза, то есть скачал с винтов больше 300 гигов. На четвертом прогоне вышла ошибка ввода-вывода. Текущие прерывания в системе:
[root@ibmx306 ~]# cat /proc/interrupts
CPU0 CPU1
0: 22467290 22570706 IO-APIC-edge timer
1: 9 0 IO-APIC-edge i8042
8: 4 10 IO-APIC-edge rtc
9: 0 0 IO-APIC-level acpi
12: 496 60 IO-APIC-edge i8042
14: 31 0 IO-APIC-edge ide0
169: 0 0 IO-APIC-level uhci_hcd
177: 0 0 IO-APIC-level uhci_hcd
185: 0 0 IO-APIC-level ehci_hcd
193: 1986946 2056498 IO-APIC-level libata
209: 1743433 0 IO-APIC-level eth0
NMI: 0 0
LOC: 45042060 45042059
ERR: 0
MIS: 0

anonymous
()
Ответ на: комментарий от anonymous

А может провода/с железом проблемы? У тебя есть возможность винду загрузить туда, ну или ДОС и попробовать, может ошибки и там бывают?

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

да пожалуй уже и не подцепить там ничего. Досадно то, что раньше на нем тоже Maxtor'ы стояли, но по 160гиг, и не было никаких глюков год, а вот после апгрейда на тоже Maxtor'ы по 300гиг началась такая фигня.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.