LINUX.ORG.RU
ФорумAdmin

сервер и сетевые карты


0

0

Здравствуйте! Уже поднимал тему http://www.linux.org.ru/view-message.jsp?msgid=3492931&lastmod=1234521037...

, но появились новые факты и подозрения, решил создать в этом разделе.

Есть сервер hp proliant ml110, на котором стоит debian-40r4a. На сервере 2 сетевые карты WOL ENW-9700. Работает squid, apache, mysql..вобщем стандартно. Сервер держит сайт. 1 сетевая смотрит внутрь сети, 2 сетевая - интернет.

Месяца назад все это заработало и работало без проблем недели 3, пока не произошло зависание компа... я пришел на работу и вижу работающий сервер, но неработающий интернет. оказалось что сетевая, которая смотрит внутрь выдает destination host..вобщем сетевая недоступна. я вытянул кабель и вставил обратно. в этот момент линукс выдал: kernel panic.........до этого набор регистров со значениями, process swapper..... call traces: ккуча значений, code: набор кодов и

kernel panic - not syncing : Fatal exception in interrupt

компьютер намертво завис!

дальнейшие танцы с перестановкой сетевых местами, заменой кабеля, перестановкой внутренней сети в разные порты свича, ничего не дали. Вот зависание было снова пол часа назад. Второй раз за сутки. Выдает ошибку в момент, когда я выдергиваю кабель из сетевой, которая не отвечает:

eth0: rx error, status 0x7ffc0001... или eth1: rx error, status 0x7ffc0001...

Стоит мне вставить карту обратно, как она сразу начинает отвечать на запросы. Причем иногда в момент выдергивания комп намертво зависает в ошибкой kernel panic - not syncing, а иногда выдает rx error.

зависали обе карты, но ошибка та же. в логах чисто. только фиксируется момент выдергивания кабеля и установка назад. смотрел syslog, messages, kern.log. ifconfig показывает 2 карты в момент падения. все нормально вроде.

Что посоветуете делать дальше? Может обновить ядро?

уточняю - сервер зависает периодически. т.е. может сутки работать и обязательно зависает с одной из ошибок указанных в посте.

alex_ss1
() автор топика

Итак, есть сервак, который нормально работает. При выдергивании патчкорда (?) из любой из 2х сетевых происходит кернел паник?

Komintern ★★★★★
()
Ответ на: комментарий от Komintern

да, в момент зависания. я нашел аналогичную проблему. читайте здесь - http://lists.debian.org/debian-kernel/2006/10/msg00205.html

вобщем я так понял что нужно попробовать переустановить драйвер?. каким образом это сделать? я в линуксе далеко не гуру, поэтому посоветуйте как можно переустановить драйвер из исходников линукса или может закачать обновления, которые его заменят? буду очень благодарен.

alex_ss1
() автор топика
Ответ на: комментарий от alex_ss1

не в момент зависания, а момент, когда карта становится недоступной. прочитал по ссылке - пишут ошибка связанная с переполнением буфера. похоже что проблемы с драйвером. у 2 сетевухи одинаковые. подскажите как мне переустановить драйвера линуха??? не хочу ставить тот что на диске, на стандартном работало все на ура 3 недели.

alex_ss1
() автор топика

>смотрел syslog, messages, kern.log. ifconfig

Смотрели dmesg? это команда такая.

Посмотрите общее состояние сервера, вентиляторы, пыль. Может быть слот грязный, может БП перегружен и при инициализации сетевки идет просадка напряжения...

Что написано на чипах сетевок и с каким драйвером/модулем они работают.

mky ★★★★★
()
Ответ на: комментарий от alex_ss1

И еще вопрос - при обновлении ядра - обновятся ли драйвера сетевых карт? изначально все работало ведь нормально. наверняка что-то с драйвером. и в ссылке той, что я дал написано

> You can solve this situation by bringing down the interface, unloading the driver, loading the driver > again and bringing up the interface. Just cycling the interface down and up is not enough.

> You get the following messages by doing this. First was cycling down and up. Second was down, reload > driver and bringing network up again.

можно ли как-то восстановить стандартные драйвера их инсталляционного пакета дебиана?

alex_ss1
() автор топика
Ответ на: комментарий от alex_ss1

ну что, кто-нибудь подскажет как можно обновить только драйвера сетевых карт или восстановить из дистрибутива все что есть? Или как сделать reload driver?

alex_ss1
() автор топика
Ответ на: комментарий от alex_ss1

> как можно обновить только драйвера сетевых карт

вообще-то ядро тебе надо бы обновить. поищи в репозитории более новое ядро.

> как сделать reload driver


rmmod модуль
modprobe модуль

Komintern ★★★★★
()
Ответ на: комментарий от Komintern

да вот запустил apt-get upgrade. сижу жду.

хотя у меня ядро конечно не такое и старое. проблема как я посмотрю вообще 2006 года.

rmmod модуль modprobe модуль

спасибо

alex_ss1
() автор топика
Ответ на: комментарий от alex_ss1

Не сообщал, пробовались ли другие сетёвки? Ядро если не самосборное, в нём обычно многое включено. Попробуй для теста другую карту поставить.

Gular
()
Ответ на: комментарий от alex_ss1

Про приведенной вам ссылке советуется изменить драйвер сетевки, то есть взять исходники ядра, отредактировать их и скомпилировать ядро (и драйвера как его часть). Если вы собираетесь дальше администрировать линукс, то можете попробовать проделать этот путь, вот одно из пособий http://jedi-linux.blogspot.com/2007/09/blog-post_3999.html и гугл дает ещё много ссылок по поводу компиляции ядра линукс в дебиане.

Но замечу, что ИМХО, данный патч (правка ядра) уже применён, то есть если смотреть, к примеру, 2.6.25, то там нет строк, приводимых в http://lists.debian.org/debian-kernel/2006/10/msg00205.html.

Можете взять ядро из unstable ветки дебиана или вобще ванильное --- исходники с сайта www.kernel.org

>изначально все работало ведь нормально. наверняка что-то с драйвером. и в ссылке той, что я дал написано

Там ещё написано, что проблема появляется при высокой нагрузке, может у вас не драйвер "испортился", а просто по сети стало больше пакетов ходить?

mky ★★★★★
()
Ответ на: комментарий от mky

Да, нагрузка высокая. Но она была высокая и такая же и осталась. Когда сеть работала без сбоев, то нагрузка была уж точно не ниже. И за 3 недели ни одного сбоя. А потом в один прекрасный момент это произошло и с тех пор зависания идут каждый день! Что касается строк http://lists.debian.org/debian-kernel/2006/10/msg00205.html, то действительно я их не нашел. попробую просто переустановить драйвер, может это решит проблему.

>>Можете взять ядро из unstable ветки дебиана или вобще ванильное --- исходники с сайта www.kernel.org

извините, если я может не правильно выражаюсь или понимаю некоторые вещи. насколько я понял, ссылка показывает кусок кода в файле драйвера sky2.c, который входит в исходники ядра. при обновлении ядра мне было сказано что ядро новое аналогичное с моим и поэтому не было предложено действий по обновлению. Вы предлагаете установить более старое ядро? И еще вопрос - может просто установить драйвер сетевой карты с диска поверх и проблема решиться?

alex_ss1
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.