LINUX.ORG.RU
ФорумAdmin

Зависает внутренняя сеть


0

1

Добрый день. Помогите решить проблему. Есть сервер с Debian. Он выступает шлюзом. На нем крутятся правила iptables, настроены тунели и т.д. В последнее время стала часто(до 20 р. в день) зависать сетевая карта, которой присвоен внутренний сетевой адрес. 192.168.27.1. Она виснет, все тунели падают. Интернет тоже. Захожу по внешке на шлюз, выполняю команды ifdown eth1 и ifup eth1. Все поднимается. Но не на долго. Ifconfig выводит много dropped, errors и frame пакетов на этом интерфейсе. Теперь что пробовал: 1) Менял кабель 2) Менял коммутатор 3) Менял сетевую карту Ни чего не сработало. Помогите разобраться.

Вывод ifconfig:

eth1      
Link encap:Ethernet  HWaddr 00:e0:51:8e:07:4e inet addr:192.168.27.1  Bcast:192.168.27.255  Mask:255.255.255.0
UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
RX packets:361912 errors:71 dropped:1003 overruns:0 frame:57
TX packets:371858 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000
RX bytes:163941489 (156.3 MiB)  TX bytes:187441819 (178.7 MiB)
Interrupt:19 Base address:0xd100

eth2      
Link encap:Ethernet  HWaddr 6c:f0:49:42:94:e1 inet addr:91.185.xx.xx  Bcast:91.185.xx.xx  Mask:255.255.255.252
UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
RX packets:323361 errors:0 dropped:0 overruns:0 frame:0
TX packets:358070 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:178199688 (169.9 MiB)  TX bytes:159806405 (152.4 MiB)
Interrupt:27 Base address:0x6000

lo        
Link encap:Local Loopback
inet addr:127.0.0.1  Mask:255.0.0.0
UP LOOPBACK RUNNING  MTU:16436  Metric:1
RX packets:477 errors:0 dropped:0 overruns:0 frame:0
TX packets:477 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:89689 (87.5 KiB)  TX bytes:89689 (87.5 KiB)

Кто-то внутри шалит, инспекция трафика тебе поможет. tcpdump или Wireshark тебе в руки

anonymous
()
Ответ на: комментарий от mzv

sudo ethtool -S eth1 | grep error
и вот так было-бы тоже не плохо, хоть понятно станет, что за ошибки и куда копать

anonymous
()
Ответ на: комментарий от mzv

Тут много чего. Чаще появляются строки обмена данными корпоративной почты. Кстати, зависания начались как раз, после настройки корпоративной почты на Zimbra. Только сама почта весит на другом сервере, за шлюзом, под управлением Ubunta Server 12.04. Так кстати тоже есть drop пакеты. Но error и frame нету.

serega1576
() автор топика
Ответ на: комментарий от mzv

Врятли петля. Сеть не особо сложная. 1й офис(15 пк)--->24х портовый комм-р DLINK------ ------->8ми портовый гигабитный свич<----------24х портовый комм-р DLINK<--------------------------2й офис(10 пк). Другие офисы соеденены gre туннелями. На их шлюзах зависаний интерфейсов не обнаружено. Я заметил, если просто идут DROP пакеты, то сеть не зависает, но стоит появится парочке ERROR вместе с FRAME, сразу отвал.

serega1576
() автор топика
Ответ на: комментарий от handbrake

lshw -class network

description: Ethernet interface
       product: RTL-8139/8139C/8139C+
       vendor: Realtek Semiconductor Co., Ltd.
       physical id: 1
       bus info: pci@0000:05:01.0
       logical name: eth1
       version: 10
       serial: 00:e0:51:8e:07:4e
       size: 100MB/s
       capacity: 100MB/s
       width: 32 bits
       clock: 33MHz

serega1576
() автор топика
Ответ на: комментарий от serega1576

Врятли.

я кстати в свое время петлю с помощью wi-fi создал ;) Подключил wi-fi роутер по сети, а потом коллеги воткнули в него lan когда уже дотянули сеть до нового кабинета.

fjfalcon ★★★
()
Ответ на: комментарий от serega1576

Я бы:

1) все-таки убедился, что проблема программная, отключил по возможности конечные линки и подождал воспроизведения проблемы.

2) дальше гуглить и анализировать трафик. dmesg, /var/log/messages, load average.

mzv
()
Ответ на: комментарий от mzv

Пошарил лог messages. Искал запрос eth1. В итоге следующая закономерность на eth1.

8139too 0000:05:01.0: eth1: RealTek RTL8139 at 0xd100, 00:e0:51:8e:07:4e, IRQ 19

затем, по такому же времени, только ниже по списку, следующее событие

eth1: link up, 100Mbps, full-duplex, lpa 0xC5E1

Значит ли это что нибудь?

serega1576
() автор топика
Ответ на: комментарий от serega1576

Сегодня с утра опять зависла сеть. После перезапуска eth1 первым делом зашел в /var/log/messages. Там ничего. Только сообщение что eth1 up. И все.(((

serega1576
() автор топика
Ответ на: комментарий от serega1576

А может из за коммутатора появляться такие ошибки? Я вчера подключал другой коммутатор. Подключил к нему шлюз, контроллер домена, пару компов из сети и свой ноут. Просматривал вывод ifconfig. Кроме drop пакетов, других не было. Может просто не дождался их появления? Или может какой нибудь комп в сети или сервер выносит eth1?

serega1576
() автор топика
Ответ на: комментарий от mzv

Менял коммутатор. Временно. Увидев 30 drop пакетов поставил обратно. Переведу сегодня после обеда сеть на другой коммутатор. И подожду возникновения error или frame. Прочитал статью с пометкой SOLVED. Там была проблема с картой Broadcom. У меня такие:

[root@telma rusanovsa]# lspci
04:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168B PCI Express Gigabit Ethernet controller (rev 02)
05:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)
05:01.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)
Две сетевых карты pci и одна встроенная. Все три Realtek. Офис не так давно переехал. На прежнем месте были зависания, но крайне редко. Может 1 раз в месяц. Сейчас же на дню по 15 раз. Систему не обновлял, в железо не лез. Все как было так и осталось. Только зависание сети увеличилось.

serega1576
() автор топика
Ответ на: комментарий от serega1576

Из-за коммутатора вполне может быть. Теоретически может на коммутаторе виснуть порт, и когда вы переподнимаете интерфейс порт на коммутаторе оживает. Так что попробуйте подольше потестировать на другом коммутаторе.

На счет кольца в сети: легла бы вся сеть а не только интерфейс на марутизаторе. И переподнимание интерфейса ничего не давало бы. Но на всякий проверить все равно стоит.

Другой комп или сервер вряд ли может ложить интерфейс кривыми пакетами. Но если не поможет смена коммутатора - выход один: подключать всех по очереди :(

crlam0
()
Ответ на: комментарий от serega1576

Найди любую PCIe и используй вместо этой.
Могут быть проблемы с гигабитным линком (если свитч не умеет) тогда прибьешь 100/Full евертулом.

handbrake ★★★
()
Ответ на: комментарий от handbrake

У меня во встроенную был подключен интернет канал, в pci(тут дроппы и ошибки) внутренняя сеть. Вчера поменял их местами. В итоге на внутреннюю сетевую карту повешал внутреннюю сеть, на pci повешал провайдера. Теперь ошибок и дропов на внутренней сети нет, соответственно сама ЛВС без всяких колец и глючных коммутаторов, а вот на стороне провайдера полезли дропы. В общем, видимо глючат PCI порты на материнской плате. Либо 2 сетевушки pci сразу)) Такое вообще может быть? Или нести третью pci карту для достовеорности? И еще вопрос. Когда я поменял кабеля местами, и поправил interfaces, перестал работать интернет у компов в сети. На самом шлюзе инет есть, сайты пингуются.. У меня настроен Squid без авторизации. Где в конфиге сказать Squidу слушать не eth2, а eth1 допустим? Беда именно в кальмаре, так как если иду мимо него, iptables пропускают в инет)).

serega1576
() автор топика
Ответ на: комментарий от serega1576

Не, я же тебе сказал - поставь pcie сетевуху. Я уже проверял три. Десятка.

handbrake ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.