Я арендую несколько выделенных серверов. На одном из них периодически падает сеть. Debian RHEL6 + http://wiki.openvz.org/Download/kernel/rhel6/042stab061.2
Oct 10 15:44:18 host-5 kernel: [91522.910264] r8169 0000:03:00.0: eth0: link down
Oct 10 15:44:21 host-5 kernel: [91525.255116] r8169 0000:03:00.0: eth0: link up
Oct 10 15:44:33 host-5 kernel: [91537.773078] r8169 0000:03:00.0: eth0: link down
Oct 10 15:44:53 host-5 kernel: [91557.447399] r8169 0000:03:00.0: eth0: link up
Успешно поставил драйвер и спокойно лег спать. Но утром обнаружил снова.
Oct 11 10:16:34 host-5 kernel: [34970.152419] r8168: eth0: link down
Oct 11 10:16:35 host-5 kernel: [34970.674281] r8168: eth0: link down
Oct 11 10:16:37 host-5 kernel: [34972.688883] r8168: eth0: link up
Oct 11 10:16:38 host-5 kernel: [34973.674202] r8168: eth0: link up
Oct 11 10:16:49 host-5 kernel: [34985.012568] r8168: eth0: link down
Oct 11 10:16:50 host-5 kernel: [34985.667411] r8168: eth0: link down
Oct 11 10:17:09 host-5 kernel: [35004.792170] r8168: eth0: link up
Oct 11 10:17:10 host-5 kernel: [35005.656979] r8168: eth0: link up
Далее была бесполезная переписка с техподдержкой ДЦ. На сервере перепрошили биос, далее заменили кабель и порт. Но проблема осталась. Делать нечего, я решил, что нужно перебросить клиентов на сервер который нормально работает. Взял более дорогой Xeon E-1245 с Intel Corporation 82574L Gigabit Network Connection. Поставил на него Debian + ядро http://wiki.openvz.org/Download/kernel/rhel6/042stab062.2 Поработал сервер несколько часов и на этом новом сервере снова упала сеть
Oct 15 13:17:11 host-6 kernel: [12139.886613] e1000e: eth0 NIC Link is Down
Oct 15 13:17:19 host-6 kernel: [12147.197303] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx / Tx
Oct 15 13:17:31 host-6 kernel: [12160.024052] e1000e: eth0 NIC Link is Down
Oct 15 13:17:59 host-6 kernel: [12187.437176] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Плюнул, все снес, поставил CentOS и далее через yum с репозитория openvz - последнее ядро ovz. Несколько дней сервер замечательно проработал. И я решил, что пора перетаскивать клиентов с проблемного сервера. Но сегодня ночью обнаружил в логе эти заветные строчки
Oct 24 11:02:24 sun kernel: [595195.420810] e1000e: eth0 NIC Link is Down
Oct 24 11:03:29 sun kernel: [595259.503573] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Oct 24 11:03:40 sun kernel: [595270.938053] e1000e: eth0 NIC Link is Down
Oct 24 11:04:08 sun kernel: [595298.627905] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Настройки sysctl
# On Hardware Node we generally need
# packet forwarding enabled and proxy arp disabled
net.ipv4.ip_forward = 1
net.ipv6.conf.default.forwarding = 1
net.ipv6.conf.all.forwarding = 1
#net.ipv6.conf.all.proxy_ndp = 0
net.ipv4.conf.default.proxy_arp = 0
# Enables source route verification
net.ipv4.conf.all.rp_filter = 1
# Enables the magic-sysrq key
kernel.sysrq = 1
# We do not want all our interfaces to send redirects
net.ipv4.conf.default.send_redirects = 1
net.ipv4.conf.all.send_redirects = 0
# From CentOS standard configration
net.ipv4.icmp_echo_ignore_broadcasts=1
[root@sun cache]# ethtool -i eth0
driver: e1000e
version: 1.9.5-k
firmware-version: 1.8-0
bus-info: 0000:04:00.0
Так же есть еще два сервера на старом ядре, там таких проблем по логам не вижу. Написал в багтрекер openvz http://bugzilla.openvz.org/show_bug.cgi?id=2394 но пока ответ не получил. Так же в баг трекере есть еще http://bugzilla.openvz.org/show_bug.cgi?id=2382 - падает есть после перезагрузки контейнера vps. У меня же в логах в момент down link нет перезагрузки.
Буду очень рад советам. Никак не получается решить проблему.
А на старом сервере вообще какой-то ад, каждый день 2-3 раза падает.
Oct 24 01:56:37 host-5 kernel: [866533.491971] r8168: eth0: link down
Oct 24 01:56:38 host-5 kernel: [866534.339673] r8168: eth0: link down
Oct 24 01:56:40 host-5 kernel: [866536.054816] r8168: eth0: link up
Oct 24 01:56:40 host-5 kernel: [866536.338921] r8168: eth0: link up
Oct 24 01:56:52 host-5 kernel: [866548.362539] r8168: eth0: link down
Oct 24 01:56:53 host-5 kernel: [866549.330787] r8168: eth0: link down
Oct 24 01:57:12 host-5 kernel: [866568.059443] r8168: eth0: link up
Oct 24 01:57:12 host-5 kernel: [866568.319954] r8168: eth0: link up
Oct 24 06:25:03 host-5 rsyslogd: [origin software="rsyslogd" swVersion="4.6.4" x-pid="1233" x-info="http://www.rsyslog.com"] rsyslogd was HUPed, type 'lightweight'.
Oct 24 18:28:34 host-5 kernel: [926014.652800] r8168: eth0: link down
Oct 24 18:28:34 host-5 kernel: [926015.169786] r8168: eth0: link down
Oct 24 18:28:36 host-5 kernel: [926016.975563] r8168: eth0: link up
Oct 24 18:28:36 host-5 kernel: [926017.169043] r8168: eth0: link up
Oct 24 18:28:49 host-5 kernel: [926029.510269] r8168: eth0: link down
Oct 24 18:28:49 host-5 kernel: [926030.160902] r8168: eth0: link down
Oct 24 18:29:09 host-5 kernel: [926049.334105] r8168: eth0: link up
Oct 24 18:29:09 host-5 kernel: [926050.149478] r8168: eth0: link up