LINUX.ORG.RU
ФорумAdmin

Сервер периодически недоступен


0

1

Здравствуйте! Тут такая проблема: linux сервер (fedora 13, не обновлялись) находится в сети универа. Для удаленной работы используется ssh, пользуемся wiki, redmine, проект на tomcat7 и т.д. В общем, из дома на сервер не всегда достучишься: пинг либо такой:

PING 212.193.39.46 (212.193.39.46) 56(84) bytes of data.
From 212.193.32.1 icmp_seq=667 Destination Host Unreachable
From 212.193.32.1 icmp_seq=671 Destination Host Unreachable
From 212.193.32.1 icmp_seq=674 Destination Host Unreachable
From 212.193.32.1 icmp_seq=677 Destination Host Unreachable
From 212.193.32.1 icmp_seq=681 Destination Host Unreachable

и т.д. Потом через какое-то время (не получается засечь, в пределах часа примерно) пинг такой:

From 212.193.32.1 icmp_seq=987 Destination Host Unreachable
64 bytes from 212.193.39.46: icmp_req=990 ttl=59 time=32.1 ms
64 bytes from 212.193.39.46: icmp_req=991 ttl=59 time=13.1 ms
64 bytes from 212.193.39.46: icmp_req=992 ttl=59 time=11.2 ms
64 bytes from 212.193.39.46: icmp_req=993 ttl=59 time=11.6 ms
64 bytes from 212.193.39.46: icmp_req=994 ttl=59 time=12.3 ms
64 bytes from 212.193.39.46: icmp_req=995 ttl=59 time=12.5 ms

--- 212.193.39.46 ping statistics ---
1335 packets transmitted, 346 received, +82 errors, 74% packet loss, time 1334578ms
rtt min/avg/max/mdev = 10.571/12.956/85.365/4.167 ms, pipe 2

грешили на режим энергосберегания, мол, засыпает и не просыпается. Отключили в ядре поддержку acpi и apm. В iptables нет правил для маршрутизации и т.п. заполнена только таблица filter (правила для портов 8080, 443 и т.п.) Когда сервер будет временно доступен (стучусь из дома), то пришлю вывод команд. Причем, пинг может быть нормальным примерно час. Потом опять долгий, сервер недоступен. Когда непосредственно за ним сидишь и работаешь, то все ок. Как только какое-то время за ним не работаешь, блокируешь, logout делаешь и т.п. - начинаются косяки. Подскажите, плиз, что не так? Куда ткнуть?

зы: я админ так, название одно, начинающий. Курс сетей только в универе был и так, основные команды шелла знаю и в линуксе 3 год сижу.

с сервера делай постоянно мониторинг состояния )

Jetty ★★★★★
()
Ответ на: комментарий от AnViar

смотреть /var/log/messages

[root@w12-422-03 ~]# cat /var/log/messages | tail    
Apr  4 13:46:04 w12-422-03 dhclient[1054]: bound to 212.193.39.46 -- renewal in 1773 seconds.
Apr  4 14:15:37 w12-422-03 dhclient[1054]: DHCPREQUEST on eth0 to 212.193.32.4 port 67
Apr  4 14:15:37 w12-422-03 dhclient[1054]: DHCPACK from 212.193.32.4
Apr  4 14:15:37 w12-422-03 dhclient[1054]: bound to 212.193.39.46 -- renewal in 1381 seconds.
Apr  4 14:38:38 w12-422-03 dhclient[1054]: DHCPREQUEST on eth0 to 212.193.32.4 port 67
Apr  4 14:38:39 w12-422-03 dhclient[1054]: DHCPACK from 212.193.32.4
Apr  4 14:38:39 w12-422-03 dhclient[1054]: bound to 212.193.39.46 -- renewal in 1546 seconds.
Apr  4 15:04:25 w12-422-03 dhclient[1054]: DHCPREQUEST on eth0 to 212.193.32.4 port 67
Apr  4 15:04:25 w12-422-03 dhclient[1054]: DHCPACK from 212.193.32.4
Apr  4 15:04:25 w12-422-03 dhclient[1054]: bound to 212.193.39.46 -- renewal in 1491 seconds.

rainbow
() автор топика
Ответ на: комментарий от rainbow

с сервера делай постоянно мониторинг состояния )

и такие мысли были)) был постоянный пинг по крону каждые минут 5. не помогло.

rainbow
() автор топика
Ответ на: комментарий от AnViar

У тебя сервер адрес по DHCP получает ? :)

Типа того:

[root@w12-422-03 ~]# cat /etc/sysconfig/network-scripts/ifcfg-eth0 
# Intel Corporation 82567LF-2 Gigabit Network Connection
DEVICE=eth0
HWADDR=00:27:0e:17:11:1b
BOOTPROTO=dhcp
TYPE=Ethernet
NM_CONTROLLED=no
ONBOOT=yes
USERCTL=no
PEERDNS=yes
IPV6INIT=no
MTU=1500

Еще могу вывод tracepath сделать:

[rw@rw-think ~]$ tracepath 212.193.39.46
 1:  rw-think                                              0.148ms pmtu 1500
 1:  mygateway1.ar7                                        1.971ms 
 1:  mygateway1.ar7                                        1.945ms 
 2:  mygateway1.ar7                                        1.905ms pmtu 1492
 2:  me60-2.san.ru                                        32.421ms 
 3:  10.64.2.33                                           32.835ms 
 4:  no reply
 5:  88.147.129.238                                       32.506ms asymm  4 
 6:  curva-vlan2.sgu.ru                                   37.835ms asymm  5 
 7:  no reply
 8:  no reply
 9:  no reply
10:  no reply
11:  no reply
12:  no reply
13:  no reply
14:  no reply
15:  no reply                                                                                                                                                
16:  no reply                                                                                                                                                
17:  no reply                                                                                                                                                
18:  no reply                                                                                                                                                
19:  no reply                                                                                                                                                
20:  no reply                                                                                                                                                
21:  no reply                                                                                                                                                
22:  no reply                                                                                                                                                
23:  no reply                                                                                                                                                
24:  no reply                                                                                                                                                
25:  no reply                                                                                                                                                
26:  no reply                                                                                                                                                
27:  no reply                                                                                                                                                
28:  no reply                                                                                                                                                
29:  no reply                                                                                                                                                
30:  no reply                                                                                                                                                
31:  no reply                                                                                                                                                
     Too many hops: pmtu 1492                                                                                                                                
     Resume: pmtu 1492         
rainbow
() автор топика
Ответ на: комментарий от rainbow

cat /var/log/messages|grep dhclient|grep -v «bound to 212.193.39.46»

или

zcat /var/log/messages.1.gz|grep dhclient|grep -v «bound to 212.193.39.46»

подтверди, что или не получает адрес или выдает другой.

дальше:

а) разбирайся с провайдером

б) пропиши статический адрес, как уже посоветовали.

AnViar
()
Ответ на: комментарий от rainbow

>пользуемся wiki, redmine, проект на tomcat7

Может не сеть, а просто ресурсов не хватает, в своп случаем не уходит?

К консоли как-то можно добраться (не по сети), на кнопки он реагирует?

lvi ★★★★
()

74% packet loss

Патчкорд поменяй для начала, посмотри логи на свиче порт не падает?

testuser123
()
Ответ на: комментарий от lvi

К консоли как-то можно добраться (не по сети), на кнопки он реагирует?

Да, сразу просыпается, когда к нему подходишь.

rainbow
() автор топика
Ответ на: комментарий от AnViar

cat /var/log/messages|grep dhclient|grep -v «bound to 212.193.39.46»

Ничего не находит.

А что за сервер? самба там или хттп? ну если по ссш заходите то и ssh-server!

http сервер.

Статический IP ему дай

Это не в моих полномочиях. Надо админов этой сети просить. Да и точно ли это поможет?

rainbow
() автор топика
Ответ на: комментарий от rainbow

Может не сеть, а просто ресурсов не хватает

Не, ресурсов достаточно. По 5% примерно использовано всего.

rainbow
() автор топика
Ответ на: комментарий от rainbow

По всем признакам, как засыпает что-то.

А если ему в крон пинг прописать, например один пинг куда-нибудь, раз в 5 мин. Мне приходилось такое делать, было 2 внешних IP на одной сетевушке, и железяка провайдера постоянно теряла мак для 2-го. Провайдер не смог помочь, пришлось выкручиваться.

lvi ★★★★
()
Ответ на: комментарий от rainbow

если он засыпает - тому есть какая-то причина ==> смотреть логи.

Komintern ★★★★★
()

1) пишешь скрипт, который пингует по крону каждые 5 минут шлюз провайдера и еще какой-нибудь хост. вывод скрипта складируешь в файл.
2) ловишь момент когда сервак недоступен со внешки, засекаешь время
3) позже, когда его отпускает, смотришь логи за тот момент, когда он был недоступен. тут могут быть 2 варианта: пинги прошли или соответственно не прошли.

Если пинги не прошли - разбираешься почему(как минимум определяешь твой это косяк или вышестоящего маршрутизатора). Если пинги прошли - все ясно - косяк на твоей стороне.

Как-то так. Дальнейший план действий зависит от результата выполнения вышеперечисленного...

Pinkbyte ★★★★★
()
Ответ на: комментарий от Pinkbyte

Спасибо, попробую. Хоть я и пробовала уже пинговать каждые 5 минут, но еще раз попробую вами предложенный план - может чего упустила.

Если проблема решится или что-то не получится,-отпишусь.

rainbow
() автор топика
Ответ на: комментарий от rainbow

А если снова за компом логинешься то все работает? А ты сеть не через NetworkManager настраивал? если логаут, а сеть доступна только твоему пользователю.....сам подумай....

anykey_mlya
()
Ответ на: комментарий от rainbow

Apr 4 13:46:04 w12-422-03 dhclient[1054]: bound to 212.193.39.46 — renewal in 1773 seconds

[guess] попробуй увеличить renewal интервал до максимально возможного (у меня это 36000 секунд). Ну и чтоб renewal «происходил» около 00:00

ZuBB ★★★★★
()
Ответ на: комментарий от anykey_mlya

А ты сеть не через NetworkManager настраивал?

Настраивала через network. NetworkManager глючил по страшному.

если логаут, а сеть доступна только твоему пользователю.....сам подумай....

Сеть доступна не только моему пользователю. Проверяли.

попробуй увеличить renewal интервал до максимально возможного (у меня это 36000 секунд). Ну и чтоб renewal «происходил» около 00:00

Спасибо, посмотрю.

Сейчас кстати стали чаще сбои происходить. Через несколько минут уже сервер опять не пингуется.

rainbow
() автор топика
Ответ на: комментарий от rainbow

Еще есть подозрения на глючную сетевую карту.

Ethernet controller: Intel Corporation 82567LF-2 Gigabit Network Connection
        ...//и т.д. и т.п.
        Kernel driver in use: e1000e
        Kernel modules: e1000e

Ни у кого не было с ней проблем в федоре 13? Я не нашла, как отключить режим засыпания в карте (есть ли он или нет, тоже не нашла. не подскажете как это узнать?)

Апдейт системы не помог. Смена мака на мак компа, на котором все хорошо пинговалось,не помогла. Проблема в сети?

rainbow
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.