LINUX.ORG.RU

Виснет сервер


0

1

Ситуация следующая:

Есть сервер,

[root@srv-4-0 ~]# cat /etc/*relea* cat: /etc/lsb-release.d: Is a directory CentOS release 5.4 (Final) [root@srv-4-0 ~]#

uname -a Linux srv-4-0.***.ua 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:30:06 EDT 2010 x86_64 x86_64 x86_64 GNU/Linux

Симптоматика:

При зависании продолжает пинговатся. Телнетятся ssh и http. Но зайти в консоль не возможно. С бортового квм тоже невозможно зайти, консоль виснет после введения пароля.

Сервер мониторится какти. Из всех графиков только LA показывает всплеск до 8 единиц. Остальные графики (память, своп, сеть) в норме. Причем периодически появляются подобные всплески LA но проходит безболезненно.

В поисках решения проблемы решил сменить аппаратную часть - а именно - мать, память, проц. Благо рядом простаивает идентичный сервер с идентичными железками.

Непомогло.

В логе messages ничего. На экране КВМ тоже нет алярмов.

Рейд живой.

Температура тоже в норме.

На сервере крутится heartbeat для перекидывания айпишника на резервный сервер. Этого не происходит.

На сервере nginx c примонтированным nfs разделом и passenger на бекенде.

Ребят, что подскажете?

P.S Настройки NFS сервера

root@srv-2-0:~# cat /etc/exports

/export/sdb1/ 10.10.10.1(rw,sync,no_root_squash,no_subtree_check)

/export/sdb1/ 172.16.0.4(rw,sync,no_root_squash,no_subtree_check)

/export/sdb1/ 172.16.0.5(rw,sync,no_root_squash,no_subtree_check)

/export/sdb1/ 172.16.0.6(rw,sync,no_root_squash,no_subtree_check)

/export/sdb1/ 172.16.0.7(rw,sync,no_root_squash,no_subtree_check)

/export/sdb1/ 172.16.0.8(rw,sync,no_root_squash,no_subtree_check)



Последнее исправление: I00matolog (всего исправлений: 2)

Ответ на: комментарий от I00matolog

>Рядом стоит идентичный сервер.

С идентичным ПО и с идентичными настройками.

Один в один.


Аптайм больше года.



Хех. У меня в начале года была такая история с новым сервером. Начало не нашёл (на ЛОРе зачем-то ограничили глубину просмотра своих тем), а развитие истории - http://www.linux.org.ru/forum/general/4324241

Сервер зависал (симптомы как у тебя) из-за сбоев в дисковой подсистеме. При чём - непредсказуемо. То полтора месяца без нареканий отработает, то каждый час виснет. Сдавал продавцу на тестирование - у них всё ок, все тесты проходят.

В итоге взял точно такой же сервер на работу - там всё работает идеально.

Это убедило продавца, что дело в железе. Поменял сервер целиком (правда, на другую модель, тех уже не было) - работает с тех пор отлично.

KRoN73 ★★★★★
()
Ответ на: комментарий от I00matolog

Как вариант, сделать минимальный набор библиотек и утилит, в том числе ssh на другом порту на ram-диске. Наверное, мегабайт 10 хватит. ИМХО, это позволит зайти на сервер при высокой загрузке и при проблемах с дисками.

mky ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.