LINUX.ORG.RU
ФорумAdmin

Рандомное зависание сервера


0

1

Помогите пожалуйста понять в чем проблема и разрулить ее... Сервер на базе Ubuntu 11.04, LAMP,pptpd,ftp.в начале периодически начал отваливатся Apache но при этом phpmyadmin работал..но при подключении по ssh и попытке ввести какую - нибудь комманду, консоль больше не отвечала...в логах ничего подозрительного обнаружено небыло.а вот сегодня сервер как я понял повис вообще...скрин https://picasaweb.google.com/108860862466016490702/qeSppG#5680877419533912290.

Прошу помочь...


в логах ничего подозрительного

В каких именно логах?
системных? логах приложения?
Хотя, нет, нет, не говори, местные аналитеги и так диагноз поставят.

Если проблема стабильно воспроизводится, сделай хотя бы вывод top и iostat в файл по крону, увидишь кто что делал перед смертью

zolden ★★★★★
()
Ответ на: комментарий от xpahos

Да только вы там смотрите баг трэкер centos, а у вас Ubuntu, ядра очень разные, что CentOS, который собирается из исходников red hat, что Ubuntu накладывают много патчей на ядро.

kostik87 ★★★★★
()
Ответ на: комментарий от zolden

в логах апача и в системных логах(dmesg,syslog) ничего подозрительного.. на счет стабильности скажу следущее:

в начале таких глюков, мне показало что апач падал из-за атак на него,т.к. в логах апача были сканы с тайваня и прочих мест...после блокировок подобных адресов сервер вновь упал,но при этом уже ничего подозрительного небыло за исключением скрина...и при чем было замечено что упал опять ровно через неделю...

На счет выводов в файл-спасибо,попробую!

kbu
() автор топика

Инкременирую предложение посмотреть SMART жёстких дисков.

Попробуйте держать наготове ssh-сессию со статически собранным busybox ash в качестве шелла с отключённым автодополнением и текущей директорией где-нибудь в /proc, чтобы минимизировать вероятность обращения к жёсткому диску, и из такого шелла попытайтесь отладить ситуацию.

Также может оказаться полезной статья www.linux.org.ru/wiki/en/Как_получить_содержимое_буфера_ядра_с_зависшей_системы

AITap ★★★★★
()
Ответ на: комментарий от kbu

Если зависания действительно случайные и не зависят от нагрузки, в логах ничего нету - то очень вероятна проблема с оборудованием.

Shtsh ★★★★
()

Как уже сказали выше - почти 100% уверенность, что проблема с жёстким диском.
Если сервак боевой, с боевыми данными, без RAID1 и резервных копий - то сейчас практически последний шанс это исправить не потеряв данные.
1. Подключаем пару-тройку дополнительных хардов.
2. Грузимся с livecd
3. делаем бекап всех нужных данных на один из двух дисков.
4. переносим ещё живую систему на raid1 из двух других жисков.
5. перезагружаемся, отключив диск с бэкапом и сбойный.
Бэкап храним, сбойный диск тестируем и меняем по гарантии (выкидываем, если кончилась) или используем дальше, если он ещё жив.

И на будущее, как минимум RAID1 в сервере - обязательно нужен, чтобы избежать простоя при проблемах такого рода.

CyberTribe ★★
()
Ответ на: комментарий от AITap

имхо, при подозрениях на проблемы с жёстким диском и явным отсутсвием raid-а (а значит, скорее всего, и бэкапов) - лучше сначала сохранить данные, а потом уже разбираться :)

CyberTribe ★★
()

Если, конечно, мой libtelepathy не поломан и у ТС не аппаратный RAID, тогда можно проверить вариант с планировщиком I/O

CyberTribe ★★
()
Ответ на: комментарий от xpahos

Да, вы не ТС, но не суть, но у ТС`то Ubuntu ...

kbu

...Сервер на базе Ubuntu 11.04, LAMP,pptpd,ftp://ftp...

kostik87 ★★★★★
()
Ответ на: комментарий от CyberTribe

Прежде всего всем спасибо за ответы и за советы! raid на сервере есть и при чем отдельный раид для сайта,второй под саму систему.

kbu
() автор топика
Ответ на: комментарий от kbu

и в догонку скажу,что забыл вчера сказать: интересности начались еще при установке системы,а именно - при установочном визарде переключения между шагами установки иногда доходили до 60минут...некоторые шаги проходили быстро...

З.Ы. всех с наступлением зимы;)

kbu
() автор топика
Ответ на: комментарий от kbu

и еще момент забыл уточнить - на сервере частые подключения по пптп.

kbu
() автор топика

периодически начал отваливатся Apache но при этом phpmyadmin работал

жестокая жесть :)

p.s. hdd вряд-ли приделах - ищите прожорливое приложение. Можно скриптом в цикле писать статистику netstat, lsof, top -b в файл, а потом спокойно надо ним подумать.

MKuznetsov ★★★★★
()
Ответ на: комментарий от MKuznetsov

Наверное не совсем корректно выразился по поводу отваливания Apache... сайты которые на нем крутятся становились недоступными,кроме phpmyadmin'a,но при этом в логах апача ничего критического не было... За вывод статистики спасибо,учту!

kbu
() автор топика

а у вас случаем swap не на mdraid?

BigAlex ★★★
()

Вообще, лучше начать с установки пакета systat и курения вывода sar. Если там ничего не будет и зависания дейтсивтельно рандомные - это железо.

BigAlex ★★★
()
Ответ на: комментарий от BigAlex

Вот мой fdisk -l

Disk /dev/cciss/c0d0: 36.4 GB, 36414750720 bytes
255 heads, 32 sectors/track, 8716 cylinders
Units = cylinders of 8160 * 512 = 4177920 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0007f41a

Device Boot Start End Blocks Id System
/dev/cciss/c0d0p1 1 1437 5858304 82 Linux swap / Solaris
Partition 1 does not end on cylinder boundary.
/dev/cciss/c0d0p2 * 1437 1485 195584 83 Linux
Partition 2 does not end on cylinder boundary.
/dev/cciss/c0d0p3 1485 8716 29505536 83 Linux
Partition 3 does not end on cylinder boundary.

Disk /dev/cciss/c0d1: 72.8 GB, 72829501440 bytes
255 heads, 63 sectors/track, 8854 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x000c4665

Device Boot Start End Blocks Id System
/dev/cciss/c0d1p1 1 8855 71120896 83 Linux

Disk /dev/cciss/c0d2: 36.4 GB, 36414750720 bytes
255 heads, 63 sectors/track, 4427 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x000ecdf2

Device Boot Start End Blocks Id System
/dev/cciss/c0d2p1 1 4428 35559424 83 Linux

Disk /dev/cciss/c0d3: 36.4 GB, 36414750720 bytes
255 heads, 63 sectors/track, 4427 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00013037

Device Boot Start End Blocks Id System
/dev/cciss/c0d3p1 1 4428 35559424 83 Linux

kbu
() автор топика
Ответ на: комментарий от kbu

случаем не хопэ и зависание произошло через 200 дней?

xpahos ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.