LINUX.ORG.RU

Что может быть с системой?? полный дурдом... :-/


0

0

Стоит машина на колокейшне у Агавы. Gentoo Linux. Проблем не наблюдалось. С неделю назад из-за какого-то глюка Апач начал жрать память (коей всего было 512М), уводил машину в своп (2Гб), переполнял его и машину вешал.

Вписал я в него лимиты (не системные, а RLimitMem и т.п.) и... после того, как он отожрал память и повесил машину, после дистанционной (через техсуппорт в смысле) перезагрузки машина не отзывалась. Пинговалась, но ни один сервис (ssh, http, ftp, webmin, jabber и т.д. ) н еотзывался. Давали мгновенный Rejected/Refused.

Удалось, наконец, выбраться к ним на площадку (у меня работа с довольно жёстким графиком посещаемости). Приносят мне машину. Включаю (пока ещё без сети) - всё работает! На всякий случай сношу Апач из автозагрузки. Подключают сеть. Рестартую машину пару раз - всё встаёт нормально. На форуме (через lighttpd работает) уже 15 человек в онлайне, всё нормально. Добавил 2Гб оперативки и сдал машину назад.

Прихожу домой. Работает. Начинаю возиться с Апачем. Запускаю. Успеваю только заметить по top, что он сожрал уже больше 4Гб памяти (оперативной и свопа), успевая ввести /etc/init.d/apache2 stop и всё. Система больше не отзывается. Звоню в суппорт. Машину перезагружают. Те же уши - пингуется, но ни один сервис не доступен. Чуть позже замечаю, что Jabber-сервис - РАБОТАЕТ! (правда, без JIT'ов, но сам факт!)

В общем, на 90% уверен, что если поеду к ним снова, то ситуация повторится. Мне принесут машину, которая загрузится без проблем и будет работать. Как вчера :-/

У кого-нибудь есть идеи, из-за чего всё это может быть?

★★★★★

Ну очевидно, что в первую очередь надо посмотреть логи ядра и апача...
Ты не описал, каково предназначение машины, но если это что-то типа фрихостинга, то 90% вероятности, что какой-нибудь из хостеров запускает кривой CGIник.

R00T
()

Слухай сюды.

Апач при каждом коннекте рожает потомка - видать шибко твой ресур популярен иль тачка - тормоз

чтоб это доло прибить рекомендую в апач пропускать через squid - будет тебе щасте

фтыкай!

anonymous
()
Ответ на: комментарий от anonymous

дообновлялся видимо :))) - излишние обновления вредят особенно на серверах

anonymous
()
Ответ на: комментарий от R00T

>Ну очевидно, что в первую очередь надо посмотреть логи ядра и апача...

Детально изучить логи не успел, но что заметил: - По ядру сперва всё ок, потом начинают сыпаться "memory allocation error" - это, судя по всему, когда кончался своп (видел перед этим дистанционно цифры ~30Мб free in swap - кто видел меньше? :D) - По Апачу никакого особого криминала. Хотя плотность загрузки, возможно, была высокой. Нельзя исключить, что пытались DOS'ить, ходят на эту тему слухи...

>Ты не описал, каково предназначение машины, но если это что-то типа фрихостинга, то 90% вероятности, что какой-нибудь из хостеров запускает кривой CGIник.

Машина - свой собственный web-сервер. Основная нагрузка - на lighttpd, он и жил нормально.

Но тут проблема не в этом. Пусть Апач хоть уперезагружается. Но вчера он был удалён из автозапуска (что и наблюдалось на практике) и на состояние сервера после перезагрузки влиять не должен. Однако ж - машина после перезапуска не отзывается (кроме Jabber'а - что странно :) )

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

>Апач при каждом коннекте рожает потомка - видать шибко твой ресур популярен иль тачка - тормоз

Апач удалён из автозагрузки :-( А lighttpd и не такую нагрузку держал легко (200+ запросов в секунду при загрузке процессоров ~3..5%), да и вчера он работал нормально...

Сейчас хочется узнать не почему ложится Апач, с этим разобраться всегда можно, и лимиты ему прописать. Хочется узнать, почему при _отключенном_ Апаче, после падения системы из-за него, машина нормально не стартует. И почему, когда вчера её мне принесли в таком же состоянии, завелась она сразу после включения :-/

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

Попробуй сделать так:
сходи туда, выруби все кроме SSH. После этого пусть машину подключат и по SSH запусти анализатор траффика (типа netwatch), понаблюдай кто откуда и по каким портам к тебе ломиться будет. Если все ОК, то после этого врубай по одному сервису...
На самом деле, могу действительно DDoSить...

R00T
()
Ответ на: комментарий от R00T

Как бы там ни было, главная непоняность в том, почему у меня машина вчера перезагружалась без глюков при той же сети (и без глюков работала до начала экспериментов) а у них, что до, что после - нет :-/

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

Не, ну может быть они на тебя какой-нибудь хитрый фарволл поставили, так что наружу только джаббер после этого торчит...

Кстати, если будешь делать как я сказал, смени порт у SSH с дефолтного на какой-нибудь другой... Так, на всякий случай.

R00T
()
Ответ на: комментарий от R00T

Дык (я уже на этом зацикливаюсь) - вчера всё заработало только от "эффекта присутствия" и работало до зависа машины из-за Апача. Не станут же они ставить firewall, активирующийся только при перезагрузке целевой машины :D

KRoN73 ★★★★★
() автор топика

У меня было такое из-за какой-то рекурсивной работы mod_rewrite (было написано хитрое правило редиректов, которое почему-то не прерывалось встроенной защитой).

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.