LINUX.ORG.RU
ФорумAdmin

Падает/перезагружается система


0

0

Есть сервер с debian'ом, сильно ранее с opensuse, на котором живет xen4, собранный из исходников, на сусе был пакетами.
По неизвестной причине перезагружается, причем суся хотя бы раз в 30 дней примерно, а дебиан совсем непонятно, сегодня упал - наверно 2х недель не прошло с последней такой фигни.
В messages и syslog ничего необычного, крон, да хапы rsyslog'а, а потом идет загрузки системы.

Между сусей и дебианом стоял XCP, на центосе - такой фигни не было, серв сам не перезагружался.

Как отследить причину перезагрузок ?
На продакшн сервере такая хрень очень вредит.

Сервер хоть как-нибудь мониторится, или только по логам смотрите?

om-nom-nimouse ★★
()

выкинь куда-нибудь логи netconsole - может он у тебя паникует и в ребут уходит

Pinkbyte ★★★★★
()

может быть он падает от полученных обновлений? с анстэйблом такое частенько бывает.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

А вы на продакшн серверах, да даже более-менее нагруженных и ответственных всегда используете unstable ?

kostik87 ★★★★★
()

Так может поставить centos?

kerneliq ★★★★★
()
Ответ на: комментарий от anonymous

Я мой админ и говорю НЕХ.
Менять систему сейчас не прокатит.
Я использую обычный debian 6.0 squeeze, именно stable.
Только по логам, некуда мониторить.
Автоматом обновления не ставятся.

zlofenix
() автор топика
Ответ на: комментарий от uspen

Проблемно.
Бесперебойник в дц, дц в москве, я в 1000км от москвы.
Только верить что ипб нормальный т.к. их серв на нем же.

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

ты не понял. ибп у них «нормальный», интерактивный, за 100500 баксов от APC на 100500 Вт, но я тебе говорю про ибп с двойным преобразованием, я говорю про тип.

uspen ★★★★★
()

Есть сервер с debian'ом,[ ...] , на котором живет xen4, собранный из исходников,

На продакшн сервере такая хрень очень вредит.

1) Я конечно извиняюсь, но экспериментировать нужно на тестовом стенде. За сборку гипервизора из сырцов на продуктиве я бы гнал с профнепригодностью.

2) Желательно проверить память на сервере и настроить мониторинг железа ( в идеале весь impi, если нет сойдёт просто lm-sensors ).

Дальше пойдёт моё ИМХО, т.к. с xen'ом плотно не работал.

3) Если в xen есть свой механизм сбора краш дампов, нужно его использовать. Если нет, посмотри в сторону kdump. Вкратце: ядро резервирует сколько не жалко памяти ( обычно 256 Мб ). В случае kernel panic в этой памяти запускается новое ядро ( crash kernel ), новому ядру передаётся управление, оно наскоро инициализирует часть оборудования, собирает краш дамп со старого ядра и пишет его в указанное место.

router ★★★★★
()
Ответ на: комментарий от router

1. Никто не экспериментировал, что плохого в сорцах ?
За установку пакетов гнал бы я, а сборка из исходников = нормальная версия и установка то что нужно и куда нужно, в данном случае - ксен в репозиториях древний как мамонт.

2. Сенсоры есть, но не угадать когда упадет => не проверить из-за температур ли это.
3. Предвижу что нет, ксен тут не при делах ибо падает хостмашина, а не виртуалка на ней.

Главный вопрос про панику - будет ли серв перезагружен при панике ? Если нет - значит не паника у меня.

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

1. Никто не экспериментировал, что плохого в сорцах ?

Почему у тебя сейчас не работает?

2. Сенсоры есть, но не угадать когда упадет => не проверить из-за температур ли это.

google система мониторинга

3. Предвижу что нет, ксен тут не при делах ибо падает хостмашина, а не виртуалка на ней.

Не факт

Главный вопрос про панику - будет ли серв перезагружен при панике ? Если нет - значит не паника у меня.

google kernel panic reboot

router ★★★★★
()
Ответ на: комментарий от router

1. Офигительная логика, т.е. пакеты стабильней ибо пакеты ?
И пофиг что пакеты древние ?
Ну и до кучи - раньше были пакеты, лучше не было.
3. wiki виртуальная машина

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

Офигительная логика, т.е. пакеты стабильней ибо пакеты ?

Ты можешь ответить на мой вопрос? Если нет, то почему?

3. wiki виртуальная машина

Ну ты поучи дедушку пердеть. У тебя ВМ падает или весь железный сервер?

router ★★★★★
()
Ответ на: комментарий от router

1. Сейчас работает, речь про что падает и еслиб знал почему - наверно не стал спрашивать. 3. Поучу, весь железный сервер, изначально про это речь.

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

Главный вопрос про панику - будет ли серв перезагружен при панике ? Если нет - значит не паника у меня.

таким не способным учиться идиотам нет в нашем ремесле.

я тебе даже дал где посмотреть, паника у тебя или нет. ты не впитываешь информацию. вали.

uspen ★★★★★
()
Ответ на: комментарий от zlofenix

1. Сейчас работает, речь про что падает и еслиб знал почему - наверно не стал спрашивать.

И к возможным проблемам добавляются кривизна твоих рук, неванильное ядро, дистрибутивные патчи и прочая и прочая. Сборка была бы оправдана, если бы стабильных репозиториев не было.

3. Поучу, весь железный сервер, изначально про это речь.

Вот именно. Для справки, гипервизор xen работает ниже ядра ОС.

router ★★★★★
()
Ответ на: комментарий от router

Какой ты упертый.
Повторить что в репах древний ксен ?
Да и вообще умничай в блокноте, есть что по делу - пиши тут, а свои посылы в гугл, засирания сорцов и прочее - в блокнот или бложик свой изливай.
Глазами читать научишься - приходи, 100 раз написано что падает железный серв, а не виртуалки, я понимаю что ты к vmware привык и кушаешь все готовое и в сборочке, поэтому и собрать ничего не можешь и винишь всех и во всем, т.к. ничего не можешь умного сказать.

zlofenix
() автор топика
Ответ на: комментарий от uspen

Ты кинул что-то - я тебе кинул что там, на этом все, ты перекатился на вопросы о бесперебойниках.
Я даже не пробовал узнать что это было ибо, в данном случае, похуй.
Не паника у меня, ок, сходи покакай@добрее станешь, что злой то какой ?
Про бесперебойники - не спорю, я в них ничего не понимаю, в дц даже думать над такими вопросами не будут, все пашет - мой не пашет, бесперебойник 1, вывод очевиден - или у меня супер хреновый бп или дело таки не в этом.

Куда вообще лор скатился ? Что не спроси - через несколько нормальных постов набигают озлобленные умники и засирают своими очень важными комментами.

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

Я даже не пробовал узнать что это было ибо, в данном случае, похуй.

Вот ты и есть, как раз, злобный дурак. Значение /proc/sys/kernel/panic 0 как раз означает, что машина при kernel panic перезагружена автоматом не будет, на что тебе упорно намекали. Я бы даже сказал, тыкали носом.

Сенсоры есть, но не угадать когда упадет => не проверить из-за температур ли это.

Мониторить температуру и напряжения через lm_sensors хоть скриптом, хоть кактусом можно научить даже секретаршу. Херовый ты админ, раз такие вопросы возникают.

Что говорят dmesg и /var/log/messages, как понимаю, ты посмотреть не удосужился.

Куда вообще лор скатился <...> через несколько нормальных постов набигают озлобленные умники и засирают своими очень важными комментами.

Не шёл бы ты нахер отсюда с такими заявлениями, эникей недоделанный?

nbw ★★★
()
Ответ на: комментарий от nbw

Шел бы ТЫ, еще 1 озлобленный умник, даже 1й пост темы прочитать не можешь.
Я не говорил что не могу в мониторинг, я говорил что не угадать когда упадет, а проверять сенсоры каждую минуту - не очень хорошая идея.
Иди убунту ставь секретаршам своим дальше.

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

Я не говорил что не могу в мониторинг, я говорил что не угадать когда упадет, а проверять сенсоры каждую минуту - не очень хорошая идея.

У тебя реально в ДНК баг.

http://itmages.ru/image/view/653183/826f8d7f

Вот как-то так тебе советовали сделать, пока ты говном в добрых людей кидаться не начал. Застрелись и не загрязняй генофонд Родины.

nbw ★★★
()
Ответ на: комментарий от nbw

пусти самописный скрипт в фоне, пусть пишет. Никто не знает когда на самолете произойдет ЧП, поэтому черные ящики всегда пишут

blokant ★★
()
Ответ на: комментарий от blokant

пусти самописный скрипт в фоне, пусть пишет.

Не тому отвечаешь. Не проснулся чтоле? ТС, судя по всему, не понимает смысла словосочетания «самописный скрипт».

nbw ★★★
()
Ответ на: комментарий от nbw

именно не проснулся) извиняюсь. ТС не хочет принять советов, а зря. Хотя бы на тестовом железе сначала бы пустил Xen, штукенция то не из простых, особенно если сам собрал...

blokant ★★
()
Ответ на: комментарий от nbw

Как же ты достал, уйди уже отсюда, умник, от тебя, кроме тонн говна, не было ничего тут.
Иди вконтактику рассказывай какой ты умный и какие слова знаешь.

zlofenix
() автор топика
Ответ на: комментарий от blokant

Советы я принимаю без проблем, zabbix накрутил себе и netconsole, за что спасибо первым ответам.
Тестового железа нет, сервер всего 1, да и тесты - не продакшн, нагруз не предскажешь, мало-ли что на виртуалках могут запускать.
Сам собрал - ничего плохого же, что сложного собрать софт из исходников ?

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

zabbix накрутил себе

Хвост себе накрути :D

Что с температурой-то? В решении вопроса продвигаешься, или только злобные высеры пишешь? ;)

nbw ★★★
()
Ответ на: комментарий от nbw

Не ходи больше на чаны.
Пока все нормально, не падал, температура в обычных пределах.

zlofenix
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.