LINUX.ORG.RU

Зависание с ошибкой Linux

 ,


1

1

Здравствуйте. На предприятии установлен сервер с CentOS на борту в качестве роутера(pppoe, DHCP, iptables). последнее время начал зависать с : такой вот ошибкой. Что это за ошибка? Почему сервер не перезагружается сам, если это типо «синего экрана» в винде, или как включить перезагрузку при критических ошибках? При зависании ложится сеть (думаю потому что DHCP на нем). Не всегда удобно ехать в 10 часов вечера перезагружать сервак. Спасибо за помощь

последнее время начал зависать с : такой вот ошибкой.

что в это время делалось?

Что это за ошибка? Почему сервер не перезагружается сам, если это типо «синего экрана» в винде, или как включить перезагрузку при критических ошибках?

это кернел паник. И не смей сравнивать это с жалким синим экраном. ;)
Конфигурация компа. Мне что-то подсказывает что дело в HDD(RAM)

gssomi ★★
()
Последнее исправление: gssomi (всего исправлений: 1)

Да, с синим экраном не стоит сравнивать: по сути это одно и то же, но, если в Винде синий экран «бывает» (например, переодически на моём ноуте, когда вынял-вставил USB Bluetooth адаптер), то в Линуксе это всегда повод к разбирательству.

В 99% случаев kernel panic - это либо не так сконфигурил ядро (если ты только что это сделал), либо проблема с железом. У тебя скорее всего последнее.

Почему сервер не перезагружается сам

Потому, что см. выше. И когда приедешь - нужно гонять тесты, смотреть логи и т. п.

Но если тебе так нравятся перезагрузки сервера, то вот:
http://www.cyberciti.biz/tips/reboot-linux-box-after-a-kernel-panic.html
http://unix.stackexchange.com/questions/29567/configure-reboot-on-linux-kerne...
http://lmgtfy.com/?q=kernel panic reboot

Kroz ★★★★★
()
Ответ на: комментарий от gssomi

HDD почти новые, в прошлом году меняли. Memtest-ом прогнать не могу, положу сеть на всем предприятии, меня кастрируют )). Придется остаться после работы, погонять. Спасибо

Siberian
() автор топика
Ответ на: комментарий от Kroz

Спасибо, почитаю. Пока буду разбираться с причиной, лучше поперезагружаю.

Siberian
() автор топика
Ответ на: комментарий от Kroz

Подскажите где будут логи по kernel panic? перелистал все в папке /var/log, нигде не нашел упоминание об этой ошибке

Siberian
() автор топика

Похоже на проблемы с памятью.

post-factum ★★★★★
()

А с чего он должен перезагружаться? Watchdog есть на сервере? На интеловских платах вроде такой есть.

Deleted
()

Я бы проверил память. Когда вставляешь установочный CD, DVD или флешку с линуксом, то один из пунктов - Memtest86.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от Siberian

Подскажите где будут логи по kernel panic?

Если /var/log уже был смонтирован на момент kernel panic, то будет в /var/log/messages (или где там у тебя системный лог собирается). Для особо тяжелых случаев еще дополнительно включают доп. логирование в ядре опциями.

Если /var/log/messages не смотнитован, то есть много способов - через сеть, через COM кабель. Но, ИМХО, до такого нужно опускаться в крайних случаях. Я бы начал с банального «что менялось в поледнее время», посмотрел бы /var/log/messages на предмет подозрительных сообщений (возможно, с включенным доп. логированием в ядре), потестировал бы память, сделал нагрузочное тестирование на CPU и мониторингом температуры; иногда с режимами ACPI или настройками BIOS поиграться и т. п.

Если сервер старый, и стоИт где-то в углу, то иногда помогает банально пропылесосить, пройтись резинкой по контактам памяти, заменить шлейфы HDD - я лично так поднимал несколько машин (правда, не серверов).

Kroz ★★★★★
()
Ответ на: комментарий от Kroz

Последняя запись в messages перед отключением(14 часов потом висел в ошибке): linux kernel: IN-ppp0 OUT= MAC= SRC=204.42.253.2 DST=мой IP LEN=78 TOS=0x00 TTL=54 ID=3340 DF PROTO=UDP SPT=39947 DPT=53 LEN=58 Все, след запись через 14 часов

Siberian
() автор топика
Ответ на: комментарий от Siberian

Если я правильно понял, была попытка подключится к DST порту 53, хоть он у меня заблокирован в iptables(в сети DDNS-ят, провайдер рекомендует блокировать)

Siberian
() автор топика
Ответ на: комментарий от Siberian

Последняя запись в messages перед отключением

Тогда уже весь лог выложи. Конкретно эта строчка ничего не даст.

Kroz ★★★★★
()
Ответ на: комментарий от Kroz

Пока не трогал сервер, завтра утром займусь. Где то дома лежала планка DDR2, попробую поменять(посмотрел конфигурацию, там обычная десктопная мать, с обычным AMD процессором). Спасибо

Siberian
() автор топика
Ответ на: комментарий от Siberian

Что интересно, вырубается в основном утром или ночью, до начала рабочего дня. Весь день работает без проблем

Siberian
() автор топика
Ответ на: комментарий от Siberian

Хорошо что ты не хирург...

Почитай логи!

Потестируй!!!


Тыкать пальцем в небо - последнее дело.

Kroz ★★★★★
()
Ответ на: комментарий от Siberian

Что интересно, вырубается в основном утром или ночью, до начала рабочего дня. Весь день работает без проблем

Есть ещё класс проблем - именно с таким диагнозом.

Уборщица к вам когда приходит?

Kroz ★★★★★
()

RH/CentOS отвратительно работает на железе отличном от указанного в HCL, иногда фиксится отключением наиболее бажных модулей, но их поиск та еще песня. Если стало недавно - думай что меняли, загляни в cron, что он запускает в это время. Если стало просто само по себе - скорее всего прилетело замечательное обновление. Или разбирайся, или меняй дистр.

af5 ★★★★★
()
Ответ на: комментарий от Siberian

М.б.

перегревается, стоит в кладовке, на ночь закрыли окно, выключили вентиляцию.

прыгает(падает) 220в., что-нить переключают на подстанции, в соседнюю розетку втыкают дрель,утюг,чайник,пылесос.

Старый блок питания или мат.плата, высохли кондеры (раньше часто перегревался).

anonymous
()

Предлагаю банить пожизненно всех, кто даёт ссылки на радикал. Была бы моя воля, так я бы и расстреливал ещё.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.