LINUX.ORG.RU
решено ФорумAdmin

Зависло новое ядро на удаленном сервере. Как его пнуть?


0

1

Пересобрал новое ядро на удаленном сервере. Тестовый запуск, во избежание kernel panic, обезопасил как полагается: ядру передал panic=5, дефолтным пунктом menu.lst сделал старое ядро, а перезагружался после grubonce.

Так эта зараза все равно подвисла посередине. Т.е. не kernel panic, но и сеть с sshd не подняла, даже не пингуется. Видать, на раннем этапе в диалог вступила, ожидает ввода.

Чем её сдвинуть с мертвой точки? Нету ли, по аналогии с wake-on-lan, reset-on-lan?

Есть ли какие-то методы избежать такого расклада? Допустим, принудительный перезапуск после 5 минут простоя.

Благодарю всех заранее за участие.



Последнее исправление: mclaudt (всего исправлений: 2)

Чисто теоретически, можно попробовать сконфигурировать software watchdog таким образом, чтобы он валил ядро через некоторое время, если некая программа его не отключит.

tailgunner ★★★★★
()

Насколько я понимаю, «удаленный от вас сервер» совсем не в ЦОДе, и никакой панели управления им нет. Также нет и доступа по KVM-over-IP. Верно?

ИМХО тут нет иного выхода кроме позвонить и попросить кого-то сделать обычный ресет или ресет по питанию. А на будущее предусмотреть такую возможность самому (проще всего ИМХО доработать напильником телефон, чтоб по принятию звонка с определённого номера срабатывало нажатие кнопки RESET)

adriano32 ★★★
()

> принудительный перезапуск после 5 минут простоя.
watchdog?

AITap ★★★★★
()
Ответ на: комментарий от tailgunner

Ок, только это не избавляет от проблем до подмонтирования коневого каталога. А я сам лично видел как ядро спрашивало какой её взять root=, так как переданный её не устроил.

Согласитесь, странно, что с такой проблемой не столкнулась критичная для написания решения масса программистов.

mclaudt
() автор топика
Ответ на: комментарий от mclaudt

> Ок, только это не избавляет от проблем до подмонтирования коневого каталога.

Вкомпилированный в ядро watchdog, активированный опцией командной строки - избавляет (нет, я не знаю, можно ли его так сконфигурировать). Вот если тебя волнуют проблемы, возникающие при инициализации самих вкомпилированных модулей, тогда ой.

Согласитесь, странно, что с такой проблемой не столкнулась критичная для написания решения масса программистов.

Аппаратные вотчдоги, KVM-over-IP, панели управления, саппорт в датацентрах :)

tailgunner ★★★★★
()
Ответ на: комментарий от mclaudt

это и есть промышленный подход к решению проблемы

Но для этого нужно у провайдера ещё один IP попросить.

И да, как ты себе представляешь сбросить систему по сети, если она сеть не подняла, и не откликается даже на клаву?

adriano32 ★★★
()
Ответ на: комментарий от mclaudt

> А почему все-таки не запилить reset-on-lan?

Потому что это DoS. Впрочем. большой брат давно проталкивает vPro.

tailgunner ★★★★★
()
Ответ на: комментарий от adriano32

>>да, как ты себе представляешь сбросить систему по сети, если она сеть не подняла

Я просто надеялся услышать, что в таких случаях по истечении времени она сама ребутнется. Сидел вот, гипнотизировал пинги с соседней ноды.

mclaudt
() автор топика
Ответ на: комментарий от mclaudt

Ну про вотчдог тебе уже сказали. Правда нужен аппаратный, а не программный ИМХО. Во всяких там микроконтроллерах, микропроцессорах итп аппаратный вотчдог это мастхэв. Он даже по умолчанию включен и любит у нубов вызывать проблемы типа «А чё мой цикл|функция сбросился не дойдя до конца?!»

Покупай у провайдера ещё один линк и ставь KVM или сооруди цепь сброса питания через GRPS.

adriano32 ★★★
()

Ладно, всем спасибо, решением, похоже, станет KVM-over-всю-москву-на-общественном-транспорте ;)

mclaudt
() автор топика

> Есть ли какие-то методы избежать такого расклада?

В нормальных датацентрах на выбор:

- reset из панели управления
- reset + загрузка rescue image по сети
- reset + загрузка по сети хитрой виртуалки + загрузка там с ваших дисков + доступ через жаба-апплет. Такой хитровыпуклый софтовый KVM, показывает даже меню груба.

за отдельные бабки - аппаратный KVM, но он не нужен.

Vit ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.