LINUX.ORG.RU
решено ФорумAdmin

Обеспечение работы по ssh в случае отказа дисковой подсистемы


0

4

Вот сегодня в очередной раз наткнулся на подобное чудо. Умер софтовый рэйд на одном древненьком сервере. По ssh подключится нельзя. Только брутальная перезагрузка.
Переодически возникают такие проблемы, к примеру кончается место на диске.

Есть-ли способ обеспечить независимость ssh и основных утилит от винтов?
Чтобы даже в случае полного отказа контроллера был доступ к какой-то минимальной функциональности?

Ответ на: комментарий от lioncub

1. Средство мониторинга тут причём? Я говорю не о диагностике, а о действиях после аварии.
2. Сетевой КВМ это да, это хорошо :) Он даже есть и даже должен работать, но не работает :(

dmitryalexeeff
() автор топика

ОСТОРОЖНО! Глупая идея!

А нельзя создать что-то типа RAM-диска, чтобы все нужные утилиты и ведро висели там? Т.е. пока питание есть - пофиг на винты. Как я это вижу: 1. Начинается загрузка. 2. Создаётся RAM-диск. 3. Загрузка продолжается с RAM-диска.

anonymous
()

подпишусь, так как сам с таким иногда сталкиваюсь.
Насколько я понимая, демону или системе нужно записать логи (как я понимаю о логине), а так как места для записи нет, то все обламывается. В oracle на этот случай есть аккаунт sys или system, чьи действия не логируются и который, соответственно может зайти независимо от того, есть место под логи или нет.
Сделать отдельного такого пользователя для ssh думаю не получится, поэтому я думал в направлении полного отключения логирования.
Но так тесты не доведены до конца, понаблюдаю за успехами в этой теме

zolden ★★★★★
()

ФС разве не резервирует место руту?

melkor217 ★★★★★
()
Ответ на: комментарий от zolden

Дело не только в логах. При подключении с диска читаются исполняемые файлы и библиотеки, если sshd не сможет их прочитать и загрузить в память - также ничего не выйдет.

Я пробовал как-то на одном сервере, с дебианом, у которого периодически умирает RAID (ну, я так думаю что это он ).
Насколько помню, при загрузке копировал в tmpfs папки /bin /var /tmp /lib и монтировал их вместо оригинальных. Но тогда это не помогло, или не всё перенёс в память, или дело было не в рэйде, или чего-то не учёл.

dmitryalexeeff
() автор топика
Ответ на: комментарий от new_account

события сегодняшнего дня говорят мне об обратном

dmitryalexeeff
() автор топика
Ответ на: комментарий от dmitryalexeeff

При подключении с диска читаются исполняемые файлы и библиотеки

OH SHIT, ты хочешь сказать, при тысяче коннектов у меня будет висеть тысяча копий библиотек и исполняемых файлов?
Давай проверим? Вносите методику проверки

zolden ★★★★★
()
Ответ на: комментарий от zolden

я хочу сказать что шелл вполне может тянуть за собой какую-нибудь «telephaty_autocompletion.so», которая ничем кроме этого шелла не используется.
но вообще, мысль единственно верная в этом случае посмотреть что грузится с диска при открытии ssh-сессии

dmitryalexeeff
() автор топика
Ответ на: комментарий от dmitryalexeeff

посмотреть что грузится с диска при открытии ssh-сессии

как минимум /etc/profile ~/.profile или чтото специфичное для каждого шела

Skolotovich ★★★
()
Ответ на: комментарий от dmitryalexeeff

1. Средство мониторинга тут причём? Я говорю не о диагностике, а о действиях после аварии.

наверное, чтоб предупреждать аварии... (например кончается место на винте)

lioncub ★★
()
Ответ на: комментарий от dmitryalexeeff

Лучше в ramfs, так как tmpfs может уйти в swap. Хотя, если диск со swap'ом отвалится, а ядро захочет посвопится, будет паника.

mky ★★★★★
()

Сделайте raid 1 для необходимого вам, на гигабайт, из 4/5/6/...100500 разделов, физически расположенных на как минимум двух жестких дисках.

Помимо вышеприведенных методов перемещения в RAM, можно сделать копию утилит на смонтированный cd/flash/etc

Ещё можно монтировать бинарники с библиотеками по сети. Пока есть сеть — будут использоваться извне, нет — прочитаются с диска.

kompas
()

sdio, mky
а какие есть варианты, если бинарники и библиотеки на месте, и просто нет места на диске
(т.е. скорее всего, просто не могут писаться логи)?

zolden ★★★★★
()
Ответ на: комментарий от zolden

Насколько я понимая, демону или системе нужно записать логи (как я понимаю о логине)

Это же через syslog делается, sshd пофигу на это. Он же не отпадает, если syslogd остановить. :-)
А вот на что ему не пофиг, похоже, так это на LA немеряный...

AS ★★★★★
()
Ответ на: комментарий от AS

Блин, ну тогда я не знаю что не так, раз все логи пишутся асинхронно и не на что не влияют. У меня есть еще теория про .history и wtmp, но, судя по всему, они тоже не виноваты

zolden ★★★★★
()
Ответ на: комментарий от zolden

Блин, ну тогда я не знаю что не так, раз все логи пишутся асинхронно

Что-то все стормозили, включая меня. passwd-то недоступен...

AS ★★★★★
()
19 апреля 2013 г.

Всё решилось установкой аппаратного watchdog и перезагрузкой в случае отказа.

dmitryalexeeff
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.