LINUX.ORG.RU

Удаленное управление питанием серверов.

 , ,


0

2

Стал сейчас вопрос о реализации удаленного управления питанием на десятке сервером (3 из них под виндой, остальные линуксы). Погуглив на эту тему не нашел ничего кроме готовых железок стоимостью в сотни долларов, что для нашей конторы не особо катит, ибо любят экономить.

Пока что есть такие идеи: -Настроить wake on lan для того, чтоб можно было включить сервер, остальное делать при помощи ssh/rdp. Тут мне не ясно, как это будет работать в случае, если машина наглухо зависла, например...

-Сделать так, чтоб можно было физически замыкать контакты на материнке с определенного сервера. Тут вообще мало идей, как это реализовать...

Может кто-то сталкивался с подобным, подскажете что-то?



Последнее исправление: andrey_blind (всего исправлений: 1)

если машина наглухо зависла

Аппаратный watchdog, например.

Chaser_Andrey ★★★★★
()
Ответ на: комментарий от AnDoR

Подошло бы, если б стоило подешевле. на десять серверов по плате по 80-120 баксов дохера получается( Такое дело, что в компании денег достаточно, но особо не горят тратить на что-либо(

andrey_blind
() автор топика
Ответ на: комментарий от andrey_blind

Ну им нужно попытаться популярно объяснить, что за надёжность все хотят деньги.

Chaser_Andrey ★★★★★
()

Хотите сэкономить на спичках Remote Power Switch'ах — паяйте их подобия на коленках тиристорах. Только потом не жалуйтесь, что внезапно погорели недешевые сервера или блоки питания.

blexey ★★★★★
()

Ну пусть наймут какого-нибудь алкаша за стакан самогонки. Он им будет ходить включать и выключать. По надёжности это будет даже выше, чем наколеночная самопальщина.

imul ★★★★★
()
Ответ на: комментарий от AnDoR

Есть охранники, которых можно пускать в серверную...Но такое решение особо надежным мне не кажется. На самый худой конец сделаю блок кнопок перезагрузки и включения, который подсоединю к материнкам...Но грустно это, сами понимаете.

andrey_blind
() автор топика
Ответ на: комментарий от andrey_blind

если нет денег и хочется своей жопой отвечать за надежность - можно спаять плату на LPT и написать плагин к nagios или(на правах саморекламы!) воспользоваться моим костылем(в процессе написания) под названием yasnd

Pinkbyte ★★★★★
()
Ответ на: комментарий от Pinkbyte

Вот это уже походу ближе всего к нужному. твой костыль - плагин к наджиос, который при недоступности хоста через ком порт дает на материнку сигнал, я правильно понял?

А есть схемка платы?

p.s. давно уже хотел наджиос поднять, повода не было.

andrey_blind
() автор топика
Ответ на: комментарий от Pinkbyte

А где можно раздобыть схему платы, которая будет работать с твоим демоном? И напиши, плиз вкратце его возможности.

andrey_blind
() автор топика
Ответ на: комментарий от andrey_blind

схему у меня всё руки никак не дойдут выложить. А список возможностей там скромный. Пишется конфиг(для парсинга конфига используется библиотека Confuse), в котором указываются следующие параметры:

1) список из хостов, которые необходимо проверять, включающий в себя:
- DNS-имя хоста или ip-адрес(поддерживается пока только IPv4);
- Номер pin на плате(ну и на LPT ессно), в который подключена контактом reset на матплате того хоста, чье имя или IP-адрес заданы выше.

2) Параметры для связи с телефоном и/или GSM-модемом для отправки SMS(реализовано через библиотеку Gammu):

- использовать ли вообще SMS-оповещение?;
- номер телефона, куда слать SMS о том, что «усё пропало»;
- порт, куда подключен телефон;
и т.д.

3) Параметры сигнализации сбоекв(более заумно назвать не догадался ^_^)
- сколько должно раз обломиться тестирование, чтобы вызвать 1 реакцию(по требования заказчика это - отправка SMS вида «Хост такой-то упал!» на указанный номер)
- сколько раз должно обломиться тестирование(этот параметр больше предыдущего), для того, чтобы в отсутствии реакции(реакция - ответная SMS с указанным текстом, пока не реализовано), вызвать reset проблемного хоста путем кратковременной подачи питания на пин, указанный в конфигурационном файле для проблемного хоста, что приведет к его принудительной перезагрузке;
- сколько раз должно обломиться тестирование(этот параметр как-правило должен быть гораздо больше чем предудыщий), чтобы сбросить статистику сбоев(например reset не удался по какой-то причине? Этого требования заказчика я до конца не понял. Но - хозяин барин)

4) Параметры уровня отладки(пока их 3: нет отладки, базовая и полная)

5) Возможность отключения работы с LPT - для отладки, тестового прогона или просто для использования демона в качестве SMS-информирования. Но тогда последний параметр сигнализации сбоев стоит поставить побольше, а то заспамит SMS-ками :-)

Пока всё, что скрывается за умным словом «тестирование» - это банальный ping. В будущем планируется реализовать более специфичные тесты. Демон многопоточный(используется pthreads), для передачи управляющих сообщения используются IPC-очереди. Есть ебилды для Gentoo(ставят прямо из git, так как ни одного релиза еще не было).

Однако к энтерпрайз-применения я его пока увы порекомендовать не могу(хотя от тестеров я бы не отказался) - он всё-таки еще в процессе написания.

Маленькое замечание - тупо соединить выводы LPT с контактом Reset на матплате нельзя! Почему - это тебе любой человек более-менее соображающий в электронике расскажет(мне вот рассказали ;-)).

Pinkbyte ★★★★★
()

1. Берем мобильник, который умеет работать с ком-портом и пускать бинари (я лично взял бы симанц с эльфпаком, ибо умею с ним работать).
2. Цепляем контроллер (авр какой-нить) к порту телефона, к контроллеру контакты питания от серверов, запитываем контроллер и телефон
3. Пишем эльфик, который парсит входящие смски на предмет команд и посылает команды в порт, программируем контроллер, запускаем.
4. Вуаля! Отправляем смску на телефон с номером сервера и что с ним надо сделать, сервер старует/выключается, все рады
ну, допиливать можно во все стороны, вплоть до получения текущего состояния сервера наличием тока на светодиоде power

kostett ★★★
()
Ответ на: комментарий от kostett

Чето сильно много возни...ну, как для меня, ламера)

andrey_blind
() автор топика
Ответ на: комментарий от Pinkbyte

Скинь плиз схему, буду у тебя тестером) Только крутится эта штука будет не под генту, а под дебианом наверное. ну, или бубунтой)

andrey_blind
() автор топика
Ответ на: комментарий от andrey_blind

На всякий случай я выложил новую схему на github - в предыдущей была ошибка с значением одного из сопротивлений

Pinkbyte ★★★★★
()

Тут мне не ясно, как это будет работать в случае, если машина наглухо зависла, например...

use xen

maloi ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.