Ахтунг, дисклаймер: это нытик тред, я просто изливаю накопившуюся боль от одной приблуды.
Арендовал деловский сервер на online.net. Сервер оснащён iDRAC, это такой IPMI с джавааплетами и вебмордой. И вот с этим iDRAC-ом у меня постоянные забеги по граблям. Проблема в том что он имеет свойство отваливаться при неосторожных манипуляциях с сетевым интерфейсом (как я понял он работает через тот-же интерфейс который использует система, не вполне понимаю как реализуется такое совместное использование). Возможно какие-то другие действия тоже могут завесить его. Я ловил зависания после перезагрузки сервера из ОС и во время установки ОС через вебморду хостера, но эти сценарии у меня не получилось протестировать так-же хорошо как проблемы связанные с сетевым интерфейсом.
Если iDRAC завис то единственное что можно сделать это попросить ТП ребутнуть его, ребут сервера из ОС (если она остаётся жива и доступна) не помогает. В общем в большинстве случаев требующих вмешательства IP KVM этот самый IP KVM (от реализован через IPMI) дохнет вместе с тем что он должен был реанимировать.
В результате у меня с сапортом километровая переписка в духе «Сломалось. Презагрузили, работает. Опять сломалось. Перезагрузили, пожалуйста проверьте ваши сетевые настройки. Проверил, а оно опять сломалось».
Конечно солидную часть зависонов можно списать на мою косолапость, но не все. Например только-что, после очередной перезагрузки и обдефолчивания сетевых настроек, сервер благополучно запустился и iDRAC перестал отвечать. Сервер работает, доступен по SSH, а вот через админку провайдера сделать с ним что-либо нельзя. Сапорт пишет что
That's most likely an issue from IDRAC but unfortunately as we are not the manufacturer it's not possible to update it on our side.
И позже
Unfortunately that is not something we can fix on our side, it requires an update on the IDRAC that needs to be done from its manufacturer.
In that case it will indeed require to create a ticket to ask for an electrical reboot.
Что делать? Вдоль? Бочку? Троллейбус из буханки? Сжечь буддийского монаха перед офисом Dell?
Последним моим действием которое всё сломало было service networking restart с предварительным добавлением пустого (без подключенных интерфейсов) бриджа для lxc в конфиг. Вроде не особо экстремально, но поди ж ты.
P.S. при этом другой сервер у того-же провайдера (кажется от Supermicro, какой-то блейд кажется) работает прекрасно и мозги не сношает (ну только тормозит непомерно, но это естественное следствие смехотворной цены). А с этим делом банальная остановка ОС растянулась в квест на несколько дней. В результате я решил просто забить на попытки сразу поставить debian testing из iso, поставил stable через вебморду хостера и уже потом обновил его до testing (отдельный квест — правильно (или хотя-бы не слишком неправильно) разметить диски через ту вебморду и при этом не закрашить iDRAC (при установке с некоторыми вариантами разметки он крашится)).