Очередной раз перезагружая свой домашний сервер после обновления ядра, задался вопросом: а как делают подобные вещи на компьютерах, на которых недопустима перезагрузка, например на продакшн серверах, где секунда даунтайма это огромные потери для компании?
Load-balancing это конечно хорошо: один компьютер вышел из строя — за него отрабатывает другой. Но что делать когда невозможен вывод из строя хотя бы пары серверов?
Какие инструменты используются для того чтобы латать дыры «на лету»? ksplice? Возможно, какие-нибудь другие технологии?