История изменений
Исправление router, (текущая версия) :
Осталась мелочь — реализовать возможность агенту прожить ещё до 5 минут на умершем сервере, чтобы он смог отдать данные по запросу наружу :)
Если там действительно kernel panic, а не проблемы с железом, то пример уже назывался - kdump. При старте сервера резервируется ~ 256Мб памяти, туда сразу загружается второе ядро с персональным ramdisk'ом ( он создаётся автоматом скриптами из пакета с kdump ). После паники «основное» ядро передаёт управление «резервному» «crash» ядру. С единственной задачей - собрать дамп и записать/отправить его куда было сказано в конфиге kdump'а при создании ramdisk'а
update. Да, crash kernel точно так же с нуля инициализирует железо, поэтому может быть проблема с некоторыми контроллерами. Например, с hp smart array. Универсальное решение - писать дамп не на диск, а на удалённый сервер по ssh
update2. Хотя бы подключи клавиатуру до падения.. Если после падения будет мигать индикаторами - точно паника.
Исправление router, :
Осталась мелочь — реализовать возможность агенту прожить ещё до 5 минут на умершем сервере, чтобы он смог отдать данные по запросу наружу :)
Если там действительно kernel panic, а не проблемы с железом, то пример уже назывался - kdump. При старте сервера резервируется ~ 256Мб памяти, туда сразу загружается второе ядро с персональным ramdisk'ом ( он создаётся автоматом скриптами из пакета с kdump ). После паники «основное» ядро передаёт управление «резервному» «crash» ядру. С единственной задачей - собрать дамп и записать/отправить его куда было сказано в конфиге kdump'а при создании ramdisk'а
update. Да, crash kernel точно так же с нуля инициализирует железо, поэтому может быть проблема с некоторыми контроллерами. Например, с hp smart array. Универсальное решение - писать дамп не на диск, а на удалённый сервер по ssh
Исходная версия router, :
Осталась мелочь — реализовать возможность агенту прожить ещё до 5 минут на умершем сервере, чтобы он смог отдать данные по запросу наружу :)
Если там действительно kernel panic, а не проблемы с железом, то пример уже назывался - kdump. При старте сервера резервируется ~ 256Мб памяти, туда сразу загружается второе ядро с персональным ramdisk'ом ( он создаётся автоматом скриптами из пакета с kdump ). После паники «основное» ядро передаёт управление «резервному» «crash» ядру. С единственной задачей - собрать дамп и записать/отправить его куда было сказано в конфиге kdump'а при создании ramdisk'а