LINUX.ORG.RU
ФорумAdmin

pstore — как понять, отчего нет записей после паники?

 erst, , pstore


0

2

Есть кучка разных серверов с дебианом 11. Конфигурация ядра идентична, версия системд идентична. На части серверов (gigabyte) сохраняются в /sys/fs/pstore и правильно подхватываются systemd-pstore дампы консоли при панике, на большей части (в т.ч. HP gen7,8) ничего нет. Понятно, паника вызывалась везде) Загрузка у всех legacy, т.е. бэкенд – ERST. В логах загрузки у всех есть строки об обнаружении таблиц ERST (на части серверов HP сообщения «firmware timeout»), pstore примонтировано везде. Можно ли что-то сделать, чтоб логи складывались везде, или это чисто вендорозависимо и даже невозможно понять, в чем беда (скажем, малый размер хранилища или ещё что-то)?

Много лет пользуюсь.
У меня оно работало только на однопроцессорных машинах и не на всех. IMHO зависит от bios/uefi

А какие параметры ядру указаны ядру для для pstore? Для его работы требуется зарезервировать кусок памяти.

IMHO самый работоспособный вариант получить корку - kexec + makedumpfile.

vel ★★★★★
()
Ответ на: комментарий от vel

Да никакие не указаны. Я так понимаю, это всё монтируется тем же systemd-pstore. У нас используется ограждение через WDT, поэтому вот такие способы типа pstore + запись в ipmi SEL – то, что доктор прописал. Но как-то оно кисло, раз на большинстве машин не работает. Как я понял, в отличие от ramoops, оно живёт где-то помимо ОЗУ, типа cmos ram (ну или в efi vars для uefi, но у меня всё легаси)

olegkrutov ★★
() автор топика
Ответ на: комментарий от olegkrutov

systemd-pstore видимо как-то настраивать нужно :)

У меня нет машин с pstore и c systemd.

для отладочных нужд использую ramoops Как увидеть предсмертные printk? (комментарий)

А еще есть netconsole. Если нет жестких требований по безопасности, то можно ей воспользоваться.

Если у тебя срабатывает watchdog, то корки может и не быть...

vel ★★★★★
()
Ответ на: комментарий от vel

Да он простой как заклёпка, берёт готовые записи из /sys/fs/pstore и перекладывает их в файловую систему, очищая при этом собственно pstore, так как оно мелкое. Но если записей нет (а их кладет ядро), то и класть нечего. Вопрос – почему их нет) Netconsole зависит от сети, бывает, что проблема как раз в её отсутствии, что тоже вызовет ограждение по кластерному хранилищу. Логи будут, если проблема связана с машиной (паника, MCE), и их не будет, если ограждение внешними узлами, но там уже на них смотрим логи.

olegkrutov ★★
() автор топика