LINUX.ORG.RU

kernel panic прошу помощи

 ,


1

1

Собрал новый ПК (мать X79 Huanan, проц Xeon E52665, память с ECC), поставил gentoo все вроде нормально, но иногда под нагрузкой, к примеру майнинг + OpenShot (общая загрузка проца ~50-60%, память 8-10%, температура проца 55), комп делает системный бик и во все открытые терминалы выскакивает ошибка:

Message from syslogd@shicko-komp1 at Wed Mar  7 00:15:25 2018 ...
shicko-komp1 kernel: [28237.411858] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 5: 8c00004000010093

Message from syslogd@shicko-komp1 at Wed Mar  7 00:15:25 2018 ...
shicko-komp1 kernel: [28237.411862] mce: [Hardware Error]: TSC 3db0078ebdcf ADDR 28a46b5c0 MISC 204050d086 

Message from syslogd@shicko-komp1 at Wed Mar  7 00:15:25 2018 ...
shicko-komp1 kernel: [28237.411867] mce: [Hardware Error]: PROCESSOR 0:206d7 TIME 1520352925 SOCKET 0 APIC 0 microcode 710

Гуглинг дал пару англоязычных тем с подобными ошибками и обе без решения. На Fedora На Arch Заметил что в первой ссылке у человека обе материнки с BIOS от American Megatrends как и на моей материнке. Прошу помощи сообщества.



Последнее исправление: CYB3R (всего исправлений: 2)

Прочитайте начало man mcelog, это аппаратная ошибка, какое вы хотите решение...

Possible causes can be cosmic radiation, instable power supplies, cooling problems, broken hardware, or bad luck.

mky ★★★★★
()
Ответ на: комментарий от mky

апп

аппаратная то есть проблема в железе? Это уже 2я материнка от разных производителей с одинаковой ошибкой? Или это проблема в процессоре? Что там с ним может быть камень и камень... имхо... Что же тогда так долго обсуждали в федоровской теме, всякие микрокоды биос апдейты и прочее...

mshicko
() автор топика

log

Выложил на G диск лог syslog'a за последние сутки начиная с загрузки системы. https://drive.google.com/open?id=102do8r6BEb3iHr2eeyjXoIBxvj_GD_nk

PS просьба «не бить ногами» и объяснять попроще, я не сисадмин а рядовой пользователь, на gentoo сижу пару лет но в глубины особо не лезу.

mshicko
() автор топика
Ответ на: mcelog от mshicko

Чтобы прочитать man не обязательно устанавливать ПО, есть интернет https://linux.die.net/man/8/mcelog

Ваша тема слабо связана с той федоровской. Там они тёрли за mce сообщение, появляющиеся сразу после загрузки системы и рассматривали предположение, что это BIOS не чистит флаг ошибки — не правильно инициализирует железо. У вас ошибка выскакивает под нагрузкой, и она может быть связана с чем угодно, хоть с нагревом CPU, хоть с проблемами передачи по PCI.

mky ★★★★★
()

Похоже на прогрев + скрытый дефект в железе. Есть такой способ локализации - по очереди в разные места материнки и вообще оборудования направляется поток воздуха от маленького вентилятора. Проработало пару суток без сбоев - значит лечить в том месте

vaddd ★☆
()

Когда я был гентушником, у меня периодически выпадал кернел паник. Причиной был разгон, причем минимальный и даже неважно чего - проца или памяти. На других дистрах при разгоне паника не прибегала. До конкретных причин такого поведения я не докопался.

Deleted
()
Ответ на: комментарий от mky

еще

Обратил внимание вот еще на что именно сегодня ошибка возникала только при работе с OpenShot это видеоредактор и он использует кеширование предпросмотра в оперативке. При частом беспорядочном прыганьи по разным отрезками видео начинает сыпать эту ошибку. Оперативка стоит серверная от Hynix с ECC 2 планки по 8, может она давать такую ошибку?

mshicko
() автор топика
Ответ на: еще от mshicko

нагрузка проца

Потому как закрыв OpenShot я запустил обновление системы и сейчас загрузка проца 80-100% температура доходит до 58-60 но ошибка не выскакивает...

mshicko
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.