LINUX.ORG.RU

История изменений

Исправление fehhner, (текущая версия) :

Hardware event. This is not a software error.

ЧТД.

Ничего не доказал, у венды такой проблемы не возникает при проверке - значит, проблема в софте, который нормально не умеет с hardware данным

Ну значит в процессоре так записано. Что в lscpu?

Там это:

CPU family:            6
Model:                 158
Model name:            Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
Но это неверные данные, в офф спеках intel, чёрным по белому написано, что это седьмое поколение, а не шестое.

И не надо меня смешить «отличными» вентиляторами в ноутбуке.

Вентиляторы мощные (зад под экраном приподнят и установлены горизонтальные решётки дополнительно), у меня датчики температуры на рабочем столе. Обычно холодный и тихий, даже на паре лёгких виртуалок не греется сильно, при запуске производительной задачи, тут же включаются шумные вентиляторы.

Просто попробуй для начала выключить турбо.

Я попробовал отключить турбо (хотя в моём случае чаще срабатывает speedstep на понижение), спидстеп так же, отключить, не помогло.
Всё одному человеку знать невозможно. Сейчас нашёл на сайте по редхату инфу, это проблема похоже связана с работой с оперативной памятью. https://discuss.pivotal.io/hc/en-us/articles/206145257-DCA-V2-kernel-Hardware-Error-Machine-check-events-logged. Единственная проблема, что там указано при

MCi status:
Corrected error
«In the above case customer has used non-standard DIMMs in the cluster» «This applies to mcelog running on Intel servers» «mcelog has the (socketid, channel, DIMM) information from the CPU and tries to translate that into a motherboard silkscreen label using SMBIOS. The label is then logged in the log file and in the accounting database in memory.»
Но в моём случае,
MCi status:
Error overflow
Uncorrected error
Это может быть DIMM Failure, однако я запустил из биоса навороченное приложение диагностики и проверил всё, а затем 5 раз поряд прогнал только полный тест оперативки со всеми подтестами. Он сказал, что всё работает идеально.
Учитывая, что оперативка у меня вполне обычная для современной, получается, что ядро не может нормально работать с оперативкой на моём процессоре интел.

Исходная версия fehhner, :

Hardware event. This is not a software error.

ЧТД.

Ничего не доказал, у венды такой проблемы не возникает при проверке - значит, проблема в софте, который нормально не умеет с hardware данным

Ну значит в процессоре так записано. Что в lscpu?

Там это:

CPU family:            6
Model:                 158
Model name:            Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz
Но это неверные данные, в офф спеках intel, чёрным по белому написано, что это седьмое поколение, а не шестое.

И не надо меня смешить «отличными» вентиляторами в ноутбуке.

Вентиляторы мощные (зад под экраном приподнят и установлены горизонтальные решётки дополнительно), у меня датчики температуры на рабочем столе. Обычно холодный и тихий, даже на паре лёгких виртуалок не греется сильно, при запуске производительной задачи, тут же включаются шумные вентиляторы.

Просто попробуй для начала выключить турбо.

Я попробовал отключить турбо (хотя в моём случае чаще срабатывает speedstep на понижение), спидстеп так же, отключить, не помогло.
Всё одному человеку знать невозможно. Сейчас нашёл на сайте редхата инфу, это проблема похоже связана с работой с оперативной памятью. https://discuss.pivotal.io/hc/en-us/articles/206145257-DCA-V2-kernel-Hardware-Error-Machine-check-events-logged. Единственная проблема, что там указано при

MCi status:
Corrected error
«In the above case customer has used non-standard DIMMs in the cluster» «This applies to mcelog running on Intel servers» «mcelog has the (socketid, channel, DIMM) information from the CPU and tries to translate that into a motherboard silkscreen label using SMBIOS. The label is then logged in the log file and in the accounting database in memory.»
Но в моём случае,
MCi status:
Error overflow
Uncorrected error
Это может быть DIMM Failure, однако я запустил из биоса навороченное приложение диагностики и проверил всё, а затем 5 раз поряд прогнал только полный тест оперативки со всеми подтестами. Он сказал, что всё работает идеально.
Учитывая, что оперативка у меня вполне обычная для современной, получается, что ядро не может нормально работать с оперативкой на моём процессоре интел.