LINUX.ORG.RU

machine check error


0

2

Ноут стал периодически падать жалуясь на сабж, в mcelog пока одна запись:

MCE 0
CPU 0 BANK 0 
ADDR 7f6d13f93000 
TIME 1359834885 Sat Feb  2 23:54:45 2013
STATUS f600000000010015 MCGSTATUS 0
MCGCAP 106 APICID 0 SOCKETID 0 
CPUID Vendor AMD Family 20 Model 1
Это проц подыхает или память?

надо смотреть логи IPMI ежели это сервер

у меня МЦЕ были из-за того что поставили дешевую кингстоновскую память и она начала глючить.

Slackware_user ★★★★★
()
Ответ на: комментарий от Lonli-Lokli

мемтест кстати у меня за 15 прогонов ничего не дал

а вот просто запущеный линукс вешал машину за 15-20 минут

Slackware_user ★★★★★
()
Ответ на: комментарий от Slackware_user

Радиатор вроде чистый, да и не похоже на перегрев - падает при 56 градусах, при 63 ревёт но работает. Память поменял - не помогло.

Lonli-Lokli ★★
() автор топика
Ответ на: комментарий от Lonli-Lokli

Если не память, то тогда или перегрев видяхи, или что-то на мамке. На материнской плате могут быть проблемы с конденсаторами или flexing какой-нибудь, это, кстати, и видеочип может быть.

Попробуй ещё вытащить, почистить и хорошо вставить обратно всякие miniPCI или usb платки и прочее, например wifi карту.

byteworm
()

сменить ядро, запустить оффтоп и посмотреть будет ли падать в нём

smilessss ★★★★★
()
Ответ на: комментарий от Lonli-Lokli

За два прогона memtest86 ошибок не нашлось. Какую ещё диагностику имеет смысл провести?

memtest86 делает что угодно, но только не детектирует ошибок. Заявляю авторитетно, так как проверял на собственном опыте.

протестируй S&M. У меня была планка, с которой глючил комп. memtest86 не нашел ничего за сутки прогона. А S&M нашел сбой за 2-3 минуты.

dikiy ★★☆☆☆
()
Ответ на: комментарий от mv

«BKDG for AMD Family 14h Models 00h-0Fh Processors (PUB)» говорит, что Error code type: TLB, Transaction Type: Data, Cache level: L1. Т.е. произошла ошибка трансляции виртуального адреса в физический при работе с кешем данных первого уровня.

Учитывая, что при TLB miss процессор лезет в память ажно 4 раза, то ставлю на сбоящую память или нестабильное питание.

mv ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.