LINUX.ORG.RU

Проблемы с периодическим ребутом компа

 ,


0

1

Суть такова - есть машина, сейчас работает только под арчем, раньше периодически еще запускалась винда семерка. Под любой из осей в какой-то момент машина может ребутнуться. Под виндой это происходило в основном во время игры во что-нибудь хорошо загружающее машину (типа Divinity OS 2 на минималках).
Под арчем сейчас чаще всего происходит при игре в Insurgency (а вот в Dead Cells - нет никаких проблем). Так же иногда комп просто виснет как во время игры, так и во время использования для серфинга интернета/прослушивания музыки и т.д. Какой-либо закономерности не выявлено, кроме того, что чаще всего проблема возникает во время игр. Частота появления от 10 минут до пары часов (при игре во что-то типа ГТА5 средний разброс - 15-25 минут).
Проблеме около года, в последнее время усугубилась. За это время был докуплен хард (на котором сейчас система) и полностью заменена оперативка.
С чего начать копать? Прочекать харды? Мемтест для оперативки ничего не выявил.

При загрузке после такого ребута всплывают ошибки:

сен 02 20:28:31 brobl kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 4: fa000010000b0c0f
сен 02 20:28:31 brobl kernel: mce: [Hardware Error]: TSC 0 MISC c012000001000000 
сен 02 20:28:31 brobl kernel: mce: [Hardware Error]: PROCESSOR 2:600f20 TIME 1535920101 SOCKET 0 APIC 0 microcode 6000817

машина:
Linux 4.18.5-arch1-1-ARCH
проц AMD FX-4300
видюха Radeon HD 7750/8740
мать ASRock 960GM-VGS3 FX



Последнее исправление: captain_cat (всего исправлений: 1)

Проблемы с периодическим ребутом компа

В чем проблема? Период ребута не устраивает?

anonymous
()

Да, у меня такое было. Поменяй материнскую плату для начала.

anonymous
()

Перегрев проца или кривая мама. Еще могут быть проблемы с питанием.

athost ★★★★★
()
Последнее исправление: athost (всего исправлений: 1)

Скорее всего перегрев - последи за температурой.

najlus ★★★★★
()

Это амуде.

anonymous
()

При загрузке после такого ребута

Лучше бы посмотрел journalctl -e -b -1, нет ли в журнале подозрительного перед ребутом.

Проблеме около года, в последнее время усугубилась.

А ты термопасту менял вообще хоть раз? Иногда надо кулеры почистить и поменять.

С чего начать копать?

Запусти ту самую игру в оконном режиме (или лучше демку мощную на тест фпс, которая железо без твоего участия загрузит), в окошке терминала (или виджете) - монитор нагрузки всего и температуры, конечно же. Потом наблюдай.

fehhner ★★★★★
()
Ответ на: комментарий от fehhner

Оп пост читай. У него в dmesg сыпятся mce, тестировать уже ничего не нужно - сбоит память/проц/матплата. Нужно по одному из этих компонентов менять на заведомо рабочие, чтобы выявить виновника.

anonymous
()

Какой блок питания в компе стоит (производитель, мощность, сколько лет используется)?

spijet ★★★
()
Ответ на: комментарий от veyayawet

Не факт, может новая память тоже сбойная, или её разъём на матплате.

anonymous
()
Ответ на: комментарий от fehhner

От пыли все чищу раз в месяц - разбор и продувка сжатым воздухом из баллончика. Термопаста вся свежая - и проц, и на видюхе, меньше двух месяцев назад менял, перед этим в середине весны.

Лучше бы посмотрел journalctl -e -b -1

при следующем возникновении обязательно.

насчет перегрева - вечером попробую погонять.

captain_cat
() автор топика
Ответ на: комментарий от anonymous

Нужно по одному из этих компонентов менять на заведомо рабочие, чтобы выявить виновника

все три заведомо рабочие мне подобрать сейчас сложно будет, если есть возможность теми же тестами выявить конкретнее кто виноват, я попробую этот вариант.

сбоит память/проц/матплата

но не видеокарта?

captain_cat
() автор топика

карты таро мне сказали что это бп

anonymous
()
Ответ на: комментарий от greenman

Как вариант, нашел описание схожей проблемы, причем с моей материнкой, сатрым биосом, схожим процом и оперативкой, в результате которой возникал перегрев и сбой. Лечили обновлением биоса.

captain_cat
() автор топика

Знакомая ситуация. Частоту NB поставьте 1600Mhz в bios, будет работать. 960 чипсет фигня полная.

По возможности купите что то на 970 чипсете, будет работать в разы лучше ну и бонус от разгона можно получить, если вентилятор на северник смастерить)

sv_warvar
()
Ответ на: комментарий от anonymous

Велосипед не мой, но вполне допускаю что при неправильном использовании оборудования со стороны ПО можно получить перегрев.

captain_cat
() автор топика
Ответ на: комментарий от captain_cat

Со временем БП начинают выдавать меньшую мощность на выходе (КПД падает от «стареющих» конденсаторов, ЕМНИП). Возможно, в твоём случае мощность БП упала до «пограничной» (в том смысле, что он уже не может обеспечивать требуемую мощность).

Если перегрева у GPU/CPU не будет, проверяй/меняй БП.

spijet ★★★
()
Ответ на: комментарий от captain_cat

Лучше бы посмотрел journalctl -e -b -1

при следующем возникновении обязательно.

Не нужно ждать возникновения.

В команде journalctl -b -1 параметр -1 означает — одну загрузку тому назад. journalctl -b -2 — будет на две загрузки назад. И т.д. и т.п.

greenman ★★★★★
()
Ответ на: комментарий от greenman

Спасибо за инфу, попробовал поискать, но посление 4-5 включений были бессбойными, проще будет вечером комп погонять, чем сейчас понять, при каком включении был сбой.

captain_cat
() автор топика
Ответ на: комментарий от spijet

Со временем БП начинают выдавать меньшую мощность на выходе (КПД падает от «стареющих» конденсаторов, ЕМНИП).

Чего только не напишут на лоре :)

anonymous
()
Ответ на: комментарий от anonymous

По поводу причин могу быть не прав, но БП со временем таки деградируют. Зависит от времени работы и нагрузок.

spijet ★★★
()

Хм. Пока что (около 2 часов подряд под нагрузкой) без ребутов - после сброса биоса в дефолтное состояние (обновиться почему-то не вышло - не видит новую версию). Возможно общее похолодание немного снизило максимальную температуру внутри компа, не знаю. Буду дальше слдеить за состоянием. В любом случае спасибо за все советы, возможно еще придется ими воспользоваться.

captain_cat
() автор топика
Ответ на: комментарий от greenman

кроме ошибок с сетью и краша игры есть вот такие сообщения перед ребутом:

авг 31 19:37:36 brobl kernel: INFO: rcu_preempt detected stalls on CPUs/tasks:
авг 31 19:37:36 brobl kernel:         Tasks blocked on level-0 rcu_node (CPUs 0-7): P1564
авг 31 19:37:36 brobl kernel:         (detected by 2, t=18002 jiffies, g=419798, c=419797, q=470878)
авг 31 19:40:36 brobl kernel: INFO: rcu_preempt detected stalls on CPUs/tasks:
авг 31 19:40:36 brobl kernel:         Tasks blocked on level-0 rcu_node (CPUs 0-7): P1564
авг 31 19:40:36 brobl kernel:         (detected by 0, t=72007 jiffies, g=419798, c=419797, q=1052008)

а при краше игры:

#5  0x00000000f6233c3f n/a (/home/freshwolf/.local/share/Steam/steamapps/common/insurgency2/bin/libt>
                                                 #6  0x00000000f7c26fc2 start_thread (libpthread.so.0)
                                                 #7  0x00000000f7b3aca6 __clone (libc.so.6)
                                                 
                                                 Stack trace of thread 3204:
                                                 #0  0x00000000f7f3ede9 __kernel_vsyscall (linux-gate.so.1)
                                                 #1  0x00000000f7c2d392 pthread_cond_wait@@GLIBC_2.3.2 (libpthread.so.0)
                                                 #2  0x00000000f3c08a4b n/a (radeonsi_dri.so)
                                                 #7  0x00000000f7b12ca6 __clone (libc.so.6)
                                                 
                                                 Stack trace of thread 3133:
                                                 #0  0x00000000f7f16de9 __kernel_vsyscall (linux-gate.so.1)
                                                 #1  0x00000000f7b0831c ppoll (libc.so.6)
                                                 #2  0x00000000dfa4c2bb n/a (/home/freshwolf/.local/share/Steam/ubuntu12_32/steam-runtime/i386/usr/li>

captain_cat
() автор топика

Итак, после сброса биоса в дефолт ни единого разрыва разу не ребутнулся, и не повис. Отмечу проблему как решенную. Спасибо всем за советы и рекомендации.

captain_cat
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.