LINUX.ORG.RU

зависание компьютера ubuntu

 


0

1

Случайным образом происходит зависание компьютера, от которого помогает только кнопка перезагрузки. Частота такого эффекта от двух раз в сутки до одного раз в 2-3 недели.
Зависание бывает двух типов:
а) клавиатура и мышь не работают;
б) клавиатура и кнопки мыши не работают, но поинтер мыши передвигается по экрану.
В обоих случаях войти по сети (ssh) не удается - комп не виден. Мышь включена через usb.
В логах /var/log самому найти что-то про ошибки не удается. Я грешу на железо, которое не заканчивает какой-то обмен. Видеокарту менял, не помогло.
memtest86 гонялся пол-дня, криминала не обнаружено. Smart по дискам мне ничего не говорит, кроме редких ошибок по питанию.
«плавающий неконтакт» в материнке - это едва ли.
Есть ли какие программные пути поймать, что портит жизнь?

P.S.

                                system         B450M S2H (Default string)
/0/25                           memory         8GiB System Memory
/0/25/3                         memory         8GiB DIMM DDR4 Synchronous Unbuff
/0/2a                           processor      AMD Ryzen 5 1600 Six-Core Process
/0/100/3.1/0                    display        GK208B [GeForce GT 710]
/0/100/1.3/0/0/9                printer        Canon CAPT USB Device
/0/100/1.3/0/0/a                generic        EPSON Scanner
/0/100/7.1/0.3/0/2              input          USB Mouse
/0/100/7.1/0.3/0/3              multimedia     USB2.0 Camera
/0/100/7.1/0.3/0/4              input          USB KEYBOARD
/0/6/0.0.0          /dev/sda    disk           1TB WDC WD10EZEX-21M
/0/7/0.0.0          /dev/sdb    disk           2TB WDC WD20EZAZ-22L
/0/8/0.0.0          /dev/cdrom  disk           DVD RW AD-7240S
/0/9/0.0.0          /dev/sdc    disk           128GB m.2 Smartbuy S11

Перемещено hobbit из general



Последнее исправление: hobbit (всего исправлений: 4)
Ответ на: комментарий от Zhbert

диск m2. Описание создания загрузочной версии Victoria мне не по зубам. Абсолютно не понимаю как сделать загрузочный ISO из виндусовой папки приложения. Понимаю только: делайраз, делай два…

valentin630
() автор топика
Ответ на: комментарий от valentin630

MHDD же вроде в ISO есть. Только для SSD с них мало толку.

После чего перестало работать как надо? Что если навесить на кнопку включения ждущий режим и нажать ее во время зависания? а на REISUB как реагирует?

inxi -SM
damix9 ★★★
()
Ответ на: комментарий от damix9

Ничего е понял, что за ждущий режим? Я не специалист подобный флюсу, я пользователь. Обычная перезагрузка после зависания пока ничего не портит. Как сотворить REISUB пока не научился. ~$ inxi -SM System: Host: vak Kernel: 5.15.0-72-generic x86_64 bits: 64 Desktop: LXQt 0.14.1 Distro: Ubuntu 20.04.6 LTS (Focal Fossa) Machine: Type: Desktop Mobo: Gigabyte model: B450M S2H v: x.x serial: <superuser/root required> UEFI: American Megatrends v: F4a date: 01/30/2019

valentin630
() автор топика

На будущее: пиши так, чтобы желающим помочь было легко читать твой текст. Я чуток подправил форматирование, но ты почитай про маркдаун на ЛОРе. Там даже таблицы можно оформлять, правда, довольно черезжопно, в виде кода (как я сделал) проще, хотя менее красиво.

hobbit ★★★★★
()

«дедукция»

клавиатура и мышь не работают; б)клавиатура и кнопки мыши не работают, но поинтер мыши передвигается по экрану

войти по сети (ssh) не удается - комп не виден

kernel panic

возможные причины

диск/память сбоят «сами по себе» или из-за проблем по питанию.

диагностика (вернее попытка)

Максимально быстро (пока не зависла Ubuntu) подключиться с другого компьютера по ssh. Запросить dmesg -wT. Ждать и надеяться, что сеть и процесс будут работать до полного зависания, и ядро успеет что-то осмысленное «крикнуть».

Другой вариант. Загрузиться с флешки с какой-нибудь Manjaro|Fedora – потестить новое ядро.

P.S.

  • ? версия Ubuntu

  • ? версия ядра

  • ? какой блок питания, сколько лет эксплуатируется и т.д.

master_0K
()
Последнее исправление: master_0K (всего исправлений: 1)
Ответ на: комментарий от valentin630

Ничего е понял, что за ждущий режим?

Ну который suspend to RAM. У меня было подобное, после просыпа зависание прекращалось.

Как сотворить REISUB пока не научился.

Это так и гуглится REISUB.

Выводы команд удобнее читать в CODE или PRE.

UEFI: American Megatrends v: F4a date: 01/30/2019

Бивис устаревший.

Лучше добавить тег ryzen.

damix9 ★★★
()
Ответ на: комментарий от hobbit

Маркдаун неудобный, там даже апострофы нужны, которые с кавычками легко спутать, поэтому люди и не хотят его использовать. А таблицы удобнее делать box drawing символами, ну или |-+.

damix9 ★★★
()
Ответ на: комментарий от master_0K

«дедукция» она скорее скажет, что железо либо работает либо нет.
Случайность присуща контактам.
? версия Ubuntu
? версия ядра

  • как раз над Вашим сообщением все есть

? какой блок питания, сколько лет эксплуатируется и т.д.

  • лет пять, но опять «дедукция»
valentin630
() автор топика
Ответ на: комментарий от damix9

Это так и гуглится REISUB.
Только вылезают бестолковые на несколько страниц объяснения.

Как раз в момент написания ответа ОНО зависло.
Сразу попробовал ping - not reachable.
Сделал alt+SysRq+набрал reisub -> нуль реакций.
Поменял диск m2 на новый в 2 раза поболее, перекинул на него бэкап системы и уже пишу с новым m2.

Последний раз комп вылетал дня 3-4 назад, посмотрим, что будет с новым SSD. Кстати, еще раз посмотрел SMART для старого - абсолютно ни одной ошибки, только 21000 часов, но короткий тест проходит без ошибок. Предстоят расчеты на несколько суток, поэтому нужна стабильная работа.
Думаю, что это неконтакт где-то, может быть и в материнке.
Бдок питания 350вт, абсолютно не греется - потреблять нечему:
процессор 65вт (только при 12 процессах одновременных), и слабенькая видюшка греется максимум на 20-30вт, винчестеры десятки милиампер потребляют…
Плохо, что система никак себя не диагностирует, если нет сигнала завершения какого-то обмена. Если это с диском, то непонятно, почему нет никакого таймаута?

valentin630
() автор топика
Ответ на: комментарий от valentin630

Сделал alt+SysRq+набрал reisub -> нуль реакций.

Да не так. Нажать и держать Alt+SysRq, отпустить SysRq, нажать B.

Бдок питания 350вт

Возможно, маловато его. Важно же сколько он по линии 12В выдает.

Я думаю, надо BIOS обновить, а дальше уже смотреть, останется ли проблема.

damix9 ★★★
()
Ответ на: комментарий от damix9

Нажать и держать Alt+SysRq, отпустить SysRq, нажать B.

Квест, да и только. и «В», наверное не В, а «Ввод»?

Непонятно, чем обновление БИОСа может помочь?

Вообще, есть у меня претензии к этой материнке - она не взяла обе планки памяти Patriot - система не хочет видеть их вместе, а по одной берет. В то же время интеловская материнка и Винды видели вместе эту память. Да и на материнке MSI с этим же чипом (В450М) точно такая же история с этой памятью.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Квест, да и только. и «В», наверное не В, а «Ввод»?

Нет, это именно латинская B, там где русская И.

Непонятно, чем обновление БИОСа может помочь?

Так оно ведь почти в любой проблеме с железом может помочь.

damix9 ★★★
()
Ответ на: комментарий от damix9

именно латинская B
Попробовал сейчас такую комбинацию (система не зависала) - так это просто современное «ctrl+alt+del». С какой стати оно сработает, когда клавиатура уже не работает, не догоняю Вашу мысль?

valentin630
() автор топика
Ответ на: комментарий от valentin630

Это да? Этот «стиль» автоматически не читается (увы).

Оставляю в силе свои рекомендации: попробовать ядро по-свежее. БП 5 лет, это срок по современным меркам.

REISUB… почему-то забывают «добавлять» в описание про удержание Ctrl – она нужна как минимум для срабатывания первой комбинации, «возвращающей» клавиатуру из «графики». Ну и плюс, в убунте (да и в других «цивилизованных» дистрах) отключают многие коды из набора доступных через Sysrq: чтобы пользователь случайно(!?) не нажал. OOM-killer сейчас обычно отключён… Есть ещё SAK (SysRq+Alt+K) – «убить, всех кроме …». Забыли видимо отключить. Меня иногда выручал ).

P.S.

С какой стати оно сработает, когда клавиатура уже не работает

Это такая linux-«рулетка»: может сработает, а может уже поздно.

cat /proc/sys/kernel/sysrq какую цифру возвращает?

master_0K
()
Последнее исправление: master_0K (всего исправлений: 1)
Ответ на: комментарий от master_0K

почему-то забывают «добавлять» в описание про удержание Ctrl – она нужна как минимум для срабатывания первой комбинации, «возвращающей» клавиатуру из «графики».

У меня в кедах это не надо. Работают и скриншоты и REISUB.

Reboot оставляют включенным. Да и остальное включить можно через sysfs, просто по дефолту в конфиге ядра выключают. Хотя и не очень понятно зачем.

damix9 ★★★
()
Ответ на: комментарий от damix9

У меня в кедах это не надо. Работают и скриншоты и REISUB.

Это хорошо. Я при случае рефлекторно удерживаю и Ctrl. Может и действительно можно без него в нынешние времена…

Сейчас намного реже приходиться вспоминать о REISUB, но я большинство «компонентов» SysRq держу «Вкл». Если не потребуется – ничего страшного. А если надо будет, поздно будет включать.

master_0K
()
Ответ на: комментарий от master_0K

попробовать ядро по-свежее. БП 5 лет, это срок по современным меркам.

  • это уже фанатизм. Ядро 5-…-72 (последнее обновление Ubuntu), а БП у меня на одном уже лет 15 минимум пашет (очень люблю с выходной розеткой для монитора и прочей переферии, подсоединенной через «колхозное» реле с управлением от 12в), да и вылетали они моментально, а не мучались по году с лишним. А биос обновил на всякий случай, тем более там было обновление по поводу «совместимости памяти», о чем я в свое время очень ругался в производителями, что они туфту продают
valentin630
() автор топика
Ответ на: комментарий от damix9

Ась? Я Райзены только с 2х00 серии использовать стал, и единственный иногда виснущий в хозяйстве был 2200G, у которого проблема была однозначно связана со встроенным видео. 2600 в домашнем сервера работает как часы уже третий год.

С другой стороны, у топикстартера B450M S2H - у меня такая же есть, то ещё глюкодромье на старых биосах, на новых стабильнось получше. Биос обновить обязательно.

NOTE: при обновлении биоса ОБЯЗАТЕЛЬНО надо сначала на F40 обновиться,а потом уже более новые накатывать. Об этом в описании биосов на странице загрузок написано.

valentin630

manntes-live ★★★
()
Последнее исправление: manntes-live (всего исправлений: 2)
Ответ на: комментарий от manntes-live

то ещё глюкодромье

было бы интересно, в чем оно заключалось.
Биос удалось обновить до последнего в такой последовательности: 4а->32->51e->64a.
Вчера опять зависла, происходило все это следующим образом.
Сначала заметил, что перестала монтироваться флешка (старый раздолбаный картридер с microSd), окна открывались, двигались, потом начали двигаться, оставляя за собой след, потом все затихло. REISUB потушил экран, кнопка перезагрузки, и все как ни в чем не бывало. dmesg по нулям. Факт; умирание не моментальное. Представить логически, что происходит не в силах, может кто представит возможный сценарий?

valentin630
() автор топика
Ответ на: комментарий от valentin630

Это означает

  • reboot разрешён
  • разрешено перемонтирование разделов в «ридонли»
  • sync разрешён

т.е по умолчанию у тебя «выглядит» как-так REISUB ( комбинации с E, I убивающие всех, кроме init выключены); если интересно полное описание

Без них шансов вернуть себе контроль нет. Не всегда удаётся и с ними, но…

master_0K
()
Ответ на: комментарий от valentin630

Фанатизм? Про ошибки по питанию не я первый сказал )

Чем новее электроника, тем больше шансов у неё «уйти» раньше. И потом, если вся партия устройств «принята» это не значит, что в ней нет отдельных «слабых звеньев».

У тебя сейчас слишком широкое поле для гипотез: от ошибок в биосе/ядре до сбоев разных электронных компонентов. Так угадать причину нельзя. Нужно что-то исключать или выделять как более вероятное.

master_0K
()
Ответ на: комментарий от valentin630

Осциллографом можно ткнуть, если питание в норме, то луч просто сместиться вверх или вниз. Если луч расплывается, появляются невнятные гармоники, всякие «пилы с завалами», то надо искать причину - элемент или устройство которое портит картину.

foxy_ant ★★
()
Ответ на: комментарий от foxy_ant

Если луч расплывается, появляются невнятные

Плохо мне такое представляется. Если кондеры ВСЕ высохли плюс нагрузка, которой нет, то гудеть-дрожать блок должен), но просто для интереса привезу из загорода прибор, еще на ЭЛ трубке, посмотрю, что кажет

valentin630
() автор топика
Ответ на: комментарий от valentin630

Да и на материнке MSI с этим же чипом

Этой истории лет больше, чем вам. Почему-то издревле мамки от микростар не работают с памятью от патриотов. Никто уже и не помнит, с чего пошла эта вражда.

utanho ★★★★★
()
Ответ на: комментарий от valentin630

На ранних биосах у меня не зависания были, а случайные ребуты если оперативку выше 2666 ставить, емнип. После сколько-то апдейтов биоса оно смогло на 3200 жить стабильно. У других материнок того же периода с аналогичной агесой и тем же процом таких проблем не возникало изначально.

manntes-live ★★★
()
Последнее исправление: manntes-live (всего исправлений: 1)
Ответ на: комментарий от utanho

Этой истории лет больше, чем вам. Почему-то издревле мамки от микростар не работают с памятью от патриотов.

Это вряд ли, первый код я написал еще для ламповой БЭСМ-1. Не работают парой как и у Gigabite. Скорее всего это проблема биоса для B450M. В более поздних версиях Gigabite что-то подкрутил для совместимости, но попробовать «поезд уже ушел»

valentin630
() автор топика
Ответ на: комментарий от valentin630

Это вряд ли, первый код я написал еще для ламповой БЭСМ-1

Время прохладных историй? Лично я хоть и играл с перфокартами, будучи школьником, но никогда не называл это программированием.

utanho ★★★★★
()

Подобные темы уже были здесь. Везде фигурирует Ryzen. Зависания я встречал на системах с разными чипсетами, Ryzen с графикой и без.

Система падает по несколько раз в день (комментарий)

axle_nix ★★
()
Последнее исправление: axle_nix (всего исправлений: 2)
Ответ на: комментарий от axle_nix

Везде фигурирует Ryzen

Почему и везде в linux фигурирует Ryzen? Дело не в железе, оно либо работает, либо нет. Случайным образом может только контакт отходить… Дело в linux. Когда винды 10е стали подвисать на Ryzen, то очень бысто нашли причину в биосе и устранили, потому что за Виндами массы денег пользователей.
Я полазил по ИН и понял, что такая проблема существует, и есть люди победившие эти СЛУЧАЙНЫЕ зависания отключением/включением некоторых параметров ядра при загрузке. Проблема чисто софтовая.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Я наблюдал такие зависания и в Windows, и в Linux. Дело было в BIOS. Я в этом убедился. Я делал закупки мат. плат на чипсете B450M и процессоры Ryzen 3, Athlon 220GE. Так вот эти зависания с какого-то момента прекратились, т.к. в новых ревизиях мат. плат были изменены настройки BIOS по-умолчанию.

axle_nix ★★
()
Ответ на: комментарий от valentin630

Факт; умирание не моментальное.

Хм а раньше ты писал такое:

Сразу попробовал ping - not reachable.

Значит что-то изменилось и есть прогресс?

что перестала монтироваться флешка (старый раздолбаный картридер с microSd), окна открывались, двигались, потом начали двигаться, оставляя за собой след, потом все затихло

Открой окно с запущеным в нём top и пусть висит постоянно открытое где-нить сборку. В момент этих проблем может быть в нём будут видны какие-то особенности (чрезмерная нагрузка на процессор, закончившаяся память, большое load average или ещё что-нить). Только его именно заранее надо запустить, а то когда начнётся уже поздно будет.

REISUB потушил экран

Можно не REISUB делать а просто Alt+PrtSc+B (нажать по очереди не отпуская предыдущие). Экран наверно потушился какой-то из REISU и там же зависло окончательно, из-за чего B не сработало.

firkax ★★★★★
()
Ответ на: комментарий от valentin630

dmesg можно увидеть только из загрузки другой системы. Смотри в журнале прошлую загрузку.

что перестала монтироваться флешка (старый раздолбаный картридер с microSd), окна открывались, двигались, потом начали двигаться, оставляя за собой след, потом все затихло. REISUB потушил экран, кнопка перезагрузки, и все как ни в чем не бывало. dmesg по нулям. Факт; умирание не моментальное. Представить логически, что происходит не в силах, может кто представит возможный сценарий?

Напоминает исчерпание свободной памяти. Своп используется? При начале торможения

  • переключится в консоль
  • выполнить dmesg -wT
  • наблюдать, фиксировать

или позвать OOM-killer: кого он «положит» первый кандидат в виновники

master_0K
()
Ответ на: комментарий от master_0K

Напоминает исчерпание свободной памяти. Своп используется? При начале торможения.

Сегодня после 4х суток работы на полную мощность (10 процессов, 80% СPU ), комп был в простое несколько часов. После подхода к нему заметил, что повисло окно Хрома, другие окна работали. После попытки закрыть хром нажатием на «х», зависли намертво и все остальные окна, комп перестал быть виден в сети. Только в gkrellm что-то двигалось. Обновление биоса несколько изменило характер зависания, оно как бы стало ступенчатым, gkrellm раньше замирал насовмем. Может быть это на что-то наведет?
Своп есть, но он практически не используется даже при полной загрузке. Повешу теперь dmesg постоянно.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Зависание браузера это «дежурная классика».

После попытки закрыть хром нажатием на «х», зависли намертво и все остальные окна

Посоветую проработать эти направления

  • swap и тюнинг потребления памяти
  • ограничить аппетиты браузера
  • OOM-killer. Есть системный, но его нужно разрешать (сейчас обычно он деактивирован) и вручную вызывать: его дефолты не слишком помогают. Есть «юзерспейсные», но это нужно спрашивать – я не пользовался.

комп перестал быть виден в сети.

ядро упало или инит == финал

master_0K
()