LINUX.ORG.RU

Неконтролируемое рандомное зависание системы

 ,


0

1

Суть проблемы: зависание системы намертво во время любых действий кроме просмотра видео с жесткого диска, т.е. если я правильно понимаю, зависание происходит во время простоя процессора, хотя бывало так, что я прокручивал страницу в браузере и во время этого действия возникало зависание.

У меня есть большая предыстория, как я к этому пришел, но я опущу ее. Суть в том, что на винде я эту проблему решил с помощью аимпа, поставил 1 трек на репит и проблема решена, нигде такого решения не было описано в инете, сам поэксперементировал и получилось. В винде в журнале событий эта проблема носит название kernel power 41 63. Какое-то время назад начал изучение линукса и проблема снова появилась, но мое решение не сработало здесь, я пробовал разные плееры, остановился на vlc, вроде зависаний не было пару недель, потом появились снова и вот я ищу решение своей проблемы. Чего-то подобного журналу событий в убунту не нашел, попробовал снять дамп ядра с помощью kdump - безрезультатно, файл не появляется, я в тупике и прошу у вас совета или направления, куда копать дальше.

Вот скрин с характериситками http://s020.radikal.ru/i703/1604/c2/6e13028f81b7.png



Последнее исправление: Dairant (всего исправлений: 3)
Ответ на: комментарий от Dairant

Если я забываю включать аимп, то ловлю фриз

Скажи, а если ты запускал аимп не сразу, а, например, после другой программы, то тоже мог словить фриз?

anonymous
()
Ответ на: комментарий от anonymous

Скажи, а если ты запускал аимп не сразу, а, например, после другой программы, то тоже мог словить фриз?

Если я запускаю аимп в окошках, не важно когда, после какой проги, я уверен в том, что не получу фриз.

Dairant
() автор топика
Ответ на: комментарий от anonymous

Попробуй выводить все сообщения ядра в файл: cat /dev/kmsg > kernel_messages.log, и после фриза его посмотреть. Можешь на pastebin.com, например, выложить и нам показать.

Поправь меня, если я не прав, но разве при кажом запуске не происходит запись данных заново, т.е. после фриза я ничего не увижу или это не так?

Получается, когда я прописываю cat /dev/kmsg > kernel_messages.log то процесс не прекращается и будет работать вплоть до фриза, так?

Я его остановил и выложил что получилось на http://pastebin.com/8FQLb6w8

Memtest-ом ещё не проверял? А то может я зря переживаю.

Результаты мемтеста тут http://s018.radikal.ru/i500/1604/0b/c97789abd33f.jpg

Кстати для анонима с вопросом про 2мб кэша вот скрин http://s018.radikal.ru/i509/1604/e5/2775b8cf1ab1.jpg

мэмтест показывает 2 по 1024, хотя при тестировании (см. 1ый скрин) показывает только 1024

Dairant
() автор топика
Ответ на: комментарий от targitaj

Лезь в прошивку матери и смотри чего там можно подкрутить по напряжениям на ЦП

Если я правильно понял, то нужно залезть в биос и там что-то искать? Если да, то у меня очень скудный набор настроек, уже выключил виртуализацию и powersave, там больше нечего делать. Вот скрин, на всякий случай http://s16.radikal.ru/i191/1604/a0/483b42e2bebd.jpg

Dairant
() автор топика
Ответ на: комментарий от Dairant

процесс не прекращается и будет работать вплоть до фриза, так?

Так.

Я его остановил

Не надо было. После фриза у тебя бы остался файл kernel_messages.log, где в конце, возможно, было бы что-то о причине сбоя.

А ты пробовал после фриза просто кнопкой питания комп выключить? Может у тебя только видеподсистема виснет?

Там в логе, кстати, какой-то варнинг насчёт аудио. Но вроде он к теме не относится. Прошивка биоса у тебя, смотрю, новая, только почему-то даты релиза в файле и на сайте разные: в файле — «08/03/2015» (то ли 3 августа, то ли 8 марта), на сайте — «2015/09/16». А ещё в логе есть вот такой варнинг:

ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Gpe0Block: 128/32 (20141107/tbfadt-623)

А на мемтесте фризов не было? Странная, вообще, избирательность. Попробуй отключить всё что отключается *везде*, а потом, если вдруг зависания пропадут, включать всё потихоньку обратно, с проверкой на каждом шаге.

anonymous
()
Ответ на: комментарий от anonymous

А ты пробовал после фриза просто кнопкой питания комп выключить? Может у тебя только видеподсистема виснет?

Я только кнопкой питания и могу его выключить

Прошивка биоса у тебя, смотрю, новая, только почему-то даты релиза в файле и на сайте разные: в файле — «08/03/2015» (то ли 3 августа, то ли 8 марта), на сайте — «2015/09/16».

Попробовал поставить новую, пишет «билд слишком старый»

А на мемтесте фризов не было?

Нет, не было. Я поставил, ушел, потом вернулся, он уже 2ой круг начал делать, если бы был фриз, я бы написал сюда об этом.

Попробуй отключить всё что отключается *везде*, а потом, если вдруг зависания пропадут, включать всё потихоньку обратно, с проверкой на каждом шаге.

Слабо понял эту инструкцию, можно перефразировать?

Dairant
() автор топика
Ответ на: комментарий от unixnik

Есть вопрос к тебе. Вот моя планка (только у меня на 4)

http://catalog.onliner.by/dram/hynix/hmt41gs6bfr8apb

Если я захочу купить себе другую планку, то есть ли как-ниубдь особенности, может ты знаешь, какую лучше купить, какую не покупать, может для моей материнки что-лучше подойдет?

Вот например http://catalog.onliner.by/dram/kingston/kvr13s9s84

Что скажешь?

Dairant
() автор топика
Ответ на: комментарий от Dairant

Выбирай память на чипах или hynix или samsung. Проблемы с памятью вообще редко случаются, но если случаются то чаще всего не у этих чипов. Например такую.

unixnik ★★★★★
()
Последнее исправление: unixnik (всего исправлений: 2)
Ответ на: комментарий от Dairant

Попробуй для начала просто другую. Не факт что в ней проблема.

unixnik ★★★★★
()
Ответ на: комментарий от Dairant

Слабо понял эту инструкцию, можно перефразировать?

Ну, например, отключить все необязательные устройства физически и в биосе (кстати, в биосе могут быть доступны расширенные настройки по Ctrl+F1 или Shift+F2 или ещё как-то), загрузить минимальную конфигурацию ОС, без необязательных модулей, в режиме командрой строки. Можно взять какой-нибудь простой дистр для этого. SliTaz, думаю, отлично подойдёт. Если добавить к параметрам ядра во время загрузки (нажать TAB на пункте второго меню, а не первого, где выбор языка, «SliTaz Live») через пробел screen=text, то загрузится голая консоль с ядром 3.2. Логин пользователя — «tux», без пароля, логин рута — «root», пароль — «root».

Потом потихоньку пробовать включать разные устройства: сеть, звук, усб и т.п.

Пакетный менеджер в SliTaz называется «tazpkg». Для поиска пакета — tazpkg -s something, для установки — tazpkg -gi package.

Можешь установить, например, «gnuchess» и порубиться в шахматки. Я когда ещё не знал, то недоумевал, почему какие-то консольные шахматки загружают мою систему на 100%, списывал всё на баги. А оказалось что он, собака, всё это время ходы просчитывает!

anonymous
()
Ответ на: комментарий от Dairant

Последнее сообщение очень похоже на сообщения вот в этих багрепорах:

То есть, очень вероятно, что твоя проблема связана с видеокартой. Я, наверное, неправильно спросил про кнопку питания. Я хотел спросить, выключается ли компьютер, если однократно быстро нажать на кнопку питания, а не держать её 5 секунд? Если выключается, то тогда точно зависает только видеосистема.

Из вариантов решения или подтверждения проблемы с драйвером видеокарты могут сработать следующие:

  1. Использовать ядро версии 3.17 и старше (но возможно я ошибаюсь в переводе «V3.17 and earlier kernels run like champs», однако дальше чел говорит: «3.18-rc1 is where the problem started»)
  2. Использовать свежее ядро, 4.3 и новее, лучше последнее — 4.5.1
  3. Загрузить систему без модуля i915, добавив modprobe.blacklist=i915 (ну или как-то так, проверить загрузился модули или нет можно с помощью lsmod | grep i915) к параметрам ядра
  4. Использовать параметр ядра i915.semaphores=1 (естественно, с загрузкой модуля i915)
  5. Отключить 3D-ускорение, добавив строчку Option "NoAccel" "True" в секцию «Device» твоей видеокарты в xorg.conf
  6. Либо установить метод ускорения UXA, заменив или добавив опцию Option "AccelMethod" "uxa" в секцию «Device» видеокарты в xorg.conf

Также говорят, что воспроизвести багу можно запустив любое OpenGL приложение — в лог будут сыпаться варнинги, либо система зависнет.

Ты можешь каждый раз записывать сообщения ядра и смотреть, всегда ли появляется этот варнинг в конце лога. Кстати, лучше использовать команду dmesg -Tw > kernel_messages.log. Если тебя парит, что этот процесс висит в консоли, то можешь сделать так: dmesg -Tw > kernel_messages.log & disown %dmesg и его будет незаметно.

anonymous
()
Ответ на: комментарий от anonymous

Сори, что не ответил раньше.

Насчет дистра - это не мой уровень еще, да и лень. А насчет 2ого сообщения - я пока тестирую решение отсюда

Говорят, что вроде работает, вместо фриза через пару минут, уже через пару часов или вообще без фризов, смотря сколько сидеть будешь под линем. Но суть в том, что изменение cstate влияет на электропотребление, но другого решения пока нет. От ядра это не зависит, были фризы и на 4.3 у кого-то, так, к слову.

Здесь это решение использовали, но эффект разный, надо под себя тестить, чем собственно и занимаюсь.

Dairant
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.