LINUX.ORG.RU

виснит ноут

 , ,


0

1

Через случайные относительно длинные промежутки времени (от 12 часов до нескольких дней) виснит ноут. За последнюю неделю завис уже четыре раза, причём все четыре раза я был афк т.е. свидетелем непосредственно зависания не был, и какие действия/события, программные/аппаратные проблемы к нему приводят мне абсолютно не ясны, т.к. в журнале нет абсолютно никаких ошибок или даже подозрительных записей.
Картина следующая - ноут у меня работает 24*7, из приложений запущен только qbittorrent, который постоянно раздаёт торренты.
Зависания обычно происходят рано утром, когда монитор ноута и внешний монитор в режиме энергосбережения + я ещё уменьшаю на ночь яркость самого экрана ноута до минимума. Т.е. когда я обнаруживаю, что ноут завис - вижу просто черный «выключенный» экран, и единственное на что реагирует комп - это на клавиши яркости подсветки клавиатуры, по сети разумеется ноут также после зависания не доступен.
Очевидно, что это не перегрев CPU т.к. температура ядер около 40-50*, правда очень греется (если верить lm_sensors) из-за торентов модуль wifi - около 60*.
Как уже говорил, в журнале до/в момент зависания нет никаких ошибок. Дистрибутив arch linux, ядро 4.17, но проблема была и на 4.16. Модель ноута - Dell Inspiron 15 5567,(поставлялся с предустановленной ubuntu т.е. заявлена совместимость с linux), боис самый свежий. Встроенная утилита проверки железа от dell ошибок не находит, хотя полную проверку памяти на 4 часа не запускал.
Есть ли возможность как-то диагностировать проблему?


Есть ли возможность как-то диагностировать проблему?

Есть, конечно, кто ж тебя держит.

Для начала я бы исключил из уравнения Wi-Fi модуль, подключив ноут проводом.

t184256 ★★★★★
()

Встроенная утилита проверки железа от dell ошибок не находит, хотя полную проверку памяти на 4 часа не запускал.

Очевидный совет — запусти полную проверку на 4 часа. И побольше, чем один раз. На сутки, например.

Есть ли возможность как-то диагностировать проблему?

Кроме тестирования аппаратных проблем, стоит попробовать kdump (crashkernel) и/или netconsole, чтобы увидеть финальные сообщения ядра перез зависанием. Там может быть подсказка.

Я так как-то раз узнал, что у меня зависания были из-за кривого драйвера на Wi-Fi адаптер. К счастью, в скором времени драйвер починили.

i-rinat ★★★★★
()

99% сетевая карта.

anonymous
()

Чекнуть диск по SMART на предмет Pending Sectors (smartctl -d sat -A /dev/sda , выхлоп в студию). Запустить проверку оперативки memtest-ом пока не выпадет в ошибку, но не меньше суток. Сбросить BIOS/CMOS в дефолтные настройки. Если не поможет, вытащить модуль Wi-Fi и подключить ноут кабелем.

П.с. Был случай, когда мемтест за двое суток ошибок не показал, а gpg стабильно падал при проверке целостности пакетов. Если планок несколько, можно запускать ноут на одной, потом на другой. Планки вынимать с вынутым кабелем питания, вынутой батарей и последующим нажатием КНОПКИ ВКЛЮЧЕНИЯ (да, без батареи).

anonymous
()

Спасибо за советы, интуитивно тоже подозреваю wifi-адаптер, пока отключил его в bios.
Смарт диска в порядке:

smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.17.2-1-ARCH] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 128
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       1755
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       11545
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       455
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       6
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       21
193 Load_Cycle_Count        0x0032   092   092   000    Old_age   Always       -       85550
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       35 (Min/Max 16/43)
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0032   083   083   000    Old_age   Always       -       7071
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       8661746558
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       14995171487
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0
Как оказалось тест памяти (memory) от dell на четыре часа был как раз таки преимущественно жёсткого диска. Буду ставить memtest, хотя смотрю у него какие-то проблемы в работе с uefi.
kdump судя по всему требует пересборки ядра, включил netconsole, хотя мне казалось, что всё сообщения из dmesg сохраняются в journalctl.
Сброс bios на дефолт, тоже проделывал в первую очередь, это не помогло.
Ещё теоретически может быть проблема в постоянно подключенном usb-харде, с которого и раздоются торенты.

tm4ig
() автор топика
Последнее исправление: tm4ig (всего исправлений: 2)
Ответ на: комментарий от tm4ig

Со смартом выглядит всё ок, я думаю диск можно исключить.

Jefail ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.