LINUX.ORG.RU

Linux намертво зависает на неттопе Junibox X3pro

 , , ,


0

2

Пробовал 3 дистрибутива: Linux Mint, Manjaro, D2W OS - со всеми одна и та же проблема, система внезапно зависает. Может зависнуть при старте, перед экраном авторизации, либо после в произвольный момент времени. После долгих проверок было обнаружено, что если активно скачивать файлы (например несколько гигов через торрент), то вероятность зависания возрастает (но это не то что бы железное правило). Сейчас d2w os установлена.

CPU: Intel Core i3-1115G4 RAM: 16GB

Во время зависания связь по ssh пропадает. В логах не удалось обнаружить ничего релевантного (пробовал dmesg, demesg -f и т.п.) Проовал редактировать grub - писал quiet splash, grub_cmdline_linux=«intel_idle.max_cstate=1», max_cstate=0 и т.п, тоже не помогло.

Где-то читал про замену драйверов сетевого адаптера, но не уверен, у меня интернет работает, баг сохраняется как при проводном подключении так и по wifi… Что-то пробовал менять, но все равно не помогало. Проблема уже год сохраняется.



Последнее исправление: wh4t3v3r (всего исправлений: 1)
Ответ на: комментарий от vbcnthfkmnth123
Disk /dev/sda: 476,94 GiB, 512110190592 bytes, 1000215216 sectors
Disk model: YHJC YHS200A512H
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 5C4404A8-65E1-4430-B286-385C5E44CCFF

Device         Start        End   Sectors   Size Type
/dev/sda1       4096    1437695   1433600   700M EFI System
/dev/sda2    1437696  964656707 963219012 459,3G Linux filesystem
/dev/sda3  964656708 1000206899  35550192    17G Linux filesystem


Disk /dev/mapper/luks-8a7c3d5e-476c-4949-9494-11486f27a8fc: 459,3 GiB, 493166036992 bytes, 963214916 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/mapper/luks-6af9b9f2-66ce-488c-aab6-e53de3d3fcca: 16,95 GiB, 18199601152 bytes, 35546096 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes

Проблема сразу после покупки присутствовала, после того как снес винду и поставил линукс, так что вряд ли там был диск поврежден…

wh4t3v3r
() автор топика
Ответ на: комментарий от wh4t3v3r

Что-то я строчки

No Errors Logged
не вижу. Если у тебя нет ошибок, то должна быть такая запись в смарте. Примени smartctl -a на системный диск и покажи выхлоп.

Проблема сразу после покупки присутствовала

Диск и с завода может быть сбойным, это брак называется.

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 1)
Ответ на: комментарий от vbcnthfkmnth123

Прчему-то не выводит…

/dev/dm-0: Unable to detect device type
Please specify device type with the -d option.

Use smartctl -h to get a usage summary

Вроде верный диск взял, вот вывод df:

Файловая система 1K-блоков Использовано  Доступно Использовано% Cмонтировано в
udev               8008928            0   8008928            0% /dev
tmpfs              1615916         1536   1614380            1% /run
/dev/dm-0        472925104     56851940 391976408           13% /
tmpfs              8079568            0   8079568            0% /dev/shm
efivarfs               192           97        91           52% /sys/firmware/efi/efivars
tmpfs                 5120           12      5108            1% /run/lock
tmpfs                 1024            0      1024            0% /run/credentials/systemd-journald.service
tmpfs                 1024            0      1024            0% /run/credentials/systemd-cryptsetup@luks\x2d8a7c3d5e\x2d476c\x2d4949\x2d9494\x2d11486f27a8fc.service
tmpfs                 1024            0      1024            0% /run/credentials/systemd-cryptsetup@luks\x2d6af9b9f2\x2d66ce\x2d488c\x2daab6\x2de53de3d3fcca.service
/dev/sda1           715364       165584    549780           24% /boot
tmpfs              8079568            4   8079564            1% /tmp
tmpfs              1615912          100   1615812            1% /run/user/1000

wh4t3v3r
() автор топика
Ответ на: комментарий от wh4t3v3r

Прчему-то не выводит

Потому что ты диск там не подставляешь. Нужно подставить туда идентификатор диска, не знаю что там у тебя, sata-диск или nvme. Ты мне предлагаешь мне угадать какой у тебя диск или что? Я не совсем понимаю почему мне из тебя каждое слово нужно вытягивать клещами. Это ведь тебе нужна помощь, а не мне.

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 2)
Ответ на: комментарий от einhander

а… я просто нагуглтл что системный этот тот где /, а df почему-то sda вообще не вывел… Вот smartctl -a /dev/sda:

=== START OF INFORMATION SECTION ===
Device Model:     YHJC YHS200A512HI47
Serial Number:    001A230900206638
Firmware Version: W0201A0
User Capacity:    512 110 190 592 bytes [512 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
TRIM Command:     Available
Device is:        Not in smartctl database 7.3/5528
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Jan 24 23:42:46 2025 +05
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (  120) seconds.
Offline data collection
capabilities:                    (0x11) SMART execute Offline immediate.
                                        No Auto Offline data collection support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        No Selective Self-test supported.
SMART capabilities:            (0x0002) Does not save SMART data before
                                        entering power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  10) minutes.
SCT capabilities:              (0x0001) SCT Status supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   100   100   050    Old_age   Always       -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   050    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   050    Old_age   Always       -       349
 12 Power_Cycle_Count       0x0032   100   100   050    Old_age   Always       -       196
160 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       0
161 Unknown_Attribute       0x0033   100   100   050    Pre-fail  Always       -       100
163 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       4
164 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1205
165 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       3
166 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1
167 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       2
168 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       5050
169 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       100
175 Program_Fail_Count_Chip 0x0032   100   100   050    Old_age   Always       -       0
176 Erase_Fail_Count_Chip   0x0032   100   100   050    Old_age   Always       -       0
177 Wear_Leveling_Count     0x0032   100   100   050    Old_age   Always       -       0
178 Used_Rsvd_Blk_Cnt_Chip  0x0032   100   100   050    Old_age   Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   050    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   050    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   050    Old_age   Always       -       152
194 Temperature_Celsius     0x0022   100   100   050    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x0032   100   100   050    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   050    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0032   100   100   050    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   050    Old_age   Always       -       0
232 Available_Reservd_Space 0x0032   100   100   050    Old_age   Always       -       100
241 Total_LBAs_Written      0x0030   100   100   050    Old_age   Offline      -       11341
242 Total_LBAs_Read         0x0030   100   100   050    Old_age   Offline      -       7806
245 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       990

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

Selective Self-tests/Logging not supported

The above only provides legacy SMART information - try 'smartctl -x' for more
wh4t3v3r
() автор топика

Открой окно терминала, запусти в нём top, уменьши шрифт чтобы не сильно мешало и пусть всегда показывается. Открой второе окно, запусти в нём dmesg -TW и тоже поставь чтобы всегда было видно, хотя бы на 10 строчек в высоту.

Когда зависнет - посмотри что в этих окнах (сфоткай).

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от firkax

Вот, зависло: https://i.postimg.cc/DwM2t7x9/IMG-20250125-003719.jpg

Ничего нового в консоли не появилось, как обычно…

Вот это сообщение firmware failed… раньше вроде не видел, как-будто с драйвером сетевой карты связано, но оно сразу было, даже до того как начал загрузку файлов из интернета, не знаю релевантно зависанию или нет….

wh4t3v3r
() автор топика
Последнее исправление: wh4t3v3r (всего исправлений: 1)
Ответ на: комментарий от wh4t3v3r

Ну как по мне, 12 гигов буферов и кеша в оперативной памяти - ненормально. Хотя если большие файлы качать, раздавать (transmission на заднем плане) и т.д - кэш страниц жиреет, нормально.

По lps state - видимо сетевая карта из powersave не выходит, его в конфиге NetworkManager (или что там за сетевой менеджер стоит), в документации по драйверу может опция cmdline есть, можно выключить.

Попробуй еще badblocks запусти, может и правда хард, других мыслей пока нет

MrBackToPython
()
Последнее исправление: MrBackToPython (всего исправлений: 1)

У меня такое было на SSD Adata, его даже признали гарантийным и вернули денег. Просто в какой-то момент SSD переставал отвечать на запросы контроллера.

Попробуй загрузиться с флешки и нагрузить систему с флешки, не используя SSD.

Aceler ★★★★★
()
Ответ на: комментарий от wh4t3v3r

Да, выглядит как будто всё норм и зависло на ровном месте. Вероятно с железом что-то (и нет, не с диском - от него бы в dmesg что-то было точно перед зависанием).

Попробуй память попроверять например.

firkax ★★★★★
()

Для начала smartctl -x /dev/sda. Потом копать в сторону оперативной памяти. Вероятно один из чипов перегревается. Там достаточно более 60 градусов иметь чтобы получить сбой. То есть проблемный чип будет горячим и проявляется это на торрентах вероятно потому что идет активная работа с памятью. Если никак проверить не получается попробовать снять вольтаж на 0.050 милливольт у памяти. Вероятно этого хватит для того чтобы память не перегревалась, но падения могут продолжаться, так что придется снять например 0.025 мв. Можно вытащить одну планку памяти. Если он на гарантии, то пробовать вернуть как сбойный. Возможно процессор плющит и стоит попробовать андервольтнуть его. Вот тут пример адекватного андервольта

https://overclockers.ru/blog/Gamandril_Stories/show/203367/Osobennosti-andervol-ta-i-razgona-na-intele-na-primere-MSI-Z790-A-s-12900K-na-bortu

anonymous
()

Какая версия ядра?

$ uname -rp

Все эти хитрые новомодные энергоэффективные процессоры плохо работают с (старыми версиями) linux - спонтанные зависания, перезагрузки, тормоза. Поэтому только распоследние версии ядра, и firmware.

Также по скриншоту, проблемы с wifi-карточкой rw_8821ec. Проблема связана с энергосбережением и firmware. Погугли проблемы с этой карточкой. Скорее всего на в опциях надо отключить энергосберегающий режим, обновить прошивки.

anonymous
()
Ответ на: комментарий от wh4t3v3r

Для эксперимента поставь/настрой oom-killer (systemd-oomd или earlyoom или oomd или …) или попробуй при зависании SAK (мне иногда помогало при нехватке памяти). Все эти меры помогают узнать кто есть память как не в себя. Дальше ограничиваешь «едоков» через cgroups (если неправ поправьте). Разреши REISUB (в современных линуксах оно обычно забанено, чтобы «юзер случайно не использовал»). Эти меры работают, если проблемы со стороны программного обеспечения. Иначе дело в «железе». Удачи! Поиск в помощь.

anonymous
()
Ответ на: комментарий от wh4t3v3r

Попробуй выгрузить драйвер сетевой карты у которой сообщение про firmware failed to leave lps state командой modprobe -r и используя вторую посмотри, может тогда не будет зависать.

У меня подобная фигня была - это был драйвер Wi-Fi, потом в новой версии ядра почнили.

Xenius ★★★★★
()
Ответ на: комментарий от Xenius

Попробовал modprobe -r rtw88_8821ce (странно, интернет при этом не пропал, хоть и появилось сообщение что wifi отключен), запустил загрузку торрента, через некоторое время зависло. (в dmesg в этот раз не было сообщения что firmware failed)

wh4t3v3r
() автор топика
Ответ на: комментарий от wh4t3v3r

интернет при этом не пропал, хоть и появилось сообщение что wifi отключен

«вангамод»: «провод» подключен

запустил загрузку торрента, через некоторое время зависло

что за клиент?

anonymous
()
Ответ на: комментарий от anonymous

а, точно… думал он в ноут вставлен)

Клиент Transmission. Просто при активной загрузке как-будто быстрее зависает, поэтому запускаю торрент для проверки, а так бывало и при скачивании обновлений и при composer update и просто в произвольные моменты зависало

wh4t3v3r
() автор топика
Ответ на: комментарий от Dimez

только после того как проблема уже возникла… Но вроде всё в изначальное состояние возвращал, в основном только то, что было нужно для установки трогал

wh4t3v3r
() автор топика
Ответ на: комментарий от wh4t3v3r

Переключи комп на текстовый виртуальный терминал (Ctrl-Alt-F1..F6) и вызови ещё одно зависание. Я сообщения kernel panic только так выцепил, хотя по идее из иксов на терминал должно автоматом переключаться.

Xenius ★★★★★
()
Последнее исправление: Xenius (всего исправлений: 2)
Ответ на: комментарий от wh4t3v3r

Я вангую, что в какой-то момент свободная память исчерпывается и «зависает» (перестаёт откликаться). Слабые стороны в моей гипотезе: 16 GB это довольно хороший задел. Свапом пользуешься?

anonymous
()
Ответ на: комментарий от anonymous

В общем я обновил ядро до версии 6-12.9 и пока нормально работает(хотя та часть строки так и осталась unknown) - загружал файлы, запускал видео с ютуба и пока что не зависает. Раньше на Manjaro пробовал обновлять ядро, но тогда не помогло. И блокирвка экрана стала работать (на 6.11 не блокировался).

Правда некоторые новые баги появились, менее критичные: У меня шифрование диска включено и когда пароль ввожу во время бута теперь пишет мол проверка не прошла, превышено максимальное число попыток (хотя пароль точно верный), но через какое-то время всё равно открывает экран авторизации (который тоже какой-то кривой стал и каждый раз виртуальная клавиатура вылазит). И некоторые виджеты kde отвалились (например пишет org.plasma.kikerdash не существует)

wh4t3v3r
() автор топика
Последнее исправление: wh4t3v3r (всего исправлений: 1)
Ответ на: комментарий от wh4t3v3r

Целый день всё работало, не зависало ни при скачивании, ни даже в играх, но потом зависло при просмотре браузера, выключил, ещё раз включил и зависло сразу как залогинился, снова выключил и теперь вообще не включается, даже кнопка питания не загорается) то ли перегрелся, хз…

wh4t3v3r
() автор топика