LINUX.ORG.RU

Виснет Рязань((

 , , ,


1

2

Виснет
asrock b450 pro4
R5 1600

что интересно, если что-то проигрывается, то после зависания на экране всего, звук не прерывается, не зависает, продолжает играть дальше, онлайн радио очень долго слушал, пока не надоело.

курсор мыши двигается, а вот экран и клавиатура не откликаются.
на вирт.терминалы F1/F2 тоже не может переключиться.

память тестил два раза, два дня то есть проверял
несколько полных циклов мемтеста прошлось. всё ок.
processor.max_cstate=5 не помог.
отключение в биосе чего то аналогичного тоже частично помогло.
ядро 5.2.10, дистр. и самосборное.
по теме, оказалось, нагугливается много всего, но работающего решения не нашёл
https://www.google.com/search?q=ryzen linux freezes&oq=ryzen linux freeze...
rceid=chrome&ie=UTF-8

в общем, хелп.

Ответ на: комментарий от darkenshvein

А ты не бойся!

> pkg info -r llvm90
llvm90-9.0.0.r4_1:
	mesa-dri-18.3.2_6

> pkg info -x xorg
xorg-drivers-7.7_5
xorg-fonts-100dpi-7.7
xorg-fonts-cyrillic-7.7
xorg-fonts-truetype-7.7_1
xorg-macros-1.19.2
xorg-minimal-7.5.2_2
xorg-server-1.18.4_12,1
xorgproto-2019.1
iZEN ★★★★★
()
Ответ на: комментарий от mittorn

Можно попробовать amdgpu-pro.

с ним тоже виснет, но там чёрт ногу сломит, какой именно драйвер используется, amdgpu или amdgpu-pro

darkenshvein ★★★★★
() автор топика
Последнее исправление: darkenshvein (всего исправлений: 1)
Ответ на: комментарий от mittorn

самое подозрительное:
clinfo -l
[пусто]

glxinfo
https://pastebin.com/xmT4J3Yr

sudo modinfo amdgpu
[sudo] пароль для darkshvein:
filename: /lib/modules/4.19.0-6-amd64/updates/dkms/amdgpu.ko
version: 5.0.73
license: GPL and additional rights
description: AMD GPU
author: AMD linux driver team

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от Landgraf

dmesg |grep -i amdgpu

[    0.000000] Command line: BOOT_IMAGE=/vmlinuz-4.19.0-6-amd64 root=UUID=87421040-cb03-4f9f-b9ec-5ff0fc0f9525 ro quiet splash console=xvc console=tty amdgpu.exp_hw_support=1 radeon.si_support=0 radeon.cik_support=0 amdgpu.si_support=1 amdgpu.cik_support=1 tpm_tis.force=1 elevator=bfq processor.max_cstate=1 rcu_nocbs=0-11 idle=nomwait
[    0.000000] Kernel command line: BOOT_IMAGE=/vmlinuz-4.19.0-6-amd64 root=UUID=87421040-cb03-4f9f-b9ec-5ff0fc0f9525 ro quiet splash console=xvc console=tty amdgpu.exp_hw_support=1 radeon.si_support=0 radeon.cik_support=0 amdgpu.si_support=1 amdgpu.cik_support=1 tpm_tis.force=1 elevator=bfq processor.max_cstate=1 rcu_nocbs=0-11 idle=nomwait
[    1.378811] [drm] amdgpu kernel modesetting enabled.
[    1.378812] [drm] amdgpu version: 5.0.73
[    1.381197] amdgpu 0000:09:00.0: kfd not supported on this ASIC
[    1.394133] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_mc.bin
[    1.394140] amdgpu 0000:09:00.0: VRAM: 3072M 0x000000F400000000 - 0x000000F4BFFFFFFF (3072M used)
[    1.394141] amdgpu 0000:09:00.0: GART: 1024M 0x000000FF00000000 - 0x000000FF3FFFFFFF
[    1.394332] [drm] amdgpu: 3072M of VRAM memory ready
[    1.394334] [drm] amdgpu: 15969M of GTT memory ready.
[    1.395883] amdgpu 0000:09:00.0: PCIE GART of 1024M enabled (table at 0x000000F400900000).
[    1.395951] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_pfp.bin
[    1.395959] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_me.bin
[    1.395968] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_ce.bin
[    1.395977] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_rlc.bin
[    1.396282] amdgpu 0000:09:00.0: firmware: direct-loading firmware amdgpu/tahiti_smc.bin
[    1.396305] [drm] amdgpu: dpm initialized
[    1.396452] [drm] AMDGPU Display Connectors
[    1.772834] fbcon: amdgpudrmfb (fb0) is primary device
[    2.095620] amdgpu 0000:09:00.0: fb0: amdgpudrmfb frame buffer device
[    2.553759] [drm] Initialized amdgpu 3.33.0 20150101 for 0000:09:00.0 on minor 0

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Судя по glxinfo AMDGPU-PRO не взлетел... Какую версию устанавливаешь? Я себе на hd8240 ставил 19.30 в Ubuntu 18.04.3 с последними апдейтами. Может все же проще с нуля переустановить?

OpenMind ★★★★
()
Ответ на: комментарий от mittorn

окей, как заставить использовать pro?
заблеклистить обычный amdgpu?
но названия одинаковые, modprobe amdgpu-pro драйвера не видит, да и об этом не написано.

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

Причём здесь modprobe? amdgpu-pro это реализация libdrm, opengl и иксового драйвера

mittorn ★★★★★
()

Ставил в генту вручную так: распаковал все дебы, в xorg.conf прописал новый путь к модулям иксов, в LD_LIBRARY_PATH путь к либам. Ещё в /etc что-то пришлось положить и снести radv, он не работает с закрытыми дровами

mittorn ★★★★★
()
Ответ на: комментарий от anonymous

radeon_dp_aux_transfer_native: callbacks suppressed

аааблэт, ааааамд! драйвер радеон на рязани тоже фризится!
амд, что ты делаешь, прекрати!

правда, подвисает мягше, чем амдгпу, при рестарте сессии лайтдм, все благополучно снимается.
амдгпу же подвисал так, что только reboot -f помогал.

darkenshvein ★★★★★
() автор топика

Мне помогли:

  • обновление прошивки материнской платы;
  • ядро 4.14.x;
  • опции ядра «idle=nomwait rcu_nocbs=0-15 noiswmd»;

Ядро должно быть собрано с CONFIG_RCU_NOCB_CPU=y. Вот мануал для Убунты, который должен подойти и для Debian'а: https://blog.programster.org/ubuntu-16-04-compile-custom-kernel-for-ryzen . Если ядер не 16, то «0-15», разумеется, нужно заменить на «0-N», где N равно кол-во ядер минус 1.

saahriktu ★★★★★
()
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: А ты не бойся! от iZEN

На днях в портах откатили взад зависимость mesa-dri от LLVM - в девятой версии что-то не сростается с AMD GPU.

iZEN ★★★★★
()
Ответ на: комментарий от darkenshvein

По сути, да, речь о том, что выводит

$ grep ^model\ name /proc/cpuinfo | wc -l

saahriktu ★★★★★
()
Ответ на: комментарий от darkenshvein

А это уже надо смотреть. По моим впечатлениям в последних ядрах что-то поменяли, и из за этих изменений опции не так хорошо помогали бороться с фризами. Однако, может быть, уже и поисправляли.

Кстати, все фризы на своём Ryzen'е я ловил исключительно в иксах и с запущенным Firefox'ом. Видимо, эта связка умеет наступать на грабли.

А вот в ядерной консоли без иксов я не видел ни одного фриза даже без применения костылей и с самыми свежими ядрами.

saahriktu ★★★★★
()
Ответ на: комментарий от saahriktu

так. стоп. рыжий то у меня тоже запущен.
хотя, если он умеет лезть, куда не надо, виноваты таки разрабы вёдер и водителей, но всё же, отключу его, и потестирую

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

лезть, куда не надо

Не то чтобы «куда не надо». Фризы же из за аппаратных багов происходят. У меня, например, при перезагрузке после фризов в логи приходит такое:

июл 26 01:03:57 maganux kernel: mce: [Hardware Error]: Machine check events logged
июл 26 01:03:57 maganux kernel: [Hardware Error]: Uncorrected, software containable error.
июл 26 01:03:57 maganux kernel: [Hardware Error]: CPU:10 (17:1:1) MC1_STATUS[Over|UE|MiscV|-|AddrV|-|Poison|-|TCC]: 0xf>
июл 26 01:03:57 maganux kernel: [Hardware Error]: Error Addr: 0x000000004202ec40
июл 26 01:03:57 maganux kernel: [Hardware Error]: IPID: 0x000100b000000000
июл 26 01:03:57 maganux kernel: [Hardware Error]: Instruction Fetch Unit Extended Error Code: 12
июл 26 01:03:57 maganux kernel: [Hardware Error]: Instruction Fetch Unit Error: L2 Cache Response Poison error.
июл 26 01:03:57 maganux kernel: [Hardware Error]: cache level: L1, mem/io: IO, mem-tx: IRD, part-proc: SRC (no timeout)
июл 26 01:03:57 maganux kernel: mce: [Hardware Error]: Machine check events logged
июл 26 01:03:57 maganux kernel: [Hardware Error]: System Fatal error.
июл 26 01:03:57 maganux kernel: [Hardware Error]: CPU:10 (17:1:1) MC5_STATUS[-|UE|MiscV|PCC|AddrV|-|-|SyndV|TCC]: 0xbea>
июл 26 01:03:57 maganux kernel: [Hardware Error]: Error Addr: 0x0001ffff8702eb80
июл 26 01:03:57 maganux kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
июл 26 01:03:57 maganux kernel: [Hardware Error]: Execution Unit Extended Error Code: 0
июл 26 01:03:57 maganux kernel: [Hardware Error]: Execution Unit Error: Watchdog timeout error.
июл 26 01:03:57 maganux kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
июл 26 01:03:57 maganux kernel:  #11 #12 #13 #14 #15

saahriktu ★★★★★
()
Ответ на: комментарий от saahriktu

на 5.2 не помогло. позже, качну 4.14 соберу, и попробую на нём.

на ихбт пытаются ванговать проблему:

Проблема выглядит как некий конфликт между реализацией «предсказателя» Ryzen, внеочередным выполнением инструкций и вычислением адресов относительно регистра RIP на фоне «конструкций» типа repz ret, которая широко используются именно в gcc...
Выглядит как «отложенное исполнение» команды использующей смещение относительно RIP, но вычисление адреса выполняется не с тем значением RIP, которое было в момент её запуска, а тем, которое «получилось» в момент исполнения



выглядит умно, но вряд ли что можно отключить, по такому толкованию

darkenshvein ★★★★★
() автор топика
Ответ на: комментарий от darkenshvein

так gcn 1.0 осталось на radeonsi, поддержка в amdgpu - эксперементальная

Ford_Focus ★★★★★
()
Ответ на: комментарий от annulen

Кстати, ещё одно подтверждение, что скупой платит дважды.

anonymous
()
Ответ на: комментарий от darkenshvein

хм. переставил видеокарту в нижний слот, по совету с интернетов - зависания пропали. даже амдгпу вернул - играю уже несколько часов в etc2 и не виснет

darkenshvein ★★★★★
() автор топика

в общем, хелп.

Какой тут может быть хелп если очевидно, что покупался девайс именно для страданий, ковыряний, починок и отговорок «а зато штеуд с уязвимостями», «а зато дешевле штеуда!», «а зато не переплатил за бренд!»

Теперь хелп: продать этот комп, купить на Intel + NVIDIA.

Alve ★★★★★
()
Ответ на: комментарий от Alve

что покупался девайс именно для страданий, ковыряний, починок

facepalm.jpg

King_Carlo ★★★★★
()

asrock b450 pro4

Посмотри, пожалуйста, какие мосфеты используются в преобразователе питания для модулей памяти (они расположены рядом с широким разъёмом питания платы и не закрыты радиатором). Пошла тенденция ставить Никосы — сегодня обсуждали инциденты на Хоботе. Возмущенью нет предела!

iZEN ★★★★★
()
Последнее исправление: iZEN (всего исправлений: 1)
Ответ на: комментарий от iZEN

Ты не устал спорить с умственно отсталым forzay-ем на хоботе?

anonymous
()
Ответ на: комментарий от anonymous

Как бы мощность потребления памяти малоинтересна. Но в её питальник ставятся такие же транзюки, что и процессорный VRM. А он накрыт радиаторами - проблема снять и проверить. Легче у разъёмов DIMM - там открыто и не надо ничего демонтировать.

iZEN ★★★★★
()

Если сохранилась коробка от платы, сфотографируй, пожалуйста, этикетку со штрих-кодами и выложи на обозрение. (Но сначала сфоткай транзюки у DIMM.)

iZEN ★★★★★
()

ну щто.
продолжаем гадать на кофейной гуще?
mem_encrypt=off Не помогло. утащил с генту форума.
idle=nomwait rcu_nocbs=0-11 до этого стояло. тоже не помогло.

darkenshvein ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.