LINUX.ORG.RU

VLC вешает amdgpu

 ,


1

3

Аппаратное ускорение декодирования отключено, потому что работало коряво.

Плеер стоит на паузе и свёрнут.

В произвольный момент времени в лог начинает сраться бесконечное

Aug  7 00:03:44 RERE-turk kernel: [76742.076355] amdgpu 0000:05:00.0: amdgpu: [mmhub0] no-retry page fault (src_id:0 ring:40 vmid:7 pasid:32784, for process vlc pid 1852235 thread vlc:cs0 pid 1852470)
Aug  7 00:03:44 RERE-turk kernel: [76742.076370] amdgpu 0000:05:00.0: amdgpu:   in page starting at address 0x0000800101a10000 from IH client 0x12 (VMC)
Aug  7 00:03:44 RERE-turk kernel: [76742.076378] amdgpu 0000:05:00.0: amdgpu: VM_L2_PROTECTION_FAULT_STATUS:0x00740051
Aug  7 00:03:44 RERE-turk kernel: [76742.076381] amdgpu 0000:05:00.0: amdgpu: 	 Faulty UTCL2 client ID: MP1 (0x0)
Aug  7 00:03:44 RERE-turk kernel: [76742.076384] amdgpu 0000:05:00.0: amdgpu: 	 MORE_FAULTS: 0x1
Aug  7 00:03:44 RERE-turk kernel: [76742.076386] amdgpu 0000:05:00.0: amdgpu: 	 WALKER_ERROR: 0x0
Aug  7 00:03:44 RERE-turk kernel: [76742.076388] amdgpu 0000:05:00.0: amdgpu: 	 PERMISSION_FAULTS: 0x5
Aug  7 00:03:44 RERE-turk kernel: [76742.076390] amdgpu 0000:05:00.0: amdgpu: 	 MAPPING_ERROR: 0x0
Aug  7 00:03:44 RERE-turk kernel: [76742.076392] amdgpu 0000:05:00.0: amdgpu: 	 RW: 0x1

Через несколько минут ради пущего веселья сабж пытается починить то, что не сломано, и ломает графику напрочь:

Aug  7 00:03:54 RERE-turk kernel: [76752.173003] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring sdma0 timeout, signaled seq=428330, emitted seq=428331
Aug  7 00:03:54 RERE-turk kernel: [76752.173156] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process vlc pid 1852235 thread vlc:cs0 pid 1852470
Aug  7 00:03:54 RERE-turk kernel: [76752.173275] amdgpu 0000:05:00.0: amdgpu: GPU reset begin!
Aug  7 00:03:54 RERE-turk kernel: [76752.405438] [drm] free PSP TMR buffer
Aug  7 00:03:54 RERE-turk kernel: [76752.431452] CPU: 14 PID: 1837166 Comm: kworker/u32:0 Tainted: P           OE     5.19.0-50-generic #50-Ubuntu
Aug  7 00:03:54 RERE-turk kernel: [76752.431459] Hardware name: LENOVO 82L5/LNVNB161216, BIOS GSCN33WW 07/04/2022
Aug  7 00:03:54 RERE-turk kernel: [76752.431462] Workqueue: amdgpu-reset-dev drm_sched_job_timedout [gpu_sched]
Aug  7 00:03:54 RERE-turk kernel: [76752.431476] Call Trace:
Aug  7 00:03:54 RERE-turk kernel: [76752.431479]  <TASK>
Aug  7 00:03:54 RERE-turk kernel: [76752.431482]  show_stack+0x52/0x69
Aug  7 00:03:54 RERE-turk kernel: [76752.431491]  dump_stack_lvl+0x49/0x6d
Aug  7 00:03:54 RERE-turk kernel: [76752.431498]  dump_stack+0x10/0x18
Aug  7 00:03:54 RERE-turk kernel: [76752.431504]  amdgpu_do_asic_reset+0x2b/0x441 [amdgpu]
Aug  7 00:03:54 RERE-turk kernel: [76752.431912]  amdgpu_device_gpu_recover_imp.cold+0x4f6/0x805 [amdgpu]
Aug  7 00:03:54 RERE-turk kernel: [76752.432283]  amdgpu_job_timedout+0x15e/0x190 [amdgpu]
Aug  7 00:03:54 RERE-turk kernel: [76752.432650]  ? finish_task_switch.isra.0+0x84/0x290
Aug  7 00:03:54 RERE-turk kernel: [76752.432657]  drm_sched_job_timedout+0x6a/0x120 [gpu_sched]
Aug  7 00:03:54 RERE-turk kernel: [76752.432664]  process_one_work+0x21c/0x400
Aug  7 00:03:54 RERE-turk kernel: [76752.432669]  worker_thread+0x50/0x3f0
Aug  7 00:03:54 RERE-turk kernel: [76752.432673]  ? rescuer_thread+0x3a0/0x3a0
Aug  7 00:03:54 RERE-turk kernel: [76752.432675]  kthread+0xeb/0x120
Aug  7 00:03:54 RERE-turk kernel: [76752.432680]  ? kthread_complete_and_exit+0x20/0x20
Aug  7 00:03:54 RERE-turk kernel: [76752.432684]  ret_from_fork+0x1f/0x30
Aug  7 00:03:54 RERE-turk kernel: [76752.432692]  </TASK>
Aug  7 00:03:54 RERE-turk kernel: [76752.432707] amdgpu 0000:05:00.0: amdgpu: MODE2 reset
Aug  7 00:03:54 RERE-turk kernel: [76752.432792] amdgpu 0000:05:00.0: amdgpu: GPU reset succeeded, trying to resume
Aug  7 00:03:54 RERE-turk kernel: [76752.433013] [drm] PCIE GART of 1024M enabled.
Aug  7 00:03:54 RERE-turk kernel: [76752.433019] [drm] PTB located at 0x000000F400FA0000
Aug  7 00:03:54 RERE-turk kernel: [76752.433036] [drm] VRAM is lost due to GPU reset!
Aug  7 00:03:54 RERE-turk kernel: [76752.433039] [drm] PSP is resuming...
Aug  7 00:03:54 RERE-turk kernel: [76752.452919] [drm] reserve 0x400000 from 0xf47fb00000 for PSP TMR
Aug  7 00:03:55 RERE-turk kernel: [76752.712977] amdgpu 0000:05:00.0: amdgpu: RAS: optional ras ta ucode is not available
Aug  7 00:03:55 RERE-turk kernel: [76752.723675] amdgpu 0000:05:00.0: amdgpu: RAP: optional rap ta ucode is not available
Aug  7 00:03:55 RERE-turk kernel: [76752.723681] amdgpu 0000:05:00.0: amdgpu: SECUREDISPLAY: securedisplay ta ucode is not available
Aug  7 00:03:55 RERE-turk kernel: [76752.723686] amdgpu 0000:05:00.0: amdgpu: SMU is resuming...
Aug  7 00:03:55 RERE-turk kernel: [76752.724205] amdgpu 0000:05:00.0: amdgpu: SMU is resumed successfully!
Aug  7 00:03:55 RERE-turk kernel: [76752.724753] [drm] DMUB hardware initialized: version=0x0101001F
Aug  7 00:03:55 RERE-turk kernel: [76753.118193] [drm] kiq ring mec 2 pipe 1 q 0
Aug  7 00:03:55 RERE-turk kernel: [76753.344452] amdgpu 0000:05:00.0: [drm:amdgpu_ring_test_helper [amdgpu]] *ERROR* ring sdma0 test failed (-110)
Aug  7 00:03:55 RERE-turk kernel: [76753.344813] [drm:amdgpu_device_ip_resume_phase2 [amdgpu]] *ERROR* resume of IP block <sdma_v4_0> failed -110
Aug  7 00:03:55 RERE-turk kernel: [76753.345136] amdgpu 0000:05:00.0: amdgpu: GPU reset(1) failed
Aug  7 00:03:55 RERE-turk kernel: [76753.345202] amdgpu 0000:05:00.0: amdgpu: GPU reset end with ret = -110
Aug  7 00:03:55 RERE-turk kernel: [76753.345210] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* GPU Recovery Failed: -110

В интернетах нашёл только советы вида «обнови ядро». Сейчас стоит 6.2.0-26-generic, более нового в репе нет.

Если в светлом будущем будут существовать компьютеры, я буду пользоваться чем угодно, кроме продукции AMD. Сколько же, блин, можно.


Попробуй с другим плеером. Например, mpv с --hwdec=auto. Заодно и проверишь «Аппаратное ускорение» с ним.

Все же полезно узнать, vlc ‘гадит’ или там в принципе проблема с amdgpu. Имхо.

krasnh ★★★★
()

$sudo fwupdmgr upgrade
?
бивис старый, 2022 год, мож пофиксили?
зы, тут возможен и откат - краем уха ветер нашептал, что в районе 6.2 - позднего 6.1 они что-то в amdgpu/mesa ломали.
т.е. либо откат, либо кастом ванильки 6.4, либо попробовать блобы свежии найти. варианты есть :-D

etwrq ★★★★★
()
Последнее исправление: etwrq (всего исправлений: 1)
Ответ на: комментарий от bo4ok

скачай, обновись со флешки.
можешь какой-нибудь живчик на основе стабильного дебиана попробовать. там по идее 6.1.0-10 ведро - должно быть еще неполомано в плане amdgpu/mesa.
можно офф живчик, только в /etc/kernel/postinst.d/ подчистить - кривовато собрано, емнип.

etwrq ★★★★★
()

Закомментируй строчку в ядре, которая выставляет vram is lost, иногда это помогает резету пройти не ломая графику совсем
Так же можешь поиграться с разными reset mode, раз mode2 фейлится.
Ну и если это встройка-вега, то для резета нужно обесточить чип полностью
Ну и попробуй mesa из гита. Эти проблемы из-за неправильного кожа отправленного на gpu, либо ошибок в нём из-за фейлов, например, питания, а не из-за версии ядра обычно. Ядро только процессом резета занимается, но делает это неправильно

mittorn ★★★★★
()
Последнее исправление: mittorn (всего исправлений: 1)
Ответ на: удаленный комментарий

Очередная попытка нарезать флешку не удалась =\

[13805.745273] EMT-0[57025]: segfault at 0 ip 00007fd2036e53f9 sp 00007fd22d1a6570 error 4 in VBoxDD.so[7fd203624000+17c000] likely on CPU 12 (core 6, socket 0)

bo4ok
() автор топика
Ответ на: комментарий от Khnazile

Некоторые вешающие линукс баги в amdgpu висят уже 5 по лет.

Такое положение дел не очень-то удивительно, если вспомнить, какой размер у амдешных дров. Емнип, в ядре linux чуть ли не треть кода приходится на эти дрова.

Это ненормально, по-моему.

alex1101
()
Ответ на: комментарий от bo4ok

Тут это, если у тебя процессор тоже амуде, то скорее всего он в могилу ползет. Может быть, это ипамять, но в случае с амуде первое гораздо более вероятно: много заводского брака.

Khnazile ★★★★★
()
Ответ на: комментарий от bo4ok

--audio-files=

Вроде бы.. но лучше уточнить в манах.

Ещё есть managed режим. В нём можно прямо налету добавлять и убирать видео/аудио/субтитровые треки из внешних файлов. Команды опять же в манах

robus ★★★★★
()
Ответ на: комментарий от bo4ok

Ну дык.. АМД – лучше из того, что есть. NVIDIA – кривая проприетарь, её только разве что ради CUDA в какой нибудь дата центр покупать. INTEL – сыроват пока что. Остаётся Radeon..

robus ★★★★★
()
Ответ на: комментарий от bo4ok

Для mpv есть много вариантов гуи, Медиаплеер для бабушки (комментарий). Наверно самым удобный после vlc будет SMPlayer.
Это если нет желания штудировать man, который для mpv просто огромен.

p.s. Но, думаю, никто здесь не собирается навязывать другие плееры взамен привычному vlc. Речь была о том, чтобы только протестировать, с целью сузить круг виновных в баге.

krasnh ★★★★
()
Ответ на: комментарий от bo4ok

Сначала сюда: https://mpv.io/installation/.

Потом делаем вот так:

sudo apt-get install mpv smplayer smplayer-skins smplayer-themes smtube && python3 -m pip install -U yt-dlp

И радуемся тому, что ваши волосы стали мягкими и шелковистыми.

Mobutu_Sese_Seko
()
Последнее исправление: Mobutu_Sese_Seko (всего исправлений: 2)
Ответ на: комментарий от etwrq

2022 год

А я его уже обновил, оказывается /)_(\

Он самоидентифицируется как GSCN35WW, но в системе почему-то виден старый номер сборки.

Я очень хочу кого-нибудь задушить.

bo4ok
() автор топика

Сколько лет сижу на блобе nvidia под линуксом и никогда не ловил поломку драйвера. Вот вам наглядное сравнение проприетарщины и швятого опенсорса. Тысячи глаз опять недоглядели. И мейнтейнеры ядра прошляпили.

И так будет продолжаться пока копролиты в виде сишки, мейнтейнеров и списков рассылок не выкинут на помойку и не введут нормальные код ревью с автотестами, без которых нельзя замёржить в мастер.

ox55ff ★★★★★
()

тред просто зарево и коллекция чудаков да интересных, как та личность, советов.

топик снести, автора в бан и на венду.

вместо того чтобы гуглить траблы с железом своей леновы (которую авторша не удосужилась даже опейсать) оно тут ПМСит, а ещё парочка подвывает лол.

на бубунту, если это она, за 5 сек ставится почти любое, в т.ч. самое свежее ведро из mainline ppa, или тот же xanmod.

свежую mesa накатить тоже нет проблем - несколько PPA на выбор.

mrjaggers
()
Последнее исправление: mrjaggers (всего исправлений: 1)
Ответ на: комментарий от bo4ok

Решил Ватсон отучить Холмса от курения. Купил сигару, засунул себе в задницу, носил два часа, а потом предложил Холмсу. Холмс выкурил сигару, как ни в чём не бывало. На следующий день Ватсон носил сигару 4 часа, потом предложил Холмсу. Холмс выкурил сигару — и ничего. На третий день Ватсон носил сигару с утра до вечера. Холмс выкурил сигару — и опять ничего.

Так и не отучился Шерлок Холмс от курения. А вот Ватсон без сигары уже не мог.

Mobutu_Sese_Seko
()
Ответ на: комментарий от ox55ff

никогда не ловил поломку драйвера

Вот прям щас.

$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

# modprobe nvidia
modprobe: ERROR: could not insert 'nvidia': Key was rejected by service

Что случилось - хз, вчера работало, наверняка после ребута починится.

bo4ok
() автор топика
Ответ на: комментарий от Mobutu_Sese_Seko

у вас тут секта сидящих на конусе? или покланяющихся сидящим на конусе?

чувак, я mpv не то что юзаю, даже собирал сам со всякими его либплацебами и ещё бох знает чем.

заткнись.

а ты фигню набил.

mrjaggers
()
Ответ на: комментарий от leave

Общение с железом идёт через интерфейсы ядра. Можно сделать для них Mock’и и тестировать. Да даже без относительно железа полно кода, который с ним не работает. VFS какой-нибудь.

ox55ff ★★★★★
()