LINUX.ORG.RU

Зависания GNU/Linux на Ryzen 2400g

 


2

4

Господа, в чем может быть проблема? Периодически зависает, думаю проблема не в железе потому что в винде не проявляется. Винда стоит только чтобы запускать GTA раз в несколько дней, и ни разу никаких зависаний не было. Эта игра возможно не самая требовательная к железу, но загружает его всяко разно намного больше чем мои типичные задачи в Kubuntu. В Kubuntu все может зависнуть просто во время чтения ЛОРа в браузере, т.е. когда загрузка процессора и памяти минимальна. Из этого я делаю вывод что проблемы с памятью, перегревом и прочие связанные с железом можно смело исключить. Виснет нечасто, ну бывает раз в несколько дней или раз в неделю, не чаще. Ядро стоит уже 5.1, до этого переходил на новые по мере их выхода. Обещали что уже с 4.19 с APU Ryzen все будет ОК, но я пробовал все начиная с 4.15 и так ничего и не изменилось. Mesa тоже самая свежая, из PPA. Типично виснет так - только указатель мыши двигается, все остальное зависает намертво, на нажатия клавиш или клики мышкой не реагирует. Зависает обычно в открытом хромиуме, но возможно это совпадение потому что он у меня почти всегда открыт. Я понимаю что телепаты в отпуске, поэтому говорите что надо выложить и я буду выкладывать.

★★★★★

Последнее исправление: mbivanyuk (всего исправлений: 1)
Ответ на: комментарий от steemandlinux

Что, прям в международное бюро мер и весов принесли и подменили имевшийся там эталон?

Что ты несёшь, наркоман?

anonymous
()
Ответ на: комментарий от anonymous

Вообще-то да, именно opengl от nvidia считался долгое время эталоном. Сейчас из умственно отсталых остались только улитки и местные лоровцы.

steemandlinux ★★★★★
()
Ответ на: комментарий от steemandlinux

Эталон это только спецификация. Нет эталонной реализации. Какие шизики что-там считали?

anonymous
()
Ответ на: комментарий от anonymous

Но писали именно под реализацию нвидии не хрюкнув ни разу в сторону своего божества хуанга. А когда говнокот не работал на AMD и Intel орали смените видеокарту. Сейчас улитки продолжают орать то же самое, упорин у даунов не хочет кончаться.

steemandlinux ★★★★★
()
Последнее исправление: steemandlinux (всего исправлений: 1)
Ответ на: комментарий от int13h

Не лучше. по ssh можно зайти не настраивая заранее. А если зависание произошло при гибернации/сне, нетконсоль не работает и no_console_suspend не помогает. Всё равно придётся serial консоль или kgdb настраивать.
Хотя если есть способы заставить её работать притгибернации - подскажи. Мне очень важно отладить это зависание, а я даже зарепортить его не могу. serial тупо некуда цеплять

mittorn ★★★★★
()
Последнее исправление: mittorn (всего исправлений: 1)
Ответ на: комментарий от anonymous

Да сейчас не запускаются со всяким .sys говном в комплекте в основном.

steemandlinux ★★★★★
()
Ответ на: комментарий от Meyer

GIGABYTE B450M S2H + Ryzen 3 2200G + 2х8Gb@3000 памяти на микроне = Всё прекрасно работает на свежей хубунте (это я писал выше от анонимуса). Биос, разумеется, самый свежий. Так что не в бренде производителя дело, у всех есть удачные и унылые продукты.

manntes-live ★★★
()
Ответ на: комментарий от manntes-live

Как объяснишь отсутствие зависаний на amdgpu-pro и присутствие их на amdgpu/radeonsi?
возможно дело и в оборудовании, но реализация из amdgpu-pro не вводит оборудование в нестабильное состояние

mittorn ★★★★★
()

Кстати, ТС, а можешь запостить для истории полный конфиг: кроме проца ещё мать, версию биоса и оперативку? и что именно за версия кубунты?
И не скажу за сейчас, со всякими уберсвежими ядрами и месой я и на интеле в убунте ловил странные проблемы, что получается если поотключать ппа и вернуть штатные версии пакетов?

manntes-live ★★★
()
Ответ на: комментарий от Deleted

Это не юниксвейно. Head читает строки из головы, cat - выводит файлы на пайплайн, всё по феншую. Каждую тулзу можно заменить. grepd не нужен.

anonymous
()
Ответ на: комментарий от anonymous

Это называется «unixway головного мозга», «когда в руках молоток, всё выглядит гвоздями», профдеформация.

anonymous
()
Ответ на: комментарий от manntes-live

а всё работает это в течение какого примерно времени? Может тебе просто повезло. Пока не знаешь что сидишь на пороховой бочке, кажется что всё нормально. Если меньше 2 месяцев - то считай просто повезло. Это ещё от софта кстати зависит.
Попробуй пару десятков раз покрутить эти трейсы через apitrace
http://mittorn.tk/xash64.trace.xz
http://mittorn.tk/xash64.1.trace.xz
Они приводят к крашу на 2400G и 2500U, но не каждый раз.
Но даже если не крашнет - это ещё не значит что оно не крашнет где-то ещё.

mittorn ★★★★★
()
Ответ на: комментарий от manntes-live

Кстати, ТС, а можешь запостить для истории полный конфиг: кроме проца ещё мать, версию биоса и оперативку? и что именно за версия кубунты? И не скажу за сейчас, со всякими уберсвежими ядрами и месой я и на интеле в убунте ловил странные проблемы, что получается если поотключать ппа и вернуть штатные версии пакетов?

Ryzen 2400g, MSI B350M PRO-VDH, 2 планки Kingston HyperX Predator [HX430C15PB3/8] по 8 ГБ работают на частоте 2933 MHz. Kubuntu 18.04 LTS. Сначала на ядре 4.15 грузилась через раз, обновил ядро до 4.19 (без этого никак вообще, сразу говорю для тех кто планирует приобрести 2400g или 2200g) и в принципе почти все нормально, но вот эти редкие зависания остались. Но я все же думаю проблема не в железе и на то есть три основания так полагать: 1. В винде все ОК. 2. После зависания указатель мыши двигается, если бы проблема была в памяти например все бы висло намертво. 3. В логах вижу что ошибки связанные с драйвером начинаются уже с загрузки, проблемы с драйвером есть точно.

mbivanyuk ★★★★★
() автор топика
Ответ на: комментарий от mbivanyuk

В логах вижу что ошибки связанные с драйвером начинаются уже с загрузки, проблемы с драйвером есть точно.

Посмотри, что там в dmesg.

Meyer ★★★★★
()
Ответ на: комментарий от Meyer

AMD-Vi: Unable to write to IOMMU perf counter

Вот это выскакивает при загрузке.

mbivanyuk ★★★★★
() автор топика
Ответ на: комментарий от mittorn

Пока неделю у ребёнка стоит, но он его активно и в игрушки гоняет, и в браузере сидит. Трейсы скачал, вечером погоняю.

manntes-live ★★★
()
Ответ на: комментарий от mbivanyuk

Фейл amdgpu и у меня в логе есть:

[    5.158928] WARNING: CPU: 1 PID: 414 at drivers/gpu/drm/amd/amdgpu/../display/dc/calcs/dcn_calcs.c:1380 dcn_bw_update_from_pplib+0x19c/0x2d0 [amdgpu]
[    5.158929] Modules linked in: edac_mce_amd kvm_amd ccp kvm irqbypass crct10dif_pclmul crc32_pclmul ghash_clmulni_intel snd_hda_codec_realtek snd_hda_codec_generic ledtrig_audio snd_hda_codec_hdmi snd_hda_intel snd_hda_codec snd_hda_cor
e snd_hwdep snd_seq_midi snd_seq_midi_event snd_pcm snd_rawmidi aesni_intel amdgpu(+) aes_x86_64 crypto_simd cryptd glue_helper snd_seq chash amd_iommu_v2 input_leds gpu_sched ttm snd_seq_device snd_timer drm_kms_helper snd wmi_bmof drm i2
c_algo_bit fb_sys_fops syscopyarea sysfillrect sysimgblt k10temp soundcore mac_hid sch_fq_codel parport_pc ppdev lp parport ip_tables x_tables autofs4 hid_generic usbhid hid nvme r8169 i2c_piix4 nvme_core realtek ahci libahci wmi gpio_amdp
t video gpio_generic
[    5.158949] CPU: 1 PID: 414 Comm: systemd-udevd Not tainted 5.0.0-15-generic #16-Ubuntu
[    5.158950] Hardware name: Gigabyte Technology Co., Ltd. B450M S2H/B450M S2H, BIOS F40 05/16/2019
[    5.159025] RIP: 0010:dcn_bw_update_from_pplib+0x19c/0x2d0 [amdgpu]
[    5.159026] Code: 84 fd 44 ff ff ff 49 8b 95 78 01 00 00 48 89 85 30 ff ff ff df ad 30 ff ff ff d8 f1 db 42 78 de c9 de ca de f9 d9 5a 4c eb 02 <0f> 0b e8 fd 21 b3 d9 4c 89 e7 48 89 da be 04 00 00 00 e8 1d 57 fe
[    5.159027] RSP: 0018:ffffbb18c294b680 EFLAGS: 00010246
[    5.159029] RAX: 00000000ffffffff RBX: ffffbb18c294b6e0 RCX: 0000000000000006
[    5.159030] RDX: 0000000000000000 RSI: 0000000000000004 RDI: ffff910ecca593c0
[    5.159030] RBP: ffffbb18c294b750 R08: 0000000000000001 R09: 000000000000038f
[    5.159031] R10: 0000000000000004 R11: 0000000000000000 R12: ffff910ec9179500
[    5.159032] R13: ffff910eca61d800 R14: 0000000000000001 R15: ffff910eccabe300
[    5.159033] FS:  00007fe17915b8c0(0000) GS:ffff910ed0640000(0000) knlGS:0000000000000000
[    5.159034] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[    5.159034] CR2: 000056047b7bf350 CR3: 000000040cf5a000 CR4: 00000000003406e0
[    5.159035] Call Trace:
[    5.159110]  construct+0x8d7/0xb40 [amdgpu]
[    5.159114]  ? _cond_resched+0x19/0x30
[    5.159116]  ? kmem_cache_alloc_trace+0x153/0x1d0
[    5.159188]  dcn10_create_resource_pool+0x41/0x60 [amdgpu]
[    5.159257]  dc_create_resource_pool+0x11e/0x1a0 [amdgpu]
[    5.159258]  ? _cond_resched+0x19/0x30
[    5.159260]  ? __kmalloc+0x178/0x220
[    5.159331]  ? dal_gpio_service_create+0x99/0x130 [amdgpu]
[    5.159399]  dc_create+0x233/0x630 [amdgpu]
[    5.159401]  ? kmem_cache_alloc_trace+0x153/0x1d0
[    5.159474]  dm_hw_init+0xe2/0x150 [amdgpu]
[    5.159549]  amdgpu_device_init.cold.34+0x1079/0x13f9 [amdgpu]
[    5.159605]  amdgpu_driver_load_kms+0x8d/0x360 [amdgpu]
[    5.159617]  drm_dev_register+0x129/0x170 [drm]
[    5.159672]  amdgpu_pci_probe+0xc5/0x120 [amdgpu]
[    5.159675]  local_pci_probe+0x46/0x90
[    5.159677]  pci_device_probe+0x11c/0x1a0
[    5.159679]  really_probe+0xfe/0x3b0
[    5.159680]  driver_probe_device+0xba/0x100
[    5.159682]  __driver_attach+0xe4/0x110
[    5.159683]  ? driver_probe_device+0x100/0x100
[    5.159685]  bus_for_each_dev+0x79/0xc0
[    5.159687]  ? kmem_cache_alloc_trace+0x153/0x1d0
[    5.159688]  driver_attach+0x1e/0x20
[    5.159689]  bus_add_driver+0x159/0x230
[    5.159690]  ? 0xffffffffc070e000
[    5.159692]  driver_register+0x70/0xc0
[    5.159693]  ? 0xffffffffc070e000
[    5.159694]  __pci_register_driver+0x57/0x60
[    5.159748]  amdgpu_init+0x81/0x83 [amdgpu]
[    5.159750]  do_one_initcall+0x4a/0x1c4
[    5.159752]  ? _cond_resched+0x19/0x30
[    5.159753]  ? kmem_cache_alloc_trace+0x153/0x1d0
[    5.159756]  do_init_module+0x60/0x220
[    5.159757]  load_module+0x1765/0x19c0
[    5.159761]  __do_sys_finit_module+0xbd/0x120
[    5.159762]  ? __do_sys_finit_module+0xbd/0x120
[    5.159764]  __x64_sys_finit_module+0x1a/0x20
[    5.159766]  do_syscall_64+0x5a/0x110
[    5.159768]  entry_SYSCALL_64_after_hwframe+0x44/0xa9
[    5.159769] RIP: 0033:0x7fe1793e82e9
[    5.159770] Code: 00 c3 66 2e 0f 1f 84 00 00 00 00 00 0f 1f 44 00 00 48 89 f8 48 89 f7 48 89 d6 48 89 ca 4d 89 c2 4d 89 c8 4c 8b 4c 24 08 0f 05 <48> 3d 01 f0 ff ff 73 01 c3 48 8b 0d 77 cb 0c 00 f7 d8 64 89 01 48
[    5.159771] RSP: 002b:00007ffe0942e2a8 EFLAGS: 00000246 ORIG_RAX: 0000000000000139
[    5.159772] RAX: ffffffffffffffda RBX: 0000561339247350 RCX: 00007fe1793e82e9
[    5.159773] RDX: 0000000000000000 RSI: 00007fe1792c9cad RDI: 0000000000000019
[    5.159773] RBP: 00007fe1792c9cad R08: 0000000000000000 R09: 0000561339247350
[    5.159774] R10: 0000000000000019 R11: 0000000000000246 R12: 0000000000000000
[    5.159774] R13: 0000561339244e00 R14: 0000000000020000 R15: 0000561339247350
[    5.159776] ---[ end trace d774679327fba48d ]---

manntes-live ★★★
()

Кстати, у меня powertop показывается только POLL, C1 и C2 состояния, интересно сравнить с проблемными системами.

manntes-live ★★★
()
Ответ на: комментарий от manntes-live

Такая ошибка нормальна на 5.x ядрах и старом иксовом драйвере. Обнови иксовый драйвер если доступна более новая версия. Там что-то изменили в номерации портов. В драйвере что идёт с 19.10 amdgpu-pro тоже исправили

mittorn ★★★★★
()
Ответ на: комментарий от mbivanyuk

Проблемы с gpu - он перестаёт отвечать на все запросы. Только продолжает выводить содержимое фреймбуффера. Курсор мышки тоже работает, на этом всё. Если включишь gpu recovery и удастся переключиться в консоль - то есть шанс что она заработает. Ещё можно попробовать sysrq+v

mittorn ★★★★★
()
Ответ на: комментарий от mbivanyuk

Если включишь gpu recovery и удастся переключиться в консоль - то есть шанс что она заработает. Ещё можно попробовать sysrq+v. Вернуть gpu к нормальной работе можно только через спящий режим. у меня удавалось при использовании иксового драйвера modesetting рестартнуть gpu и после временного входа в спящий режим и перезапуска иксов он работал снова. с драйвером amdgpu переход в спящий режим после краша невозможен, просто зависнет.

mittorn ★★★★★
()
Ответ на: комментарий от mbivanyuk

Отказываешься от драйвера radeonsi вообще. Либо используешь llvmpipe, либо amdgpu-pro. Я уже выше писал

mittorn ★★★★★
()
Ответ на: комментарий от mbivanyuk

причина в том что gpu перестаёт отвечать на любые запросы. Это может произойти и без причины, но почему-то ядерный и юзерспейсные драйвера это не учитывают. amd просто сэкономили на обработке ошибок и во встроенных вегах не предусмотрели перезапуск без отключения питания.

Почему-то это происходит реже в amdgpu-pro. Вероятно есть какие-то программноаппаратные баги которые не проявляются с их реализацией. Или же они просто знают как избежать зависания gpu

mittorn ★★★★★
()
Ответ на: комментарий от mittorn

DKMS драйвер amdgpu-pro + mesa драйвер. В его опциях установки можно указать заменять месу или нет. Это хороший способ локализовать проблему.

steemandlinux ★★★★★
()
Последнее исправление: steemandlinux (всего исправлений: 1)
Ответ на: комментарий от steemandlinux

у меня не dkms драйвер, а ванильное ядро из git. и проблема у меня локализована. Точнее, проблемы. То что вылазит при гибернации - чисто баг ядерного драйвера. Да и вроде бы в свежих amdgpu-pro нету никаких dkms драйверов вообще.

mittorn ★★★★★
()
Ответ на: комментарий от mittorn

Что ж, первый же реплей повесил графическую систему с кучей ошибок в логе:

[   99.463797] amdgpu 0000:0a:00.0: [gfxhub] VMC page fault (src_id:0 ring:158 vmid:2 pasid:32771, for process glretrace pid 2471 thread glretrace:cs0 pid 2472)
[   99.463803] amdgpu 0000:0a:00.0:   in page starting at address 0x000080003f800000 from 27
[   99.463806] amdgpu 0000:0a:00.0: VM_L2_PROTECTION_FAULT_STATUS:0x0020153C
[  109.511149] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx timeout, signaled seq=2950, emitted seq=2952
[  109.511237] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process glretrace pid 2471 thread glretrace:cs0 pid 2472
[  109.511240] [drm] GPU recovery disabled.
[  119.751221] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx timeout, signaled seq=2950, emitted seq=2952
[  119.751308] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process glretrace pid 2471 thread glretrace:cs0 pid 2472
[  119.751311] [drm] GPU recovery disabled.
[  129.991254] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx timeout, signaled seq=2950, emitted seq=2952
[  129.991342] [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process glretrace pid 2471 thread glretrace:cs0 pid 2472
[  129.991345] [drm] GPU recovery disabled.


Видимо со всем остальным и правда просто везло.

manntes-live ★★★
()
Последнее исправление: manntes-live (всего исправлений: 1)
Ответ на: комментарий от mbivanyuk

Блин, засрали флудеры тему...

ТС, ну как отпишись! Интересно очень — сам планирую себе десктоп на Ryzen собрать, но, наверное уже на 3600G.

unanimous ★★★★★
()
Ответ на: комментарий от manntes-live

Ты что используешь труд ребенка для тестирования? Поставь ему Винду и оставь в покое. Себе собери ящик и сам тестируй

Deleted
()
Ответ на: комментарий от manntes-live

Оно не любит движки основанные на 1-2 кваке. В некоторых местах часто крашит. Ещё изредка glamor виснет (который 2д графику в иксах рисует).
В остальном почти юзабельно. Но я несколько месяцев с llvmpipe просидел и игры пускал только на вулкане или на cpu

mittorn ★★★★★
()
Ответ на: комментарий от Deleted

Должна же быть какая-то польза от этих спиногрызов))

Deleted
()
Ответ на: комментарий от unanimous

ТС, ну как отпишись! Интересно очень — сам планирую себе десктоп на Ryzen собрать, но, наверное уже на 3600G.

Да пока нечего отписываться, только внес изменения в BIOS по совету пожелавшего остаться неизвестным давшего ценный совет выше, надо протестировать хоть несколько дней.

mbivanyuk ★★★★★
() автор топика
Ответ на: комментарий от mittorn

Это очень печально. Иначе бы задумался о покупке honor magicbook amd 2019. Хотя диагональ по мне так несколько великовата

Deleted
()
Ответ на: комментарий от anonymous

SMT — это не полноценная эмуляция аппаратной мнопоточности. На некоторых задачах с интенсивным обменом данными (чем является связка CPU+GPU с общим кэшем) вызывает проблемы синхронности.

iZEN ★★★★★
()
Ответ на: комментарий от iZEN

У вас с зенитаром соревнование, кто более ламерскую чушь выдаст?

anonymous
()
Ответ на: комментарий от iZEN

Отключи SMT в BIOS

Не, не верю я честно говоря что дело в BIOS или вообще в железе. Во-первых потому что винда то прекрасно работает. Ну насколько винда может работать прекрасно это другой вопрос, но она по крайней мере работает и не зависает. Во-вторых указатель курсора то двигается. В третьих на ядре 4.15 все было вообще печально и только с 4.19 вообще стало возможным хоть как-то работать. Т.е. кривизна поддержки APU Ryzen для меня очевидна, и очевидно что дело именно в этом, а не в SMT.

mbivanyuk ★★★★★
() автор топика
Последнее исправление: mbivanyuk (всего исправлений: 1)
Ответ на: комментарий от mbivanyuk

винда то прекрасно работает

Ну вот и ответ. У тебя два варианта

1) забить и просто идти в венду, через этак год можешь снова посмотреть.

2) называться этим самым груздём, брать барабан, флажок, и самому лезть ядро адаптировать и ковырять

fornlr ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.