LINUX.ORG.RU

В очередной раз сыграл в рулетку AMD

 ,


0

4

Не знаю, может я мазохист, любитель боли и унижений, но жизнь меня тут ничему не учит.

в 20м году собрал пк на amd, с 5700xt видюхой. купил как раз перед бумом майнинга. периодически стал ловить https://bugzilla.kernel.org/show_bug.cgi?id=206903 , чаще, чем хотелось бы. даже без нагрузки на видео, даже при повседневной работе в браузере/десктопе. все пляски с бубном ни к чему не привели. в оффтопике разумеется все ок. намучавшись, скинул ее майнеру втридорога и был счастлив.

на замену взял 6700xt. и вот тут мне сложно вспомнить какие то существенные проблемы. возможно были вылеты в играх, однако десктоп был стабилен. но решил поменять свой fhd моник на 2к 165гц.

настало время авито барыг и перекупов, т.к в официальных магазах цены были запредельные. и попалась мне на глаза новая palit 4070ti, за 65к. впечатлившись dlss3 (для оффтопика) - взял. и все вроде хорошо, и даже протон работал стабильно. вылетов не помню. кажись вот оно, можно работать/играть и горя не знать несколько лет. были с нвидией мелкие проблемы (пк не выходил из сна, иногда выходил, но с черным экраном, иногда помогало рестартануть lightdm), но жить было можно. но тут резко подешевели 7900xt…

продав 4070ti (с бомжатскими 12 гигами), взял я 7900xt с царскими двадцатью… еще и в плюсе остался. и вроде как все отлично - в браузере декодирование видео изкоробки, гуйня летает, никаких проблем со сном (во всяком случае у пк). но в играх снова началось, ох как у меня горит…

подсел я на третью джаггу. офигенная вещь. но иногда, в рандомных местах картинка зависает. сам пк притом работает дальше. в логе такая хня

фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:24 vmid:5 pasid:32778, for process JA3.exe pid 15311 thread JA3.exe pid 15311)
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x000000000051d000 from client 10
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00501430
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: SQC (data) (0xa)
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x0
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x0
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x3
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x0
фев 09 15:15:48 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x0
фев 09 15:15:55 viper-manjaro NetworkManager[1050]: <info>  [1707480955.1803] dhcp6 (enp5s0): state changed new lease, address=2a00:1370:819c:57db:db60:e1dd:5c46:e8a4
фев 09 15:15:55 viper-manjaro systemd[1]: Starting Network Manager Script Dispatcher Service...
фев 09 15:15:55 viper-manjaro systemd[1]: Started Network Manager Script Dispatcher Service.
фев 09 15:15:59 viper-manjaro kernel: [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx_0.0.0 timeout, signaled seq=3598491, emitted seq=3598493
фев 09 15:15:59 viper-manjaro kernel: [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process JA3.exe pid 15311 thread JA3.exe pid 15311
фев 09 15:15:59 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GPU reset begin!
фев 09 15:16:03 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: failed to suspend display audio
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: IP block:gfx_v11_0 is hung!
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:169 vmid:0 pasid:0, for process  pid 0 thread  pid 0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x0000000000000000 from client 10
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00040B53
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: CPC (0x5)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x1
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x1
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x5
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x1
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x1
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:169 vmid:0 pasid:0, for process  pid 0 thread  pid 0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x0000000000000000 from client 10
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00000000
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: CB/DB (0x0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:169 vmid:0 pasid:0, for process  pid 0 thread  pid 0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x0000000000000000 from client 10
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00000000
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: CB/DB (0x0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:169 vmid:0 pasid:0, for process  pid 0 thread  pid 0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x0000000000000000 from client 10
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00000000
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: CB/DB (0x0)
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x0
фев 09 15:16:04 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x0

я бесконечно далек от понимания работы видео карт, но судя логу вроде как бага в игре приводит к падению драйвера. эта проблема хорошо гуглится, багрепорты заведены где только можно, пуканы у амудешников горят знатно. проблеме не один год. где то пишут, что в винде такая же проблема, однако драйвер ее переживает, в отличии от

фев 07 16:28:54 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: soft reset failed, will fallback to full reset!

и опять я достал бубен. версии месы, вулкана меняю, ничто не помогает. в других играх такой проблемы не было замечено. мб играл мало. а вот в джагге может стрельнуть как через пару минут, так и через час, стабильно.

так прошла неделя. и вдруг подумал, а че бы мне не обновить биос, для моего кроссхеира уже 5 версий вышло. т.е дальше стучу в бубен. одному бгу известно, как биос матери может повлиять на гпу, но почему бы и нет. обновил, загрузился, выяснилось, что отвалился второй nvme, вообще перестал определяться (с сабжем это никак не связано, но жопа моя раскалилась до предела). решилось отключением питание от пк.

начал играть в джаггу. через 2 минуты знакомый пролаг и зависание картинки. в голове все мысли о лизочке, однако херак, картинка отвисла, играем дальше. смотрю в лог, а там

фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: [gfxhub] page fault (src_id:0 ring:24 vmid:3 pasid:32775, for process JA3.exe pid 4941 thread JA3.exe pid 4941)
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:   in page starting at address 0x00000000002be000 from client 10
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu: GCVM_L2_PROTECTION_FAULT_STATUS:0x00301430
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          Faulty UTCL2 client ID: SQC (data) (0xa)
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MORE_FAULTS: 0x0
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          WALKER_ERROR: 0x0
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          PERMISSION_FAULTS: 0x3
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          MAPPING_ERROR: 0x0
фев 09 16:32:50 viper-manjaro kernel: amdgpu 0000:0d:00.0: amdgpu:          RW: 0x0
фев 09 16:33:00 viper-manjaro kernel: [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx_0.0.0 timeout, but soft recovered

епииииископ кондратий…. неужели помогло??? пока продолжаю наблюдение.

пс. если кому интересно - месяц выживал на 6400 рыксе - вообще никаких проблем, отличная карта. даже прошел на ней disciples 3, и он мне… понравился!

upd. еще раз стрельнуло, с soft recovered. выглядит как успешный успех!

uupd. Подумал, а не могут ли мои беды с амд быть связаны с материнкой, раз уж обновление биоса помогло… Будет время - поставлю эту рыксу в мамку от гиги, потестим.

★★★★★

Последнее исправление: Dimez (всего исправлений: 5)
Ответ на: комментарий от Khnazile

у меня классический сэндвич, по бокам мать и видяха, сверху 120-ка на выдув. я не очень понимаю, откуда там вообще перегрев может проявиться. на мой взгляд воздухопоток там даже оптимальнее обычного атх гроба - видяха и проц напрямую засасывают воздух извне (на проце тож топ флоу кулер), и он выдувается вверх. больше никаких вентов не надо.

вот шум от кулера видяхи - другой вопрос. но тоже можно решить павер лимитами

vvviperrr ★★★★★
() автор топика
Последнее исправление: vvviperrr (всего исправлений: 1)
Ответ на: комментарий от Khnazile

https://ibb.co/XXLWVyZ

https://ibb.co/G051PR4

https://ibb.co/XJxqZLt

https://ibb.co/Y8jndXS

https://ibb.co/N66jVc8

довольно тесно? по бокам воздух всасывается, сзади и сверху выдувается. сверку 120x25 вентиль.

4060ti. в стрессе хотспот 75с, в играх - 65, но эт смотря как играть. я обычно локи ставлю на 82/120/165 фпс. сэндвич вообще идеальный корпус, если температуры важны

vvviperrr ★★★★★
() автор топика
Последнее исправление: vvviperrr (всего исправлений: 1)
Ответ на: комментарий от Khnazile

лол. ps201 какой нить? это дешманские офисные корпуса, там никто не думает про игровые видюхи и их температуры. к тому же еще и бп оемный. ты бы еще оптиплекс в пример привел.

vvviperrr ★★★★★
() автор топика
Последнее исправление: vvviperrr (всего исправлений: 1)
Ответ на: комментарий от manntes-live

сейчас все стабильно

HoloISO

даж не слышал, посмотрю. а так какая разница то. ядро, меса, вулкан драйвера, и так можно тож самое, что в стимос поставить

vvviperrr ★★★★★
() автор топика
Ответ на: комментарий от anonymous

4k@60, RX6800. Всем доволен, ничего не вылетает. Возможно, мне везёт, но в целом всё хорошо с графикой AMD уже десять лет.

Все правильно, с учетом то что RX6800 выпустили 18 ноября 2020.

mx__ ★★★★★
()
Ответ на: комментарий от vvviperrr

Это игровые видюхи ненужных, а глухие офисные корпуса топ. И не такой он и дешманский, нормальный метал и адекватная конструкция, погнуть просто случайно надавив рукой не получится. У блока питания слабое место диод дежурки, по классике.

Khnazile ★★★★★
()
Ответ на: комментарий от Khnazile

да я не осуждаю. просто непонятна жалоба на перегрев. у него даже нет перфорации со стороны видюхи. она там буквально будет задыхаться. эти 2 слота тупо не предназначены под двухслотовую карту. туда максимум какую нить затычку и сетевушку, к примеру. был у меня такой, брал под ретро 775.

vvviperrr ★★★★★
() автор топика
Ответ на: комментарий от anonymous

pcie3

Посмотрел тут тесты RX 6400 на PCIE4 и PCIE3 - разница 5-10 фпс, где-то её нет вообще.
Зачем псие4 к этим камням?

whbex ★★
()
Последнее исправление: whbex (всего исправлений: 2)
Ответ на: комментарий от whbex

правильнее сказать - до 15% просадка производительности, и далеко не везде, и не везде она вообще есть. эта карта представляет интерес только как sff решение, все. откуда столько бомбящих на нее анонов - понятия не имею.

vvviperrr ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Gigabyte B550I

да, жалко было тратить asus x570i strix под эту игрушку. у меня была гига x570i, проблемная. эта вроде норм.

DEEPCOOL AN600

да, первый раз его взял. так бы поставил big shuriken 3, но не было под рукой. родной вент очень даже тихий.

Высокие модули памяти не влезут, насколько я вижу

ballistix скорее всего влезут. с подсветкой точно нет. да и кулер накрывает память частично

vvviperrr ★★★★★
() автор топика
Последнее исправление: vvviperrr (всего исправлений: 1)