LINUX.ORG.RU

AMDGPU + OpenCL Ubuntu 20.04LTS

 , ,


2

2

Обновил заголовок, проблема оказалась системной хотя изначально проявилась в Resolve, но в блендере то-же пичаль.
RX570 + Ubuntu 20.04 LTS + radeonsi + OpenCL из amdgpu-pro = ПИЧАЛЬКА :-(

Логи:

glxinfo -B
name of display: :0
display: :0  screen: 0
direct rendering: Yes
Extended renderer info (GLX_MESA_query_renderer):
    Vendor: X.Org (0x1002)
    Device: Radeon RX 570 Series (POLARIS10, DRM 3.38.0, 5.8.0-48-generic, LLVM 11.0.0) (0x67df)
    Version: 20.2.6
    Accelerated: yes
    Video memory: 4096MB
    Unified memory: no
    Preferred profile: core (0x1)
    Max core profile version: 4.6
    Max compat profile version: 4.6
    Max GLES1 profile version: 1.1
    Max GLES[23] profile version: 3.2
Memory info (GL_ATI_meminfo):
    VBO free memory - total: 2861 MB, largest block: 2861 MB
    VBO free aux. memory - total: 4027 MB, largest block: 4027 MB
    Texture free memory - total: 2861 MB, largest block: 2861 MB
    Texture free aux. memory - total: 4027 MB, largest block: 4027 MB
    Renderbuffer free memory - total: 2861 MB, largest block: 2861 MB
    Renderbuffer free aux. memory - total: 4027 MB, largest block: 4027 MB
Memory info (GL_NVX_gpu_memory_info):
    Dedicated video memory: 4096 MB
    Total available memory: 8192 MB
    Currently available dedicated video memory: 2861 MB
OpenGL vendor string: X.Org
OpenGL renderer string: Radeon RX 570 Series (POLARIS10, DRM 3.38.0, 5.8.0-48-generic, LLVM 11.0.0)
OpenGL core profile version string: 4.6 (Core Profile) Mesa 20.2.6
OpenGL core profile shading language version string: 4.60
OpenGL core profile context flags: (none)
OpenGL core profile profile mask: core profile

OpenGL version string: 4.6 (Compatibility Profile) Mesa 20.2.6
OpenGL shading language version string: 4.60
OpenGL context flags: (none)
OpenGL profile mask: compatibility profile

OpenGL ES profile version string: OpenGL ES 3.2 Mesa 20.2.6
OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20
sudo lshw -c video
[sudo] password for orlovsn: 
  *-display                 
       description: VGA compatible controller
       product: Ellesmere [Radeon RX 470/480/570/570X/580/580X/590]
       vendor: Advanced Micro Devices, Inc. [AMD/ATI]
       physical id: 0
       bus info: pci@0000:01:00.0
       logical name: /dev/fb0
       version: ef
       width: 64 bits
       clock: 33MHz
       capabilities: pm pciexpress msi vga_controller bus_master cap_list rom fb
       configuration: depth=32 driver=amdgpu latency=0 mode=1600x1200 visual=truecolor xres=1600 yres=1200
       resources: iomemory:210-20f iomemory:200-1ff irq:159 memory:2100000000-21ffffffff memory:2080000000-20801fffff ioport:e000(size=256) memory:dfe00000-dfe3ffff memory:c0000-dffff
clinfo (c 20.50)
Number of platforms                               1
  Platform Name                                   AMD Accelerated Parallel Processing
  Platform Vendor                                 Advanced Micro Devices, Inc.
  Platform Version                                OpenCL 2.1 AMD-APP (3224.4)
  Platform Profile                                FULL_PROFILE
  Platform Extensions                             cl_khr_icd cl_amd_event_callback cl_amd_offline_devices 
  Platform Host timer resolution                  1ns
  Platform Extensions function suffix             AMD

  Platform Name                                   AMD Accelerated Parallel Processing
Number of devices                                 1
  Device Name                                     Ellesmere
  Device Vendor                                   Advanced Micro Devices, Inc.
  Device Vendor ID                                0x1002
  Device Version                                  OpenCL 1.2 AMD-APP (3224.4)
  Driver Version                                  3224.4
  Device OpenCL C Version                         OpenCL C 1.2 
  Device Type                                     GPU
  Device Board Name (AMD)                         Radeon RX 570 Series
  Device Topology (AMD)                           PCI-E, 01:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes

В блендере CL валится так:

Read prefs: /home/orlovsn/.config/blender/2.92/config/userpref.blend
LLVM triggered Diagnostic Handler: Illegal instruction detected: VOP* instruction violates constant bus restriction
renamable $vgpr4 = V_CNDMASK_B32_e32 32768, killed $vgpr5, implicit killed $vcc, implicit $exec
LLVM failed to compile shader
radeonsi: can't compile a main shader part
LLVM triggered Diagnostic Handler: Illegal instruction detected: VOP* instruction violates constant bus restriction
renamable $vgpr2 = V_CNDMASK_B32_e32 32768, killed $vgpr2, implicit killed $vcc, implicit $exec
LLVM failed to compile shader
radeonsi: can't compile a main shader part

в Resolve инициализация проходит:

0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,736 | Starting GPUDetect 1.1_2-a16
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 | Done in 42 ms.
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 | Detected System:
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 |   - OS: Linux Ubuntu 20.04.2 LTS
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 |   - Model: ASUSTeK TUF Z370-PRO GAMING
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 |   - System ID: a053c830c13a45748cf7a9521a284462
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 |   - CPU: Intel Core i7-8700K, 12 threads, x86-64
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 |   - RAM: 1.9 GiB used of 47.0 GiB
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,778 | Detected 1 GPUs:
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,888 |   - "AMD Radeon RX 570 Series" (gpu:c558db0c.f91e8f0c) <- Main Display GPU
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,888 |     Discrete, 103 MiB used of 3.4 GiB VRAM, PCI:1:0.0
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,888 |     Matches: OpenCL, XOrg
0x7f1391b10640 | GPUDetect            | INFO  | 2021-03-26 19:24:46,888 | Detected 1 monitors:
0x7f1391b10640 | Main.GPUConfig       | INFO  | 2021-03-26 19:24:46,889 | Compute API set to automatic, defaulting to OpenCL.
0x7f1391b10640 | Main.GPUConfig       | INFO  | 2021-03-26 19:24:46,889 | Selected compute API: OpenCL
0x7f1391b10640 | Main.GPUConfig       | INFO  | 2021-03-26 19:24:46,889 | Automatic GPU Selection:
0x7f1391b10640 | Main.GPUConfig       | INFO  | 2021-03-26 19:24:46,889 |   - "AMD Radeon RX 570 Series" (gpu:c558db0c.f91e8f0c)
0x7f1391b10640 | IO                   | INFO  | 2021-03-26 19:24:46,889 | RED InitializeSdk with library path at /opt/resolve/libs
0x7f1391b10640 | IO                   | INFO  | 2021-03-26 19:24:46,924 | R3DAPI 8.0.0-49A09 (20201217 Lx64S) R3DSDK 8.0.0-49A09 (20201217 Lx64D C3B1) RED OPENCL 8.0.0-50396 (20201217) [/opt/resolve/libs/] init is successful

но при первом же вызове интеропа валится так:

0x7f1391b10640 | UI.GLContext         | INFO  | 2021-03-26 19:24:47,371 | Creating shared OpenGL context for this thread (1 total).
0x7f1391b10640 | UI.GLContext         | INFO  | 2021-03-26 19:24:47,374 | Initialized OpenGL 4.6 (requested 2.0) on device 'X.Org Radeon RX 570 Series (POLARIS10, DRM 3.38.0, 5.8.0-48-generic, LLVM 11.0.0)'
0x7f1350415700 | GPU.MultiBoardMgr    | INFO  | 2021-03-26 19:24:47,374 | Initializing OpenCL board manager for Main Display GPU gpu:c558db0c.f91e8f0c.
0x7f133201a700 | UI.GLContext         | INFO  | 2021-03-26 19:24:47,374 | Creating shared OpenGL context for this thread (2 total).
0x7f133201a700 | DVIP                 | ERROR | 2021-03-26 19:24:47,541 | Failed to create OpenCL context:

DVIP Exception: OpenCL error
 - API: OpenCL
 - API Error Code: Unknown CL error. (-1000)
 - Call stack:
   1   resolve                                 0x6c9ca72 
   2   resolve                                 0x6d29bd1 
   3   resolve                                 0x6d2926a 
   4   resolve                                 0x6d282f0 
   5   resolve                                 0x6d0cea9 
   6   resolve                                 0x6d10eff 
   7   resolve                                 0x5d8d35e 
   8   resolve                                 0x5d8f420 
   9   resolve                                 0x5d8f96d 
   10  resolve                                 0x5d956c5 
   11  libpthread.so.0                    0x7f13bdce6609 
   12  libc.so.6                          0x7f13a0196293 



==========[CRASH DUMP]==========
#TIME Fri Mar 26 19:24:47 2021 - Uptime 00:00:00 (hh:mm:ss)
#PROGRAM_NAME DaVinci Resolve Studio v17.1.0.0024 (Linux/Clang x86_64)
#BMD_ARCHITECTURE x86_64
#BMD_BUILD_UUID 912a4373-f5b5-4e54-9fc6-b9efab4f47f6
#BMD_GIT_COMMIT 5b371db7cafb184ffaac29f3843b849f765fc644
#BMD_UTIL_VERSION 17.1.0.0024
#OS Linux

/opt/resolve/bin/resolve() [0x47f2969]
/opt/resolve/bin/resolve() [0x47f1b68]
/lib/x86_64-linux-gnu/libpthread.so.0(+0x153c0) [0x7f13bdcf23c0]
/opt/resolve/bin/resolve() [0x5d8d37e]
/opt/resolve/bin/resolve() [0x5d8f420]
/opt/resolve/bin/resolve() [0x5d8f96d]
/opt/resolve/bin/resolve() [0x5d956c5]
/lib/x86_64-linux-gnu/libpthread.so.0(+0x9609) [0x7f13bdce6609]
/lib/x86_64-linux-gnu/libc.so.6(clone+0x43) [0x7f13a0196293]
Signal Number = 11

Если даунгрейдить CL до 20.40 (в раче говорят 20.50 бывает поломан для полярисов а 20.45 сегфолтится на ровном месте) то всё то-же самое, цл при этом меняется:

clinfo 
Number of platforms                               1
  Platform Name                                   AMD Accelerated Parallel Processing
  Platform Vendor                                 Advanced Micro Devices, Inc.
  Platform Version                                OpenCL 2.1 AMD-APP (3180.7)
  Platform Profile                                FULL_PROFILE
  Platform Extensions                             cl_khr_icd cl_amd_event_callback cl_amd_offline_devices 
  Platform Host timer resolution                  1ns
  Platform Extensions function suffix             AMD

  Platform Name                                   AMD Accelerated Parallel Processing
Number of devices                                 1
  Device Name                                     Ellesmere
  Device Vendor                                   Advanced Micro Devices, Inc.
  Device Vendor ID                                0x1002
  Device Version                                  OpenCL 1.2 AMD-APP (3180.7)
  Driver Version                                  3180.7
  Device OpenCL C Version                         OpenCL C 1.2 
  Device Type                                     GPU
  Device Board Name (AMD)                         Radeon RX 570 Series
  Device Topology (AMD)                           PCI-E, 01:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes
  Compiler Available                              Yes
  Linker Available                                Yes

п.с. на полном стеке amdgpu-pro openCL работает, но немного придурковато:

Хотца обновить резолв до 17ки, два gpu на выбор - 570 в pci-e и родная блекмеджиковская 580 через tb
Пробовал следующее:

  1. RHEL8.3 + AMDGPU-PRO 20.50 + Resolve Studio 17.1 = максимально приближенный к официальному конфигу вариант
    Резолв не может показать «вводный тур» (формально он при этом диагностит гпу и выставляет настройки по нему, но их все можно потом ручками выставить), но запускается ок.
    Проблемы:
  • переодически падает на ровном месте, в логах ничего толкового
  • пропуск кадров при обработке - т.е. покрасили клип, начинаем его играть - в среднем раз-два за секунду проскакивает кадр без применения покраски, притом фиг бы ты с ним в просмотре, при экспорте аналогично в итоговом файле
  • в fairlight не видно треков - черная дыра вместо таймлайна (известная проблема при пользовании gl из pro дров)
  1. Ubuntu 20.04LTS + AMDGPU-PRO 20.50:
    всё то-же самое только вроде не падает особо
  2. Ubuntu 20.04LTS + AMDGPU/RadeonSI (пробовал и с комплектными из бубунты и с не-про с сайта) + OpenCL от AMDGPU-PRO 20.50:
  • в fairlight появляется таймлайн, всё по звуку работает огонь

  • но видео не работает вообще - даже если просто кинуть на голый таймлайн генератор сигнала то его не видно нигде, в логах GLInterop не работает т.к. в самом начале инициализации OpenCL падает с «unknown error -1000»
    CL накатывал через amdgpu-pro-install –opencl=legacy –headless (пробовал и rocr доставлять но смысла от этого вроде нет)
    при этом clinfo говорит что используется именно амуде цл, а glxinfo говорит что используется именно X.org

  • под виндой на этой-же машине всё ок, именно с 17.1 и именно с 570

  • если воткнуть 3060 и накатить дрова невидии то вроде то-же всё ок

т.е. проблема исключительно в районе amdgpu притом похоже что и с GL (черный феирлайт) и с CL (пропуск обработки)
но хотелось бы запустить эту машинку именно на 570 или 580 ибо 3060 для другой машинки

★★★★

Последнее исправление: rukez (всего исправлений: 1)

Я. По 3 варианту: проверяй работоспособность opencl на чем-нибудь ещё, например blender или luxmark. Возможно он установился некорректно.

Khnazile ★★★★★
()
Последнее исправление: Khnazile (всего исправлений: 1)

Что говорит поддержка Blackmagic Design?

athost ★★★★★
()
Ответ на: комментарий от Khnazile

По 3 варианту: проверяй работоспособность opencl на чем-нибудь ещё, например blender или luxmark. Возможно он установился некорректно.

сегодня еще погоняю но вроде всё корректно встаёт
кстати, а как наиболее правильно вернуться от amdgpu-pro к amdgpu, после выполнения amdgpu-pro-uninstall? возможно косят на стороне GL а не CL

Что говорит поддержка Blackmagic Design?

что поддерживается только центось 7.3
но если я им напишу что поменял 8.3 на 7.3 и один фиг печаль, то они напишут что амуде под линуксом не поддерживается, хотя на оф сайте поддержка амд заявлена - это мы уже проходили когда в 16.1 начали пропадать куски интерфейса (тот-же самый феирлайт)

rukez ★★★★
() автор топика
Ответ на: комментарий от Khnazile

Я. По 3 варианту: проверяй работоспособность opencl на чем-нибудь ещё, например blender или luxmark. Возможно он установился некорректно.

Бинго, и вправду не работает
ПАМАГИТИ!11
попробовал даунгредить 20.50 до 20.40 - фиг, те-же грабли
пробовал ставить скриптиком отсюда, на случай если чего не корректно прошка ставит: https://gist.github.com/kytulendu/3351b5d0b4f947e19df36b1ea3c95cbe но всё один в один

rukez ★★★★
() автор топика
Ответ на: комментарий от timdorohin

ТС, кстати да, попробуй поставить ROCm и rocm-opencl, иначе у тебя будет только OpenCL 1.2

Накатил, есть сподвижки:

/opt/rocm/bin/rocminfo
ROCk module is loaded
Unable to open /dev/kfd read-write: Permission denied
orlovsn is member of render group
sudo /opt/rocm/bin/rocminfo
ROCk module is loaded
=====================    
HSA System Attributes    
=====================    
Runtime Version:         1.1
System Timestamp Freq.:  1000.000000MHz
Sig. Max Wait Duration:  18446744073709551615 (0xFFFFFFFFFFFFFFFF) (timestamp count)
Machine Model:           LARGE                              
System Endianness:       LITTLE                             

==========               
HSA Agents               
==========               
*******                  
Agent 1                  
*******                  
  Name:                    Intel(R) Core(TM) i7-8700K CPU @ 3.70GHz

бла-бла-бла

*******                  
Agent 2                  
*******                  
  Name:                    gfx803                             
  Uuid:                    GPU-XX                             
  Marketing Name:          Ellesmere [Radeon RX 470/480/570/570X/580/580X/590]
  Vendor Name:             AMD                                
  Feature:                 KERNEL_DISPATCH                    
  Profile:                 BASE_PROFILE                       
  Float Round Mode:        NEAR                               
  Max Queue Number:        128(0x80)                          
  Queue Min Size:          4096(0x1000)                       
  Queue Max Size:          131072(0x20000)                    
  Queue Type:              MULTI                              
  Node:                    1                                  
  Device Type:             GPU                                
  Cache Info:              
    L1:                      16(0x10) KB                        
  Chip ID:                 26591(0x67df)                      
  Cacheline Size:          64(0x40)                           
  Max Clock Freq. (MHz):   1244                               
  BDFID:                   256                                
  Internal Node ID:        1                                  
  Compute Unit:            32                                 
  SIMDs per CU:            4                                  
  Shader Engines:          4                                  
  Shader Arrs. per Eng.:   1                                  
  WatchPts on Addr. Ranges:4                                  
  Features:                KERNEL_DISPATCH 
  Fast F16 Operation:      FALSE                              
  Wavefront Size:          64(0x40)                           
  Workgroup Max Size:      1024(0x400)                        
  Workgroup Max Size per Dimension:
    x                        1024(0x400)                        
    y                        1024(0x400)                        
    z                        1024(0x400)                        
  Max Waves Per CU:        40(0x28)                           
  Max Work-item Per CU:    2560(0xa00)                        
  Grid Max Size:           4294967295(0xffffffff)             
  Grid Max Size per Dimension:
    x                        4294967295(0xffffffff)             
    y                        4294967295(0xffffffff)             
    z                        4294967295(0xffffffff)             
  Max fbarriers/Workgrp:   32                                 
  Pool Info:               
    Pool 1                   
      Segment:                 GLOBAL; FLAGS: COARSE GRAINED      
      Size:                    4194304(0x400000) KB               
      Allocatable:             TRUE                               
      Alloc Granule:           4KB                                
      Alloc Alignment:         4KB                                
      Accessible by all:       FALSE                              
    Pool 2                   
      Segment:                 GROUP                              
      Size:                    64(0x40) KB                        
      Allocatable:             FALSE                              
      Alloc Granule:           0KB                                
      Alloc Alignment:         0KB                                
      Accessible by all:       FALSE                              
  ISA Info:                
    ISA 1                    
      Name:                    amdgcn-amd-amdhsa--gfx803          
      Machine Models:          HSA_MACHINE_MODEL_LARGE            
      Profiles:                HSA_PROFILE_BASE                   
      Default Rounding Mode:   NEAR                               
      Default Rounding Mode:   NEAR                               
      Fast f16:                TRUE                               
      Workgroup Max Size:      1024(0x400)                        
      Workgroup Max Size per Dimension:
        x                        1024(0x400)                        
        y                        1024(0x400)                        
        z                        1024(0x400)                        
      Grid Max Size:           4294967295(0xffffffff)             
      Grid Max Size per Dimension:
        x                        4294967295(0xffffffff)             
        y                        4294967295(0xffffffff)             
        z                        4294967295(0xffffffff)             
      FBarrier Max Size:       32                                 
*** Done ***         
/opt/rocm/opencl/bin/clinfo
dlerror: libamdocl-orca32.so: cannot open shared object file: No such file or directory
Number of platforms:				 1
  Platform Profile:				 FULL_PROFILE
  Platform Version:				 OpenCL 2.1 AMD-APP (3180.7)
  Platform Name:				 AMD Accelerated Parallel Processing
  Platform Vendor:				 Advanced Micro Devices, Inc.
  Platform Extensions:				 cl_khr_icd cl_amd_event_callback cl_amd_offline_devices 


  Platform Name:				 AMD Accelerated Parallel Processing
Number of devices:				 1
  Device Type:					 CL_DEVICE_TYPE_GPU
  Vendor ID:					 1002h
  Board name:					 Radeon RX 570 Series
  Device Topology:				 PCI[ B#1, D#0, F#0 ]
  блаблабла

Из под пользователя резолв ведёт себя как раньше, а вот из под рута в настройках GPU появилась вторая 570 с более полным описанием и с указанием 4Гб памяти (у первой видимо только свободная отображается - обычно около 2.5Гб), если оставить только новую то появляются черные окошки где должно быть видео (до установки rocm они вообще не появлялись) но само видео не выводится и через 20-30 секунд резолв падает с «ваша память гпу тю-тю» на пустом проекте с одним добавленным генератором

пойду попробую вернуть 20.50, может поможет побороть libamdocl-orca32.so
и заодно вопрос - rocm’у только группа render нужна или еще чего? он kfd из под пользователя и не должен видеть?

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

Заранее говорю, я не знаю, какие именно пакеты надо ставить, т.к. я вручную натягивал amd-шный opencl на несовместимый дистрибутив. Я делал так: брал драйвер amdgpu-pro 20.40, и из него брал следующие файлы

библиотеки:
/opt/amdgpu-pro/lib64/libamdocl64.so
/opt/amdgpu-pro/lib64/libamd_comgr.so
/opt/amdgpu-pro/lib64/libamd_comgr.so.1.7.0

конфиги:
/etc/OpenCL/vendors/amdocl64.icd

Далее, из репозитоия ставил пакет libopencl1 (libopencl.so.1) и clinfo.
Весь остальной стек был от Mesa.
Важно: не ставь реализацию opencl из Mesa (clover), она недоделанная, и для работы драйвера из состава amdgpu-pro не нужна.


После этих манипуляций у меня заработал opencl в Blender и в luxmark

Khnazile ★★★★★
()
Ответ на: комментарий от rukez

rocm я ставил отдельно от дров, пришлось его грохнуть т.к. оно конфликтует с дровами оказывается :-)
воткнул 20.50 дрова с –opencl=legacy, rocm –headless
теперь:

dlerror: libamdocl-orca32.so: cannot open shared object file: No such file or directory
Number of platforms                               1
  Platform Name                                   AMD Accelerated Parallel Processing
  Platform Vendor                                 Advanced Micro Devices, Inc.
  Platform Version                                OpenCL 2.1 AMD-APP (3224.4)
  Platform Profile                                FULL_PROFILE
  Platform Extensions                             cl_khr_icd cl_amd_event_callback cl_amd_offline_devices 
  Platform Host timer resolution                  1ns
  Platform Extensions function suffix             AMD

  Platform Name                                   AMD Accelerated Parallel Processing
Number of devices                                 1
  Device Name                                     Ellesmere
  Device Vendor                                   Advanced Micro Devices, Inc.
  Device Vendor ID                                0x1002
  Device Version                                  OpenCL 1.2 AMD-APP (3224.4)
  Driver Version                                  3224.4
  Device OpenCL C Version                         OpenCL C 1.2 
  Device Type                                     GPU
  Device Board Name (AMD)                         Radeon RX 570 Series

т.е. есть 2.1 но нет 32бит … АРГХ!111

sudo apt install opencl-orca-amdgpu-pro-icd
Reading package lists... Done
Building dependency tree       
Reading state information... Done
opencl-orca-amdgpu-pro-icd is already the newest version (20.50-1234664).
0 upgraded, 0 newly installed, 0 to remove and 2 not upgraded.

ПАМАГИТИ!

rukez ★★★★
() автор топика
Ответ на: комментарий от Khnazile

Спасибо, видимо я рокм наворачивал 4ый, который не умеет в 5хх, надо попробовать 3.5.1

А пока вопрос - а нужен вообще legacy, который 1.2?

Я просто если правильно понял, то возможные комбинации это:

  • rocm отдельно 3.5.1 через репку амд
  • rocm отдельно или с легаси из про-дров

первый вариант вроде как требует только сток ядро (по крайней мере тута так написано: https://github.com/boriswinner/RX580-rocM-tensorflow-ubuntu20.4-guide ) но при этом более прозрачен (ну и резолв его попытался похватить)

Вообщем яб давно забил но уже интересно стало :-)

rukez ★★★★
() автор топика
Ответ на: комментарий от LongLiveUbuntu

Ну ты понял

Жаба говорит нет, я на одну 3060 в основную машину еле еле раздушился по нынешним ценам, а в этой машинке и 570 реально хватало, прост под линухом мне знамо удобнее проекты вести параллельно чем под виндой - видео и блендер это так, дурость по сути :-)

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

У меня легаси 2.1 показывает. Но вообще, как я понял, 2.x и не нужен особо, т.к. по факту его ни один драйвер не поддерживает в полном объеме, и opencl 3.0, это по факту откат до проапгреженного 1.2.

В целом, как я понял, rocm он больше для тех, кто хочет разрабатывать софт для вычислений на gpu, а если ты хочешь только исполнять, то тебе достаточно крохотного рантайма.

Khnazile ★★★★★
()
Ответ на: комментарий от Khnazile

Попробовал накатить рокм 3.5.1 на актуальное 5.8 ядро - фиг, не собралось
Даунгрейднул ядро до сток 5.4
рокм собрался

rocminfo
ROCk module is loaded
Able to open /dev/kfd read-write
=====================    
HSA System Attributes    
=====================    
Runtime Version:         1.1
System Timestamp Freq.:  1000.000000MHz
Sig. Max Wait Duration:  18446744073709551615 (0xFFFFFFFFFFFFFFFF) (timestamp count)
Machine Model:           LARGE                              
System Endianness:       LITTLE     
*******                  
Agent 2                  
*******                  
  Name:                    gfx803                             
  Uuid:                    GPU-XX                             
  Marketing Name:          Ellesmere [Radeon RX 470/480/570/570X/580/580X/590]
  Vendor Name:             AMD                                
  Feature:                 KERNEL_DISPATCH                    
  Profile:                 BASE_PROFILE                       
  Float Round Mode:        NEAR                               
  Max Queue Number:        128(0x80)                          
  Queue Min Size:          4096(0x1000)                       
  Queue Max Size:          131072(0x20000)                    
  Queue Type:              MULTI                              
  Node:                    1                                  
  Device Type:             GPU                                

в блендере всё по старому не работает с тем-же выхлопом, в резолве в выхлопе больше нет ошибок (внезапно, вообще нет - ни цл не валится ни интероп) но один фиг нифига не работает - черные окошки вместо видео и то через раз

я устал, я мухожук

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

напоследок заценил связку 5.4.0-42 + полный стек pro:

  • блендер таки отрисовал одну картинку не ругаясь вообще, но за ровно те-же 26 секунд что и на проце, что намекает (в настройках выбран гпу, в рендере то-же гпу, mesa-opencl-icd не установлен)
    со второй попытки просто упал в сегфолт:
Read prefs: /home/orlovsn/.config/blender/2.92/config/userpref.blend
Read blend: /home/orlovsn/Documents/Blender/fenceAni2.blend
Cycles: compiling OpenCL program base...
Cycles: compiling OpenCL program background...
Kernel compilation of base finished in 0.40s.
Segmentation fault (core dumped)
Cycles: compiling OpenCL program background...
Writing: /tmp/fenceAni2.crash.txt
Segmentation fault (core dumped)
  • в резолве видео отображается но в фейрлайте черная дыра
  • в целом ОСь явно менее отзывчива визуально

п.с. убунта очень порадовала тем что ни разу не упала за три дня активной любли, единственный нюанс - вынос модулей для вафли и гпу в пакет modules-extra, который не подхватывается автоматом это некоторый удар серпом в моё яйко :-)

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

блендер таки отрисовал одну картинку не ругаясь вообще, но за ровно те-же 26 секунд что и на проце, что намекает

На одних и тех же (дефолтных) настройках рендера, на GPU было бы даже медленнее, чем на CPU. Чтобы была разница нужно ручки крутить. Но раз разницы нет, видимо и правда не работает.

Khnazile ★★★★★
()
Ответ на: комментарий от LongLiveUbuntu

Возьми 16-ю серию, не обязательно брать монстра. Хотя смотри сам.

На основной машине уже обновил 16 на 17, удобней когда можно таскать проекты туда-сюда.
Ну и в целом чёрная дыра началась с 16.1 т.е. для полноценной работы на про-стеке надо откатываться на довольно багованный 16.0

rukez ★★★★
() автор топика
Ответ на: комментарий от Khnazile

На одних и тех же (дефолтных) настройках рендера, на GPU было бы даже медленнее, чем на CPU. Чтобы была разница нужно ручки крутить. Но раз разницы нет, видимо и правда не работает.

Ага, совпадают до десятых секунды все три варианта - рендер на цпу, типа рендер на гпу на про-стеке и рендер на гпу с отвалом опенцл на микс-стеке

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

Удалось хотя-бы починить феирлайт в свежих 16, вдруг кому надо, рецепт для убунты 20.04:

  • оставляем штатный amdgpu
  • ставим дрова 20.40 (на 20.50 чот проблемно, 20.45 говорят работает но в другом месте говорят через опу, я пока на 20.40 сразу откатился) sudo ./amdgpu-install -y –opencl=legacy –no-dkms –headless ибо pal на 5х0 нафиг не сдался
  • качаем резолв с сайта, 17 мимо, нужен последний из 16 (16.2.8 у меня)
  • собираем деб скриптом отсюда https://www.danieltufvesson.com/makeresolvedeb ибо это только 17ый умеет из коробки в дебианы (хотя и нигде не написано но реально умеет)
  • качаем вот этот патч: https://github.com/h33p/resolve-amdocl-fix и читаем как его пользовать
  • ну и бонусом для hidpi экранов накидываем QT_DEVICE_PIXEL_RATIO=2 QT_AUTO_SCREEN_SCALE_FACTOR=true
  • потом идём в настройки графония в самом резолве и снимаем галку с gpu for waveforms (или чот подобное, вообщем отключаем отрисовку показометров на гпу иначе хрен вам а не парад и спектроскоп), логично сразу прописать в настройках место куда класть кеш ибо по дефолту его резолв под линухом вообще не прописывает

при первом запуске будет черный экран - это нормально, у меня приветствие ни разу не отображалось вообще никогда на амуде, надо прибить процесс (ну или через терминал стартовать и по ктрл+це жмакнуть) и перезапустить

п.с. 17.1 так не работает - GL не подхватывается и соотв. пустые места вместо видео + бонусом не отключить гпу для показометров (по крайней мере нет такого в меню больше)

rukez ★★★★
() автор топика
Последнее исправление: rukez (всего исправлений: 1)
Ответ на: комментарий от LittleKawaiiNeko

Я так понял что обосрались все:

  • блендер 2.91 не работает с амуде даже на про-стеке
  • резолв 17.1 работает с амуде только на про-стеке и только с глюками
  • резолв 16.2 работает с микс-стеком но с небольшими костылями, которые исправляют несовместимость амдгпу гл с амдгпу-про цл

Вообщем некоторый ад и израиль, благо хоть новые проекты можно стартовать в 16.2 и из 17 перекинуть уже готовые фьюжен заготовки

С другой стороны, под виндой у меня резолв тоже не эталон стабильности - не вылетает вообще но экспортировать тяжёлые 4к ролики может только на свеже открытом приложении, если поработать немного в таймлайне то экспорт наиболее вероятно упокоится на первом фьюжен блоке

rukez ★★★★
() автор топика
Ответ на: комментарий от rukez

Как я тебя понимаю. У меня 2 года экспериментов с OpenCL красных. Постоянные проблемы. Теперь только карты от Nvidia буду брать.

anonymous
()
Ответ на: комментарий от anonymous

С невидией у меня никогда не было проблем - декодеры/энкодеры так вообще эталон (стабильности, не качества), но один нюанс - что под линухом что под виндой у меня на невидиях вечное ощущение что появляется лаг картинки, притом это с дремучих времён и до последних карт.
В играх/кино не заметно, а вот просто в операционке прям в глаза бросается, особенно на фоне идеально плавного мака :-(
С другой стороны opencl и невидия умеет, да и один фиг сейчас почти все под куду оптимизировано так что да, в амуде смысла ноль остаётся, тем более что интерфейс можно на встройку подоткнуть

rukez ★★★★
() автор топика
Ответ на: комментарий от anonymous

Как я тебя понимаю. У меня 2 года экспериментов с OpenCL красных. Постоянные проблемы. Теперь только карты от Nvidia буду брать.

это по ходу единственный правильный путь

купил ноут с Т1000/4Гб, пихнул диск с убунтой из компа с амуде, дрова амуде грохнул, на невидию накатил с сайта:

  • резолв 17.1 встал и из коробки заработал. вообще без головняков - фейрлайт работает, куда сама подцепилась (притом даже до того как я сообразил её поставить, лол, правда резолв сразу падал пытаясь её поиметь - пришлось таки постаивить :-D )
  • таймлайн с 10750/Т1000 заметно быстрее чем на 8700к/570, фьюжн вставки прям очень быстрее, 4к вполне рабочие, с прокси так вообще летает всё
  • экспорт … н264 аппаратный чот у меня с первого раза упоролся об первую фьюжн вставку, а вот н265 аппаратный прям воу-воу разогнался - ролик, который 570+8700к считали под полной нагрузкой 10-20 минут, тут считается 1 минуту и при этом вентиляторы даже не успевают включиться о_О

но теперь новый вопрос - под линухом реально подцепить ртх5000 через егпу? брать её в ноуте смысла не было (110Вт лимит при 200-250Вт у полноценной при условии что в ноуте она допом стоила как дискретка+егпу на выбор)

rukez ★★★★
() автор топика
1 февраля 2022 г.
Ответ на: комментарий от anonymous

Если используешь ixgbe из ядра и проприетарные дрова NVIDIA будут траблы с сетевухами, которые ixgbe юзают. проприетарные дрова NVIDIA надо устанавливать в таком случае без CUDA. На девелоперском сайте NVIDIA есть топик как сделать. Такая беда была с 1030,1650,2080супер Еще - у меня дрова NVIDIA каким-то образом мешали работать встроенной выдяхе ASPEED. Вроде конфиг иксовый требовалось ручками настраивать, чтобы обе работать могли, забил на это.

Поставил видео от красных, проблемы нет.

klimi
()
Ответ на: комментарий от klimi

ixgbe

оно в ноутах разве часто встречается?

проприетарные дрова NVIDIA надо устанавливать в таком случае без CUDA

зачем мне невидия без куды? я лучше сетевушку поменяю :-)

мешали работать встроенной выдяхе ASPEED

у меня вроде такая в компе с 3070 но я даже и не думал пробовать её включать :-)
кстати там и 10ти гбитки интеловские, проблем ноль под ораклом 8.3: Fresh stable (Oracle Linux + свежий софт)

rukez ★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.