LINUX.ORG.RU

Состоялся релиз Rocm 3.8.0

 , ,


0

2

RadeonOpenCompute — это свободный набор драйверов, библиотек и утилит для реализации OpenCL и технологий машинного обучения для платформ на базе видеокарт AMD. Развивается компанией AMD.

Набор включает в себя модуль ядра rock-dkms, компиляторы HCC, HIP и версию rocm-clang-ocl, библиотеки для поддержки OpenCL, наборы библиотек и примеров для реализации базовых алгоритмов машинного обучения.

В новом выпуске:

  • Поддержка новых видеокарт на базе Vega20 7nm
  • Поддержка Ubuntu 20.04/18.04, RHEL/Centos 7.8 и 8.2, SLES15
  • Новая библиотека hipfort для поддержки ускорения вычислений на видеокартах для языка Fortran
  • ROCm Data Cetner Tool — новая утилита для мониторинга видеокарт и выполняемых на них задач
  • Появилась возможность статически линковать библиотеки ROCm в приложениях
  • Видеокарты GFX9 (Radeon Vega 56/64, Radeon VII) теперь не требуют поддержки PCIe Atomics, а значит, могут работать на более широком спектре процессоров и материнских плат
  • Видеокарты GFX9 могут работать через интерфейс Thunderbolt

Внимание! Обновление с предыдущих версий не поддерживается! Вам необходимо полностью удалить предыдущие версии ROCm перед установкой ROCm 3.8.0!

>>> Подробности

★★★★★

Проверено: leave ()
Ответ на: комментарий от Aceler

Ты походу в курсе ситуации. И че там с этим шлангом? Они хоть работают или просто таск сформировали и забили? Я видел как минимум любительских проекта по добавлению поддержки нави еще в 2019 году. Неужто все утихло?

anonymous
()
Ответ на: комментарий от anonymous

HCC уже объявили deprecated, поэтому деваться им некуда.

Aceler ★★★★★
() автор топика

Оно же только чтоб хеши считать и то не нужно? Или там уже что-то есть работающее из pytorch / tensorflow на карточках адекватной мощности? (сравнимой хотя б с каким-нибудь gtx1070)

ei-grad ★★★★★
()
Ответ на: комментарий от ei-grad

Есть только старые бенчи, в которых Vega64 примерно на уровне GTX1070. Я, правда, не нашёл, сколько сейчас стоит Vega64, чтобы сравнить, на сколько это адекватно по сравнению с GTX, плюс, в старых бенчах используется ROCm, прости господи, 2.0, поэтому они наверняка неактуальны.

Ну и планируемый переход на clang, он, в общем-то, ради производительности и возможности прямого запуска приложений CUDA, и задумывался.

Aceler ★★★★★
() автор топика
Последнее исправление: Aceler (всего исправлений: 1)
Ответ на: комментарий от Aceler

В игровой производительности Vega 64 равна GTX 1080. В вычислениях, думаю, должна быть производительней.

anonymous
()

поддержка OpenCL

Дает ли эта штука поддержку OpenCL в системе? То есть можно ли ее ставить вместо amdgpu-pro, чтобы ее обнаружили сторонние программы, например, darktable?

BigSerpent ★★
()
Ответ на: поддержка OpenCL от BigSerpent

Эта штука альтернатива OpenCL. Или он, или рокм.

anonymous
()
Ответ на: комментарий от anonymous

Под виндой — да. У ROCm ещё есть запас, куда расти.

Но это старые бенчи, повторюсь, кто знает, что там в 3.8.0.

Aceler ★★★★★
() автор топика
Ответ на: поддержка OpenCL от BigSerpent

Да, конечно, я её только ради этого и использую.

Более того, можно поставить только поддержку OpenCL, не устанавливая всякие HIP, HCC и прочие немаленькие библиотеки. HCC, например, весит 300Мб O_o

Aceler ★★★★★
() автор топика

Один из самых, пожалуй, интересных инструментов в ROCm начиная с версии 3.0 это появление компилятора AOMP. Позволяет, так же, как и библиотека OpenMP, распараллелить вычисления. Только OpenMP распределяет нагрузку по имеющимся ядрам CPU (ну 4 .. 16 потоков на среднем ПК), а AOMP создаёт бинарник платформы amdgcn и позволяет распределить вычисления на все шейдерные процессоры GPU (2048 и более), т.е. вычисления ускоряются многократно, причем даже без применения выч.кластеров MPI. Да, написание кода на C специфично, но гораздо проще чем на OpenCL или CUDA.

Gcc 9 и 10 тоже могут amdgcn, но только на 2 потока. И что-то недавно речь шла о том, чтобы убрать поддержку этой платформы, а не расширить её, к сожалению.

anonymous
()
Ответ на: комментарий от Aceler

Понял, попробую. Правда мне не для дарктейбла, а для ффмпега для работы с h264_vaapi на navi. ХЗ заведется ли…

anonymous
()

Попробуем обновить на Debian Testing и посмотреть что получится на этот раз.

anonymous
()
Ответ на: комментарий от Aceler

Да я понял, я про то что посмотреть на новую версию

anonymous
()
Ответ на: комментарий от anonymous

процессоры GPU (2048 и более

звездёж, ведь маркетоиды за процессор GPU считают ALU, и таким макаром 2ядерный CPU можно назвать 8ядерным, тк в каждом ядре по 4 ALU

anonymous
()
Ответ на: комментарий от anonymous

А эти ALU параллелятся? Если параллелятся, то хоть горшком назови, главное, чтобы работало быстро.

Aceler ★★★★★
() автор топика
Ответ на: комментарий от Aceler

в процессорах тоже параллелятся, это собственно единственный смысл наличия более одного alu, лол

то хоть горшком назови

это называется обман потребителей и это вообще-то статья, вон амуде штраф выплачивает

anonymous
()
15 ноября 2020 г.
Ответ на: комментарий от anonymous

Сабж для нейросеток. Для рисования унитаза либо вытаскивай из amdgpu блоб опенкл или жди у моря погоды

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.