Релиз AMD ROCm 3.3.0 — открытой платформы высокопроизводительных вычислений на GPU

0

2

ROCm – открытая платформа для высокопроизводительных вычислений на GPU, которая несет «философию UNIX в плане выбора, минимализма и модульности программной разработки в среде использования GPU» [1]. ROCm поддерживает интеграцию множества языков программирования для удобства как разработчиков, использующих ROCm в своих проектах, так и пользователей, использующих ROCm в личных целях.

Основные изменения в релизе ROCm 3.3.0:

Пользователи могут устанавливать и использовать одновременно разные версии тулкита (ранее была доступна для установки и использования только одна версия).
Добавлена функция предоставления информации о процессе GPU. Для получения информации могут быть использованы API и CLI.
Добавлена поддержка 3D Pooling Layers, которая позволяет запускать на GPU AMD Radeon Instinct 3D конволюционные (сверточные) сети, например, ResNext3D.
Произведены улучшения формата нейросетевого обмена ONNX. Добавлена поддержка предварительно подготовленных моделей в форматах: ONNX, NNEF и Caffe.
Признан неподдерживаемым ряд ранее используемых функций менеджера объектов кода (Comgr).

На сегодняшний день официально ROCm все еще не поддерживает AMD APU (интегрированные GPU AMD), хотя они включены в апстримные версии драйверов и в ROCm OpenCL runtime. Ожидаемая поддержка GPU на архитектуре Navi также не была включена в релиз.

[1] ROCm documentation

>>> Подробности

Ссылка

←	Релиз LXC 4.0 LTS

Релиз OpenTTD 1.10.0

→

Не очень понятно что это. Я глянул: вроде как набор драйверов для AMD видеокарт (не встроенных пока, ноуты в пролете), некий тулчейн для обучения и применения моделей машинного обучения. Что они подразумевают под платформой? Самописный пакет под МЛ на АМД ГПУ? Зачем? Ну, т.е. буквально уже целый зоопарк фреймворков, причем аппаратнонезависимых в том числе. И второй, еще более странный момент: нет, видеокарты АМД не умеют в МЛ по сравнению с НВидиа. Navi тоже https://www.reddit.com/r/deeplearning/comments/caiily/new_amd_navi_gpus_for_deep_learning/ Зачем делать платформу заранее понимая, что разработчики не будут серьезно это использовать? Если ты профессионально с этим работаешь – ты возьмешь нормальный инструмент, если поиграться – тебе не нужна никакая особая платформа.

Если уж нужна некоторая «платформа» для удаленного обучения моделей, ну, есть зондовый и условнобесплатный colab от гугла. Опенсурс – это замечательно, но я не вижу где эта работа нужна. Возможно я чего-то не понимаю.

~~JAkutenshi~~ ★★
(05.04.20 22:05:40 MSK)
Последнее исправление: JAkutenshi 05.04.20 22:11:57 MSK (всего исправлений: 2)

Ответ на: комментарий от JAkutenshi 05.04.20 22:05:40 MSK

ROCM это CUDA для AMD.

Зачем делать платформу заранее понимая, что разработчики не будут серьезно это использовать? Если ты профессионально с этим работаешь – ты возьмешь нормальный инструмент, если поиграться – тебе не нужна никакая особая платформа.

Tensorflow это платформа? А Keras? Благодаря ROCM появилась возможность работать с нейронками с аппаратным ускорением не только на чипах Nvidia, но и AMD, используя при этом существующий код написаный с помощью тех же Tensorflow и Keras.

Mike_RM ★
(05.04.20 22:39:08 MSK)

В этом вашем rocm две засады. Первая - не на всякой конфигурации оборудования он вообще заводится. Вторая - даже если конфигурация правильная, не на всех дистрибутивах и ядрах он заводится.

Ostegard ★
(05.04.20 22:43:59 MSK)

Ответ на: комментарий от Ostegard 05.04.20 22:43:59 MSK

ну вообще они указали в доке и то, и другое. Но да - ограничений многовато

https://github.com/RadeonOpenCompute/ROCm#hardware-and-software-support

https://github.com/RadeonOpenCompute/ROCm#Supported-Operating-Systems

Ford_Focus ★★★★★
(05.04.20 23:17:10 MSK)

Ответ на: комментарий от Ford_Focus 05.04.20 23:17:10 MSK

Приколы связанные с переставлением видеокарты из одного слота PCIe x16 в другой от того что они описаны в доке от этого не пропадают)

Mike_RM ★
(05.04.20 23:43:59 MSK)

Ссылка

Ответ на: комментарий от Mike_RM 05.04.20 22:39:08 MSK

ROCM это CUDA для AMD.

Причем программы для зеленой true CUDA вроде бы запускаются теперь в HIP и на AMD?

А OpenCL работает и на зеленых GPU.

anonymous
(05.04.20 23:56:45 MSK)

Ссылка

Ответ на: комментарий от Mike_RM 05.04.20 22:39:08 MSK

Tensorflow это платформа? А Keras?

Tensorflow->ROCm работает на RX 470 8GB? есть ли какие-то ограничения и недостаткиу такой железки кроме относительно низкой производительности по сравнению с современными и необходимостью использовать матплату с true PCI 3.0 atomics?

anonymous
(05.04.20 23:58:55 MSK)

Можно ли на AMD использовать DotNet библиотеки типа:

https://en.wikipedia.org/wiki/ML.NET

https://github.com/SciSharp/TensorFlow.NET

anonymous
(06.04.20 00:02:05 MSK)

Ответ на: комментарий от anonymous 05.04.20 23:58:55 MSK

The following list of GPUs are enabled in the ROCm software, though full support is not guaranteed:

«Polaris 11» chips, such as on the AMD Radeon RX 570 and Radeon Pro WX 4100

Ford_Focus ★★★★★
(06.04.20 00:13:39 MSK)

Ответ на: комментарий от anonymous 05.04.20 23:58:55 MSK

У меня на RX480 4GB работает.

есть ли какие-то ограничения и недостатки у такой железки

Да. Если использовать новое ядро и идущие с ним драйверы (метод Using Debian-based ROCm with Upstream Kernel Drivers) то есть ограничение на использование видеопамяти в 3/8 от оперативной, т.е. при моих 8 ГБ ОЗУ я могу в ROCm использовать только 3 из 4. Если собирать драйвер самому - таких ограничений нет, но фреймворк для сборки в виде Bazel зело затейлив и нетороплив.

Можно ли на AMD использовать DotNet

Не могу сказать.

P.S. Перепутал. Tensorflow-rocm из исходников собирается с помощью Bazel (но обычно этого делать не нужно), ROCm ставится нормально.

Mike_RM ★
(06.04.20 00:15:24 MSK)
Последнее исправление: Mike_RM 06.04.20 00:23:00 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от Ford_Focus 06.04.20 00:13:39 MSK

The following list of GPUs are enabled in the ROCm software, though full support is not guaranteed: «Polaris 11» chips, such as on the AMD Radeon RX 570 and Radeon Pro WX 4100

Но это ведь только теория, а практика:

https://github.com/RadeonOpenCompute/ROCm/issues/595

https://github.com/RadeonOpenCompute/ROCm/issues/825#issuecomment-506737088

https://github.com/ROCmSoftwarePlatform/tensorflow-upstream/issues/162

или нет?

От версии ROCm зависит возможность выпадания работоспособности старых карточек типа RX470 на более новых версиях ROCm?

anonymous
(06.04.20 01:18:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 06.04.20 00:02:05 MSK

Tensorflow с поддержкой видеокарт AMD и Tensorflow с поддержкой Windows это два разных форка от AMD и Microsoft, оба из которых имеют мало шансов на попадание в апстрим, так как гуглу это не интересно.

В состав Windows включена библиотека WinML, которая вроде как похожа на ML.net и работает на видеокартах любых производителей с заявленной поддержкой DirectX 12.

anonymous
(06.04.20 02:48:19 MSK)

Ответ на: комментарий от anonymous 06.04.20 02:48:19 MSK

Tensorflow с поддержкой видеокарт AMD и Tensorflow с поддержкой Windows это два разных форка от AMD и Microsoft, оба из которых имеют мало шансов на попадание в апстрим, так как гуглу это не интересно.

У Tensorflow для AMD ведь есть поддержка линуксового Python?

А в DotNet Core наверняка есть либы для вызова питона в runtime, причем не из командной строки, а через какой-нибудь динамический генератор обвязки API для питоновых либ, для нодеJS ведь такое есть.

anonymous
(06.04.20 05:01:33 MSK)

Ответ на: комментарий от anonymous 06.04.20 05:01:33 MSK

линуксового Python

щта? под вендой питон тоже работает

anonymous
(06.04.20 05:12:00 MSK)

Пользователи могут устанавливать и использовать одновременно разные версии тулкита (ранее была доступна для установки и использования только одна версия).

Всё настолько криво?

anonymous
(06.04.20 12:25:34 MSK)

Ответ на: комментарий от anonymous 06.04.20 12:25:34 MSK

Пользоваться

PATH="${PATH}:/opt/rocm/hcc/lib"

никто не мешает.

steemandlinux ★★★★★
(06.04.20 12:35:23 MSK)

Ссылка

Ответ на: комментарий от Mike_RM 05.04.20 22:39:08 MSK

TF и Keras – фреймворки для работы с МЛ. Они не зависели от драйверов, считаться могли и на CPU, и на GPU, AMD – тоже, потому что OpenCL. Были улучшения для CUDA, но это не вина разработчиков что АМД карты такие.

используя при этом существующий код написаный с помощью тех же Tensorflow и Keras.

Вот это я не увидел, увидел что у них там набор каких-то своих библиотек. В этом-то и проблема. Я бы понял, если это просто драйвера и патчи в фреймворки, на будущее, вдруг их карты станут пригодны для работы в этом направлении. Но тут этого нет, это меня и удивляет.

~~JAkutenshi~~ ★★
(06.04.20 13:43:21 MSK)

Ответ на: комментарий от JAkutenshi 06.04.20 13:43:21 MSK

TF и Keras – фреймворки для работы с МЛ. Они не зависели от драйверов, считаться могли и на CPU, и на GPU, AMD – тоже, потому что OpenCL. Были улучшения для CUDA, но это не вина разработчиков что АМД карты такие.

Винить кого-либо кроме себя за сделанный выбор глупо. Каждой задаче свой инструмент. Вендорные реализации CUDA и ROCm будут выигрывать в производительности более универсальному OpenCL - чудес не бывает.

Вот это я не увидел, увидел что у них там набор каких-то своих библиотек. В этом-то и проблема. Я бы понял, если это просто драйвера и патчи в фреймворки, на будущее, вдруг их карты станут пригодны для работы в этом направлении. Но тут этого нет, это меня и удивляет.

Плохо смотрели. Это именно набор драйверов (в т.ч. dkms) и патченные фреймворки (в т.ч. tensorflow-rocm).

Mike_RM ★
(06.04.20 14:43:52 MSK)

Ссылка

Пол:11 http://repo.radeon.com/rocm/apt/debian xenial/main amd64 hcc amd64 3.1.20114 [408 MB]                                                                                                                      
26% [11 hcc 56,3 MB/408 MB 14%]                                       27,2 kB/s 3ч 38мин 14с

Мде :-)

Ostegard ★
(06.04.20 16:01:36 MSK)

Ссылка

Это пять!!!

https://github.com/preda/gpuowl/issues/133

Did you install libncurses5 ? (as strange as that sounds)

I just did it and this resolved the issue :-)

Ostegard ★
(06.04.20 20:50:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 06.04.20 05:12:00 MSK

под вендой питон тоже работает

А зачем мне венда?

anonymous
(07.04.20 15:52:22 MSK)

Ссылка

knd а когда для бинарного пакета amdvlk сделают 32 битную версию?
А то я ставлю его с вашего бинарного репозитария, а он содержит только 64 версию и в результате у меня не работает vulkan для вайна и протона, из-за чего не работает dxvk и часть зависящих от него или вулкана стимовских игрушек.