12 июня командой разработчиков Intel была выпущена библиотека oneDNN версии 3.5, которая теперь является частью UXL Foundation, обеспечивая дополнительную оптимизацию производительности для существующего и будущего оборудования Intel.
В выпуске oneDNN 3.5 улучшена производительность масштабируемых процессоров Xeon Sapphire Rapids 4-го поколения, а также улучшена производительность Xeon 6 благодаря недавно выпущенным процессорам SIerra Forest и предстоящим процессорам Granite Rapids. В выпуске oneDNN 3.5 также есть общие настройки для повышения производительности примитива групповой нормализации, повышения производительности примитива MATMUL, улучшения производительности различных подграфов с помощью Graph API и других настроек.
Также предусмотрена настройка графического процессора с улучшениями для будущего оборудования Xe2 в Lunar Lake и Battlemage. Кроме того, появилось больше оптимизаций для серии Intel Data Center GPU Max, улучшена производительность Intel Arc Graphics DG2/Alchemist и другие улучшения.
В эту библиотеку для создания программного обеспечения глубокого обучения и искусственного интеллекта также внесен ряд дополнений API:
- поддержка среды выполнения OpenCL для API Graph
- экспериментальный API микроядра для процессоров Intel
- поддержка FP64 MATMUL для графических процессоров Intel
Для справки: oneDNN — программное обеспечение, которое ранее было известно как «Intel Math Kernel Library for Deep Neural Networks (Intel(R) MKL-DNN)» и «Deep Neural Network Library (DNNL)». Это кроссплатформенная библиотека глубокой нейронной сети oneAPI (oneDNN) с открытым исходным кодом, состоящая из базовых строительных блоков для приложений глубокого обучения. oneDNN является частью общего проекта oneAPI,открытого стандарта, принятого Intel для унифицированного интерфейса прикладного программирования (API), предназначенного для использования в различных архитектурах вычислительных ускорителей (сопроцессоров), включая графические процессоры, ускорители искусственного интеллекта и программируемые в полевых условиях вентильные матрицы.
>>> Детальные подробности и загрузка доступны на странице проекта в github