Состоялся релиз NVIDIA CUDA 4.0. Также можно отметить релиз CUDA-GDB. Далее - текст из официальной русскоязычной новости.
Набор инструментов NVIDIA CUDA 4.0 был создан, чтобы упростить параллельное программирование и позволить еще более широкому кругу разработчиков портировать свои приложения на GPU. Основные возможности новой архитектуры:
- Технология NVIDIA GPUDirect™ 2.0 обеспечивает равноправную связь между GPU в рамках одного сервера или рабочей станции, что упрощает и ускоряет мультипроцессорное программирование и работу приложений.
- Унифицированная виртуальная адресация (UVA) организует единое адресное пространство для основной системной памяти и памяти GPU, что делает параллельное программирование еще быстрее и проще.
- Библиотеки примитивов Thrust C++ - набор алгоритмов C++ с открытым кодом для параллельных расчетов и структур данных, которые упрощают программирование для разработчиков на C++. Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5-100 раз по сравнению с библиотеками Standard Template Library (STL) и Threading Building Blocks (TBB).
Другие функции и возможности:
- интеграция MPI с приложениями CUDA – Модификация MPI, например, OpenMPI, автоматически пересылает данные в память GPU и обратно по Infiniband, когда приложение посылает или получает запрос от MPI.
- Многопоточность и GPU – Многочисленные потоки с CPU хоста могут обмениваться контекстом на одном GPU, что упрощает совместное использование GPU многопоточными приложениями.
- Использование нескольких GPU одним потоком с CPU – Один поток с CPU хоста может иметь доступ ко всем GPU в системе. Разработчики могут легко распределить работу между несколькими GPU для таких задач, как обмен «ореолами» в приложениях.
- Новая библиотека NPP для обработки изображений и компьютерного видения – Большой набор операций по трансформации изображения, которые позволяют быстро разрабатывать приложения обработки изображений и компьютерного зрения.
Новые и улучшенные возможности:
- Автоматический анализ производительности в Visual Profiler
- Новые функции в cuda-gdb и поддержка MacOS
- Поддержка функций C++, таких как new/delete и виртуальные функции
- Новый бинарный дизассемлер на GPU
Подробности о новых возможностях можно узнать на странице с русскоязычной новостью. В ней не сказано о том, что состоялся релиз, потому что в тот день существовал ещё только кандидат в релизы. Англоязычная новость, в свою очередь, объявляет релиз, гораздо короче (просто список терминов без разъяснений) и подробнее.