LINUX.ORG.RU

NVIDIA приоткрывает исходные коды компилятора CUDA

 , ,


0

1

Сегодня NVIDIA анонсировала открытие исходных кодов нового компилятора CUDA, основанного на технологиях LLVM, для академических групп и разработчиков програмного обеспечения. Это позволит облегчить программирование GPU на различных языках и добавить возможность запускать CUDA программ на альтернативных вычислительных архитектурах. Также в NVIDIA надеются на ускорение развития гетерогенных вычислительных архитектур нового поколения.

Новый CUDA компилятор, основанный на технологии LLVM доступен в последнем выпуске CUDA Toolkit (версия 4.1).

Разработчики программного обеспечения смогут использовать исходные коды компилятора для создания собственных решений.

Doug Miles, директор The Portland Group:

Эта инициатива позволит PGI создать нативные компиляторы CUDA Fortran и OpenACC. Также позволит безпроблемно выполнять отладку и профилирование, используя существующие инструменты, и PGI сфокусируется на высокоуровневой оптимизации и языковых особенностях.

Доступ к исходным кодам компилятора CUDA квалифицированные академические исследователи и разработчики программного обеспечения могут получить после регистрации здесь.

>>> Подробности

★★★★★

Проверено: Shaman007 ()
Последнее исправление: Shaman007 (всего исправлений: 2)

А теперь, товарищи, вопрос на засыпку: Почему, если взять радеон и жифорс одного класса, то вычисления на GPU на радеоне с помощью OpenCL быстрее, чем на жифорсе? Типичный пример - генерация биткоинов

PaRuSoft ★★★★
()
Ответ на: комментарий от Reset

скорее это не типичный пример, а единственный в котором радеон быстрее

А для меня лично, это пример очень показательный : софт для поиска биткойнов супероптимизированный. Тут прямой вопрос денег - было бы выгоднее делать на CUDA - сделали бы, но не позволяют возможности очевидно.

lenin386 ★★★★
()
Ответ на: комментарий от dinn

Хватит уже со своими биткоинами, не нужны они никому.

С тем, что биткойны не нужны, какбэ никто не спорит. Просто как факт : есть задача, есть алгоритм. Одноклассовый Radeon решает ещё в 2-3 раза быстрее. И это не случайность : этот софт оптимизировался очень тщательно на очень многие существующе платформы.

lenin386 ★★★★
()
Ответ на: комментарий от dinn

У amd и nvidia сейчас совсем разные архитектуры графических процессоров.

Так вот в том то и дело, что софт для поиска биткойнов оптимизировался для очень разных архитектур : CPU, GPU, FPGA, и из каждой выжимался максимум. Для меня, это показалось каким-то универсальным тестом пиковой производительности. И AMD+opencl очень мощно выиграла...

lenin386 ★★★★
()
Ответ на: комментарий от lenin386

софт для поиска биткойнов супероптимизированный.

скорее один из немногих где выгоднее очень много очень тупых вычислительных модулей. Проблемы оптимизации там нет, проблема оптимизации возникает когда надо распараллеливать софт который распараллеливается плохо

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от Reset

> скорее это не типичный пример, а единственный в котором радеон быстрее

+1.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от Reset

А ещё самый разрекламированный

dinn ★★★★★
() автор топика
Ответ на: комментарий от lenin386

> Одноклассовый Radeon решает ещё в 2-3 раза быстрее.

В 10 раз. Как и перебор паролей. А вот серьёзные вычисления, увы, медленнее.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от ZenitharChampion

В 10 раз. Как и перебор паролей. А вот серьёзные вычисления, увы, медленнее.

В 2-3 раза, иногда в 4. https://en.bitcoin.it/wiki/Mining_hardware_comparison Ну, приведи пример сурьёзных вычислений, а я проверю.

lenin386 ★★★★
()
Ответ на: комментарий от Reset

Что-то мне подсказывает, что не решит :) Зато очень «полезные» биткоины нагененрит :)

htower_ ★★
()
Ответ на: комментарий от lenin386

Прямо сейчас я пишу с компьютера, на котором считаются биткойны. Быстрее nvidia в 10 раз, я о той, которая показывает ту же скорость в OpenGL и имеет ту же цену. 412 мегахешей.

Пример? Моделирование движения химических элементов.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от lenin386

Ну, приведи пример сурьёзных вычислений, а я проверю.

Как насчет молекулярной динамики?

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от lenin386

Ты забыл про то, что в картах nVidia OpenCL и другие стандарты расчётов(DirectCompute) работают поверх CUDA. Именно поэтому OpenCL работает медленное на видеокартах nVidia.

rom-hvichia
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.