LINUX.ORG.RU

NVIDIA CUDA 5

 ,


1

0

Вышла новая версия платформы для вычисления на графических ускорителях NVIDIA CUDA 5.0.

Новые возможности:

  • Динамическая параллельность. Вычислительные потоки могут динамически порождать новые.
  • Библиотеки для графических процессоров. Новая библиотека CUDA BLAS позволяет использовать возможности динамической параллельности из сторонних библиотек.
  • GPUDirect — прямое сообщение между графическими процессорами через шину PCI-E, включая прямой доступ к памяти.
  • Интегрированная среда для разработки программ Nsight на базе Eclipse.

>>> Подробности

★★★★★

Проверено: JB ()
Последнее исправление: JB (всего исправлений: 3)
Ответ на: комментарий от Ttt

Вроде при переходе на llvm они рассказывали, что теперь каждый желающий может сделать поддержку cuda для своей железки и своего языка программирования.

dinn ★★★★★
() автор топика
Ответ на: комментарий от Boboms

Для этого надо правильно сформулировать зачем это нужно. Ответ поиграться на будущее не пройдёт.

dinn ★★★★★
() автор топика
Ответ на: комментарий от BattleCoder

Я уже жалею, что всё-таки не AMD себе купил, предлагали же =)

ток на OpenCL надо время тратить, с CUDA хоть немного, а знаком.

Я использую pyopencl, хорошее решение для быстрого вхождения в тему.

Vudod ★★★★★
()
Ответ на: комментарий от Eddy_Em

Жаль только, что многие фишки поддерживаются лишь дорогими карточками (например, на бюджетных нельзя double, нельзя атомарные операции, и т.д., и т.п.).

Вы с какого века к нам прибыли?

anonymous
()
Ответ на: комментарий от Kindly_Cat

Плюсую. На форуме boinc.ru сравнил производительность вычислений на NVidia и AMD и прифигел.

Можно ссылку/подробности?

DarkAmateur ★★★★
()
Ответ на: комментарий от Vudod

ужасное решение. пробовал. во-первых, попадался код, написанный другим человеком на pyopencl - совершенно нечитаемый. Во-вторых, там используется гамно мамонт - python2, я не понимаю, почему не третья версия.

BattleCoder ★★★★★
()
Ответ на: комментарий от kranky

А что толку от этого отсутствия вендор-лока? Напишете код, который будет работать, например, на nvidia - openCL + задействовать все ядра ЦПУ?

BattleCoder ★★★★★
()
Ответ на: комментарий от dinn

Я конечно видел как люди статьи и целые книги пишут в текстовых процессорах, но как-то не хочется повторять такое геройство.

У тебя есть предложения, как организовать совместную работу над одним текстом (например, книгой), чтобы можно было выделить кусок текста и прокомментировать его? У меня — нет.

AP ★★★★★
()
Ответ на: комментарий от dinn

Текстовые процессоры пригодны только для написания служебок.

скажи честно «не осилил» - будь мужиком

nu11 ★★★★★
()
Ответ на: комментарий от Eddy_Em

Посмотрите на цены на профессиональные видеокарты Tesla - и падайте со стула.

По факту GeForce - это игровые видеокарты. Они послабее Tesla, памяти там поменьше и т.п.

BattleCoder ★★★★★
()
Ответ на: комментарий от BattleCoder

А что толку от этого отсутствия вендор-лока?

Можно практически на любом железе юзать, а не только на выпущенном одной конторкой. Мне казалось это очевидно.

Напишете код, который будет работать, например, на nvidia - openCL + задействовать все ядра ЦПУ?

Эээ.. чё?

kranky ★★★★★
()
Ответ на: комментарий от dinn

Больше 4-х лет уже как открыто

после того, как формат похоронили. И есть небольшая проблема: M$ word работает не по этим спекам

nu11 ★★★★★
()
Ответ на: комментарий от BattleCoder

Чего мне падать? Мне все равно для развлечений максимум, что позволят купить — что-нибудь тысяч за 15...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от buddhist

Может быть перевод плохой и имеется ввиду «обновлённая»?

BattleCoder ★★★★★
()
Ответ на: комментарий от kranky

Можно практически на любом железе юзать, а не только на выпущенном одной конторкой. Мне казалось это очевидно.

Не будьте голословным. Вы даже не пробовали.

BattleCoder ★★★★★
()
Ответ на: комментарий от Eddy_Em

А ты пробей канал в сторону ближайшего университета с теслами.

Evgueni ★★★★★
()
Ответ на: комментарий от BattleCoder

Не будьте голословным. Вы даже не пробовали.

Да вот мне-то как раз пришлось покодить на openCL пару софтин для DSP, и никаких проблем с запуском ни на радеонах, ни на cpu не было.

kranky ★★★★★
()
Ответ на: комментарий от Eddy_Em

У меня дома карточка 9800 (поддерживает CUDA не выше 1.1), на работе — GT215 (не выше 1.2).

Это не бюджетные карточки, это старье. Чувствуете разницу?

anonymous
()
Ответ на: комментарий от nu11

Справедливости ради, полностью освоить все возможности любого из двух актуальных текстовых процессоров не сильно проще, чем освоить XeTeX (LaTeX не нужен).

Homura_Akemi
()
Ответ на: комментарий от BattleCoder

Да вот как раз нет. Бонусы его в:

1) хорошей документации;
2) адекватной поддержке через мейлинг-лист;
3) есть заготовки, чтобы не писать сто раз одно и то же ядро;
3) оно таки может работать с python3.

Ну а говнокодить никто никому запретить не может.

lu4nik ★★★
()
Ответ на: комментарий от Eddy_Em

Нет, это не так. Я сам использую double и атомарку на nVidia GT 540M (compute capability 2.1), которую дорогой назвать никак нельзя. К слову, double не так уж и тормозит - на моей машине разница в 4 раза.

lu4nik ★★★
()
Ответ на: комментарий от anonymous

старье

Какое, нафиг, старье? Этим карточкам и пяти лет нет!

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Homura_Akemi

XeTeX (LaTeX не нужен)

Кому как. С моей точки зрения, XeTeX — излишняя сущность.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

И для числодробилок именно ее пользуют, т.к. OpenCL слишком сырая.

Видно эксперта по OpenCL.

Ну, а для извращений — на nVidia можно и OpenCL. Только смысл?

Смысл как минимум в отсутствии vendor lock-in'a. OpenCL на их картах тормозной по сравнению с CUDA только потому, что они специально забивают на производительность потому, что пытаются пропихивать свой проприетарный стандарт.

anonymous
()
Ответ на: комментарий от lu4nik

nVidia GT 540M

Ее же только недавно выпустили!

Я не собираюсь каждые 5 лет железо обновлять! Апгрейд надо делать тогда, когда либо железо совсем безнадежно устарело, либо когда оно сгорело.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от anonymous

Ладно, чего спорить. Я на OpenCL ни строчки не написал (и не напишу, надеюсь, никогда), а CUDA у меня используется «постольку поскольку» (для ускорения редких ресурсоемких задач).

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от ymuv

1.opencl можно запускать на разных видеокартах? Работает он на opencl?

Представь себе, да!

2. Можно связать несколько карточек на нескольких хостах через mpi?

В CUDA 5 добавили специальную поддержку MPI. А так и раньше было можно, другое дело, что не эффективно.

anonymous
()
Ответ на: комментарий от Eddy_Em

Пишешь комментарии … в комментариях к тексту. Как ни странно!

С тобой уже всё давно понятно.

AP ★★★★★
()
Ответ на: комментарий от Eddy_Em

Я на OpenCL ни строчки не написал

Вот оно и видно, и связкой OpenCL + OpenMP тоже не пользовался (привет КУДА!). Но полярное мнение относительно OpenCL, при этом, имеешь.

anonymous
()
Ответ на: комментарий от Vudod

Для double гораздо лучше АМД: у них в старшем поколении отношение float/double 4/1, у nVidia даже для 580 уже 16/1, про 680 молчу вовсе --- это число игровое решение, у него вообще 24/1. Поэтому на матрицах в OpenCL старый Radeon 6950 уделывает топовый GeForce 580 вдвое, потому что тупо больше блоков.

А можно поподробнее? Откуда известно, что у GTX 680 double блоков 24/1? Разве не все шейдерные блоки умеют double?

ytdpzkb
()

GeForce 690 и Tesla (забыл модель) изготовлены на одном и том же процессоре K10 - 3072 CUDA ядра все дела...только памяти 4 Гб против 8 у Tesla. И в чём же их реальное отличие, если учесть что 690-й стоит $1100, а Tesla $4999?

kkk ★★
()
Ответ на: комментарий от AP

Что со мной понятно?

А вот насчет тебя, понятно, что ты в латехе ни разу не ковырялся, но обсирать его горазд. Прямо как я в 99.99% случаев ☺

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Boboms

А Латекс не позволяет?

Это неудобно. Вообще, я знаю пример, когда использование LaTeX на месяцы отодвинуло срок прохождения редактуры.

AP ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.