LINUX.ORG.RU

Библиотека по быстрым преобразованиям Фурье в степенях двойки


0

0

Выпущена библиотека по быстрым преобразованиям Фурье в степенях двойки с помощью графических ускорителей от nVidia. Согласно проведённым тестам на производительность, GeForce 7900GTX выполняет подобные математические преобразования в четыре раза быстрее, чем самые лучшие процессоры от AMD и Intel. Для личного применения библиотека может быть свободно скачана с сайта и абсолютно бесплатна.

Результаты тестов: http://gamma.cs.unc.edu/GPUFFTW/resul...

>>> Подробности

А как задействовать в программах для вычилений графический ускоритель?

anonymous
()
Ответ на: комментарий от anonymous

Посмотреть, как сделана эта либина, и доработать :)

anonymous
()

> Согласно проведённым тестам на производительность, GeForce 7900GTX 
> выполняет подобные математические преобразования в четыре раза 
> быстрее, чем самые лучшие процессоры от AMD и Intel.

и сколько она стоит по сравнению со средним процом ?

Tester ★★★
()

М... Если потребуется исключительно по степеням двойки, тогда буду иметь ввиду... :)

atrus ★★★★★
()
Ответ на: комментарий от Tester

>и сколько она стоит по сравнению со средним процом ?

Тогда корректнее сравнивать с топовыми процессорами ;) при этом цена 7900GTX меньше :)

Swappp
()
Ответ на: комментарий от anonymous

> А как задействовать в программах для вычилений графический ускоритель?

Через операции с текстурами как с матрицами (texture program) - текстуры как входной массив, результат промежуточных хранений, и - результат (его не обязательно выводить на экран). Точность вычислений с чипов Nvidia FX не хуже чем double. Через Vertex program наверно тоже можно делать вычисления - не знаю.

Spectr ★★★
()

В IEEE Antenna Propagation Magazine, vol 47, No.6, December 2005 была статья о программировании видео карт для элетродинамических задач, в частности был приведен пример кода FDTD для 2D. Прирост по сравнению в обычными процессорами более 10 раз.Использовался язык Brook, точнее в статье говорится о дополнительном подмножестве языка С(не пинайте перевод вольный). Тест был для DireсtX, но OpenGL поддерживается тоже и я думаю для Linux это должно работать.

anonymous
()
Ответ на: комментарий от anonymous

даеш руским физикам топовые видеокарты!

anonymous
()
Ответ на: комментарий от bugmaker

> А линух на видеокарточке пойдёт?

Обязательно! И на сетевухе, и на винчестере, и на принтере.

const86 ★★★★★
()

Прикольно. Сортировка есть, БПФ по степеням двойки сделали.

Интересно что ещё могут графические ускорители :)

anonymous
()
Ответ на: комментарий от anonymous

>Интересно что ещё могут графические ускорители :)

да уж. с такими тенденциями скоро компам на CPU будет хана. В результате увидим просто голые видюхи + контроллер + БП с хардами, без матерей и CPU. :)

qqqq ★★
()
Ответ на: комментарий от qqqq

Кому эта тема интересна, поищите на offline.computerra.ru - там пара статей было посвящено вычислениям на видеокартах.

Spice
()
Ответ на: комментарий от Spectr

2Spectr:
> Точность вычислений с чипов Nvidia FX не хуже чем double
Может быть, но по крайней мере на заглавной страничке проекта сказано, что поддерживаются только 32-битные данные.

V_P
()

а как бы мне посчитать фурье на контроллере raid?

anonymous
()

Супер, теперь можно будет легко убедить шефа на апгрейд до какой-
нибудь топовой видяхи - и играть в игры в high details.

Krupica
()

залейте на рапидшару плиииз

не ахота регаца

anonymous
()

Извращенцы херовы. Для таких вычисления есть DSP, который и быстрей и дешевле.

Puzan ★★★★★
()

гы, а нейросеть оно смогет?

hooj ★★
()
Ответ на: комментарий от anonymous

> a 4to FFT byvaet i ne v stepenyah dvoiki?!?

да. по английски это называется prime-factor FFT. Вообще говоря, если изучить алгоритм быстрого FFT, то станет ясно, что сложность вычисления FT длины m=p*q, где p и q - простые сомножители суть m*(p+q). Тривиальной индукцией можно показать, что если m=2^k, то сложность алгоритма FFT получается равной m*q = m*log_2(m)

annoynimous ★★★★★
()

Молодцы! Даешь использование периферии не по назначению!!

Предлагаю следующим шагом использовать видеопамять в качестве кэша винчестера. Как раз в иерархии по скорости будет между RAM и IDE.

Annymous
()
Ответ на: комментарий от vasaka

Да, brook приятная и простая штука. Вот только подмножество C получается уж очень урезанным -- целочисленных типов нет, циклов в общем виде нет, и т.д.

Как, например, оперируя только float'ами реализовать a^b?

И, похоже, это не вылечить -- ограничен набор инструкций GPU. Так что cell как рулил, так и рулит.

Shmuma
()
Ответ на: комментарий от Romantic

а если несколько pci-e карточек воткнуть... чтож это за зверь то будет :)

anonymous
()
Ответ на: комментарий от Shmuma

ну и нах циклы? Вообще пора от них уходить - иначе параллельного выполнения не будет

hooj ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.