LINUX.ORG.RU

Altera научит FPGA «понимать» OpenCL

 , , ,


0

2

Известный производитель микросхем программируемой логики, компания Altera, представила общественности проект по созданию инструмента, позволяющего исполнять на FPGA код, написанный для OpenCL. OpenCL является основанным на C открытым стандартом для параллельного программирования. В настоящее время он активно используется для переноса на графические карты вычислений, требующих высокой производительности. Интерес к графическим картам был вызван в первую очередь тем, что применяемые в них процессоры способны одновременно выполнять большое число операций, что позволяет достичь колоссальной производительности на хорошо распараллеливаемых задачах. Эти же соображения подтолкнули разработчиков обратить внимание на FPGA. Altera стала членом рабочей группы по OpenCL в январе прошлого года.

Анонсированный инструмент поддерживает системы, сочетающие программируемую логику с ARM или x86 процессорами. Первые результаты применения этой технологии показали 35-кратный прирост производительности в сравнении с классическими многоядерными решениями и пятидесятипроцентное уменьшение времени разработки в сравнении с разработкой на HDL.

Сайт проекта

Анонс

>>> Подробности

★★

Проверено: DoctorSinus ()
Последнее исправление: prozium (всего исправлений: 4)
Ответ на: комментарий от registrant

да вот эти параллельные вычисления. особенно, если алгоритм на плавучке. при прочих равных FPGA будет медленнее и жрать больше энергии, чем ASIC. FPGA даст выигрыш в реалтайме

Ну надо уточнять, что за плавучка конкретно считаться будет. У девайса с памятью, к которой нужно ходить через внешнюю шину, мягко говоря, есть нюансы :) К тому же, сколько той памяти в видеокарте? Один-два гигабайта, не густо. А к FPGA можно QDR пришлёпать, у которой латентность от DDR на порядки отличается...

mv ★★★★★
()
Ответ на: комментарий от mv

Ну надо уточнять, что за плавучка конкретно считаться будет.

думаю на любой - задержки из-за коммутируемого интерконнекта никуда не денутся. так что АЛУ-шки по-любому будут медленнее по тактовой и больше жрать при одинаковом техпроцессе.

У девайса с памятью, к которой нужно ходить через внешнюю шину, мягко говоря, есть нюансы :)

ну да, я это и имел в виду под реалтаймом. можно, конечно, задачу поставить так, что задержки на шине будут узким местом.

есть и еще один нюансик - FPGA сильно дороже в изготовлении, чем серийный чип. я не говорю, что проект не взлетит, просто тут в теме многие проявили необоснованный энтузиазм

registrant ★★★★★
()
Ответ на: комментарий от Rzhepish

ты их серии сравни с массовыми чипами. FPGA для прототипов и мелких серий, никто на них десятками тысяч не штампует.

registrant ★★★★★
()
Ответ на: комментарий от registrant

Я бы с радостью сравнил, была бы возможность.

Rzhepish
()
Ответ на: комментарий от Rzhepish

всё то, что предшествует сериям

не все ведь идет в серию. что-то будет жить мелкой серией. можно модернизировать старые устройства. я выше не совсем корректно выразился. сами-то чипы FPGA, конечно, серийные. но устройства на их базе - нет.

registrant ★★★★★
()
Ответ на: комментарий от registrant

сами-то чипы FPGA, конечно, серийные. но устройства на их базе - нет.

Чего это нет? Вполне себе шлёпают достаточно серийные устройства с достаточно немелкими FPGA типа 3-го Циклона.

mv ★★★★★
()
Ответ на: комментарий от mv

достаточно серийные устройства

достаточно серийные имеет смысл переводить на ASIC. считать, конечно, надо. а мелкие серии - конечно, я про это и писал.

registrant ★★★★★
()
Ответ на: комментарий от mv

К тому же, сколько той памяти в видеокарте? Один-два гигабайта, не густо

а как с этим у встроенных? Теоретически никто не мешает хоть сотню гигабайт воткнуть. Правда скорость вызывает сомнения

nu11 ★★★★★
()
Ответ на: комментарий от nu11

а как с этим у встроенных?

Нормально. Какие проблемы?

Теоретически никто не мешает хоть сотню гигабайт воткнуть. Правда скорость вызывает сомнения

Память является бутылочным горлышком даже для «медленных» FPGA (медленных по сравнению с нереконфигурируемым железом). Зато практически можно воткнуть вместе много дешёвой DRAM и немножкой дорогой SRAM, и оптимизировать работу с памятью в зависимости от ворклоада: матрицы перемножаем в DRAM, хэш-таблицы держим в SRAM.

Вообще, у FPGA основное преимущество - многократное переиспользование при скоростях работы близким к bare metal. Если это преимущество не нужно, а характер расчётов на особенности видеокарты хорошо ложатся, то проще и дешевле купить Теслу.

mv ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.