Altera научит FPGA «понимать» OpenCL

0

2

Известный производитель микросхем программируемой логики, компания Altera, представила общественности проект по созданию инструмента, позволяющего исполнять на FPGA код, написанный для OpenCL. OpenCL является основанным на C открытым стандартом для параллельного программирования. В настоящее время он активно используется для переноса на графические карты вычислений, требующих высокой производительности. Интерес к графическим картам был вызван в первую очередь тем, что применяемые в них процессоры способны одновременно выполнять большое число операций, что позволяет достичь колоссальной производительности на хорошо распараллеливаемых задачах. Эти же соображения подтолкнули разработчиков обратить внимание на FPGA. Altera стала членом рабочей группы по OpenCL в январе прошлого года.

Анонсированный инструмент поддерживает системы, сочетающие программируемую логику с ARM или x86 процессорами. Первые результаты применения этой технологии показали 35-кратный прирост производительности в сравнении с классическими многоядерными решениями и пятидесятипроцентное уменьшение времени разработки в сравнении с разработкой на HDL.

Сайт проекта

Анонс

>>> Подробности

Ссылка

←	GNOME ввёл в строй каталог дополнений для GNOME Shell

Третья встреча Одесской Java группы

→

Показаны ответы на комментарий. Показать все комментарии.

Ответ на: комментарий от registrant 03.12.2011 00:27:45 +00:00

да вот эти параллельные вычисления. особенно, если алгоритм на плавучке. при прочих равных FPGA будет медленнее и жрать больше энергии, чем ASIC. FPGA даст выигрыш в реалтайме

Ну надо уточнять, что за плавучка конкретно считаться будет. У девайса с памятью, к которой нужно ходить через внешнюю шину, мягко говоря, есть нюансы :) К тому же, сколько той памяти в видеокарте? Один-два гигабайта, не густо. А к FPGA можно QDR пришлёпать, у которой латентность от DDR на порядки отличается...

mv ★★★★★
(03.12.2011 00:36:55 +00:00)

Ответ на: комментарий от mv 03.12.2011 00:36:55 +00:00

Ну надо уточнять, что за плавучка конкретно считаться будет.

думаю на любой - задержки из-за коммутируемого интерконнекта никуда не денутся. так что АЛУ-шки по-любому будут медленнее по тактовой и больше жрать при одинаковом техпроцессе.

У девайса с памятью, к которой нужно ходить через внешнюю шину, мягко говоря, есть нюансы :)

ну да, я это и имел в виду под реалтаймом. можно, конечно, задачу поставить так, что задержки на шине будут узким местом.

есть и еще один нюансик - FPGA сильно дороже в изготовлении, чем серийный чип. я не говорю, что проект не взлетит, просто тут в теме многие проявили необоснованный энтузиазм

registrant ★★★★★
(03.12.2011 00:46:47 +00:00)

Ответ на: комментарий от registrant 03.12.2011 00:46:47 +00:00

FPGA сильно дороже в изготовлении, чем серийный чип.

Внезапно FPGA - серийные чипы

Rzhepish ★
(03.12.2011 01:19:58 +00:00)

Ответ на: комментарий от Rzhepish 03.12.2011 01:19:58 +00:00

ты их серии сравни с массовыми чипами. FPGA для прототипов и мелких серий, никто на них десятками тысяч не штампует.

registrant ★★★★★
(03.12.2011 01:35:13 +00:00)

Ответ на: комментарий от registrant 03.12.2011 01:35:13 +00:00

Я бы с радостью сравнил, была бы возможность.

Rzhepish ★
(03.12.2011 01:57:33 +00:00)

Ссылка

Ответ на: комментарий от registrant 03.12.2011 01:35:13 +00:00

Дабы внести ясность — под несерийными я понимаю шаттл/MPC/MPW, т.е. всё то, что предшествует сериям.

Rzhepish ★
(03.12.2011 02:59:53 +00:00)

Ответ на: комментарий от Rzhepish 03.12.2011 02:59:53 +00:00

всё то, что предшествует сериям

не все ведь идет в серию. что-то будет жить мелкой серией. можно модернизировать старые устройства. я выше не совсем корректно выразился. сами-то чипы FPGA, конечно, серийные. но устройства на их базе - нет.

registrant ★★★★★
(03.12.2011 03:22:40 +00:00)

Ответ на: комментарий от registrant 03.12.2011 03:22:40 +00:00

сами-то чипы FPGA, конечно, серийные. но устройства на их базе - нет.

Чего это нет? Вполне себе шлёпают достаточно серийные устройства с достаточно немелкими FPGA типа 3-го Циклона.

mv ★★★★★
(03.12.2011 04:11:10 +00:00)

Ответ на: комментарий от mv 03.12.2011 04:11:10 +00:00

достаточно серийные устройства

достаточно серийные имеет смысл переводить на ASIC. считать, конечно, надо. а мелкие серии - конечно, я про это и писал.

registrant ★★★★★
(03.12.2011 04:24:41 +00:00)

Ссылка

Ответ на: комментарий от mv 03.12.2011 00:36:55 +00:00

К тому же, сколько той памяти в видеокарте? Один-два гигабайта, не густо

а как с этим у встроенных? Теоретически никто не мешает хоть сотню гигабайт воткнуть. Правда скорость вызывает сомнения

nu11 ★★★★★
(03.12.2011 11:26:50 +00:00)

Ответ на: комментарий от nu11 03.12.2011 11:26:50 +00:00

а как с этим у встроенных?

Нормально. Какие проблемы?

Теоретически никто не мешает хоть сотню гигабайт воткнуть. Правда скорость вызывает сомнения

Память является бутылочным горлышком даже для «медленных» FPGA (медленных по сравнению с нереконфигурируемым железом). Зато практически можно воткнуть вместе много дешёвой DRAM и немножкой дорогой SRAM, и оптимизировать работу с памятью в зависимости от ворклоада: матрицы перемножаем в DRAM, хэш-таблицы держим в SRAM.

Вообще, у FPGA основное преимущество - многократное переиспользование при скоростях работы близким к bare metal. Если это преимущество не нужно, а характер расчётов на особенности видеокарты хорошо ложатся, то проще и дешевле купить Теслу.

mv ★★★★★
(03.12.2011 13:59:00 +00:00)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	GNOME ввёл в строй каталог дополнений для GNOME Shell

Hardware and Drivers

Третья встреча Одесской Java группы

→

Похожие темы