LINUX.ORG.RU

История изменений

Исправление aist1, (текущая версия) :

Честно – не знаю. Поэтому и вопрос задал. Но спасибо за наводку – загуглю. =)))

Я неудачно высказался. Сейчас биокомпьютинг по факту доминирует. Т.е. это мы — прокладки между стулом и монитором. Биокомпьютинг начинается тогда, когда заканчивается «свобода воли». Но да ладно.

По IDS on FPGA. У меня есть вот такая игрушка, как раз для этих задач предназначенная. Там 8GB HBM на борту, т.е. можно гонять memory-bound нагрузки. Если бы я делал адаптивный классификатор, я бы пробовал сжатые пространственные деревья вместо нейронных сетей. У первых куда лучшая асимптотика работы. И это, кстати, то, чем нейросети плохие — линейная трудоемкость вывода относительно количества параметров. У деревьев — логарифмическая. Но они и на много сложнее в реализации. И, скорее всего, просто не могут быть надежно реализованы в био-нейронном базисе.

По стальному (ARM 128 cores), они хорошо себя чувствуют и будут чувствовать на embarrassingly parallelizable задачах. Типа make -j N. А вот ту же IDS на них делать, всё может оказаться не так идилистично.

--------------

Добавлю. Поскольку CPU относительно легко программировать, многоядерные CPU будут использоваться всегда, как минимум, на начальном этапе разработки. Сначала мы создаем и отлаживаем метод на CPU, и уже потом переносим на спецжелезо, как с теми же SmartNIC для IDS.

Исходная версия aist1, :

Честно – не знаю. Поэтому и вопрос задал. Но спасибо за наводку – загуглю. =)))

Я неудачно высказался. Сейчас биокомпьютинг по факту доминирует. Т.е. это мы — прокладки между стулом и монитором. Биокомпьютинг начинается тогда, когда заканчивается «свобода воли». Но да ладно.

По IDS on FPGA. У меня есть вот такая игрушка, как раз для этих задач предназначенная. Там 8GB HBM на борту, т.е. можно гонять memory-bound нагрузки. Если бы я делал адаптивный классификатор, я бы пробовал сжатые пространственные деревья вместо нейронных сетей. У первых куда лучшая асимптотика работы. И это, кстати, то, чем нейросети плохие — линейная трудоемкость вывода относительно количества параметров. У деревьев — логарифмическая. Но они и на много сложнее в реализации. И, скорее всего, просто не могут быть надежно реализованы в био-нейронном базисе.

По стальному (ARM 128 cores), они хорошо себя чувствуют и будут чувствовать на embarrassingly parallelizable задачах. Типа make -j N. А вот ту же IDS на них делать, всё может оказаться не так идилистично.