История изменений
Исправление LINUX-ORG-RU, (текущая версия) :
У видеокарт есть косяк, для них спец приблуды нужны в виде специальной упаковки данных. Да как видеокарта, но с низкой латентностью выгрузки данных обратно в оперативную память. То есть сделал я malloc
есть у меня кусок запускаю код вычислений с чтением/записью в этот блок памяти и всё не парюсь более. Сейчас так нельзя, вернее можно, но отчасти. Универсального решения нет, только вендор альтернативы, куды, опенцл, openmp4+ последнее наиболее юзабельное с точки зрения удобства. В общем я про некую универсальную финтифлюшку, на видимокартах удобно что-то конкретное пилить, но неудобно нечто общее. Например запустить на 100 ядрах ARM картах расширения listen сервера и каждое будет сливать в свой блочёк данных обычной ram данные и никаких трабл с разруливанием этого из однопотока, тредами и прочим. Работает там себе на стороне, никому не мешает и норм. Да, будут задержки, но это компенсируется разгрузкой CPU основного цель которого будет в логике и перелопачивании тонны данных без переключения то туда то сюда. Но фишка тут в том что можнл и обычный проц x86 сделать 10020 ядерным только драть будет много. Хз короче. Дай пофантазировать :D
Исходная версия LINUX-ORG-RU, :
У видеокарт есть косяк, для них спец приблуды нужны в виде специальной упаковки данных. Да как видеокарта, но с низкой латентностью выгрузки данных обратно в оперативную память. То есть сделал я malloc
есть у меня кусок запускаю код вычислений с чтением/записью в этот блок памяти и всё не парюсь более. Сейчас так нельзя, вернее можно, но отчасти. Универсального решения нет, только вендор альтернативы, куды, опенцл, openmp4+ последнее наиболее юзабельное с точки зрения удобства. В общем я про некую универсальную финтифлюшку, на видимокартах удобно что-то конкретное пилить, но неудобно нечто общее. Например запустить на 100 ядрах ARM картах расширения listen сервера и каждое будет сливать в свой блочёк данных обычной ram данные и никаких трабл с разруливанием этого из однопотока, тредами и прочим. Работает там себе на стороне, никому не мешает и норм. Да, будут задержки, но это компенсируется разгрузкой CPU основного цель которого будет в логике и перелопачивании тонны данных без переключения то туда то сюда.