LINUX.ORG.RU

История изменений

Исправление aist1, (текущая версия) :

«Утешительная акселерация».

Ну а больше ничего пока что в динамический параллелизм не умеет даже формально. Можно, конечно, выполнять анализ структуры формулы на CPU, и моно-ветки считать на нем же, а появившиеся в товарном количестве параллельные ветки выгружать на GPU и другие статические акселераторы. Но это всё же схема, в которой присутствует достаточно быстрый CPU. Т.е. без CPU не обойтись. Поэтому, достаточно быстрые OoOE ядра всё же предусмотрены в архитектурах перспективных акселераторов приложений. Типа, 16 быстрых ядер и 1024 «минионов». Вот эти быстрые ядра, как предполагается, и будут заниматься динамическим параллелизмом.

Но вот сами одни только OoOE-ядра, без минионов, это — да. Тупик (энергоэффективности).

Исходная версия aist1, :

«Утешительная акселерация».

Ну а больше ничего пока что в динамический параллелизм не умеет даже формально. Можно, конечно, выполнять анализ структуры формулы на CPU, и моно-ветки считать на нем же, а появившиеся в товарном количестве параллельные ветки выгружать на GPU и другие статические акселераторы. Но это всё же схема, в которой присутствует достаточно быстрый CPU. Т.е. без CPU не обойтись. Поэтому, достаточно быстрые OoOE ядра всё же предусмотрены в архитектурах перспективных акселераторов приложений. Типа, 16 быстрых ядер и 1024 «минионов». Вот эти быстрые ядра, как предполагается, и будут заниматься динамическим параллелизмом.