История изменений
Исправление aist1, (текущая версия) :
«Утешительная акселерация».
Ну а больше ничего пока что в динамический параллелизм не умеет даже формально. Можно, конечно, выполнять анализ структуры формулы на CPU, и моно-ветки считать на нем же, а появившиеся в товарном количестве параллельные ветки выгружать на GPU и другие статические акселераторы. Но это всё же схема, в которой присутствует достаточно быстрый CPU. Т.е. без CPU не обойтись. Поэтому, достаточно быстрые OoOE ядра всё же предусмотрены в архитектурах перспективных акселераторов приложений. Типа, 16 быстрых ядер и 1024 «минионов». Вот эти быстрые ядра, как предполагается, и будут заниматься динамическим параллелизмом.
Но вот сами одни только OoOE-ядра, без минионов, это — да. Тупик (энергоэффективности).
Исходная версия aist1, :
«Утешительная акселерация».
Ну а больше ничего пока что в динамический параллелизм не умеет даже формально. Можно, конечно, выполнять анализ структуры формулы на CPU, и моно-ветки считать на нем же, а появившиеся в товарном количестве параллельные ветки выгружать на GPU и другие статические акселераторы. Но это всё же схема, в которой присутствует достаточно быстрый CPU. Т.е. без CPU не обойтись. Поэтому, достаточно быстрые OoOE ядра всё же предусмотрены в архитектурах перспективных акселераторов приложений. Типа, 16 быстрых ядер и 1024 «минионов». Вот эти быстрые ядра, как предполагается, и будут заниматься динамическим параллелизмом.