LINUX.ORG.RU

История изменений

Исправление lu4nik, (текущая версия) :

Как уже написали выше, у GPU узкое место — работа с памятью. Причем на GPU несколько типов памяти, причем наибольший по объему достаточно медленный. Эффективное использование бортовой памяти — как минимум половина успеха на видеокартах.

Но это не единственная проблема. Наличие большого числа ветвлений здорово снижает производительность кода (пример: использование на GPU всяких экзотических сортировок вроде odd-even mergesort и bitonic sort вместо quicksort). И это без учёта других более мелких особенностей. Кстати, поэтому некоторые задачи писать для GPU бывает более затратно, чем закупить мешок обычных CPU.

Исходная версия lu4nik, :

Как уже написали выше, у GPU узкое место — работа с памятью. Причем на GPU несколько типов памяти, причем наибольшая по объему достаточно медленная. Эффективное использование бортовой памяти — как минимум половина успеха на видеокартах.

Но это не единственная проблема. Наличие большого числа ветвлений здорово снижает производительность кода (пример: использование на GPU всяких экзотических сортировок вроде odd-even mergesort и bitonic sort вместо quicksort). И это без учёта других более мелких особенностей. Кстати, поэтому некоторые задачи писать для GPU бывает более затратно, чем закупить мешок обычных CPU.