История изменений
Исправление lu4nik, (текущая версия) :
Как уже написали выше, у GPU узкое место — работа с памятью. Причем на GPU несколько типов памяти, причем наибольший по объему достаточно медленный. Эффективное использование бортовой памяти — как минимум половина успеха на видеокартах.
Но это не единственная проблема. Наличие большого числа ветвлений здорово снижает производительность кода (пример: использование на GPU всяких экзотических сортировок вроде odd-even mergesort и bitonic sort вместо quicksort). И это без учёта других более мелких особенностей. Кстати, поэтому некоторые задачи писать для GPU бывает более затратно, чем закупить мешок обычных CPU.
Исходная версия lu4nik, :
Как уже написали выше, у GPU узкое место — работа с памятью. Причем на GPU несколько типов памяти, причем наибольшая по объему достаточно медленная. Эффективное использование бортовой памяти — как минимум половина успеха на видеокартах.
Но это не единственная проблема. Наличие большого числа ветвлений здорово снижает производительность кода (пример: использование на GPU всяких экзотических сортировок вроде odd-even mergesort и bitonic sort вместо quicksort). И это без учёта других более мелких особенностей. Кстати, поэтому некоторые задачи писать для GPU бывает более затратно, чем закупить мешок обычных CPU.