История изменений
Исправление Zyy, (текущая версия) :
Вот хотя бы то, как mantle показала себя на моём ноуте
за счёт чего бы если не за счёт оптимального доступа к памяти
Да у тебя там процессорная часть кукурузная являлась боттлнеком, а mantle снижало процессорный оверхед. Интел проц+амд дискретка были бы быстрее и без mantle небось.
560ti
Это же ферми, мемный позор нвидии уровня пня4 и фуфыкса.
Вскоре появился вулкан
Вулкан это и есть mantle с доработками. Mantle до прям настоящей низкоуровневости далеко всё равно.
1 команду
Одну команду в реальных задачах и процессорах никто не выполняет.
а вот если собрать пакет из 1000 команд и отдать их одной транзакцией на исполнение сопроцессору, а в это время продолжить выполнять что то другое… Тут результат совершенно очевиден
Не очень понял, что тебе очевидно, но когда ядро нагружено, оно как раз и исполняет «бесконечный» пакет инструкций, и ему в общем-то насрать одно там этими инструкциями делается, или другое(если не считать кэшмиссов). Если для обращения к fpu на уровне отдельных инструкций нужно было бы обращаться к другому ядру - синхронизация заняла бы больше времени, чем сами вычисления, ядра бы тупо простаивали. Так что на практике как раз вычисляют длинные «пакеты» инструкций и стараются синхронизировать ядра как можно меньше. Если в ядре нет fpu - таких крупных пакетов бы не вышло.
А общая память apu никак не вписывалась в классические api графики.
И каким же образом? На тот момент в опенгл давно можно было мапить память и задавать хинты её использования.
Так всётаки ничего не даёт или
Это ты сам определись, ты же писал что память не быстрее, а каналов больше. Можно подумать, сама циферка количества каналов что-то там даёт, а не повышение пропускной способности.
Исходная версия Zyy, :
Вот хотя бы то, как mantle показала себя на моём ноуте
за счёт чего бы если не за счёт оптимального доступа к памяти
Да у тебя там процессорная часть кукурузная являлась боттлнеком, а mantle снижало процессорный оверхед.
560ti
Это же ферми, мемный позор нвидии уровня пня4 и фуфыкса.
Вскоре появился вулкан
Вулкан это и есть mantle с доработками. Mantle до прям настоящей низкоуровневости далеко всё равно.
1 команду
Одну команду в реальных задачах и процессорах никто не выполняет.
а вот если собрать пакет из 1000 команд и отдать их одной транзакцией на исполнение сопроцессору, а в это время продолжить выполнять что то другое… Тут результат совершенно очевиден
Не очень понял, что тебе очевидно, но когда ядро нагружено, оно как раз и исполняет «бесконечный» пакет инструкций, и ему в общем-то насрать одно там этими инструкциями делается, или другое(если не считать кэшмиссов). Если для обращения к fpu на уровне отдельных инструкций ужно было бы обращаться к другому ядру - синхронизация заняла бы больше времени, чем сами вычисления, ядра бы тупо простаивали. Так что на практике как раз вычисляют длинные «пакеты» инструкций и стараются синхронизировать ядра как можно меньше. Если в ядре нет fpu - таких крупных пакетов бы не вышло.
А общая память apu никак не вписывалась в классические api графики.
И каким же образом? На тот момент в опенгл давно можно было мапить память и задавать хинты её использования.
Так всётаки ничего не даёт или
Это ты сам определись, ты же писал что память не быстрее, а каналов больше. Можно подумать, сама циферка количества каналов что-то там даёт, а не повышение пропускной способности.