История изменений

Исправление Zyy, 27.10.21 23:12 (текущая версия) :

Вот хотя бы то, как mantle показала себя на моём ноуте

за счёт чего бы если не за счёт оптимального доступа к памяти

Да у тебя там процессорная часть кукурузная являлась боттлнеком, а mantle снижало процессорный оверхед. Интел проц+амд дискретка были бы быстрее и без mantle небось.

560ti

Это же ферми, мемный позор нвидии уровня пня4 и фуфыкса.

Вскоре появился вулкан

Вулкан это и есть mantle с доработками. Mantle до прям настоящей низкоуровневости далеко всё равно.

1 команду

Одну команду в реальных задачах и процессорах никто не выполняет.

а вот если собрать пакет из 1000 команд и отдать их одной транзакцией на исполнение сопроцессору, а в это время продолжить выполнять что то другое… Тут результат совершенно очевиден

Не очень понял, что тебе очевидно, но когда ядро нагружено, оно как раз и исполняет «бесконечный» пакет инструкций, и ему в общем-то насрать одно там этими инструкциями делается, или другое(если не считать кэшмиссов). Если для обращения к fpu на уровне отдельных инструкций нужно было бы обращаться к другому ядру - синхронизация заняла бы больше времени, чем сами вычисления, ядра бы тупо простаивали. Так что на практике как раз вычисляют длинные «пакеты» инструкций и стараются синхронизировать ядра как можно меньше. Если в ядре нет fpu - таких крупных пакетов бы не вышло.

А общая память apu никак не вписывалась в классические api графики.

И каким же образом? На тот момент в опенгл давно можно было мапить память и задавать хинты её использования.

Так всётаки ничего не даёт или

Это ты сам определись, ты же писал что память не быстрее, а каналов больше. Можно подумать, сама циферка количества каналов что-то там даёт, а не повышение пропускной способности.

Исходная версия Zyy, 27.10.21 23:08:

Вот хотя бы то, как mantle показала себя на моём ноуте

за счёт чего бы если не за счёт оптимального доступа к памяти

Да у тебя там процессорная часть кукурузная являлась боттлнеком, а mantle снижало процессорный оверхед.

560ti

Это же ферми, мемный позор нвидии уровня пня4 и фуфыкса.

Вскоре появился вулкан

Вулкан это и есть mantle с доработками. Mantle до прям настоящей низкоуровневости далеко всё равно.

1 команду

Одну команду в реальных задачах и процессорах никто не выполняет.

а вот если собрать пакет из 1000 команд и отдать их одной транзакцией на исполнение сопроцессору, а в это время продолжить выполнять что то другое… Тут результат совершенно очевиден

Не очень понял, что тебе очевидно, но когда ядро нагружено, оно как раз и исполняет «бесконечный» пакет инструкций, и ему в общем-то насрать одно там этими инструкциями делается, или другое(если не считать кэшмиссов). Если для обращения к fpu на уровне отдельных инструкций ужно было бы обращаться к другому ядру - синхронизация заняла бы больше времени, чем сами вычисления, ядра бы тупо простаивали. Так что на практике как раз вычисляют длинные «пакеты» инструкций и стараются синхронизировать ядра как можно меньше. Если в ядре нет fpu - таких крупных пакетов бы не вышло.

А общая память apu никак не вписывалась в классические api графики.

И каким же образом? На тот момент в опенгл давно можно было мапить память и задавать хинты её использования.

Так всётаки ничего не даёт или