История изменений
Исправление
ckotinko,
(текущая версия)
:
да именно так. я как раз обоснование пишу под свой проц и там вот такие ссылки: 1, 2
видно как графики загибаются вниз в последние годы.
а вот теоретическое обоснование и практическое подтверждение, что насасывают процы изза кэша. у них тупо очередь переупорядочивания меньше(напр. 40 в Pentium2 = 8*5 реально, причем эти 5-очень разные типы операций, 128 у i7 - это 16*8) в разы меньше значения где насасывание начинает спадать. Регистров в разы меньше, опять же по этой же причине - их много «всего» но сортами отличаются. +гирей висит просто малое колво регистров вообще, надо дрючить кэш на предмет локальных переменных(mov-mov-mov-mov-mov... - и так 40% команд)
Вот тебе пример - А15 может 3 команды за цикл но делает 1 за 2.2 цикла.Пень и7 может 4 за цикл а делает 1 за 0.7 цикла и это только потому что у него огромный L3. Убери L3 и будет насасывать как ARM
Исходная версия
ckotinko,
:
да именно так. я как раз обоснование пишу под свой проц и там вот такие ссылки: 1, 2
видно как графики загибаются вниз в последние годы.
а вот теоретическое обоснование и практическое подтверждение, что насасывают процы изза кэша. у них тупо очередь переупорядочивания меньше(напр. 40 в Pentium2 = 8*5 реально, причем эти 5-очень разные типы операций) в разы меньше значения где насасывание начинает спадать. Регистров в разы меньше, опять же по этой же причине - их много «всего» но сортами отличаются. +гирей висит просто малое колво регистров вообще, надо дрючить кэш на предмет локальных переменных(mov-mov-mov-mov-mov... - и так 40% команд)
Вот тебе пример - А15 может 3 команды за цикл но делает 1 за 2.2 цикла.Пень и7 может 4 за цикл а делает 1 за 0.7 цикла и это только потому что у него огромный L3. Убери L3 и будет насасывать как ARM