LINUX.ORG.RU

Как и чем мерить лошадиные силы CPU?

 ,


0

3
  • У меня есть 2-х ядерный zen 1, как мне узнать его FP32 и вот это вот всё?
  • Как сравнить прирост мощей между поколениями? Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?
  • Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации? Например, в кодировании видео, в обсчете LLM, в компиляции кода и т. п.

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

Это не видеокарта, такой почти параметр бесполезен.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Нет.

anonymous
()

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

HPL-MxP

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Да. Требуется высокая квалификация инженера, разрабатывающего модель производительности.

VIT
()

Берёшь свои типичные задачи и смотришь их тесты.

гугли «cpu benchmarks»

Passmark’ом и табличками я уже пользуюсь, мне больше интересно, что есть на Linux для измерений вычислительной мощности как в целом, так и по наборам инструкций.

HPL-MxP

О, буду знать.

Чего там мерить, и так ясно что лошадь дохлая

Ну-с, кому что, однако даже дохлые лошади тянут без тормозов современную OS, видосики, браузер, LLM 3-8B, компиляцию wine’а и всё такое прочее))

Reptile
() автор топика
Ответ на: комментарий от Reptile

даже дохлые лошади тянут без тормозов

Показатель «тянут без тормозов» - субъективный. Если вам норм, значит, норм. Рядовой линуксоид, попробовав это, начнёт рвать волосына жone и кричать, что «так жить невозможно!»

tiinn ★★★★★
()

в кодировании видео, в обсчете LLM, в компиляции кода

У фороникса есть test suite. Заходишь в поисковик, вбиваешь название проца и phoronix. Тут возможны нюансы связанные с тем что zen1 тестили на одном ядре и компиляторе, а zen5 уже на другом ядре и другой версии компилятора

cobold ★★★★★
()

Смотри размеры и частоты кэша. Вряд ли сами ядра становятся сильно быстрее с каждым поколением, частоты всё так же ограничены нагревом. Для кодирования видео можно использовать GPU и Video Acceleration API, там не все кодеки доступны, но это быстрее и энергоэффективнее. Для LLM вроде бы нужна видеокарта с максимальной памятью на борту, чтобы туда поместилось больше данных и модель была полезнее.

neumond
()
Ответ на: комментарий от neumond

Вряд ли сами ядра становятся сильно быстрее с каждым поколением

Мне на ЛОРе как-то люди объяснили, что между Zen2 и Zen3 на определенных задачах прям пропасть (400% в плюс на тех же частотах - не хухры-мухры)

С тех пор у меня в закладках такое: https://www.agner.org/optimize/instruction_tables.pdf

можно прям пальцем посчитать такты на инструкциях для разных ядер.

Toxo2 ★★★★
()

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Нет никакой «реальной» производительности. Для разных задач она будет отличаться.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

В теории — можно. На практике прям полных спецификаций у тебя нет, а ту или иную задачу последовательно по всем инструкциям в скомпиллированном виде ты не анализирова. Так что нет, на практике посчитать не получится. Разве что прикинуть примерно.

Например, в кодировании видео

Запускаешь кодирование, смотришь время. Запускаешь на другом процессоре. Сравниваешь. Вот тебе разница в производительности на конкретной задачи.

Чтобы удобно запускать несколько раз несколько разных тестов и т.д. и т.п., собирать статистику, могу порекомендовать hyperfine.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 2)

Cinebench r23 через wine заодно можно будет сравнить насколько твой проц отстает(или нет) от чьих - то цифер в интернете по тому же процу(насколько твои разгон, охлад, экземпляр хороши)

blokant ★★
()
Ответ на: комментарий от Toxo2

Прирост в 400% в одном тесте, ухудшение на 10% в сотне других тестов, смешанные результаты в тысячах других. В итоге примерно одно и то же с каждым поколением. Есть фундаментальный предел роста для последовательных вычислений, единственная реальная возможность что-то ускорить это сделать жирный кэш или пустить вычисление в параллель (как с теми же векторными инструкциями).

neumond
()
Ответ на: комментарий от neumond

Ядра точно становятся быстрее, благодаря росту Instructions Per Cycle, не от одной частоты всё зависит, хотя и она в среднем понемногу растёт, благодаря улучшению техпроцесса.

anonymous
()
Ответ на: комментарий от neumond

Ухудшений не бывает(не берём в счёт интеловскую лажу с alder lake, и намеренное урезание скорости устаревших инструкций вроде mmx).

Основной рост производительности в процессорах идёт от предсказателя ветвлений и прочей speculative out-of-order лабуды, если не считать кэша и контроллера памяти. Векторные инструкции не везде применимы, это не видеокарта.

anonymous
()
Ответ на: комментарий от neumond

Там горбатый подход с с Infinity Fabric на другом чиплете убивает скорость напрочь. Откуда там взяться вменяемо скалируемым результатам?

anonymous
()

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Математические тесты показывают производительность математических расчётов (но даже в этом случае лучше сделать бенчмарк из своих расчётов).

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Если бы был полный код реализации (на верилоге или на чём там их пишут), то наверное как-то можно было бы оценить (нейросеть натренировать:)

annulen ★★★★★
()

Но очень много сейчас зависит от управления питанием внутри проца. Сейчас в процы зашит авторазгон и лимиты по температуре и потребляемой мощности, и при большом числе рабочих потоков и хорошем охлаждении всё упирается именно в мощность. Так что какая по факту получится производительность зависит от количества загруженных ядер и решений, принимаемых автоматикой на ходу по показаниям сенсоров.

annulen ★★★★★
()
Ответ на: комментарий от anonymous

Я имел в виду, что авторазгон процессора (турбобуст) упирается в мощность. А скорость самого расчёта может и в процессор, и в память упираться, но тут я не силён (по крайней мере, я не знаю, как профайлерами получать инфу по боттлнекам в доступе к памяти)

annulen ★★★★★
()
Последнее исправление: annulen (всего исправлений: 1)