Как и чем мерить лошадиные силы CPU?

0

2

У меня есть 2-х ядерный zen 1, как мне узнать его FP32 и вот это вот всё?
Как сравнить прирост мощей между поколениями? Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?
Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации? Например, в кодировании видео, в обсчете LLM, в компиляции кода и т. п.

←	Меняется порядок плат видеозахвата PCIe

Ноутбук на Intel N100?

→

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

Это не видеокарта, такой почти параметр бесполезен.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Нет.

anonymous
(05.02.25 12:31:43 MSK)

гугли «cpu benchmarks», полно сайтов с рейтингами cpu по разным тестам и сравнительными таблицами и диаграммами

просто как пример https://www.cpubenchmark.net/

alysnix ★★★
(05.02.25 12:32:42 MSK)

долго искать подходящий cpu FP32 benchmark

pfg ★★★★★
(05.02.25 12:38:41 MSK)
Последнее исправление: pfg 05.02.25 12:39:38 MSK (всего исправлений: 1)

https://cpubenchmark.net/compare/3325vs4811vs5573vs5648vs6199/AMD-Athlon-200GE-vs-AMD-Ryzen-5-5600-vs-AMD-Ryzen-5-5600X3D-vs-AMD-Ryzen-5-7500F-vs-AMD-Ryzen-5-9600X

Например

anonymous
(05.02.25 12:46:23 MSK)

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

HPL-MxP

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Да. Требуется высокая квалификация инженера, разрабатывающего модель производительности.

VIT ★★
(05.02.25 12:58:42 MSK)

Чего там мерить, и так ясно что лошадь дохлая

DumLemming ★★★
(05.02.25 13:01:27 MSK)

Берёшь свои типичные задачи и смотришь их тесты.

гугли «cpu benchmarks»

Passmark’ом и табличками я уже пользуюсь, мне больше интересно, что есть на Linux для измерений вычислительной мощности как в целом, так и по наборам инструкций.

HPL-MxP

О, буду знать.

Чего там мерить, и так ясно что лошадь дохлая

Ну-с, кому что, однако даже дохлые лошади тянут без тормозов современную OS, видосики, браузер, LLM 3-8B, компиляцию wine’а и всё такое прочее))

Reptile
(05.02.25 13:11:42 MSK) автор топика

Ответ на: комментарий от Reptile 05.02.25 13:11:42 MSK

даже дохлые лошади тянут без тормозов

Показатель «тянут без тормозов» - субъективный. Если вам норм, значит, норм. Рядовой линуксоид, попробовав это, начнёт рвать волосы~~на жone~~ и кричать, что «так жить невозможно!»

tiinn ★★★★★
(05.02.25 15:21:09 MSK)

в кодировании видео, в обсчете LLM, в компиляции кода

У фороникса есть test suite. Заходишь в поисковик, вбиваешь название проца и phoronix. Тут возможны нюансы связанные с тем что zen1 тестили на одном ядре и компиляторе, а zen5 уже на другом ядре и другой версии компилятора

cobold ★★★★★
(05.02.25 16:15:03 MSK)

Смотри размеры и частоты кэша. Вряд ли сами ядра становятся сильно быстрее с каждым поколением, частоты всё так же ограничены нагревом. Для кодирования видео можно использовать GPU и Video Acceleration API, там не все кодеки доступны, но это быстрее и энергоэффективнее. Для LLM вроде бы нужна видеокарта с максимальной памятью на борту, чтобы туда поместилось больше данных и модель была полезнее.

neumond ★★
(05.02.25 17:42:30 MSK)

В BogoMIPS'ах, в чём же ещё. ;))

Dr64h ★★★★
(05.02.25 17:54:47 MSK)

Ответ на: комментарий от neumond 05.02.25 17:42:30 MSK

Вряд ли сами ядра становятся сильно быстрее с каждым поколением

Мне на ЛОРе как-то люди объяснили, что между Zen2 и Zen3 на определенных задачах прям пропасть (400% в плюс на тех же частотах - не хухры-мухры)

С тех пор у меня в закладках такое: https://www.agner.org/optimize/instruction_tables.pdf

можно прям пальцем посчитать такты на инструкциях для разных ядер.

Toxo2 ★★★★★
(05.02.25 18:08:42 MSK)

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Нет никакой «реальной» производительности. Для разных задач она будет отличаться.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

В теории — можно. На практике прям полных спецификаций у тебя нет, а ту или иную задачу последовательно по всем инструкциям в скомпиллированном виде ты не анализирова. Так что нет, на практике посчитать не получится. Разве что прикинуть примерно.

Например, в кодировании видео

Запускаешь кодирование, смотришь время. Запускаешь на другом процессоре. Сравниваешь. Вот тебе разница в производительности на конкретной задачи.

Чтобы удобно запускать несколько раз несколько разных тестов и т.д. и т.п., собирать статистику, могу порекомендовать hyperfine.

CrX ★★★★★
(05.02.25 18:10:04 MSK)
Последнее исправление: CrX 05.02.25 18:11:07 MSK (всего исправлений: 2)

Cinebench r23 через wine заодно можно будет сравнить насколько твой проц отстает(или нет) от чьих - то цифер в интернете по тому же процу(насколько твои разгон, охлад, экземпляр хороши)

blokant ★★
(05.02.25 18:22:38 MSK)

Ответ на: комментарий от Toxo2 05.02.25 18:08:42 MSK

Прирост в 400% в одном тесте, ухудшение на 10% в сотне других тестов, смешанные результаты в тысячах других. В итоге примерно одно и то же с каждым поколением. Есть фундаментальный предел роста для последовательных вычислений, единственная реальная возможность что-то ускорить это сделать жирный кэш или пустить вычисление в параллель (как с теми же векторными инструкциями).

neumond ★★
(05.02.25 18:47:30 MSK)

Ответ на: комментарий от neumond 05.02.25 17:42:30 MSK

Ядра точно становятся быстрее, благодаря росту Instructions Per Cycle, не от одной частоты всё зависит, хотя и она в среднем понемногу растёт, благодаря улучшению техпроцесса.

anonymous
(05.02.25 18:57:35 MSK)

Ответ на: комментарий от neumond 05.02.25 18:47:30 MSK

Ухудшений не бывает(не берём в счёт интеловскую лажу с alder lake, и намеренное урезание скорости устаревших инструкций вроде mmx).

Основной рост производительности в процессорах идёт от предсказателя ветвлений и прочей speculative out-of-order лабуды, если не считать кэша и контроллера памяти. Векторные инструкции не везде применимы, это не видеокарта.

anonymous
(05.02.25 19:02:29 MSK)

$ 7z b

dataman ★★★★★
(05.02.25 19:14:31 MSK)

Ответ на: комментарий от anonymous 05.02.25 19:02:29 MSK

arrow lake, конечно же

anonymous
(05.02.25 20:15:04 MSK)

Ответ на: комментарий от neumond 05.02.25 18:47:30 MSK

Там горбатый подход с с Infinity Fabric на другом чиплете убивает скорость напрочь. Откуда там взяться вменяемо скалируемым результатам?

anonymous
(05.02.25 23:42:41 MSK)

5 раз пересобрать мир с -march=native и столько же раз без него.

fucpsy
(06.02.25 15:55:48 MSK)
Последнее исправление: fucpsy 06.02.25 15:59:37 MSK (всего исправлений: 2)

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Математические тесты показывают производительность математических расчётов (но даже в этом случае лучше сделать бенчмарк из своих расчётов).

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Если бы был полный код реализации (на верилоге или на чём там их пишут), то наверное как-то можно было бы оценить (нейросеть натренировать:)

annulen ★★★★★
(06.02.25 16:00:41 MSK)

Но очень много сейчас зависит от управления питанием внутри проца. Сейчас в процы зашит авторазгон и лимиты по температуре и потребляемой мощности, и при большом числе рабочих потоков и хорошем охлаждении всё упирается именно в мощность. Так что какая по факту получится производительность зависит от количества загруженных ядер и решений, принимаемых автоматикой на ходу по показаниям сенсоров.

annulen ★★★★★
(06.02.25 16:05:42 MSK)

Ответ на: комментарий от annulen 06.02.25 16:05:42 MSK

Нет, упирается в скорость памяти, традиционно. А потом уже в мощность.

anonymous
(06.02.25 16:33:51 MSK)

Ответ на: комментарий от anonymous 06.02.25 16:33:51 MSK

Я имел в виду, что авторазгон процессора (турбобуст) упирается в мощность. А скорость самого расчёта может и в процессор, и в память упираться, но тут я не силён (по крайней мере, я не знаю, как профайлерами получать инфу по боттлнекам в доступе к памяти)

annulen ★★★★★
(06.02.25 19:28:47 MSK)
Последнее исправление: annulen 06.02.25 19:29:27 MSK (всего исправлений: 1)

←	Меняется порядок плат видеозахвата PCIe

Linux-hardware

Ноутбук на Intel N100?

→

Похожие темы