LINUX.ORG.RU
ФорумTalks

Эффективность процессоров


0

1

Провел небольшой бенчмарк процессоров, имеющихся у меня, на моей вычислительной задаче.

Сравнивал amd k5 90 MHz и athlon64 II x2 (k10), 3000 МГц,

На athlon 64 II считается за 118 секунд на одном ядре, на K5 примерно за десять часов (экстраполировано, проверялось на меньшем объеме данных).

Разница в ~300 раз, хотя частота ниже в 33 раза. Задача меряет практически только процессор, т.к. ни HDD и памяти активно не использует.

Итого, k10 эффективнее k5 в 9 раз.

вот использовавшаяся программа

https://github.com/vladtcvs/geodesic

geodesic_server, geodesic_client

Если не затруднит, проверьте у себя. время исполнения, частота процессора

★★★★★

Последнее исправление: cvs-255 (всего исправлений: 1)

(экстраполировано, проверялось на меньшем объеме данных).

Вот где-то тут ты и облажался.

Manhunt ★★★★★
()

А вообще, кроме частоты много чего шагнуло вперед с тех пор - размеры L1, L2, L3, улучшился cache prediction, конвеер стал еще более сложным, векторные инструкции... На К5-то небось даже ММХ нету. Компилятор, кстати, с одинаковыми march запускался?

nanonymous
()
Ответ на: комментарий от cvs-255

В данном случае зависимость времени от количества данных совершенно линейная.

А ты всё-таки замерь.

И вот еще какая мысль: ты говоришь, что память почти не используешь. Это значит, что оно могло уместиться в кэши k10, но не влезть в кэши k5.

Еще один вариант — плохая работа предсказателя переходов на k5. Попробуй собрать свою программу с profile guided optimization.

Manhunt ★★★★★
()
Последнее исправление: Manhunt (всего исправлений: 1)

K5 был тем ещё говнецом, так что ничего удивительного не вижу.

svr4
()
Ответ на: комментарий от Manhunt

А ты всё-таки замерь.

Замерил. на 10 точках 10.8 секунд, на 100 точках 118 секунд. Потому что первые 3 точки чуть-чуть попроще. Так что если результат (10 часов) и искажен, то чуть-чуть занижен.

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от Manhunt

Еще один вариант — плохая работа предсказателя переходов на k5.

Банально - у новых процессоров несколько конвееров.

devl547 ★★★★★
()

У тебя там вещественные числа считаются? На K5 сопроцессор говном был. Насколько помню, ситуация только в K7 улучшилась...

atrus ★★★★★
()
Ответ на: комментарий от vasya_pupkin

но он тормозит в 300 раз быстрее

wxw ★★★★★
()

Интересно конечно, но IDT C6-180Mhz улетел в мусорный бак лет так 7 назад.

Deleted
()

Если не затруднит, проверьте у себя. время исполнения, частота процессора

Как запускать-то?

Relan ★★★★★
()

слишком длинный у тебя однострочник...

MyTrooName ★★★★★
()
Ответ на: комментарий от asaw

в смысле там метрика Минковского. А моя программа расчитывает движение в искривленном пространстве, например пространстве с метрикой Шварцшильда. Отличие в том, что в плоском тела (и свет) движутся по прямым линиям, а в искривленном по довольно кривым геодезическим, которые надо численно искать, потому задача куда более ресурсоемкая

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от atrus

У тебя там вещественные числа считаются?

long double

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от cvs-255

Ах, это ж ОТО, я ступил... Ну что ж, успехов! Как научишься там решать задачу трех тел - чиркни на ЛОР))

asaw ★★★★★
()
Ответ на: комментарий от cvs-255

Да это я к тому, что классическая математика не слишком хорошо подходит для моделирования реального мира, а ещё хуже - для численного моделирования... ИМХО, конечно, но выстраданное, так сказать, ИМХО)

asaw ★★★★★
()
Ответ на: комментарий от asaw

классическая математика не слишком хорошо подходит

А что тогда подходит? Какая-то неклассическая математика?

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от cvs-255

Какая-то, которую ещё не придумали, а, может, уже и придумали как обычно, но к физике не успели приложить)

asaw ★★★★★
()
Ответ на: комментарий от cvs-255

1.6GHz.

Прикол этого проца в том что он обладает отсутствием спекулятивного выполнения и переименования регистров. Кроме того, в 512к кэша даже такой простенький процесс «не лызе». Ну и вдобавок там в фоне дочёрта всего было запущено, на пустой системе может и быстрее бы справился.

svr4
()
Ответ на: комментарий от cvs-255

i7 есть, но дома. Может через пару дней доберусь.

svr4
()
Ответ на: комментарий от svr4

Кроме того, в 512к кэша даже такой простенький процесс «не лызе»

У меня суммарно все файлы бинарей занимают 190k. Так что впринципе могло бы и влезть

cvs-255 ★★★★★
() автор топика
Последнее исправление: cvs-255 (всего исправлений: 1)
Ответ на: комментарий от cvs-255

Кстати, это было откомпилено без оптимизации.

С оптимизацией показало 651,95s

В фоне по-прежнему болтается хром с десятком вкладок, плеер и bzip2.

svr4
()

$ make
make: *** Не заданы цели и не найден make-файл. Останов.

Ты б хоть сказал, чем это собирать?

KRoN73 ★★★★★
()
Ответ на: комментарий от cvs-255

61,7 с

Core i5-4670K @ 4,2 ГГц, GCC 4.8.2, CXXFLAGS='-Wall -O3 -march=native -fomit-frame-pointer'.

Relan ★★★★★
()

В тесте, как я понял, достаточно инструкций FPU? Тогда ничего удивительного, поскольку некоторые из них достаточно сильно ускорились, отдельные вообще стали «условно бесплатными»

frame ★★★
()
Ответ на: комментарий от luke

Windows 2.0, она многозадачна

Там только кооперативная многозадачность. Так что проще переписать без клиент-серверной архитектуры.

redgremlin ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.