LINUX.ORG.RU

Сравнение производительности Эльбрус-8С с Intel и AMD

 , , , ,


0

4

http://keldysh.ru/papers/2018/prep2018_152.pdf

Из документа можно сделать много интересных выводов, в том числе о кукурузности ядер АМД. Отставание Эльбруса довольно заметное, но не катастрофическое, в целом он на уровне Opteron 6276, у которого в 2 раза больше ядер, и на гигагерц больше частота.

Рассматривались несколько моделей процессоров Intel Xeon, от моделей 5-летней давности до наиболее современных. Чудес, конечно, не бывает, Эльбрус ожидаемо оказался медленнее процессоров Intel. Проигрыш по производительности ядра составил в среднем 2.6 раза для кода NOISEtte и 1.5 раза для кода Tapir. Это представляется достаточно хорошим результатом, учитывая, что тактовая частота Эльбрус-8С примерно вдвое ниже, т. е. в пересчете на такт Эльбрус не уступает Intel.

Дискач


Итог:


Эльбрус ожидаемо оказался медленнее процессоров Intel. Проигрыш по производительности ядра составил в среднем 2.6 раза для кода NOISEtte и 1.5 раза для кода Tapir. Это представляется достаточно хорошим результатом, учитывая, что тактовая частота Эльбрус-8С примерно вдвое ниже, т.е. в пересчете на такт Эльбрус не уступает Intel. Кроме того, проигрыш около двухраз на данном классе приложений является типичным даже для процессоров AMD, основного конкурента Intel. По производительности всего процессора проигрыш относительно Intel на коде NOISEtte составил от 2.5 раз против 8-ядерного IvyBridge до 6.8 раз против 24-ядерного Skylake, а на кодеTapir – от 2 до 5 раз, соответственно

Deleted
()
Ответ на: комментарий от Deleted

Похоже, что для обычного домашнего или офисного компа Эльбруса вполне хватит даже на современном не сильно жирном ПО.

Deleted
()

Где мне его можно заказать на алиэкспрессе? :P

Harald ★★★★★
()
Ответ на: комментарий от Deleted

На ядро молчат? Производительность Атлон х64, может и меньше.

Как для команды разработчиков, которая с нуля и в текущих условиях нарисовала и отлила в кремнии - действительно нельзя сказать что облажались.

Но достоверны ли сами бенчмарки.
Там видео есть?

Deleted
()
Ответ на: комментарий от Deleted

На ядро идентично интелу, если с поправкой на частоту. Всё написано, в том числе в ОП, если уж по ссылке сходить не можешь. Телепузики с ютуба это песец, конечно %)

K21
() автор топика
Ответ на: комментарий от Deleted

Там видео есть?

ААААААААААААА

K21
() автор топика

Неплохо было бы ещё упомянуть, что исходники бенчмарков немного допиливали для большей производительности на «Эльбрусе».

С другой стороны:

Все вышеуказанные модификации совместимы с компиляторами GCC и Intel. Для компилятора Microsoft Visual Studio требуется добавить пустые определения для отсутствующих ключевых слов и функций.Изменения в исходном коде NOISEtte и Tapir суммарно затронули всего несколько десятков строк. Для кода NOISEtte модификации дали ускорение на архитектуре Эльбрус около 1.3 раз, для кода Tapir –более 2 раз. При этом изменения не оказали заметного влияния на время вычислений на процессорах Intel, имеющихвнеочередное исполнение команд.

Singularity ★★★★★
()
Ответ на: комментарий от K21

Не могу без телепузиков!
Так что буду ждать ссылки на видосик с тестированием в РВ.

Deleted
()
Ответ на: комментарий от Deleted

Тю блин.. прочитал как «на процессор». Спокуха это же RTP!

Deleted
()

Есть бенчмарки независимых источников? А то по экономике мы тоже не облажались, сам РосСтат говорит.

anonymous
()

особый код с ручными оптимизациями (пушо конпелятор умеет в оптимизации почти как в ОоО, но пока нет) - это конечно занятно.

интереснее производительность в чем-то более реальном. ну, там, libreoffice. или хот бы конпеляция gcc.

а еще интереснее сравнить с С66х - прямыми конкурентами (VLIW с линуксом).

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

особый код с ручными оптимизациями

Там пару десятков строк этих оптимизаций. С учётом того что оригинал писался для x86, там наверняка ещё большой простор для ускорения. А если изначально писать под Эльбрус с учётом его особенностей...

С66х

Это что?

GCC

Это есть в древнем бэнчмарке Эльбрус 2с. На уровне атома https://m.habr.com/ru/post/390099/

K21
() автор топика

Opteron 6276

Бульдозер первого поколения. На уровне какого-нибудь десктопного FX8350

у которого в 2 раза больше ядер

Зато FPU столько же, а подсистема кэшей и памяти дно донное.

Дискач

На чистой математике догнали камни 2009 года.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

На уровне какого-нибудь десктопного FX8350

Так на него тут вся кукурузная секта надрачивает.

K21
() автор топика

Тащи результаты mozilla kraken. А то в тупой идельно параллелящейся числодробильне рулят всё равно видеокарты.

anonymous
()
Ответ на: комментарий от K21

Ну так рейтят-то его не за то, что он заруливает всё и вся, а за то, что за цену Эльбруса их десяток взять можно. Очень уж вкусное соотношение цена качество получилось и без обрезанности младших интелов — тут тебе и ECC, и IOMMU и прочее.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от devl547

Не, у МЦСТ кукурузы нет, и тепловыделение куда меньше. Судя по производительности на такт, взяли за основу Skylake, которого тогда и не было.

K21
() автор топика
Ответ на: комментарий от gremlin_the_red

Цена - вопрос массового производства. Если сразу 10 миллионов их напечатать, ещё и дешевле будет, нет переплаты за брэнд и маркетинг.

K21
() автор топика
Ответ на: комментарий от K21

Производительность на такт зависит от конкретного приложения и сценария его использования.

anonymous
()
Ответ на: комментарий от Deleted

Хватит.

//Устрицы ел, в веснот играл, в интернет ходил.

Aceler ★★★★★
()
Ответ на: комментарий от K21

Судя по производительности на такт, взяли за основу Skylake

Тогда уж Transmeta Efficeon взяли. Тот тоже VLIW внутрях.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Ага, и сравниваться на х86 коде.

Deleted
()

Создал в техразделе, чтобы не было флейма. Ужос, Кащ прогнулся под кровавую модерастию)

goingUp ★★★★★
()
Ответ на: комментарий от goingUp

Скор 45, где ещё создавать. Можно, конечно, было в новости накинуть, но там ещё подтверждения от кровавой модерастии ждать.

K21
() автор топика

Норм. Когда в продаже?

targitaj ★★★★★
()

в пересчете на такт Эльбрус не уступает Intel.

Какой смысл считать производительность на такт, если из-за отличия в микроархитектурах максимальные тактовые частоты будут разными даже на одном техпроцессе?

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

У эльбруса вообще пассивное охлаждение, в отличие от х86-печек. Думаю, с активным можно и частоту задрать.

K21
() автор топика
Ответ на: комментарий от K21

У эльбруса вообще пассивное охлаждение, в отличие от х86-печек

Где? У 8С TDP в 80 ватт и башенный кулер.
x86-печки? i9-9900 и 9900T - 8 ядер, SIMD в 2-4 раза шире используемых в тестах в этой PDF и 65/35 ватт
ryzen 2700 - 8 ядер, 65 ватт и тоже куда более жирный SIMD.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Эльбрус-4С, 4 ядра «Эльбрус», тактовая частота 800МГц, 8 МБ кэш-памяти. ... Ноутбук имеет пассивное охлаждение и выдерживает диапазон температур от –10 до +45 градусов

K21
() автор топика
Ответ на: комментарий от devl547

на подходе

Тогда и эльбрус 16с на подходе. Ну и, конечно, тепловыделение в 3 раза ниже совсем никак на производительности не скажется, ага. Вангую там просто частота в 3 раза ниже.

K21
() автор топика
Ответ на: комментарий от K21

Ну да, сравнил уже на налаженном отгружающем чипы производстве перемаркировать и локнуть, и производителя чипов шрёдингера без задач и покупателей.

А тепловыделение не соотносится линейно к частоте, немного скинуть частоты от верхнего предела кристалла и оно падает в разы.

anonymous
()
Ответ на: комментарий от K21

с активным можно и частоту задрать

(Сейчас придут анонимы и начнут придираться. Поэтому сразу скажем, что всё это спекуляции, и вообще вилами по воде писано. Тем не менее.)

Транзисторы не переключатся мгновенно, есть задержка. Соответственно, если за транзистором стоит другой транзистор, тот не начнёт переключаться, пока не переключится первый, и так далее. Не то чтобы длительности переключения просто суммировались, но чем длиннее цепочка, тем дольше сигнал будет проходить. Другими словами, чем сложнее внутреннее устройство проца, тем меньше у него максимальные частоты. И дело там не в тепловыделении, он просто не успеет переключиться за один такт, если такт слишком короткий.

Поэтому я сомневаюсь, что частоты у Эльбрусов ограничены из-за тепловыделения. И думаю, что больше они не могут из-за внутреннего устройства. Примерно как CICS-процессоры проигрывали по частоте RISC-ам из-за особенностей внутреннего устройства.

Было странным ограничивать частоту только чтобы сделать пассивное охлаждение, а потом проигрывать в скорости конкурентам. Логичнее задрать частоты как можно выше и выиграть, а об охлаждении уже думать потом.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Я правильно понимаю такое усложнение проца как перенос в него некоторых программных струткур?

Deleted
()
Ответ на: комментарий от i-rinat

Эльбрус 16с будет 2Ггц. Да и количество транзисторов при таком техпроцессе явно меньше ителовского. Так что мимо, имхо.

K21
() автор топика
Ответ на: комментарий от K21

Дело не в количестве транзисторов вообще, которые могут быть вообще во встроенном контроллере pci-e, а в количестве транзисторов последовательно на «критическом пути».

anonymous
()
Ответ на: комментарий от anonymous

Это мы подсчитать не можем, и совершенно неочевидно что у эльбруса по основной цепи транзисторов больше/меньше.

K21
() автор топика
Ответ на: комментарий от K21

Да и количество транзисторов при таком техпроцессе явно меньше ителовского. Так что мимо, имхо.

Число транзисторов может быть больше тупо за счёт больших кешей.

i-rinat ★★★★★
()
Ответ на: комментарий от Deleted

Не смогу дать ответа, мало что в этом понимаю.

i-rinat ★★★★★
()
Ответ на: комментарий от anonymous

Ну вот и упирается в техпроцесс. Хотя нет, погоди, пень 4 даже с завода на 4ГГц работал, про разгон не говорим.

K21
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.