LINUX.ORG.RU

Сравнение производительности Эльбрус-8С с Intel и AMD

 , , , ,


0

4

http://keldysh.ru/papers/2018/prep2018_152.pdf

Из документа можно сделать много интересных выводов, в том числе о кукурузности ядер АМД. Отставание Эльбруса довольно заметное, но не катастрофическое, в целом он на уровне Opteron 6276, у которого в 2 раза больше ядер, и на гигагерц больше частота.

Рассматривались несколько моделей процессоров Intel Xeon, от моделей 5-летней давности до наиболее современных. Чудес, конечно, не бывает, Эльбрус ожидаемо оказался медленнее процессоров Intel. Проигрыш по производительности ядра составил в среднем 2.6 раза для кода NOISEtte и 1.5 раза для кода Tapir. Это представляется достаточно хорошим результатом, учитывая, что тактовая частота Эльбрус-8С примерно вдвое ниже, т. е. в пересчете на такт Эльбрус не уступает Intel.

Дискач


Ответ на: комментарий от anonymous

Нет, «всё» не «работает параллельно». Чисто физически тебе нужно сначала знать X и Y, прежде чем посчитать X*Y, это никак не обходимая проблема и потому такие архитектуры ни годны нигде кроме узких ниш.

anonymous
()
Ответ на: комментарий от anonymous

Нет, «всё» не «работает параллельно». Чисто физически тебе нужно сначала знать X и Y, прежде чем посчитать X*Y, это никак не обходимая проблема и потому такие архитектуры ни годны нигде кроме узких ниш.

------------

Читайте выше: Процессору на вход поступают т.н. «широкие команды», в каждой из которых закодированы инструкции для всех исполнительных устройств процессора, которые должны быть запущены на данном такте.

За один такт выполнятся максимум 25(33) инструкции.

Да, надо оптимизировать и писать именно под Эльбрус, я именно про это и пишу, а не про х86.

anonymous
()
Ответ на: комментарий от anonymous

Утрируя, представь такую ситуацию: вычисление X, Y и X*Y не влезает в одну инструкцию. Занавес, приходится генерировать несколько инструкций, состоящих из одной операции и кучи заглушек. А всяких примочек, ускоряющих такой код в эльбруе нет, а в x86 куча...

anonymous
()
Ответ на: комментарий от peregrine

Это рассуждения немного уровня «В огороде бузина, а в Киеве — дядька». Для нейросеток делают специальные ASIC, я уверен, они для этого быстрее эльбруса.

anonymous
()
Ответ на: комментарий от anonymous

Для нейросеток делают специальные ASIC

Делают. Вот только я бы хотел видеть универсальный ASIC (а это уже не ASIC) в составе каждого смартфона и ПК, чтобы быстренько дообучать их, например, затачивая распознавалку голоса под конкретного владельца устройства.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 1)
Ответ на: комментарий от anonymous

25(33)

Да, но у x86 IPC =/= ILP.
Плюс кэш декодированных инструкций. Так что показатель не сильно ниже, чем у vliw.

devl547 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.