LINUX.ORG.RU
ФорумTalks

Обновлены результаты 7zip bencmark для Эльбрусов

 


2

4

На сайте с результатами бенчмарка 7zip произошло массовое обновление результатов для процессоров Эльбрус. В том числе были добавлены результаты для новых процессоров Эльбрус-8СВ и R-2000. Предлагаю ознакомиться всем интересующимся.

Ответ на: комментарий от legolegs

У эльбруса самба три чвэаса собирается, а толку никакого.

kirk_johnson ★☆
()
Ответ на: комментарий от legolegs

Тогда бенчмарк ничего не показывает.

Не пытайся, он не поймет, о чем ты...

vasya_pupkin ★★★★★
()
Ответ на: комментарий от Deleted

Я не понимаю, как люди, позиционирующие себя как технические специалисты, начинают играть в очень тупую игру «а у меня работает, значит, я молодец»

А почему я должен верить каким-то сайтам, типа whoisproxy.ru, если у меня все работает ?

Это их сугубо личные и интимные провайдеропроблемы

vasya_pupkin ★★★★★
()
Последнее исправление: vasya_pupkin (всего исправлений: 1)
Ответ на: комментарий от praseodim

Конечно, с современными интелом и амд эльбрусу не тягаться

Они для большинства задач нафиг не нужны. У меня phenom ii x4, ему уже 6 лет. Норм, полет нормальный

upcFrost ★★★★★
()
Ответ на: комментарий от legolegs

У i86 работает переупорядочивание и спекулятивное исполнение инструкций, а у эльбруса это делает компилятор.

А то шланг и гцц не делают ничего из этого

upcFrost ★★★★★
()
Ответ на: комментарий от legolegs

Тогда бенчмарк ничего не показывает. Для VLIW «процессоро-специфичная оптимизация» при компиляции - это обязательная часть технологии.

На уровне комплятора - да. А на уровне исходника - это уже нечестный бенчмарк получится. Для интела в боевой версии там, например, специальные asm-вставки имеются, которые компилятор сам не сможет сделать.

alexanius ★★
() автор топика
Ответ на: комментарий от upcFrost

Они для большинства задач нафиг не нужны. У меня phenom ii x4, ему уже 6 лет. Норм, полет нормальный

Ты уже успел сравнить его с Эльбрусом ?

vasya_pupkin ★★★★★
()
Ответ на: комментарий от vasya_pupkin

если у меня все работает

А, понятно, невменько.

Deleted
()
Ответ на: комментарий от alexanius

Хм

Я думал линейная это без ветвления.

Что является идеальным случаем для любого процессора.

При этом VLIW, по моим ламерским понятия, сможет лучше оптимизировать и распараллелить независимые операции по сравнению со стандартным циск или риск процессором, так как это происходит еще на стадии компиляции.

grim ★★☆☆
()
Ответ на: комментарий от vasya_pupkin

Да откуда я знаю как. У меня без обхода блокировок - не работает. И сайты всё ещё находятся в заблокированных подсетях. Хватит тупить.

DawnCaster ★★
()
Ответ на: комментарий от vasya_pupkin

Ты уже успел сравнить его с Эльбрусом ?

эльбруса у меня нема, а так сравнил бы

upcFrost ★★★★★
()
Ответ на: комментарий от grim

Я думал линейная это без ветвления.

Да, это я не очень точно выразился.

Что является идеальным случаем для любого процессора.

Это хорошие условия, но не достаточные. Если есть, например, цикл где каждое следующее вычисление ожидает результата предыдущего, то по сути он будет замерять только задержку инструкций процессора, что к производительности имеет довольно мало отношения.

При этом VLIW, по моим ламерским понятия, сможет лучше оптимизировать и распараллелить независимые операции по сравнению со стандартным циск или риск процессором, так как это происходит еще на стадии компиляции.

Всё зависит от конкретного теста. Бывают очень разные условия и подставы откуда не ждали. Вплоть до того что может тупо не хватить регистров, и тормоза будут на пересылках регистр-память-регистр

alexanius ★★
() автор топика
Ответ на: комментарий от tommy

Хватит заниматься идиотизмом. ПОЖАЛУЙСТА.

Подсеть в бане. Если у кого-то открывается ресурс из бана - вам сильно повезло. В совершенно любой момент это может закончиться.

Deleted
()
Ответ на: комментарий от Deleted

Спокойно. Я как раз и показываю что подсеть в бане. Через Megafon 7-zip тоже недоступен.

Когда работает - это как раз ошибка провайдера

tommy ★★★★★
()
Последнее исправление: tommy (всего исправлений: 1)
Ответ на: комментарий от tommy

Я как раз и показываю что подсеть в бане.

Ты не так показываешь. Надо просто тупо погрепать в выгрузке (или в соответствующих ресурсах), а не устраивать бессмысленную ерунду «у XXX не работает, у YYY не работает, у ZZZ работает»

Deleted
()
Ответ на: комментарий от alexanius

параллелизма тут по сути нет и сильные стороны VLIW не раскрываются

А в какой реальной задаче они могут раскрыться? Я не про управление ракетными двигателями разумеется (в таких задачах где на этапе компиляции можно все оптимизировать - да, раскроются), а про применение в компьютерах, серверах или десктопах неважно, т.е. там где на этапе компиляции невозможно предугадать и распараллелить все на 8 или 16 равных потоков. Мне кажется таких на серверах и тем более десктопах в принципе быть не может. Если так то чем тебе не нравится именно этот тест? Мне кажется Эльбрус всегда будет отставать от самых днищенских Атомов по определению, т.е. не потому что он плохой сам по себе, а потому что гениальные скрепные менеджеры пытаются приспособить архитектуру для чего она изначально не предназначена.

mbivanyuk ★★★★★
()
Последнее исправление: mbivanyuk (всего исправлений: 1)
Ответ на: комментарий от Deleted

Я просто подтвердил то, что в московском мтс не работает. Тут одному человеку вообще не верили. Заодно проверил других провайдеров что были доступны. Обнаружил что на одном сайт 7-zip просачивается. Доложил. Всё.

Ты не погрепал. А я не помню где, надо в телеге искать место. Что лень.

tommy ★★★★★
()

просто скажите мне, это победа, или предательство?

Shulman
()
Ответ на: комментарий от crutch_master

Так даже эльбрусовцы работают на клятых капиталистов, я уверен, что скоро их всех пересажают, оппортунистов.

zendrz ★★
()
Ответ на: комментарий от vasya_pupkin

провайдеропроблемы

Вот. Сижу я дома. На телефоне теле2 открывает. С компа через акаду не может. Могу ещё проверить по пути из метро и с работы. Скорее всего и там и там будет доступ. Причём, провайдеропроблемы заключаются именно в том, что доступ как раз есть. И это может быть большой проблемой для провайдера.

imul ★★★★★
()
Последнее исправление: imul (всего исправлений: 1)
Ответ на: комментарий от grim

При этом VLIW, по моим ламерским понятия, сможет лучше оптимизировать и распараллелить независимые операции по сравнению со стандартным циск или риск процессором, так как это происходит еще на стадии компиляции.

В реальности, поведение кода (ветвления, возможность распараллелить) зависит от данных, а это на этапе компиляции предсказать невозможно.

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 1)
Ответ на: комментарий от dave

Хз, я за PR не отвечаю, спросите у автора :)

alexanius ★★
() автор топика
Ответ на: комментарий от mbivanyuk

А в какой реальной задаче они могут раскрыться? Я не про управление ракетными двигателями разумеется (в таких задачах где на этапе компиляции можно все оптимизировать - да, раскроются), а про применение в компьютерах, серверах или десктопах неважно, т.е. там где на этапе компиляции невозможно предугадать и распараллелить все на 8 или 16 равных потоков.

В любой. Я вот сейчас смотрю на сравнение 8СВ и i7-8700 на широком наборе задач: в зависимости от пакета тестов до половины задач по логической скорости быстрее на Эльбрусе. Одна задача быстрее по абсолютной скорости.

Мне кажется таких на серверах и тем более десктопах в принципе быть не может

Для примера - кодек x264 имеет весьма неплохой результат.

Если так то чем тебе не нравится именно этот тест?

Мне этот тест как раз нравится. Если серьёзно анализировать его результат, то можно увидеть что у Intel i7-1065G7 результат 0.97 попугаев на ГГц, а у Эльбрус 8СВ результат 1.23 попугая на ГГц. Т.е. по факту имеем лучшее распараллеливание на VLIW на стороне компилятора, а само количество попугаев зависит больше от частоты (и от памяти). И тут хоть спектрум разгони до 4 ГГц, у него результаты будут лучше чем у современного интеля.

Мне кажется Эльбрус всегда будет отставать от самых днищенских Атомов по определению, …

См. объяснение выше

alexanius ★★
() автор топика
Ответ на: комментарий от alexanius

И тут хоть спектрум разгони до 4 ГГц, у него результаты будут лучше чем у современного интеля.

Вот читал тебя, читал. И вроде, умные слова пишешь, даже в фразы складываются. А тут БАЦ и ТАКОЕ !!! Товарищ, ведь чушь жэ абсолютная. Хоть до 4 терагерц зедник разгони, у него не будут результаты лучше современного Интеля. Он жэ элементарную 8-и битную команду 8-12 тактов считает, а 16-и битное умножение, например, будет считать до 1000 тактов. А сколько он будет считать 64-х битное деление, допустим - представь только.

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 5)
Ответ на: комментарий от lenin386

Ладно, замечание справедливое. Поправлюсь тогда - при ещё более гипотетическом 64-х битном Спектруме. Мысль в том что результаты конкретного теста зависят от частоты процессора и характеристик памяти

alexanius ★★
() автор топика
Ответ на: комментарий от alexanius

Я вот сейчас смотрю на сравнение 8СВ и i7-8700 на широком наборе задач: в зависимости от пакета тестов до половины задач по логической скорости быстрее на Эльбрусе. Одна задача быстрее по абсолютной скорости.

Если бы это было так ты бы сейчас закидал меня пруфами - что за задачи, какие тесты, где посмотреть результаты и т.д. Я бы не стал подвергать твои слова такому сильному сомнению, но уж очень расходится это твое утверждение с результатами независимых (ну ладно, не сильно проплаченных) тестов показывающих что Эльбрусы ну мягко говоря сливают старым Атомам. Новые может и не сильно сливают но до i7-8700 им конечно как сам знаешь до чего.

См. объяснение выше

Куда смотреть? Никакого объяснения выше у тебя нет.

mbivanyuk ★★★★★
()
Ответ на: комментарий от mbivanyuk

результатами независимых (ну ладно, не сильно проплаченных) тестов

А можно списочек тестов?

Ну из тех что есть в публичном доступе, можно, например посмотреть эту публикацию. Как думаешь, какой результат там atom покажет?

Куда смотреть? Никакого объяснения выше у тебя нет.

Объяснение про характер конкретной задачи и почему в нём результаты будут коррелировать с частотой

alexanius ★★
() автор топика
Ответ на: комментарий от alexanius

Ну из тех что есть в публичном доступе, можно, например посмотреть эту публикацию.

Там же для таких гуру в области микропроцессоров первые главы так и названы - «особенности архитектуры эльбрус» и следующая «адаптация программы к архитектуре эльбрус». Там русским языком объясняют - «Поскольку у VLIW архитектуры за планирование загрузки множественных исполнительных устройств отвечает компилятор, некоторая помощь компилятору со стороны программиста позволяет существенно повысить производительность вычислений.» Разумеется в используемом в реальной жизни софте никто такую «помощь» оказывать не будет. Я же тебе изначально и говорил - там где задача может быть распараллелена на этапе компиляции там стихия Эльбруса. Другое дело что на типичном сервер или десктопе такого нет и вряд ли будет. Но ты то утверждаешь совсем другое:

А в какой реальной задаче они могут раскрыться? Я не про управление ракетными двигателями разумеется (в таких задачах где на этапе компиляции можно все оптимизировать - да, раскроются), а про применение в компьютерах, серверах или десктопах неважно, т.е. там где на этапе компиляции невозможно предугадать и распараллелить все на 8 или 16 равных потоков.

В любой. Я вот сейчас смотрю на сравнение 8СВ и i7-8700 на широком наборе задач: в зависимости от пакета тестов до половины задач по логической скорости быстрее на Эльбрусе. Одна задача быстрее по абсолютной скорости.

Ну и где результаты тестов в «любой» задаче?

Как думаешь, какой результат там atom покажет?

Отличный. Эльбрус даже со всей «помощью» на этапе компиляции сливает старому IvyBridge. Новый Атом уделает это чудо.

mbivanyuk ★★★★★
()
Ответ на: комментарий от alexanius

без ветвления.

Да,

Что является идеальным случаем для любого процессора.

Это хорошие условия, но не достаточные. Если есть, например, цикл где каждое следующее вычисление ожидает результата предыдущего, 

А разве цикл не частный случай ветвления?

Вплоть до того что может тупо не хватить регистров, 

А разве суть VLIW не в том что у нас есть очень длинное слово и данные грузится с командами чтобы регистры были практически не нужны?

grim ★★☆☆
()
Последнее исправление: grim (всего исправлений: 2)
Ответ на: комментарий от DawnCaster

в универы и в госпредприятия где использовать обходы блокировок нельзя

Это где так? Во всех учебных заведениях и научных институтах, где приходилось выходить в сеть, не было никаких препятствий для обхода блокировок.

Вы, наверное, про какие-то режимные объекты говорите?

Serge10 ★★★★★
()
Ответ на: комментарий от alexanius

у Intel i7-1065G7 результат 0.97 попугаев на ГГц, а у Эльбрус 8СВ результат 1.23 попугая на ГГц

Я надеюсь, ты считал на ядра, а не на потоки? И да, даже +25% на ГГц — приговор для VLIW. Он должен больше, гораздо больше производительности на ГГц показывать, что бы хоть как-то начать конкурировать.

Intel i7-1065G7

Ммм, планшетник Surface Pro 7… Может, заодно их сравним по удельному энергопотреблению? Или удельному весу компьютера?

gremlin_the_red ★★★★★
()
Ответ на: комментарий от Serge10

Ну, насчёт универов, я, правда, давно уже лично не проверял. В моё время в универе можно было лазать в ынтернеты только через проксю. В котором не работал HTTPS (тогда это было не критично). И часть сайтов блокировались. И это всё было задолго до гос-блокировок. Вот я и предположил.

Но судя по новостям, в учебных заведениях вроде ведь должен быть уполномоченный оператор связи и более репрессивная система фильтрации, что-бы детишки не могли случайно на какие-нибудь китайские порно-мультики наткнуться посреди учебного процесса.

DawnCaster ★★
()
Последнее исправление: DawnCaster (всего исправлений: 2)
Ответ на: комментарий от DawnCaster

Но судя по новостям, в учебных заведениях вроде ведь должен быть уполномоченный оператор связи и более репрессивная система фильтрации, что-бы детишки не могли случайно на какие-нибудь китайские порно-мультики наткнуться посреди учебного процесса.

Вы университеты со школами/детскими садами не путаете? ;)

В СПбГУ, например, IP-адреса (внешние) долгое время выдавались по заявкам сотрудников. При этом данный сотрудник полностью отвечает за всю сетевую активность с данного адреса. Но делать может с этим адресом, что угодно - хоть серую сеть за ним развернуть, хоть прокси поднять, хоть VPN куда хочет кинуть. По умолчанию, все входящие соединения закрыты. Для открытия нужно настроить соответствующие сервисы и доступ из подсети NOC к машине по snmp. После этого пишется заявка в NOC и нужные порты открывают.

Последние лет 7, в связи с исчерпанием реальных IP, стали выдавать серые адреса. Но в остальном ничего не поменялось.

Serge10 ★★★★★
()
Ответ на: комментарий от tommy

Ты не погрепал.

Погрепал.

grep 159\.65\.0\.0 dump.csv

Deleted
()

А расскажи пожалуйста сделали ли предсказатель переходов в 8СВ и какой (если сделали)?

Так то архитектура с параллельными конвейерами прикольная - сделал вызов по середине процедуры, переключился на параллельный куда уже код подготовился, там посчитал вернулся обратно в место где вызывал, и очень хорошо с окнами сочетается. Хотя бы один то остался такой или все убрали, как-то по другому сделали?

uin ★★★
()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от uin

предсказатель переходов
VLIW

Эм, одна из основных идей VLIW — упростить железо, убрав оттуда все эти out-of-order и branch prediction. У тебя компилятор сам раскидывает инструкции по исполнителям в нужном порядке и предсказывает ветвления.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Ну там есть аналог с подготовкой перехода но он не везде хорошо работает. Как уже написал вызывать какую то функцию с тяжелым циклом в котором допустим еще что то вызывается циклично удобно и классно, а вот свитч какой нибудь здоровый с кучей кейсов или if гиганский с кучей еще ветвлений внутри по обе стороны уже не очень. В идеале конечно лучшеб было бы и то и то, пусть даже в чуть понерфеном виде может.

uin ★★★
()
Ответ на: комментарий от gremlin_the_red

Я надеюсь, ты считал на ядра, а не на потоки? И да, даже +25% на ГГц — приговор для VLIW. Он должен больше, гораздо больше производительности на ГГц показывать, что бы хоть как-то начать конкурировать.

Почитай ещё раз описание задачи - там технически не откуда взять IPC.

Ммм, планшетник Surface Pro 7… Может, заодно их сравним по удельному энергопотреблению? Или удельному весу компьютера?

Да не вопрос. Только давай возьмём 1C+. Получаем 1.3 попугая Эльбруса против 0.97 интеля. Смотрим потребление: 10 Вт Эльбруса против 15 Вт интеля. Что же лучше то…

alexanius ★★
() автор топика
Ответ на: комментарий от grim

А разве цикл не частный случай ветвления?

Нет. Ветвление не подразумевает возврат выше по управлению.

А разве суть VLIW не в том что у нас есть очень длинное слово и данные грузится с командами чтобы регистры были практически не нужны?

Данные лежат в регистрах. Оно по-другому не заработает.

alexanius ★★
() автор топика
Ответ на: комментарий от alexanius

Ну у вас на сайте просто есть пару работ

http://mcst.ru/doc/130621/Abdurazakov.pdf
http://mcst.ru/doc/130621/Shabanov.pdf
http://www.mcst.ru/files/5847d1/e80cd8/50076d/000001/abdurazakov_m.r._volin_v...

Следует отметить, что сжатые сроки разработки и существенное преобразование процессорного ядра при реализации дополнительных функций, определенных в очередной версии системы команд «Эльбрус», не позволили ввести спроектированное устройство предсказания переходов в окончательный вариант микропроцессора «Эльбрус-1С+». Тем не менее, приведенные результаты дают веские основания для применения описанного решения в перспективных разработках.


Этот вопрос я так понимаю решенный раз в публикациях лежит.

uin ★★★
()
Ответ на: комментарий от mbivanyuk

следующая «адаптация программы к архитектуре эльбрус»

Читаем дальше: «Для большинства ресурсоемких операций NOISEtte не выполнялось никакой специальной адаптации к архитектуре Эльбрус. Для Tapir была выполнена сравнительно несложная адаптация вычислений под архитектуру Эльбрус, описанная выше в разделе 3». Т.е. минимальные правки только на одной задаче.

Разумеется в используемом в реальной жизни софте никто такую «помощь» оказывать не будет.

Разумеется будут всеми правдами и неправдами. HPC вычисления - по-любому, более общие пакеты - по-разному.

Ну и где результаты тестов в «любой» задаче?

А это не любая задача? Ну ок, допустим тебе не нравится научная задача. У меня нет открытых данных по десктопу, могу только сказать что он вполне себе работает. Я спокойно сидел на машине с 700 МГц.

Отличный. Эльбрус даже со всей «помощью» на этапе компиляции сливает старому IvyBridge. Новый Атом уделает это чудо.

А почему тогда i7-6900K (Broadwell) 16 года уделывает i7-1065G7 (Ice Lake) 19-ого года? :)

alexanius ★★
() автор топика
Ответ на: комментарий от alexanius

Читаем дальше: «Для большинства ресурсоемких операций NOISEtte не выполнялось никакой специальной адаптации к архитектуре Эльбрус.

И без этой «адаптации» Эльбрус и показывает свои истинные результаты - сливает в разы старым бюджетным Интелам. Смотри результаты в таблице. О чем я тебе и говорил выше, что для обычного софта без какой-либо адаптации (возможность такой адаптации это другой вопрос) результаты Эльбрусов будут на уровне Атомов. Ещё раз - не потому что Эльбрусы плохие, просто архитектура такая.

Но если уж ты сравниваешь результаты «адаптированного» под архитектуру Эльбруса кода, может сравним например с результатами оптимизированными под гетерогенные вычисления AMD? А то вы фанаты Эльбруса любите играть в одни ворота. Там вычислительная нагрузка переносится на GPU (тот же VLIW на старых AMD по сути). Там отрыв копеечных АМД от Эльбруса я думаю будет на несколько порядков.

mbivanyuk ★★★★★
()
Последнее исправление: mbivanyuk (всего исправлений: 3)
Ответ на: комментарий от alexanius

А разве цикл не частный случай ветвления?

Нет.

ВАУ! Какие новости!!!

Что-то я чем дальше тем больше удивляюсь

Данные лежат в регистрах. Оно по-другому не заработает.

Оббана!

Все чудесатее и чудесатее!

Кстати, 7-зип поддерживает многопоточность и на моём компе грузит все ядра.

Более того на сайте указана прозводительность при нагрузке на 8 ядер ;)

grim ★★☆☆
()
Последнее исправление: grim (всего исправлений: 4)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.