LINUX.ORG.RU

Сравнение Эльбрус-4С и Эльбрус-8С в нескольких задачах машинного зрения

 


3

5

В этой статье мы покажем, как работают технологии распознавания образов на Эльбрус-4С и на новом Эльбрус-8С: рассмотрим несколько задач машинного зрения, немного расскажем об алгоритмах их решения, приведем результаты бенчмаркинга и наконец покажем видео.

>>> Подробности

anonymous

Проверено: anonymous_incognito ()
Последнее исправление: anonymous_incognito (всего исправлений: 2)

Ответ на: комментарий от alt-x

По скорости было ближе к П3, чем к Core2

Ну так как раз потому, что частота ближе к П3, а ФФ в 2013 был без e10s, т.е. однопоточный.

redgremlin ★★★★★
()

Мне понравился пример с определением места съемки по окружающим предметам. Не знал, что такое уже возможно. Интересно.

Deleted
()
Ответ на: комментарий от redgremlin

А так, Core — это прямой наследник П3

А П3 - наследник П2. А П2 - наследник Pentium Pro. Давай с ним тогда сравнивать.

И, так как частота эльбруса гораздо ближе к п3, то сравнил его именно с п3.

И давно процессоры принято сравнивать по частоте? Не я понимаю, что школьники ещё могут что-то такое делать, но мне казалось что мы давно не в школе.

Ну не сравнивать же его с Core 2 Quad от 2007го года, у которого ядер столько же, сколько у 4С, но частота у самой младшей модели втрое выше.

А почему нет? Производительность не имеет прямой зависимости от частоты. Есть 100500 других факторов. IPC - тоже сферическая величина в вакууме. Сравнивать нужно на реальных тестах. На всякий случай приведу тест производительности (правда без 4С) где видно что 2-ядерный 2C+ на 500 МГц работает сопоставимо с Intel Atom D510 на 1660 МГц и с Pentium-M на 1000 МГц

alexanius ★★
()
Ответ на: комментарий от redgremlin

Ну так как раз потому, что частота ближе к П3

йес оф корс, а что толку?

ФФ в 2013 был без e10s, т.е. однопоточный

Этот аргумент принять не могу. Без какого-нибудь мега-волшебного JITа, VLIW будет как раз таки оптимизировать один поток. Как раз и мог показать себя во всей красе.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

В 13м году видел как запускается и работает фаирфокс на компе с Эльбрусом

FF - особая программа, в которой работает JS, который требует реализации собственного JIT'а, которого тогда не было. Т.е. по сути он работал в режиме интерпретатора.

alexanius ★★
()
Ответ на: комментарий от redgremlin

Intel Core ix такой же наследник Pentium 3, как i486 наследник Intel 4004.

Quasar ★★★★★
()
Ответ на: комментарий от alt-x

У них единственно возможное направление оптимизации - это компилятор. Сама архитектура эльбруса бесполезна для оптимизации, так как слишком многое там на компилятор возлагается изначально. Так-то тот же PostgreSQL кто-то сравнивал уже.

Quasar ★★★★★
()
Ответ на: комментарий от Quasar

Делало оно SPARCи.

Кстати жалко что свернули разработку. Их R1000 очень интересный был. Вообще, идея сделать не x86 проц максимально совместимым с x86 чипсетами - по-моему, очень интересна. Такой подход, как раз позволил бы выпустить большое количество компов недорого и в короткие сроки. Но увы.

alt-x ★★★★★
()
Ответ на: комментарий от robus

Эльбрус и Intel Core десктопные процессоры.

а на них разве десктопы продают? Судя во всему тому шуму на лоре, они только workstation для госконтор делают, так что было б вполне уместным КМК сравнить с каким нибудь зеоном.

Deleted
()
Ответ на: комментарий от alt-x

Ну, ок, кроме FF там был ещё Abiword. Тоже ближе к п3.

На глаз определяется? ) В 2013 году это скорей всего 2C+ был - тогда верю что дико тормозило (хотя посмотреть как AbiWord или FF работает на П3 не отказался бы :) ). 4С был готов только в 2014, а всерию ещё позже пошёл.

alexanius ★★
()
Ответ на: комментарий от alexanius

Сейчас разрабатывается R2000 на 2ГГц.

ничоси! Только частоту подняли, или в архитектуре тоже какие-то изменения?

alt-x ★★★★★
()
Ответ на: комментарий от alexanius

это скорей всего 2C+ был

Врядли. Эта железка была быстее Крафтвеевского компа который рядом стоял. А Крафртвеевском как раз 2С.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

ничоси! Только частоту подняли, или в архитектуре тоже какие-то изменения?

Хз, не фанат спарков и считаю что их надо закопать и заниматься только Эльбрусом. Но из общей информации - 8 ядер, 2ГГц, 28 нм, 64 ГФлопс

alexanius ★★
()
Ответ на: комментарий от alt-x

Врядли. Эта железка была быстее Крафтвеевского компа который рядом стоял. А Крафртвеевском как раз 2С.

Ну хз, может это спарк как раз и был :) Сейчас уже сложно сказать что-либо. По своему опыту могу сказать что за 4С вполне себе можно работать и троллить на ЛОРе.

alexanius ★★
()
Ответ на: комментарий от Deleted

а на них разве десктопы продают? Судя во всему тому шуму на лоре, они только workstation для госконтор делают

Просто это Россия.

robus ★★★★★
()
Ответ на: комментарий от alexanius

А П3 - наследник П2

Ну да.

А П2 - наследник Pentium Pro

Нет.

Давай с ним тогда сравнивать

Их не было сопоставимых частот. А П3 — были.

И давно процессоры принято сравнивать по частоте?

Документ выше читал? Там, где «почти не хуже равночастотного бла-бла-бла»?

Производительность не имеет прямой зависимости от частоты

Вообще-то, в рамках одной архитектуры зависимость производительности именно процессора практически линейная.

сопоставимо с Intel Atom D510 на 1660 МГц и с Pentium-M на 1000 МГц

Атом примерно равен П3 800, пентиум-м недалеко от этого же ушёл. Ну, то есть тенденция сравнивать Эльбрусы с производительностью прошлого тысячелетия вполне себе проглядывает. Да, это лучше, чем 1:1, но хуже, чем обещанные 2:1 на оптимизированном коде.

redgremlin ★★★★★
()
Ответ на: комментарий от redgremlin

А П2 - наследник Pentium Pro

Нет.

С вики:

the Pentium II featured an improved version of the first P6-generation core of the Pentium Pro

Производительность не имеет прямой зависимости от частоты

Вообще-то, в рамках одной архитектуры зависимость производительности именно процессора практически линейная.

При прочих равных - да. Но ты же сравниваешь разные архитектуры по сопоставимой частоте. Более того, даже разные Эльбрусы имеют разные версии архитектуры, не говоря уже про память, которая в ряде задач имеет крайне сильное влияние.

Атом примерно равен П3 800, пентиум-м недалеко от этого же ушёл. Ну, то есть тенденция сравнивать Эльбрусы с производительностью прошлого тысячелетия вполне себе проглядывает. Да, это лучше, чем 1:1, но хуже, чем обещанные 2:1 на оптимизированном коде.

Дык, там сравнивался 2С+ на 500 Мгц, который тоже древний. А вот про то кто кому равен по подробней, пожалуйста. Результат SPEC в студию. Из того что я привёл тот Atom примерно равен Pentium M, который является наследником Pentium III, но не им самим:

They evolved from the core of the last Pentium III–branded CPU by adding the front-side bus (FSB) interface of Pentium 4, an improved instruction decoding and issuing front end, improved branch prediction, SSE2 support, and a much larger cache.

И давно процессоры принято сравнивать по частоте?

Документ выше читал? Там, где «почти не хуже равночастотного бла-бла-бла»?

Приведу цитату:

Одно ядро R1000 имеет производительность примерно на уровне равночастотного Intel Atom, одно ядро с архитектурой «Эльбрус» – в большинстве тестов не хуже, чем равночастотный Intel Core2, но нередко в ситуациях, когда в исполняемой программе много независимых друг от друга операций, он «догоняет» архитектуру Intel Core2 с более, чем в 2 раза высокой частотой.

Тут сравнивается отнормированная по частоте производительность, т.е. логическая скорость. Причём на ряде тестов логическая скорость оказывается в 2 раза выше. В любом случае в той же статье даны результаты замеров, из которых и так всё видно.

alexanius ★★
()
Ответ на: комментарий от redgremlin

Или я не понимаю тебя, или ты не понимаешь, что такое VLIW.

Смотри: у тебя выполняется один поток, в котором есть 25 последовательных операций, причём таких которых компилятор может запихнуть в одну инструкцию, что он и делает. Выигрыш налицо.

Теперь у тебя много потоков, которые выполняются асинхронно. Компилятор не поможет, поскольку нет возможности выяснить в какой момент времени 5 операций в 5 потоках пересекутся таким удачным образом, что их можно было бы выполнить за такт. Чтобы получить выигрыш, нужен jit, встроенный в шедулер ОС. Бонусный геморрой в том, что процессы могут быть разные и привилегии у них тоже разные, но даже для арифметических операций написать такой ядерный jit - задача нетривиальная.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

Смотри: у тебя выполняется один поток, в котором есть 25 последовательных операций, причём таких которых компилятор может запихнуть в одну инструкцию, что он и делает

Для этого нужен очень умный компилятор, которого у них нет (и ни у кого нет, иначе итаниум бы не умер), да и возможно это далеко не для всех задач, веб к которым не относится от слова совсем, по причине непредсказуемости входных данных.

redgremlin ★★★★★
()
Ответ на: комментарий от anonymous

...советнег сразу предложил купить сабж...

Спасибо, взоржалъ =))

Страна Советов: каждая всезнающая гнида, потртаившая свою драгоценную жизнь на прозябание, лезет со своими никчемными советами. =)

Deleted
()
Ответ на: комментарий от redgremlin

Для этого нужен очень умный компилятор, которого у них нет

А вот про это я с особым удовольствием послушаю :)

alexanius ★★
()
Ответ на: комментарий от anonymous

встроены независимые процессоры управления и они способны работать без внешнего процессора

а фирмварь загружается через libastral

ckotinko ☆☆☆
()
Ответ на: комментарий от alt-x

25 последовательных операций, причём таких которых компилятор может запихнуть в одну инструкцию, что он и делает. Выигрыш налицо

Чё-то не очень. Есть пруф более-менее гарантированных 25 именно на операциях имеющих зависимости друг от друга? А то реальная производительность намекает на то, что нет. Так-то на штеуде тоже можно рассказывать что 4*32+1 благодаря simd будет.

anonymous
()
Ответ на: комментарий от anonymous

На самом деле в видяшках встроены независимые процессоры управления и они способны работать без внешнего процессора, что и делают в некоторых условиях.

Можно ссылку на то как это делали и что получалось?

torvn77 ★★★★★
()
Ответ на: комментарий от alt-x

Компилятор не поможет, поскольку нет возможности выяснить в какой момент времени 5 операций в 5 потоках пересекутся таким удачным образом, что их можно было бы выполнить за такт.

Как ты себе представляешь переключение задач внутри такта? В один такт один поток. Поэтому никакой jit не нужен. Если в потоке есть 25 операций, который можно складировать, значит эффект будет вне зависимости от того, сколько потоков.

monk ★★★★★
()
Ответ на: комментарий от ox55ff

А есть какой-то смысл в процессорной чистоте, когда на том же Эльбрусе стоит видеокарта AMD? Если хочется одночиповости, можно тегру попробовать.

jackill ★★★★★
()
Ответ на: комментарий от anonymous

Мощность хорошая, но сколько там ядер?

rupert ★★★★★
()
Ответ на: комментарий от monk

Выходит у него неискоренимые задержки в 25тактов, во время которых не работает шедулер, ограничивающие быстродействие)

anonymous
()

Никак не возьму в толк, как людям хватает наглости разводить подобный свинарник в достаточно безобидной теме?

Какие Intel? Какой AMD? Вы вообще статью читали, умники??? Там идёт сравнение производительности Э4С и Э8С. Там НЕТ сравнения с «конкурирующими платформами»! И не потому, что «Эльбрус» пока отстаёт по суммарной производительности от их актуальных моделей, а потому что задача подобного сравнения НЕ СТАВИЛАСЬ перед авторами статьи. Разнылись, развопились, поизливали экскременты и всё ради чего? Ради чего, я спрашиваю?! Ума палата — аж череп жмёт??? Это, блин, ВАШИ проблемы!

Люди в МЦСТ не занимаются ублажением ваших прихотей. Они занимаются развитием архитектуры процессора в соответствии с ТЗ основного заказчика. И этот заказчик — не вы, а значит и не вам диктовать правила!

По поводу сравнения с Intel: сравнение возможно. Конечные задачи схожи, но нельзя оперировать понятием производительности в целом. Только средней суммарной, и то — это лишь относительное сравнение. Процессоры ведут себя по-разному. Я полагаю, корректно сравнивать раздельно по типам вычислительных процессов: целочисленные, с плавающей запятой, скорость переключения контекста, работа с блоками данных в ОЗУ и т.д. Сравнение по принципу «кто круче» — это сравнение для дебилов!

А сотрудникам МЦСТ я посоветовал бы вообще прекратить упоминания Intel от слова «совсем». Т.е., никогда не идти на прямое сравнение, чтобы не провоцировать вот такое, вот, массовое помешательство с мракобесием обиженной школоты, которой не дали потискать новую игрушку. Пусть утрутся соплями и продолжат гордиться своими грозными Intel-ами в квартирах с облезающими обоями и протекающими кранами. Нравится им так расставлять приоритеты в жизни — пусть сами в этом болоте и тонут! Эльбрус, в первую очередь, производительная отечественная платформа. Отечественная! При чём тут Intel и AMD? Каким они тут вообще боком??? МЦСТ в ближайшем будущем и не собирается выходить на массовый потребительский рынок. Он не для вас, понятно? Он для дела, а не для ваших игрулек и прихотей извращённых мозгов IT-затычек в каждой бочке!

А уж если кто-то действительно интересуется Эльбрусами и не собирается скулить, то не помешало бы для начала почитать мат-часть! А если нет, то КАКОГО ХРЕНА вы вообще делаете в комментариях к новостям про «Эльбрус»?! Делать больше нечего? Скука заела? Слишком хорошо живётся? Бесстыжее племя, чтоб вас в таёжную хибару без следов цивилизации поселили!

krotozer
()
Ответ на: комментарий от jackill

Не имею ничего против гибридов. Просто считаю неправильным определять ненужность на основании сравнения цпу и гпу, т.к. гпу несамостоятельное, узкоспециализированное устройство. На гпу рабочую станцию не сделать.

А если мериться одними попугаями, то ещё более специализированная dsp заткнёт за пояс видеокарту в каком-нибудь FFT. Мы же не будем на основании этого факта говорить, что гпу говно и не имеет право на жизнь.

ox55ff ★★★★★
()
Ответ на: комментарий от ox55ff

Тут всё очень неоднозначно, ведь у «Эльбруса» наибольший пик производительности приходится именно на вещественные числа. Там несколько FPU могут объединяться в один для операций с подобными числами, если они достаточно «широкие». Самая «дорогая» операция для «Эльбруса» — переключение контекста.

krotozer
()
Ответ на: комментарий от krotozer

Бесстыжее племя, чтоб вас в таёжную хибару без следов цивилизации поселили!

Молодец, хорошо сказал.
Ухитрился поместить всё то, о чём думал я, в одну простыню. =)
Учетверю здесь: платформа отечественная, стало быть пора всякое раболепие перед конкурентами задушить. Тупо задушить и перестать на свой счёт их пиарить.

Deleted
()
Ответ на: комментарий от krotozer

Самая «дорогая» операция для «Эльбруса» — переключение контекста.

в смысле ?
дороже чем на x86 ?
имеется ввиду - нужно сохранять бОльшее количество регистров ?

kto_tama ★★★★★
()
Ответ на: комментарий от krotozer

мракобесием обиженной школоты,

это не школота
не тот почерк
это тролли, причем грамотные и натасканные по известным методичкам

kto_tama ★★★★★
()
Ответ на: комментарий от kto_tama

это тролли, причем грамотные и натасканные по известным методичкам

В каком месте грамотные? Тут чуть в техническую сторону копнёшь - сразу вылезает банальное непонимание принципов работы процессора/компилятора. Я прям даже разочарован.

alexanius ★★
()
Ответ на: комментарий от krotozer

Бесстыжее племя, чтоб вас в таёжную хибару без следов цивилизации поселили!

Зря ты так о работниках МЦСТ. Они, конечно, некомпетентные бездельники, но под умелым руководством опытного дровосека даже они смогут валить лес и приносить стране хоть какую-то пользу. При этом, как я вижу, некоторые из них даже имеют определённые склонности к литературной деятельности, так что будет кому стенгазету выпускать, чтоб не так скучно было долгими сибирскими вечерами.

redgremlin ★★★★★
()
Ответ на: комментарий от kto_tama

это не школота

это тролли, причем грамотные и натасканные по известным методичкам

Ты просто не видел продвинутой школоты =)
Продвинутая школота, по опыту, это в большинстве случаев производная грамотного троллинга, жертва троллей. Видал таких тучи.

Deleted
()
Ответ на: комментарий от krotozer

Он для дела, а не для ваших игрулек и прихотей извращённых мозгов IT-затычек в каждой бочке!

Правильно! Не мешайте людям распилами делом заниматься! А то ишь, чего удумали — открытия исходников патченного софта (в соответствии с условиями бездуховной GPL)! Скрепошататели окаянные!

robus ★★★★★
()

Что касается цены, то СМИ выяснили, что покупателям отечественные разработки обойдутся в 130 тыс. рублей при покупке компьютера из подсерийной партии. После старта серийного производства стоимость упадет до 70 тыс. рублей.
Источник : https://realnoevremya.ru/news/67546-kompyuter-na-baze-rossiyskih-processorov-...

vada ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.