LINUX.ORG.RU

Alibaba выпустила 128-ядерный процессор на архитектуре ARM

 , , , ,

Alibaba выпустила 128-ядерный процессор на архитектуре ARM

2

0

18 октября по заказу компании Alibaba Group был выпущен серверный 128-ядерный центральный процессор на архитектуре ARM.

Это не первый процессор, разработанный Alibaba Group. Ранее уже были представлены чип для ускорения работы искусственных нейронных сетей Hanguang 800, процессор для встраиваемых решений на архитектуре RISC-V Xuantie 907 и серверный процессор Xuantie 910.

Новый процессор использует набор инструкций ARMv9, выпущен с использованием техпроцесса 5 нм, имеет 60 млрд транзисторов, тактовую частоту 3,2 ГГц. Поддерживаются DDR5 и PCIe 5.0. Процессор ориентирован на производство серверных платформ.

Торговое название — Yitian 710. Пока к продаже на открытом рынке не предусмотрен.

>>> Подробности

★★

Проверено: hobbit ()
Последнее исправление: xaizek (всего исправлений: 8)

Ответ на: комментарий от aist1

Хэх...

Я сейчас FPGA всем обычным программистам советую, кто хочет какого-то необычного опыта попробовать, когда CUDA — это уже скучно. Особенно тем, кто любит «распределенное программирование» или считает себя специалистом в этой области. Потому что FPGA — это целый дата-центр (по количеству взаимодействующих элементов) у тебя на столе. А глубокое понимание вычислительных архитектур, которое будет просто побочным продуктом изучения темы, может потом конвертироваться в зарплату, авторитет и ЧСВ (как у меня, гы).

Ну тут надо заметить что для FPGA надо ещё и мозг программиста перепрошивать. Могут и не пережить. =)))

Собственно, я уже ничего никому не советую. В массе своей это дело несколько бесперспективное. У нас с более-менее грамотной архитектурой и техпроцессом напряги, а уж про остальное и не говорим.

С появлением Alveo, большие FPGA стали значительно более доступными для простых сметных. $2.5-3K вполне себе подъемная цена. Аналогичная U50 борда у Intel стоит $12K+. Это за гранью.

Оооо! Видели бы Вы воронежские FPGA! Правда, там они от Altera свой род ведут. Но просто «сказка», для взрослых. Причём, в формате хардпорно. Но я не удивлюсь если сейчас нарисуется пара сотрудников отдела маркетинга и расскажут как всё хорошо и будет ещё лучше.

Я вот на эту борду еще облизываюсь: ссылка. У неё NoC разведенный есть. Но её в магазине игрушек не купить.

Да, Network-on-Chip это сильно, конечно.

Moisha_Liberman ★★
() автор топика
Ответ на: комментарий от anonymous

Ну, то есть...

Как я правильно понимаю, Вас смущает то, что под спецприменение (и все мы знаем какое именно или Вам надо и это объяснить?) Байкал прикрутил к процу ethernet? Я правильно Вас понял? Т.е., Вам похрен ядра проца и Вы решили рассказать как же тяжко скачать с openrepos IP Cores для eth?

Вы знаете, нет. Ядра Байкал-М это Cortex A57. Конкретнее – CPU: 8 ядер Arm® Cortex™-A57 с частотой до 1.5 ГГц (архитектура Armv8-A). Это именно что мобила уровня 2013-2014г. выпуска.

Рассказывать про «мужиков» Вы можете долго, я Вас стебать буду ещё дольше, но нет, ядра от этого чем-то иным, кроме как ядрами мобилы не станут. Правда, они не сильно отстатют от VLIW. Но ведь «мужики-то не знают»…

Постойте, а это точно были «мужики»? А то вон китайцы 128 ядер залудили, да ARMv9 уже, а не ARMv8 или ARMv8-a. Тут бы ещё понять кто же всё таки «мужик», а кто так… =)))

А уж под какой «широкий диапазон устройств» эти «мужики» делали проц, это Вам тут второй ананас ответит. Он, знаете ли, большой апологет VLIW и считает что ARM… Впрочем, читайте сами. Тут уже всё написано.

Извините, надоело в теме про серверные китайские процы обсуждать наших инвалидов и их половые проблемы.

Moisha_Liberman ★★
() автор топика
Последнее исправление: Moisha_Liberman (всего исправлений: 1)

Alibaba выпустила 128-ядерный процессор на архитектуре ARM

Обсуждение в треде УЧЕНОСТИ как за балет.
Спецы же обсуждают …

Вчера вот у балеруна яйца больше были ...
anonymous
()
Ответ на: комментарий от NAY_GIGGER

Т.е. ничего относительно дешёвого и подобного малинке у них не имеется?

Малинка дёшева, потому что это в известной степени детская игрушка ( https://www.raspberrypi.org/), детям дорогого не купят. Поищите бенефициаров Baikal Electronics и попробуйте объяснить - зачем этим людям дешёвое решение. У них наверняка есть бизнес-план, и там нет «глупостей» типа «We make computing and digital making accessible to all through providing low-cost, high-performance single-board computers and free software». Вероятнее позиция «Вот — змея запускаем! Купи — мамочку позабавить! За пинжачок отдам. С карманами, конечно!»

Т.е. чтобы просто потыкать железку.

я давал ссылку на «Проект Лагранж», у них можно попросить устройства для тест-драйва.

anonymous
()

Yitian 710

Когда-то давно были адекватные названия процессоров 286, 386, 486, pentium, pentium 2

Потом видимо маркитологи активизировались...

Особенно у Китайцев. Почему блин 710. Это что? ) 7-я итерация 10й архитектуры или блин что?

У них и в авто такая же хрень. Какойнибудь первый ГритВолл будет иметь что-то типа 43200123 Ex FR 123 :) При чем мне кажется это именно маркетинг у них такой а не как было в СССР класс машин (размерность) зашит в номере, типа газ 2410, ваз 2101.

bonta ★★★★★
()
Ответ на: комментарий от bonta

Цифры ж больше, чего непонятно то? Больше - лучше. Жаровня для запекания жестких дисков на 710 ватт.

anonymous
()
Ответ на: комментарий от vertexua

Китайцы очень любят безумные спеки, ты еще о том что они в аудио делают не слышал

Издят - вот что они делают. Довелось с китайцями поработать в плане разработки устройств под заказ. Вот это говномесы, вот это разработка на отвали… И ведь это не кто попало, а известная фирма в аудио ODM…

Pavval ★★★★★
()
Последнее исправление: Pavval (всего исправлений: 1)
Ответ на: комментарий от aist1

Ну так почему-то у крупных компаний хватает мотивации и у разработчиков тоже. Комплект разработчика 300 000 рублей + комп на Эльбрусе. Для компаний это мелочь при нынешних завышенных ценах. И удвоение исполняемых инструкций в Эльбрус 8СВ это не то что могли когда-то видеть те, кто понимает в архитектуре. Удаленно руками можно пощупать. Раз такой крутой - вперед. На их сайте есть такая возможность в разделе Услуги. Это Мойша тут может сопли развозить про то как надо сдаться, положиться на АРМ и ждать чуда, что нам не запретят его закупать не будь в России своей архитектуры. Если имя верное, то он не совсем русский и слушать что он несет явно противоестественно. Хотя с Mellanox сотрудничество есть и внезапно они сделали драйверы под Эльбрусы. Со всем уважением чувак сходи и проверь своими силами хорош Эльбрус или его просто так грязью поливают. Я считаю что абсолютно незаслуженно поливают грязью. Китайцы тоже нихрена не разработали бы не скупи они долю в АРМ и не своруй технологии. Этот процессор в данной теме явно плод воровства технологий. Эльбрус же полностью оригинальная разработка.

anonymous
()
Ответ на: Ну вот. Этого я и ждал. от Moisha_Liberman

Сначала надо посмотреть спеки, а вдруг там показывают 8СВЮ который на подходе.

И что этот анализ дает? Кто-то разогнал память перепрошивкой модулей? Кто-то использовал новое ядро линукс? Ты хоть попытался расшифровать что значит 2815*** в тесте Octane, который внезапно жабоскрипт? А ты проверял в каком браузере это происходило? У меня даже хромиум дает погрешность в несколько процентов.

А вот на это ты так решительно закрыл глаза да?

     Байкал   Эльбрус   Core i7-2600

MP MFLOPS 49788 381326 81745

И прекрати смешивать независимых людей с пиар отделом. Это не смешно уже.

anonymous
()
Ответ на: комментарий от NAY_GIGGER

Ты какой-то фейковый майнер, если в требованиях указываешь одинаковую частоту, но не указываешь одинаковое энергопотребление

cobold ★★★★★
()
Ответ на: комментарий от x-signal

Да нет, у Амазона такое уже с год есть

cobold ★★★★★
()
Ответ на: комментарий от AlexVR

Тот арм Fujitsu специально для того супера спроектировали и он не универсальный, а для определенного класса задач, под который заточены и fp-расширения и архитектура памяти

cobold ★★★★★
()
Ответ на: Ну вот. Этого я и ждал. от Moisha_Liberman

а нельзя ли так сделать, чтобы этот ваш Эльбрус 8СВ так и помер бы где-нибудь тихо там, на подходе

Шоп ты сам сдох. Без покаяния. Злыдень.

anonymous
()
Ответ на: Ну вот. Этого я и ждал. от Moisha_Liberman

Если ты программист, то должен знать что от дистрибутива зависит какая будет производительность и сравнивать какой-нибудь дистрибутив Astra Linux заточенный на безопасность с дистрибутивом для Core i7-2600 заточенным на скорость это надо быть лютым днищем. Сначала выясняются лучшие условия, а потом задается компиляция из исходников браузера с оптимизациями вроде -O3 что может давать до 50% прироста производительности. Или ты будешь утверждать что в стабильный дистр для особо ошпаренных воткнут что-то выше -O2? Если сравнение в худшем сценарии еще и делалось через жопу в Firefox, который не блещет производительностью, то цифры могут быть не столь впечатляющие. Но ты видимо плохой программист, раз не в курсе что можно поставить Chromium/ungoogled-chromium из исходников и получить двойной прирост. Если в тесте достаточно указанных цифр для i7, значит Эльбруса вполне хватит с головой, ведь только больной на голову программист будет на Эльбрусе гонять чистый жабоскрипт. Может жабоскрипт для встраиваемых систем покажет гораздо лучше результат, чего вполне хватит для множества программ. Об этом плохой программист предпочтет «скромно» умолчать. Ты ведь помрешь раньше чем Эльбрус, так зачем так напрягаться? Если бы ты работал на Эльбрусах, а не на западников, то уже имел бы опыт не на словах. Иди скачай Эльбрус 6-й версии. Там есть lcc. Можешь запихнуть свой хеллоуворлд туда и сравнить производительность. Хотя бы код то ты можешь кинуть по ssh на удаленный сервер когда он собираться сможет компилятором. Но ты не заинтересован в том, чтобы самому все проверить. А значит никакой ты не программист ололошка.

anonymous
()
Ответ на: комментарий от anonymous

Берем Новый Эльбрус и такой же 8 ядерный АРМ. И арм сосет люто.

бла бла бла. Выше уже давали ссылку что преимущество только в HPC тесте. Где 8*6 себя могут раскрыть. И всё. На стандартных задачах или так же или «сосет» Эльбрус (как там php, java и т.п. кто это всё будет оптимизировать с их кодом ориентированным на прыг-скок?)

Ну конечно там будет архитектура «поддержанная» теми, кто на это деньги делает. x86 для США, ARM для Бритов, ой они же недавно обнаружили, что патенты то в Китай уплыли.

Там то что выгодно и энергоэффективно. А первая строчка от Японской Fujitsu которая до этого делала процессоры на спарках (рекомендую к прочтению: https://www.nextplatform.com/2018/08/24/fujitsus-a64fx-arm-chip-waves-the-hpc-banner-high/)

И этот процессор боле верно сравнивать с Эльбрусами, 8 ядер по 6 инструкций против 48 ядер. Оба от компаний занимавшихся SPARC

                          Эльбрус-8СВ      A64FX
Техпроцесс, нм                     28          7
Тактовая частота, Гц              1.5        1.8
Ядер                              8*6         48
Число транзисторов, млрд          3.5        8.8
Производительность, Гфлопс        288     2764.8
Год серийного производства       2020       2019     

Срал я на их тесты и топ 500

Не дураки супер компьютеры собирают и говорят о наглядной разнице в пользу Эльбрусов при одинаковой стоимости со штеудами.

Ты как-то определись. Для начала только HPC тесты и годятся для Эльбруса.

Во вторых, возьмём наш список https://top50.supercomputers.ru/list Где тут Эльбрусы? Т.е. не одного суперкомпьютера на Эльбрусах не собрали. Всё что меньше нашего 50-го места - это пузатая мелочь, которая работает для решения 1,5 задачи в год (я сам таким кластером управлял на 20 узлов и это не суперкомпьютер, а минимальный инструмент для работы).

Чувак он их пачками исполняет.

Чувак ты хоть раз под VLIW программировал? Ты хоть представляешь сколь работы надо проделать что бы задействовать этот «параллелизм»? Переписать циклы, слить несколько функций в одну и постоянно смотреть на ассемблерный выхлоп с комментариями от компилятора.

Ради одной вычислительной задачи работающей на DSP это ещё имеет смысл. В большой кодовой базе ориентированной на x86/ARM с их предсказаниями переходов всё это бесмысленно.

VLIW действительно интересно использовать в embedded в DSP от TI (и это доступно любому). Возможно было бы интересно порешать на кластере с Эльбрусами задачи из астрономии, физики и т.п. НО зачем зря тратить электроэнергию? Эльбрус отстаёт в темпах развития слишком сильно, что бы соревноваться с кем-то. И если Байкал и Ядро заставять его шевелиться то будет профит, а так….

AlexVR ★★★★★
()
Ответ на: комментарий от cobold

Удивительно. Это же проц для суперкомпьютеров. И он не только для этого был создан. Их уже несколько. Есть его вторая версия на 2 Гц и скоро третья, а до этого были ещё спарки от фуджитсу. А это расширение теперь будет в ARMv9.

AlexVR ★★★★★
()
Ответ на: комментарий от salozar

Например, сделать наконец-то микроядра эффективными, добавив аппаратную реализацию для быстрого мессаджинга между потоками.

зачем нужно софтовое микроядро если можно для каждой задачи выделить своё аппаратное ядро ? а inter-processor communication давно применяют в SoC

https://ieeexplore.ieee.org/document/8256756

anonymous
()
Ответ на: комментарий от cobold

Ну и как бы векторные инструкции есть и в x86 и это не заявляется как «для определенного класса задач».

AlexVR ★★★★★
()
Ответ на: комментарий от aist1

Например, сделать наконец-то микроядра эффективными, добавив аппаратную реализацию для быстрого мессаджинга между потоками.

зачем нужно софтовое микроядро если можно для каждой задачи выделить своё аппаратное ядро ? а inter-processor communication давно применяют в SoC

https://ieeexplore.ieee.org/document/8256756

anonymous
()
Ответ на: комментарий от anonymous

Бггг... =)))

А вот на это ты так решительно закрыл глаза да?

В удалённом тут комментарии (где я якобы кого-то оскорблял) я уже поминал одного клоуна, который раздавал в своё время интервью достаточно бодренько.

Хорошие были интервью. Заслушаешься. Отдельно умиляло то, что от интервью к интервью чуть ли не вдвое росла производительность и число транзисторов в проце, которого тогда ещё и не было. Да-да, я именно про того, у которого фамилия начиналась с буковки «Б». Сейчас уже очевидно что результаты несколько не так эпохальны как хотелось бы.

Приведённые показатели это расчётная производительность проца. Причём, не сказано для каких задач – просто офисных, обмолот сетевого трафика, IO вообще или это какой-то неэпический цикл вычислительный, под которые и больше ни подо что делался VLIW. На вычислительном цикле VLIW даст свой результат, но на стандартном наборе он будет на дне по производительности просто потому, что на множественные переходы он не ориентирован. Он хорош там, где нет массы переходов и ему ни что не мешает считать. Просто и тупо. Иначе вам тогда каждую софтину подтёсывать по месту и тщательно на основании выхлопа ассемблера её оптимизировать. Просто потому, что иначе по кешу или по шине (тут два варианта) она будет улетать на дно и там ещё вглубь копать продолжать.

Как только человек проанализировал работу на ряде задач, при чём не специально выстроенных, с анализом циклов и тщательной оптимизацией переходов (что нужно для VLIW) а просто взял и заюзал код, то выяснилось что с core i7 от 2011г. в 2019г. Эльбрус 8СВ и рядом не лежал.

Что этот анализ дает? Кто-то разогнал память перепрошивкой модулей? Кто-то использовал новое ядро линукс?

Что даёт этот анализ я написал выше. Перепрошивать модули? Новое ядро Линукс? Ну вот у меня сейчас в генточке ядро 5.14.14-gentoo-x86_64 #1 SMP Thu Oct 21 08:37:47 MSK 2021, куда новее? И у меня нет проблем.

Да проще поменять процессор и не использовать VLIW там, где он просто не предназначен к использованию. Всё проще. И нет, не надо мне тут на госкорпорации головой кивать, дескать вот они могут. Они могут что угодно за свои бабки делать. Отдельные госкорпорации, например, одна из них под предводительством господина с фамилией на «Ч» вообще по сути ОПГ. Денег получала, выхлоп ноль. И чё теперь – принять за ориентир?

И прекрати смешивать независимых людей с пиар отделом. Это не смешно уже.

А мне сложно понять кто же кроме пиаротдела в 2021г. на полном серьёзе (в трезвом уме и при здравой тёще) будет пытаться сравнивать 128 ядер ARMv9 (спеку хоть смотрели?) с 8 ядрами ARMv8-A, а то и вообще с VLIW, чьи ноги торчат ещё из OpenSPARC и (и нет, я не верю что всё сами и с нуля городили) и уверять что 128 ядер ARMv9 это говнище, а VLIW или телефонные ядра Байкал это наше новое всё.

Повторяю – госкорпрации могут позволить себе тратить деньги вообще в качестве благотворительности, выделяя гранты убогим. Но мы тут вот уже которую страницу вообще не про это. Мы про то, что выпускать вас, пацаны, против китайских «тигров» – это покормить тигров халявным «мясцом». Вы надеетесь на закрытие экономики? Спите и видите такой расклад, чтобы больше, кроме как вот это вот ваше говно было ничего не купить? Потому что я бы например для серваков покупал китайские 128 ядер, если бы у меня были задачи под них, а не ваши поделия по цене геро… «тяжёлых наркотиков». Я понимаю откуда у вас такая желудочная резь – жрать, говорите, хочется? Ну, что вам надо делать я выше уже написал. Повторять надо?

И не верю в то, что я общаюсь тут с технарями-ананасами просто потому, что вы не осиливаете банальное сравнение технологичких основ. До вас даже не доходит как китайцы умудрились вые… «извернуться». Там с одной когерентностью кеша вопросов будет выше крыши.

А вы мне тут предлагаете модули памяти перешивать? Чё, серьёзно? =))) Может, просто вас послать подале и прямым ходом?

Moisha_Liberman ★★
() автор топика
Ответ на: комментарий от X512

У RISC-V аж 1092 ядра

это не ядра а детские ядрышки

1088 energy-efficient ET-Minion 64-bit RISC-V in-order cores

взрослых там всего ядра

4 high-performance ET-Maxion 64-bit RISC-V out-of-order core

anonymous
()
Ответ на: комментарий от anonymous

ЛОЛШТА?!? =)))

Что за выхлоп бредогенератора я сейчас прочёл? =)))

Ладно. Отвечу. =)))

Ты ведь помрешь раньше чем Эльбрус, так зачем так напрягаться?

Если учесть что кремний бессмертен, то все эти ваши эльбрусы это теперь вечный памятник вашему раздолбайству и тупости, да. Так «попадать» в историю я бы не хотел. =)))

Если в тесте достаточно указанных цифр для i7, значит Эльбруса

Нет. Это значит что Эльбрус на этом уровне. Потому как с девятой рязанью его сравнивать – это всех вас выгнать с работы на мороз.

ведь только больной на голову программист будет на Эльбрусе гонять чистый жабоскрипт.

О! Да ни как у Вас мозг прорезался? Чудо чудное! =))) Да какая на хрен разница процу, который позиционируется как процессор общего назначения какой код на нём крутится? Какой дурак тогда будет делать СХД на таком процессоре, если проц для СХД не предназначен? Если ваш этот эльбрус это не процессор общего назначения, ну так и валите на рынок спецпроцессоров, а не вводите в заблуждение людей. О том и речь. И нефиг тут срать в форум, рассказывая сказки про то, что ща придёт Эльбрус 8СВ и всех уделает. Про то и речь… =)))

Если бы ты работал на Эльбрусах, а не на западников,

Тут тема про китайские процы, алё! =))) Китай это на востоке. Я работаю на восточников? Если чё и в вашем курятнике вдруг там не обратили внимания, то китайцы отжали всё подразделение ARM China у ARM Ltd., вместе со всей собственностью. Теперь понятно зачем они это сделали. За несколько месяцев вот такую вундервафлю на 128 ядер просто так не подготовишь.

Иди скачай Эльбрус 6-й версии. Там есть lcc.

Ну да, всё тот же самый gcc, который «обогатили» RTL для эльбруса и «забыли» вернуть в апстрим, да… =))) Батенька, вы там передайте своим инвалидам что уже есть clang и теперь можно на нём создать свой компилятор. И незачем говном марать общемировое достояние. Я про gcc, а не про lcc говорю.

Нет. Я не собираюсь колупаться в вашем говне. Жизнь слишком коротка, знаете ли, чтобы тратить её на долбо… Мне тут человек подкинул идеек кучку, вот там есть с чем поработать. А вы уж как-нибудь «сами, всё сами». Пока вас не позакрывали на фиг. =)))

Moisha_Liberman ★★
() автор топика
Ответ на: Бггг... =))) от Moisha_Liberman

Хрень ты написал. Старый Firefox, который медленнее нового, который в 2 раза медленнее хромого и ты тычешь этими «тестами»? Чувак, ты бы бросал пить. Там лишь один тест показывает тотальное превосходство Эльбрусов. Можешь и не использовать центральный процессор там где нужна универсальная многопоточная производительность. Мне начхать. Можешь это 128 ядерное монструозное говно купить за дофига денег. Но ты как программист ничего не выдал, а потому выхлоп не засчитывается. Я уже не раз писал что новый компилятор позволяет вдвое, читай: вдвое увеличить производительность кода средней паршивости. Ты конечно можешь и дальше читать наискось и общаться на убогом уровне, но это бесполезно. Оверхед в 10% сожрет пачку ядер просто как нефиг у этих 128. А убогий код, который ты так стремишься запускать на эльбрусах, который может исполняться в 600 раз медленнее и этот 128 ядерный арм сделает убогим утюгом. Через жопу можно так написать, что минут 15 будет считаться то, что может быть посчитано в несколько циклов. Тв когда в адекват придешь постарайся осилить оптимизацию, серверный рынок с серверными ценами на железо, а потом уже начинай открывать рот. Для тебя видимо нормас заплатить 48000$ за процессор от интел. Так впере. Я тебя не останавливаю. Я предпочту в таком раскладе Эльбрус. Мы ведь сравниваем топовые решения серверного сегмента.

anonymous
()
Ответ на: комментарий от anonymous

Раз такой крутой - вперед. На их сайте есть такая возможность в разделе Услуги.

Я крутой не только в программировании, но и в логике. Бремя доказательства несет утверждающий. А это здесь — ты. Если ты так болеешь за этот процессор, сходи, проведи репрезентативные тесты, накидай статью на Хабр, пингуй нас, обсудим. Я буду только рад, если Эльбрус, наконец-то, продемонстрирует давно обещаемую производительность. Мне это делать не интересно, потому что я в реальной жизни с этой железкой не столкнусь. Очень уж она нишевая пока что.

aist1 ★★★
()
Ответ на: комментарий от anonymous

зачем нужно софтовое микроядро если можно для каждой задачи выделить своё аппаратное ядро ?

Это было про microkernel operation systems)).

aist1 ★★★
()
Ответ на: Хэх... от Moisha_Liberman

Видели бы Вы воронежские FPGA!

Что за звери?)

PS. Ко мне всем здесь можно «на ты» обращаться. Пусть будет атмосфера старого доброго интернета.

aist1 ★★★
()
Ответ на: =))) от Moisha_Liberman

Она не днищевая, если говорить серьезно. Она просто (а) несбалансирована и (б) неправильно позиционируется. Ей бы дать побольше статической памяти (чтобы VLIW «шмог»), парочку обычных (sparc?) ядер в помощь для обычного кода, да систолических матричных умножителей дюжину, и была бы вундервафля для встраиваемых применений. Т.е. чип нужно вести в сторону AI-акселераторов, например. Ниша, по моему искреннему, но дилетантскому, ощущению, гарантирована.

aist1 ★★★
()
Ответ на: комментарий от aist1

Мне все равно кто там в логике силен. Есть только собственный опыт, который позволяет утверждать что-то наверняка. Как тебе такая логика Илон Маск? Дальше не читал. Ты видимо только с техникой умеешь общаться.

anonymous
()
Ответ на: комментарий от aist1

Ok.

Я тоже разрешаю тебе на «ты» ко мне обращаться. Не вопрос. =)))

Просто, раньше интернет был да, старым и добрым. Сейчас, при засилии манагеров-маркетоолухов на «ты» обращаться это проявлять некое такое доверие. А я этого даже судя по данному треду не могу. Да и отвык уже. Сложно к человеку на «ты» обращаться бывает когда палец на кнопке мыши его хочет непроизвольно послать всерьёз и далеко. Надеюсь, понятно о чём я. =)))

Что за звери?)

Лучше не вспоминать к ночи. Это всё росло из Altera, там в пределах одной партии могли характеристики «плясать» так что, становилась понятна присказка про то, что Воронеж надо бомбить. Это было ещё до всеобщего поветрия на импортозамещение. И становилось понятно почему в СССР была военная приёмка.

Про остальное даже не буду углубляться – не помню действует у меня ещё тот NDA или нет. Но в общем и целом всё было весьма мрачно и печально.

Ну и да. Вон чё наш боевой ананас пишет:

Ты видимо только с техникой умеешь общаться.

Эвона как! Мощно задвинул, не отнять. =))) Ну и кто мне скажет теперь что мой детектор маркетоолухов сломан? Кто теперь мне такую глупость заявит? =)))

Moisha_Liberman ★★
() автор топика
Последнее исправление: Moisha_Liberman (всего исправлений: 1)
Ответ на: ЛОЛШТА?!? =))) от Moisha_Liberman

Так вот посчитай цену вундервафли. И если сейчас можно произвести 48-ядерный Эльбрус, то не насрать ли на то, что кто-то делает на 128 ядер армы? А на 5 нм полагаю число ядер в Эльбрусе может быть и выше. Давай включи калькулятор, раз уж ты программист. 28 нм против 5 нм. 48 ядер на 28 нм это будет вдвое большее число ядер на Эльбрусе внезапно так. И самое главное - они будут прекрасно параллельно работать. Но кому надо просто ставит их по 4 штуки на материнскую плату и это покрывает все нужды уже сейчас. Тебе как программисту такое тяжело представить, но внезапно Эльбрусы намного эффективнее на той же частоте. То есть к вдвое большему числу ядер мы смело можем умножить вдвое производительность из-за особенностей архитектуры. А потом начинается магия профилирования и компиляции кода и вот эта вундервафля соснет даже у 4 процессорного Эльбруса. Даже изобретать ничего ненужно. Материнские платы уже есть. Слишком сложно для тебя, но ты постарайся осилить, что Эльбрусы крайне эффективны по энергопотреблению несмотря ни на что. Только не надо потом воплей как все вокруг ничего не понимают. Понимают. Твой путь тупиковый с армами. Надежды на АРМ нет никакой. Эльбрусы крайне перспективная платформа и ее надо развивать без снижения темпов развития, а еще лучше их наращивать. И это ты неспособен оспорить ничем. Математика она сильнее.

anonymous
()
Ответ на: комментарий от aist1

Это было про microkernel operation systems)).

я понял про что это было - софтовые микроядра по сути не нужны в SoC, ограничить доступ и сделать IPC можно хоть сейчас аппаратно, а задачи раскидывать по спец ядрам. Я так понимаю это и есть суть RISC-V SoC - кучи спецядер под разные задачи. ОС для таких SoC будет что-то типа монитора, в самих задачах вместо ОС только libOS для интерфейса друг с другом без планировщика.

anonymous
()
Ответ на: Ok. от Moisha_Liberman

не помню действует у меня ещё тот NDA или нет

Тогда вопросов не имею))

Мне просто показалось, что в Воронеже кто-то решил делать свои FPGA, что, по моим представлениям, куда проще, чем делать процессоры. «Маленькие» FPGA (а-ля Artix/Spartan 7) будут разлетаться как горячие пирожки. Сейчас оно хорошо тем, что открытый софт есть для синтеза. Т.е. нужен только сам чип. Если бы я был в России и занимался чипами, я бы пошел именно по этому пути (FPGA + structured ASIC).

Ну и кто мне скажет теперь что мой детектор маркетоолухов сломан?

По ходу, ты прав да)

aist1 ★★★
()
Ответ на: комментарий от aist1

Она просто (а) несбалансирована и (б) неправильно позиционируется. Ей бы дать побольше статической памяти (чтобы VLIW «шмог»), парочку обычных (sparc?) ядер в помощь для обычного кода, да систолических матричных умножителей дюжину, и была бы вундервафля для встраиваемых применений. Т.е. чип нужно вести в сторону AI-акселераторов, например. Ниша, по моему искреннему, но дилетантскому, ощущению, гарантирована.

В том и дело, что было бы новое ядро Эльбруса на 600МГц + типовое ARM/MIPS/SPARC + CAN, Ethernet с PTP и т.п. и всё в пределах < 10 Вт. Получилось бы вполне себе конкурентное решение. И это реально сделать даже на текущем техпроцессе. Но МЦСТ всё продолжает гнуть своё: что мол процессор для суперкомпьютеров, серверов, СХД, рабочих станций. У них же гены.

AlexVR ★★★★★
()
Ответ на: комментарий от anonymous

Я так понимаю это и есть суть RISC-V SoC - кучи спецядер под разные задачи.

Как таковой, само по себе, RISC-V здесь просто мимо проходил. Потребность в специализации ядер определяется объективно, так как No Size Fits All. RISC-V удобен по многим причинам. Вокруг этой системы команд много пиара и движухи, что привлекает народ. И она (система команд) сразу обещает, модульность, расширяемость и унификацию средств разработки (что очень нравится уже программистам). Но там мог бы быть и MIPS, и OpenRISC.

Парадигма «ядро на задачу» (назовем её тут так) происходит от того, что себестоимость дизайна и изготовления ядра постоянно падает. Как говорят, кремний «демократизируется». И если раньше процессоры могли делать только крупные компании, то сейчас этим занимаются даже любители по вечерам. Эта демократизация будет продолжаться, так как уже сами компании хотят снижать издержки разработки за счет кооперации (как в opensource).

И вот тут и появляется то, что я здесь называю software/hardware co-design. Вот я, например, занимаюсь движками баз данных. И я могу сдизайнить себе сам такое ядро (+ обвязка), которое бы максимизировало производительность моего кода.

Железка при этом начинает выглядеть как смесь ядер различного типа для тех задач, которые на этой железке будут запускаться. Как правило, это будет 2-8 быстрых OoOE-ядер «общего назначения» и куча спецядер для ускорения выбранных функций. Мобильные SoC-и уже давно именно так и компонуют. На очереди десктопы, лэптопы и сервера.

aist1 ★★★
()
Ответ на: комментарий от AlexVR

Я думаю, что они просто состарились там, пока свой Эльбрус до tape-out доводили, и потеряли гибкость ума. Мир уже давно другой, а они всё еще в 90-х живут.

aist1 ★★★
()
Ответ на: комментарий от aist1

Как таковой, само по себе, RISC-V здесь просто мимо проходил.

нет, у RISC-V осознанно максимально компактный базовый набор команд общий для всех ядер, все другие существуюшие архитектуры с кучей синонимов и легаси в ISA и это мешает расширяемости.

anonymous
()
Ответ на: комментарий от AlexVR

Это, скорее, был какой-то SPARC-гештальт, который они хотели просто завершить, и завершили.

aist1 ★★★
()
Ответ на: комментарий от anonymous

Ну, справедливости ради, RISC-V — не единственная исследовательская ISA, которая хотела решить проблемы индустриальных ISA. Но именно RV получил популярность и поддержку.

Я к тому, что тут надо разделять саму «движуху» и объективные факторы, эту движуху гальванизирующие. Главный объективный фактор — «демократизация» кремния и его избыток в связи с дальнейшей микроминиатюризацией. Ну не нужны на десктопах «сотни ядер». И даже на серверах не нужны, если память не вытягивает. Высвобождающуюся площадь надо чем-то занять. Вот тут и RV со своей дружественностью к акселераторам.

aist1 ★★★
()
Ответ на: комментарий от aist1

Ну не нужны на десктопах «сотни ядер». И даже на серверах не нужны, если память не вытягивает.

если они не нужны то зачем все ставят GPU с тысячами ядер и загружают их через жопу GPСGPU ? Первая ласточка которая порвала такой черезжопный метод ускорения

https://en.wikipedia.org/wiki/Fujitsu_A64FX

сейчас номер 1 в топ 500

anonymous
()
Ответ на: комментарий от anonymous

1. В GPU другие ядра.

2. GPU имеет очень широкий канал в память: 1TB/s+, но только память эта — маленькая и по десктопным, и по серверным меркам.

3. A64FX имеет HBM на борту. Но, опять же, размер это памяти — всего 32GB.

aist1 ★★★
()
Ответ на: комментарий от aist1

В GPU другие ядра

другие они только потому что так эффективней по затратам энергии чем доисторические ядра x86

A64FX имеет HBM на борту

это хорошо, но смысл был в том что для HPC они не требуют внешних GPU

anonymous
()
Ответ на: комментарий от anonymous

Я, в общем-то, про то же. Вычислительная архитектура должна быть сбалансированной, чтобы на практике достигать теоретических значений пиковой производительности. Нет смысла ставить «быстрые» ядра, если они потом будут только и делать, что ждать память. Нет смысла ставить большое количество мелких ядер, если сам код с низкой степенью параллелизма.

Глядя в архитектуру можно оценить, для каких задач она будет достигать пиковых значений производительности. Так вот, все эти 128-ядерные ARMы пока что выглядят несбалансированными. В лучшем случае они годятся для embarrassingly parallel-задач. Т.е. задач, мало общающихся друг с другом. На таких масштабах нужно явно интродьюсить NoC на уровень кода, чтобы задачи могли минимизировать движение данных по кристаллу и в память (систолические архитектуры).

Пока же взаимодействие между ядрами идет через кэш, что на таком количестве ядер уже не эффективно.

aist1 ★★★
()
Ответ на: комментарий от aist1

embarrassingly parallel

а разве облако с миллионом приватных инстансов с веб-серверами не является такой задачей? Алибаба же торгует виртуалками.

anonymous
()
Ответ на: комментарий от aist1

Так вот, все эти 128-ядерные ARMы пока что выглядят несбалансированными

я бы взял себе такой для кросскомпиляции

В лучшем случае они годятся для embarrassingly parallel-задач. Т.е. задач, мало общающихся друг с другом.

понятно что ты про конкретно этот процессор но вообще ровно наоборот - ядра объединяют когерентным кэшем 2-го уровня, так что максимальнуюю производительность они покажут на задачах которые можно объединить в конвеер для минимизации обращений к внешней памяти.

anonymous
()
Ответ на: комментарий от anonymous

Да, всё верно. Выше мы про это уже говорили. Этот процессор — для «уплотнения» облаков.

aist1 ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.