LINUX.ORG.RU

Исходники ядра Linux для e2k появились в открытом доступе

 , ,


4

4

Поздно вечером 10 августа очень маленький и пустой телеграм канал e2k-dev опубликовал ссылки на исходники ядра Linux (5.4), binutils (2.35) и glibc (2.29) для архитектуры e2k.

В репозиториях находятся diff- и patch-файлы для дистрибутива Alt Linux и сборочные скрипты.

Зеркала репозитория:

Помимо вышеперечисленного в репозитории gcov7, lcc-libs-common, libatomic7, libgcov7, liblfortran7, libquadmath7 и libstdc++7.

Так как на официальных сайтах МЦСТ и Alt linux нет сведений о публикации, скорее всего, эта публикация неофициальная.

Насколько полные исходники - неизвестно.

Подробности

Перемещено hobbit из kernel

★★★★★
Ответ на: комментарий от free-e2k

Я бы не назвал это скачком в производительности.

По сравнению со SPARC’ами от той же конторы чипы с e2k в тестах выглядят заметно повеселее. И они в России пока что лидеры.

А задача не в будущем не решаемая, а в принципе.

Есть дорожка Transmeta.

средней эффективности суперскаляра с OoO

Только не нужно путать среднюю производительность с производительностью ядер от AMD и Intel. Средняя производительность ядер если считать среди всех ядер — пока что дно. Она и не должна быть большой, потому что низкопроизводительных ядер намного больше.

есть же FPGA и на них можно сделать прототип и проверить свои идеи

Помню на Youtube было видео доклада от человека, который разрабатывал ядро x86 для FPGA. Он там явно заявил, что решения, которые подходят для непосредственно чипов, не всегда хорошо ложатся на FPGA и наоборот. Так что автоматизированный перевод прошивки FPGA в реальный чип это как бы возможно, но только если производительность особо не важна. Так что нет, FPGA как часть процесса разработки процессоров это не выход.

C910 выложен под Apache2, так что хоть куда ставь.

Если выяснится, что авторы использовали что-то покрытое патентом, который не имели права сублицензировать, все разработки на базе этого ядра сразу попадают под удар. С полностью своим ядром… а ты попробуй докажи, что патент был нарушен.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Есть дорожка Transmeta.

Трансмета мертва. Ее много раз пытались воскресить, но она все же мертва.

Он там явно заявил, что решения, которые подходят для непосредственно чипов, не всегда хорошо ложатся на FPGA и наоборот

Это правда, что rtl для фпга и для асиков отличается.

Так что нет, FPGA как часть процесса разработки процессоров это не выход.

Их буквально используют для разработки, и в стартапах, и в интеле.

steeels
()
Ответ на: комментарий от steeels

Трансмета мертва. Ее много раз пытались воскресить, но она все же мертва.

Идея мертва в ключе гонки за самым быстрым процом. Но если достаточно, чтобы было не самое быстрое, что возможно на выбранном техпроцессе, но просто не полное дно, то почему бы и нет.

Идея софтового апгрейда ядер заменой прошивки изначально была провальная в плане бизнеса. Производитель чипов получает прибыль только в момент продажи железа. «Продал и убегай». Обновление существующего железа не имеет смысла с точки зрения получения прибыли. Гораздо выгоднее сделать новую версию железа, чуть лучше, и продать её обладателям предыдущей версии железа. Но вот для государственных нужд эта идея привлекательная.

Их буквально используют для разработки, и в стартапах, и в интеле.

В интеле не только процессоры Core делают, так что ничего удивительного. К тому же ты упоминал, что весь проц в FPGA не засунешь. Так что я вообще не понимаю, к чему это было сказано.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

В интеле не только процессоры Core делают, так что ничего удивительного. К тому же ты упоминал, что весь проц в FPGA не засунешь. Так что я вообще не понимаю, к чему это было сказано.

Вот, что вспомнил: https://www-inst.eecs.berkeley.edu//~cs150/sp10/Collections/Papers/nehalemFPGA.pdf

Идея мертва в ключе гонки за самым быстрым процом. Но если достаточно, чтобы было не самое быстрое, что возможно на выбранном техпроцессе, но просто не полное дно, то почему бы и нет.

Я тут парирую нвидевским Carmel, который есть продолжение идей трансметы. У систем с бинарной трансляцией не так много плюсов, а вот минусы - жирнющие. Чего только стоит валидация самой бинарки. Отвалидировать железо куда проще, но, впрочем, нвидия справилась и с этим, сертифицировав кармель для автомотива.

steeels
()
Ответ на: комментарий от i-rinat

По сравнению со SPARC’ами от той же конторы чипы с e2k в тестах выглядят заметно повеселее. И они в России пока что лидеры.

М… проблема со спарками в том, что МЦСТ могли взять https://en.wikipedia.org/wiki/OpenSPARC и получить сразу результат веселее и Эльбруса и МЦСТшного же SPARC’а.

Кстати, доступен он с 2005-ого года, так что смысл в Эльбрусе для меня загадка уже давно.

И то что в России они лидеры, не значит что они сделали что-то хорошее. В этом проблемка.

Есть дорожка Transmeta.

Есть, про нее в ответе другому человеку я сказал уже. Вкратце - оно все равно выходит не так эффективно. Пробовала и трансмета и nvidia - не взлетело. Кстати у nvidia лучше получилось, в принципе их ядра Carmel (Tegra Xavier) похож на Cortex-A75 и даже по размеру чип не ужасный, но только по энергоэффективности они этому самому A75 проиграли. Также и Denver был примерно похож на A57, но по эффективности хуже.

Только не нужно путать среднюю производительность

Не совсем понял переход, если честно. Можете пояснить?

Так что нет, FPGA как часть процесса разработки процессоров это не выход.

Посмотрите ссылку про C910 что я давал пару комментариев назад (или оригинальную презентацию на HotChips кажется 2020-ого года). Только внимательно по слайдам. Это на практике применяется и очень активно в разработке подобных ядер.

Оптимизация уже делается несколько потом, плюс опыт разработчика позволяет проблемы обойти.

а ты попробуй докажи, что патент был нарушен.

Доказывают же, посмотрите сколько дел вокруг этого было за всю историю индустрии.

free-e2k
()
Ответ на: комментарий от free-e2k

Не совсем понял переход, если честно. Можете пояснить?

Имел в виду, что на каждое высокопроизводительное ядро даже в вычислительной технике наличествует множество микроконтроллеров, ядра которых очень слабые. Иногда намеренно, потому что целью является минимизация потребления или площади. Поэтому получается, что средняя производительность ядра среди вообще всех ядер намного меньше средней производительности x86 ядер от AMD и Intel.

Доказывают же, посмотрите сколько дел вокруг этого было за всю историю индустрии.

Чтобы вызвать интерес гигантов индустрии, нужно сначала выйти на международный рынок. Не думаю, что у разработчиков собственных российских архитектур были такие намерения.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Имел в виду, что на каждое высокопроизводительное ядро даже в вычислительной технике наличествует множество микроконтроллеров, ядра которых очень слабые. Иногда намеренно, потому что целью является минимизация потребления или площади. Поэтому получается, что средняя производительность ядра среди вообще всех ядер намного меньше средней производительности x86 ядер от AMD и Intel.

А что такое «средняя производительность ядер среди вообще всех ядер»? Как она считается? Я просто не понимаю концепт и смысл высказывания соответственно.

Чтобы вызвать интерес гигантов индустрии, нужно сначала выйти на международный рынок. Не думаю, что у разработчиков собственных российских архитектур были такие намерения.

У Syntacore были такие намерения как минимум на бумаге. У МЦСТ - непонятно, они вообще заявляют иногда противоречащие друг другу вещи.

free-e2k
()
Ответ на: комментарий от free-e2k

А что такое «средняя производительность ядер среди вообще всех ядер»? Как она считается?

Берём все вообще когда-либо произведённые процессорные ядра, в которых было OoO. Суммируем их производительность с весами, равными числу произведённых ядер. Делим на общее число произведённых ядер. Получаем среднюю производительность.

Пример. Допустим, ядер было всего два вида. Ядро А имело производительность 2 попугая, ядро Б имело производительность 5 попугаев. Ядер вида А за всё время было выпущено 99 штук, а ядер типа Б — одна штука. Средняя производительность ядер составит (99×2 + 1×5)/(99 + 1) = 2,03 попугая.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Чтобы посчитать среднее. Ты же решил сравнивать со средним.

Где? Я говорил «и все равно не достигнуть средней эффективности суперскаляра с OoO» - ничего про сравнение со средней производительностью не было.

free-e2k
()
Ответ на: комментарий от free-e2k

Производительность можно померить. Как ты померишь эффективность, не сведя измерение к измерению производительности?

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Идея софтового апгрейда ядер заменой прошивки изначально была провальная в плане бизнеса. Производитель чипов получает прибыль только в момент продажи железа.

Однако это понемногу делает даже Интел (не говоря уже о HP, IBM…)

https://habr.com/ru/company/itsumma/news/t/651277/

greenman ★★★★★
()
Последнее исправление: greenman (всего исправлений: 1)
Ответ на: комментарий от i-rinat

Производительность можно померить. Как ты померишь эффективность, не сведя измерение к измерению производительности?

Это не является ответом на мой вопрос. Давайте я его повторю:

Чтобы посчитать среднее. Ты же решил сравнивать со средним.

Где? Я говорил «и все равно не достигнуть средней эффективности суперскаляра с OoO» - ничего про сравнение со средней производительностью не было.

free-e2k
()
Ответ на: комментарий от free-e2k

и все равно не достигнуть средней эффективности суперскаляра с OoO

Окей, и как ты узнаешь, достигло нечто средней эффективности суперскаляра или нет? Как выглядит функция истинности?

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Окей, и как ты узнаешь, достигло нечто средней эффективности суперскаляра или нет? Как выглядит функция истинности?

А тут можно уже обсуждать как именно. Можно для упрощения посмотреть какого уровня достигают процессоры даже при небольшом количестве усилий, и тут хороший пример будет как раз многократно упоминаемый SonicBOOM.

Можно сделать честное сравнение всех моделей и определить нечто среднее.

Но никаких весов, как ты предлагал, не надо учитывать в любом случае.

free-e2k
()
Ответ на: комментарий от free-e2k

Но никаких весов, как ты предлагал, не надо учитывать в любом случае.

И что тогда за результат получится?

Допустим, нужно оценить эффективность работы учителя. Оценивать будем по «среднему» баллу на экзамене. Учитель помог 99 ученикам получить на итоговом экзамене пятёрку, но один ученик получил единицу. «Средний» балл составил 3. Плохой учитель.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

И что тогда за результат получится?

Адекватный результат, в отличии от твоего предложение. Ты пытаешься в оценку эффективности затянуть метрику, которая не имеет смысл в контексте задачи. Так делать нельзя. Метрика имела бы смысл, если бы оценивалась величина зависящая от количества экземпляров выпущенных, например коммерческая успешность.

Допустим, нужно оценить эффективность работы учителя. Оценивать будем по «среднему» баллу на экзамене. Учитель помог 99 ученикам получить на итоговом экзамене пятёрку, но один ученик получил единицу. «Средний» балл составил 3. Плохой учитель.

У тебя ошибка в составлении аналогии.

В аналогии, так как каждый ученик - отдельная независимая сущность, то ученик=архитектура.

В то же время в твоем предложении должно быть ученик=экземпляр процессора.

То есть если ты хочешь на аналогии объяснить свою идею, должно быть так:

«Допустим, нужно оценить эффективность работы учителя. Оценивать будем по «среднему» баллу на экзамене среди множества (строго больше одного) клонов некоторого количества людей (строго больше одного). Все клоны выращены в одинаковых условиях и учились одинаково.» - если сделать такую замену то будет точнее описывать твое предложение и делает очевидным, почему оно не имеет смысла.

Надеюсь так понятнее?

free-e2k
()
Ответ на: комментарий от i-rinat

средней эффективности суперскаляра

Куда-то вы с этими обсуждениями не туда забрались.
Выбираете набор ворклоадов, на которых интересно что-то замерять, выбираете метрику(power, ipc и тд), замеряете, делаете выводы. Еще не стоит забывать про потребление, размер кристалла и максимальные частоты, когда производите оценку.

Я думаю, [user]free-e2k[/user] в своем тейке про средний ООО суперскаляр имеет ввиду такой, который условно реально сделать если не на коленке, то на инженерной коленке.

В самом ООО нет какой-то магии, основные методики известны. Я бы в качестве примера предложил рассмотреть эппл, которые купили небольшую фирмешку, которая делала чипы и через разумное время они уже делали такие ядра, которые по ipc обходят решения от интела. Что это доказывает?

steeels
()
Ответ на: комментарий от free-e2k

У тебя ошибка в составлении аналогии.

И критерий определения ошибочности или правильности состоит в том, что?

Много раз уже тут с увеличивающей жирностью делал намёки на неоднозначность определения термина «среднее» и «эффективность», но все эти намёки пролетели мимо.

Надеюсь так понятнее?

Нет. За всё обсуждение я даже не увидел определение термина «эффективность».

Если сделать процессор, который выбирает по пять команд за такт и сразу же их исполняет, всегда по пять штук, у него IPC будет 5. Частоты будут никакими, но зато IPC = 5. Это эффективнее существующих коммерческих процов? По IPC-то наверняка да, но как по твоему определению? Пока определения нет, можно только гадать.

Достаточно ли существования ядра в виде FPGA-версии для участия в усреднении? Если да, то можно сделать кучу вариаций такого однотактного широкого процессора с автоматически генерированными ISA. Они ведь будут разными? Команды точно разные. Так можно средний IPC архитектур притянуть до 5. Но получится бред.

Так что нет, непонятно, что ты имеешь в виду.

i-rinat ★★★★★
()
Ответ на: комментарий от steeels

делали такие ядра, которые по ipc обходят решения от интела

Мне бы очень хотелось посмотреть на сравнения производительности ядер Apple, изменённых для поддержки нескольких сменных модулей DDR4, и текущего подхода с приваренной памятью. И ещё было бы интересно глянуть на производительность SoC с приваренной памятью и ядрами от Intel.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Справедливое наблюдение, да. Но по ipc эппл обошел интел еще с телефонными чипами году так в 2018. Может, смогу найти не внутреннюю презенташку.

steeels
()
Ответ на: комментарий от steeels

Можно ли сравнивать IPC на x86 и ARM один к одному?

Вернее, не так. Сравнивать-то можно. Скажем так: одни и те же задачи выполняются на x86 и ARM за одно и то же число инструкций?

i-rinat ★★★★★
()
Последнее исправление: i-rinat (всего исправлений: 1)
Ответ на: комментарий от i-rinat

Если сделать процессор, который выбирает по пять команд за такт и сразу же их исполняет, всегда по пять штук, у него IPC будет 5. Частоты будут никакими, но зато IPC = 5

Проблема не в том, чтобы сделать широкую ООО машину. Главная проблема в том, как заиметь такое здоровенное окно, чтобы оно могло всю эту ширину забивать.

Емнип, где-то был эксперимент, когда делали бесконечно широкую машину с бесконечным окном и гоняли на ней нужные ворклоады. Боюсь соврать, но ширина больше 16 совсем не имела смысла.

steeels
()
Ответ на: комментарий от i-rinat

Скажем так: одни и те же задачи выполняются на x86 и ARM за одно и то же число инструкций?

В такой постановке вопроса, конечно, нет, тк ты мне тут же предложишь на арме одной инструкцией заинкрементировать чиселку в памяти. А потом можно продолжить говорить про uops и что x86 это тоже риск внутри.

steeels
()
Ответ на: комментарий от i-rinat

И критерий определения ошибочности или правильности состоит в том, что?

Аналогия, буквально по определению, должна трансформировать какой-то концепт из одной тематики в другую. Если попутно подменяется смысл, это уже не аналогия, или, если угодно, ошибочная аналогия.

Много раз уже тут с увеличивающей жирностью делал намёки на неоднозначность определения термина «среднее» и «эффективность», но все эти намёки пролетели мимо.

Так не жирните, а спросите что непонятно или инициируйте обсуждение. А то жирненько набрасывая вы только уменьшаете вероятность ответа по существу. Так как понимаете, когда человек манипулирует и пытается подменить на ходу предмет обсуждения, уводя его в какой-то гротеск, проще же записать человека в неадекватного и начать игнорировать. Разве нет?

Но вообще предполагается, что вы пойдете в поиск, вобьете туда «cpu efficiency» и почитаете, если для вас это не очевидно.

Если непонятно что такое «среднее», я также предполагаю что вы пойдете в поиск и вобьете туда «average value» и почитаете определение.

Так понятно?

Нет. За всё обсуждение я даже не увидел определение термина «эффективность».

С учетом последних двух абзацев прошлого ответа, все еще непонятно?

free-e2k
()
Ответ на: комментарий от free-e2k

Но вообще предполагается, что вы пойдете в поиск, вобьете туда «cpu efficiency» и почитаете, если для вас это не очевидно.

How is CPU efficiency calculated?

CPU efficiency is a measure of how well an application utilizes its requests for CPU. Efficiency is calculated with the following formula: efficiency=cpu_time / (run_time x number_of_cpus).

О-о-о-о-ке-е-е-ей…

Если непонятно что такое «среднее», я также предполагаю что вы пойдете в поиск и вобьете туда «average value» и почитаете определение.

Average

In ordinary language, an average is a single number taken as representative of a list of numbers, usually the sum of the numbers divided by how many numbers are in the list (the arithmetic mean). For example, the average of the numbers 2, 3, 4, 7, and 9 (summing to 25) is 5. Depending on the context, an average might be another statistic such as the median, or mode. For example, the average personal income is often given as the median—the number below which are 50% of personal incomes and above which are 50% of personal incomes—because the mean would be misleadingly high by including personal incomes from a few billionaires.

О-о-о-о-ке-е-е-ей…

только уменьшаете вероятность ответа по существу

У тебя уже была куча возможностей ответить по существу, но этого так и не случилось. Даже сейчас всё, что есть в комментарии — попытка принизить собеседника, а не разговор по существу. Исходя из этого я делаю вывод, что ответа по существу не будет.

И что за прыжки с «ты» на «вы» и обратно от комментария к комментарию?

С учетом последних двух абзацев прошлого ответа, все еще непонятно?

Нет, мне всё ещё непонятно, что конкретно ты вкладывал в использованные слова, потому что определения, которые я нагуглил в интернете, на твои ответы ложатся плохо. Определение среднего вообще заявляет, что без указания конкретного вида среднего остаётся только догадываться из контекста. Здесь было недостаточно контекста.

проще же записать человека в неадекватного и начать игнорировать

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

У тебя уже была куча возможностей ответить по существу, но этого так и не случилось. Даже сейчас всё, что есть в комментарии — попытка принизить собеседника, а не разговор по существу. Исходя из этого я делаю вывод, что ответа по существу не будет.

А в этом месте я предлагаю вам потратить немного времени и доказать ваше утверждение про «принизить собеседника». А то звучит как попытка придумать за меня что-то, что я не вкладывал в свои слова.

Впрочем отвечаю я вам примерно в том же формате, как вы мне. Вы вместо прямых вопросов и попытки начать нормальное обсуждение начали пытаться перевернуть мои слова? Не стоит удивляться, что отношение к вам стало несколько хуже чем к другим.

И что за прыжки с «ты» на «вы» и обратно от комментария к комментарию?

Иногда бывает, особенно когда я к собеседнику начал на «вы», а собеседник отвечает используя «ты».

только догадываться из контекста. Здесь было недостаточно контекста.

И тут я не соглашусь, на мой взгляд контекста достаточно, чтобы сделать вывод что имеется в виду медиана, как минимум на базе того что эта величина будет иметь практический смысл. Опять же, вы могли напрямую спросить то, что вам непонятно.

Впрочем все это значения не имеет, так как пока не будет с вашей стороны удовлетворяющего меня доказательства, что я пытаюсь принизить собеседника - общение можно считать законченным.

free-e2k
()
11 октября 2022 г.
Ответ на: комментарий от steeels

Проблема не в том, чтобы сделать широкую ООО машину.

Проблема в этом. Интел не может сделать широкий фронт до сих пор из-за мусорности х86.

Главная проблема в том, как заиметь такое здоровенное окно, чтобы оно могло всю эту ширину забивать.

Ты где-то услышал про какое-то окно, но ты явно не понимаешь что это такое. Никакая ширина ни от какого окна не зависит. Окна в принципе не существует.

Далее обычные удивительные выводы. Это, кстати, типичная проблема пропаганды и невежества.

Очевидно, что если взять говнокод и попытаться запустить его на чём-то, то ничего не выйдет. Но это ничего не значит. Это значит, что просто нужно будет выгнать из профессии/переучить множество адептов.

Нет смысла пытаться натянуть текущие реалии на будущие. Любые попытки - всегда обречены. Новые возможности создают новые подходы. И вот их уже нужно сравнивать, а не натягивать текущий мусор на что-то.

right_security
()
Ответ на: комментарий от i-rinat

Дак суперскаляр уже давно протух. Тебе ненужно с этим спорить. Это просто какие-то особенные с методичками из прошлого века.

Ещё с нулевых с появлением нормальных компиляторов - миф о том, что суперскаляр что-то может кончился. Поэтому просто вырубаем реордеринг/инлайнинг/прочие оптимизации из компилятора и смотрим на то как работает суперскаляр(ответ - никак).

Поэтому основная часть производительности берётся именно из компиляторов и статического анализа. Во много суперскалярность мешает компилятору, а не помогает.

Единственное где суперскаляр работает - это всякая легаси-убогая динамическая лапша. И то здесь всё иначе. Работает это тем лучше - чем тупее суперскаляр.

Производительность этой лапше в принципе ненужна - на неё можно забить. А даже если нужна - можно сделать пару примитивных суперскалярных ядер, чтобы крутить там эту лапшу. Это вообще не проблема.

right_security
()
Ответ на: комментарий от steeels

Я бы в качестве примера предложил рассмотреть эппл, которые купили небольшую фирмешку, которая делала чипы и через разумное время они уже делали такие ядра, которые по ipc обходят решения от интела. Что это доказывает?

ipc мусорная метрика. Как минимум потому, что практически вся производительность дерьмокода зависит от задержек. Т.е. именно от качестве бекенда.

В том же эльбрусе бекенд говно. Судя по всему это какие-то мусорные ip-блоки. Т.е. на частоте в 2-3 раза ниже интела - он имеет задержки на инструкциях в 2-3 раза выше интела.

А задержки не зависят от частоты - они зависят от времени.

Тоже самое с эплом. Ты видел что там у эпла? Что он там реализовывал, а для чего взял готовые блобы? Судя по всему на рынке они есть. У эпла есть и доступ и бабки.

У того же эльбруса, судя по всему, доступа/бабок хватило только на третьесортные блобы. Ну или они их сами сделали, что крайне сомнительно учитывая рассуждения аффилированных с конторой персонажей.

right_security
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.