LINUX.ORG.RU

Decalon 0xA - первый российский микропроцессор с десятичной системой счисления

 


5

3

Российская компания «Модуль» подготавливает к восьмой международной выставке SEMICON Russia 2015 доклад об испытаниях тестовых образцов десятичного микропроцессора К12288ДВМ2Я (производственное обозначение степпинга - Decalon 0xA). Область использования данных микропроцессоров - высокопроизводительные вычисления в финансовом секторе для биржевых площадок уровня MillenniumIT и проведение научных расчетов.

Микропроцессор построен на основе уникальных дискретных элементов, в состав которых входит высокочастотный полевой транзистор, способный принимать десять логических уровней с величиной зазора 0,4 В. Это стало возможно путем создания ранее не применявшегося «гребенчатого» p-n перехода, благодаря которому транзистор способен поддерживать дискретность уровней на затворе. Такое решение позволило сохранить высокое входное сопротивление как по постоянному току, так и на высокой частоте, обеспечивая тем самым недостижимое ранее быстродействие, обусловленное отсутствием накопления и рассасывания неосновных носителей заряда. Дискретноуровневые полевые транзисторы (не путать с дискретными полевиками) в настоящий момент проходят процедуру получения патента в России и по соглашениям ЕАПК. Опытные кристаллы производятся на мощностях завода «Микрон» АО «НИИМЭ».

Авторы заранее заложились на многоядерную архитектуру, вследствие чего Decalon 0xA имеет два полноценных ядра с разделяемой общей шиной данных. Аккумулятор и АЛУ базируются на файле из 128 десятиричных ячеек, что позволяет на аппаратном уровне выполнять высокоточные вычисления с числами, превышающими число атомов во Вселенной. Такую же размерность имеют 22 регистра общего назачения, причем микропроцессор способен объединять регистры в пары для получения беспрецендентной аппаратной точности, ранее доступной только при использовании длинной арифметики. С этой же целью в систему команд добавлены инструкции, позволяющие определять области памяти как десятичные числа произвольной длинны, и инструкции, производящие с ними базовые арифметические операции. Такие вычисления выполняются на порядок медленнее чем на регистрах, однако в несколько раз быстрее, чем эквивалентная алгоритмическая реализация.

Для получения вычислительной среды используется специализированный контроллер памяти DDR3, который преобразует байтовую адресацию к декадной (D-битовой). Один D-бит занимает четыре бита двоичного байта, причем шесть неиспользуемых старших комбинаций используются для хранения специализированных не-чисел +Infinity, -Infinity, +0, -0, Undefined, Null (они рассматриваются как флаги и напрямую не используются в вычислениях).

Операционной системы, как таковой, данный вычислитель пока не имеет. Авторы экспериментируют с управляющей программой «Монитор», которая копируется из FLASH-микросхемы в ОЗУ при включении питания. Разрабатывается математическая библиотека libdmath, поддерживающая через API все аппаратные возможности микропроцессора.

Разработчики планируют в рекламных целях успеть до начала выставки протестировать майнинг Bitcoin, исполняющийся на новом кристалле. Производительность вычислений пока оценивать трудно, однако обнадеживает тот факт, что емкость десятичной системы на 128 разрядах выше чем двоичной в ~10^90 раз. К сожалению, из-за особенностей российского законодательства, процедура майнинга будет производится в Лейпциге (Германия), на выставке же будут представленны только сравнения производительности и результаты замеров.

>>> Подробности

★★★★★

Проверено: toney ()
Последнее исправление: toney (всего исправлений: 4)

Годная новость на первое апреля. Я так и не понял, это толсто, или правда. Так держать.

nexfwall ★★★★
()
Ответ на: комментарий от devl547

У тебя детектор юмора чтоль переклинило?)
Этот текст долго по фидошной RU.HUMOR ходил.

Ага, ибо у меня первый IBM-соместимый компьютер был ЕС 1841. И он не весил 41 кг. В RU.HUMOR такого текста не припомню.

Xintrea ★★★★★
() автор топика
Последнее исправление: Xintrea (всего исправлений: 1)
Ответ на: комментарий от devl547

если толпа народу под x86 не может действительно оптимальный код писать - то почему с Эльбрусом будет лучше?

Ты сам то статью читал вообще свою?

Единственной возможностью ускорить криптопроцедуры в известном алгоритме является введение многопоточности. Смысл такого изменения реализации алгоритма заключается в том, чтобы обсчитывать сразу несколько блоков данных параллельно.
Большинство программистов подразумевает под параллельной обработкой исключительно работу нескольких процессорных ядер, синхронизированных через прерывания и семафоры в памяти.
Однако существует и иной вариант параллельной обработки данных на одном- единственном ядре процессора. Поясню эту неочевидную мысль.
Современные процессоры имеют в своем составе как минимум два, а то и три-шесть арифметико-логических устройств. Эти АЛУ (FPU, блоки адресной арифметики и так далее) могут работать независимо друг от друга, единственным условием их параллельной работы является непересекающиеся программные объекты, которыми они оперируют.

Причина -

Большинство программных последовательностей, генерируемых автоматически (компиляторами), не могут загрузить все АЛУ и FPU, находящиеся в ядре процессора. В этом случае оборудование процессора простаивает, что значительно снижает его результирующую производительность.

Решение проблемаы -

Компиляторы, даже самые оптимизированные, и тем более — движки виртуальных машин, не могут формировать оптимизированный код с точки зрения быстродействия. Только программист с инженерными знаниями может написать такой оптимизированный код, причем инструментом для его написания является исключительно ассемблер.

А теперь бегом читать http://www.mcst.ru/files/511cea/886487/1a8f40/000000/book_elbrus.pdf можно сразу со страницы 88

uin ★★★
()
Ответ на: комментарий от Xintrea

ru.computer.humor, если быть точным.

// Блин, опять чтоль поинта взять.

devl547 ★★★★★
()
Ответ на: комментарий от uin

Я знаю что такое VLIW и EPIC. И знаю, какой это хлам с точки зрения неоптимизированных под эту архитектуру задач.

Да и рабочая станция на паре итаников (б.у. для тестов купил) с пингвином была.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

И знаю, какой это хлам с точки зрения неоптимизированных под эту архитектуру задач.

Ты только что это же самое прочитал про свой x86, где для решения проблемы автор не видит другого выхода кроме как писать все на ассемблере, так на сколько же хлам он?

uin ★★★
()
Ответ на: комментарий от uin

Только программист с инженерными знаниями может написать такой оптимизированный код, причем инструментом для его написания является исключительно ассемблер.

Эта шутка на сегодня лучшая.

A-234 ★★★★★
()
Ответ на: комментарий от devl547

Сфера ведь должна роботом управлять, скорее всего в эту память записываются всякие калибровочные данные чтобы не тратить время на каждом включении.

A-234 ★★★★★
()
Ответ на: комментарий от devl547

5.3

Какой может быть спор, когда есть объективная статистика?

Gentooshnik ★★★★★
()
Ответ на: комментарий от ugoday

Всяко лучше, чем «у нас ничего своего нет, не было и не будет».

Што, правда глазки колет?

Давай еще! Этому треду нужно MOAR ватного бомбалейло.

anonymous
()

ОПу — домашнее задание: понять, почему недвоичные компьютеры оказались на свалке истории вместе с LISP'ом и прочей маргинальщиной из 50-ых.

anonymous
()
Ответ на: комментарий от anonymous

Какая разница то, годно расписал же.

uin ★★★
()
Ответ на: комментарий от anonymous

Что вы имели в виду этим комментарием?

ugoday ★★★★★
()
Ответ на: комментарий от anonymous

просто. очень просто-технологя полупровоников в те времена не знала более двух устойчивых состояний. Теперь изобрели полевик с дискретными уровнями с 10 устойчивыми состояниями.

vovagubin1987
()

попахивает EГГОГ-логией...

anonymous
()
Ответ на: комментарий от nexfwall

Я так и не понял, это толсто, или правда. Так держать.

Позвони в «Модуль» и поинтересуйся, контакты у них на сайте. Учитывая, что тут есть люди из этой компании, и они до сих пор не написали опровержения хотя бы под анонимусом, вывод напрашивается сам собой.

Xintrea ★★★★★
() автор топика

так по идее он должен и десятичную логику поддерживать.

anonymous
()

попаболь

афтар не трави душу, современное алканодательство не знает слова наука

zyoung
()

Неплохо.

Deleted
()
Ответ на: комментарий от Xintrea

Эльбрусы E2K на 300МГц

Существует вполне обоснованное мнение, подтвержденное реальными фактами, что VLIW - говно.

hateyoufeel ★★★★★
()
Ответ на: комментарий от Xintrea

Ну знаешь, даже если это правда, почему ты решил выложить эту новость именно 1 апреля, в день петросянских новостей на ЛОРе? Причём в качестве «Подробности» предоставляешь ссылку, которая никакой объективной информации по поводу нового процессора не даёт, только перечисление технологий, которые разрабатываются на этом заводе. Но нет ни единой строчки про Decalon.

Слишком тонко, однако.

nexfwall ★★★★
()
Ответ на: комментарий от Xintrea

они там в модуле чем-нибудь ещё занимаются кроме первоапрельских приколов?

anonymous
()
Ответ на: попаболь от zyoung

ты забыл сказать про то что путин сжигает библиотеки

anonymous
()

К12288ДВМ2Я - хи-хи

Decalon 0xA - ха-ха

Дискретноуровневые полевые транзисторы... «гребенчатого» p-n перехода - хо-хо

Все остальное - архитектура програмируемого калькулятора, которые клепали на мелкой логике и даже транзисторах в 60-70е.

anonymous
()

Благодарю за хорошую шутку!

Pronin ★★★★
()
Ответ на: комментарий от hateyoufeel

Существует вполне обоснованное мнение, подтвержденное реальными фактами, что VLIW - говно.

А существует мнение что VLIW это неизбежная и очевидная эволюция в процессоростроении, и в отличии от твоего имеет под собой обоснование: Decalon 0xA - первый российский микропроцессор с десятичной системой счисления (комментарий)
В той самой статье автор по сути называет те самые проблемы которые и привели к созданию машин с широким командным словом

uin ★★★
()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от uin

существует мнение что VLIW это неизбежная и очевидная эволюция в процессоростроении

То-то AMD от него из-за проблем с GPGPU отказалась (hint: задница с зависимостью по данным).

те самые проблемы которые и привели к созданию машин с широким командным словом

То, что вы не можете решить проблему (а это у сегодняшнего OoO и не проблема), ещё не факт, что VLIW будет лучше, у него своих косяков хватает.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

То-то AMD от него из-за проблем с GPGPU отказалась (hint: задница с зависимостью по данным).

Так это палка о двух концах, нвидиа вот тоже Fermi сделали, хороший вычислитель но так себе ускоритель. И того: Nvidia Tesla все еще на архитектуре Fermi а все последующие - это настолько упрощенная архитектура что она даже видео посчитать не может, там DSP на кристале отдельно стоит.

Ну и да - VLIW VLIWу рознь, VLIW GPU это не то же самое что VLIW CPU или VLIW DSP

То, что вы не можете решить проблему

Ты можешь два предложения сложить «компиляторы не позволяют загрузить все АЛУ и FPU» и «программист с инженерными знаниями может написать такой оптимизированный код, причем инструментом для его написания является исключительно ассемблер» (читай ручное планирование операций) или нет? Почему бы это самое не реализовать в железе, что бы этим машина занималась а не человек? Так и сделали и получился Эльбрус 3.

uin ★★★
()
Последнее исправление: uin (всего исправлений: 2)
Ответ на: комментарий от uin

она даже видео посчитать не может, там DSP на кристале отдельно стоит.

Энергоэффективность, не?
У всех стоят выделенные блоки для (де)кодирования видео. QuickSync, UVD, VCE, NVENC.

Можно гонять на opencl (amd в гибридном режиме так и делает), но это сильно хуже по используемой энергии.

Почему бы это самое не реализовать в железе

Можно. Но по эффективности вопрос спорный.

devl547 ★★★★★
()
Ответ на: комментарий от uin

Тогда автор либо не знаком с предметом либо рассорился с головой. Впрочем заявление ведь ничем не подкреплено, просто мнение человека, очередное.

A-234 ★★★★★
()
Ответ на: комментарий от devl547

Можно. Но по эффективности вопрос спорный.

Не ну вот как с тобой общаться объясни?

Статья называется «Достигаем феноменальной скорости на примере шифрования ГОСТ 28147—89» в которой автор на пальцах показывает какой эффективности можно достичь при помощи ручной оптимизации. Может быть ты слово эффективность как то по другому понимаешь, поясни тогда.

A-234

Тогда автор либо не знаком с предметом либо рассорился с головой

Ну в данном случае это не имеет значение же по большому счету. Он демонстрирует каких результатов можно достигать затачивая код ну или используя по максимуму ресурсы конкретной машины, нужно ли и правильно ли так делать мы здесь уже не обсуждаем.

uin ★★★
()
Ответ на: комментарий от uin

нужно ли и правильно ли так делать мы здесь уже не обсуждаем.

А это и не должно обсуждаться. Это должно делаться всегда.
Затем оборачиваться в либы для использования)

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Не должно, ибо не портабельно

anonymous
()
Ответ на: комментарий от devl547

Ага, давай на ассемблере все пиши.
Удачи.

uin ★★★
()
Ответ на: комментарий от devl547

Это попросту невозможно. Все интела уже давно являются процессорами с «out-of-order execution», вы по прежнему можете трахаться с ассемблером но смысла в этом никакого. Да и невозможно выжав все из конкретного пня надеяться что на амд ваш код не станет аццки тормозить.

A-234 ★★★★★
()
Ответ на: комментарий от A-234

Да даже не на ассемблерном уровне, профайлер в руки и вперёд.

Да и невозможно выжав все из конкретного пня надеяться что на амд ваш код не станет аццки тормозить.

Так я и не спорю)
Но один фиг это лучше, чем наделать говнокода с производительностью 10% от максимальной, а потом жаловаться.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Да где вы такое видели, 10% от максимальной? При таком падении производительности дело уже не в компиляторе а в алгоритме. Компилятор имеет больше шансов развернуть цикл, выравнять адреса, заинлайнить функции и т.п. Делать это руками просто бессмысленно.

A-234 ★★★★★
()
Ответ на: комментарий от A-234

При таком падении производительности дело уже не в компиляторе а в алгоритме.

Yup. В том числе.

Но писать алгоритм можно и с учётом железа)

devl547 ★★★★★
()

Хотеть десятичный компьютер с десятичным ассемблером, без рисования цифр буквочками.

Napilnik ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.