LINUX.ORG.RU
решено ФорумTalks

Parallella набрала необходимый объём средств.

 ,


0

4

Ссылка: http://www.kickstarter.com/projects/adapteva/parallella-a-supercomputer-for-e...

Вкратце: это попытка продвинуть параллельные технологии в массы. Сейчас основной модуль представляет из себя двухъядерный ARM A9, параллельный 16-ядерный сопроцессор Epiphany Multicore Accelerator, 1 ГБ ОЗУ (это пока ограничение текущей сборки), 2 порта USB 2.0, 16 ГБ MicroSD, HDMI и Gigabit Ethernet. Также с платой идёт открытый SDK (C, C++ и OpenCL). Кое-какие спецификации уже выложили в открытый доступ.

P.S. Чуть не забыл — там Убунта.

★★★★★

Последнее исправление: Evgueni (всего исправлений: 3)
Ответ на: комментарий от Sadler

Все ядра абсолютно независимы, обмен информации возможен ядро-ядро с терабитной скоростью, энергопотребление значительно ниже.

Evgueni ★★★★★
() автор топика
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Sadler

Чем оно на практике лучше CUDA?

открытые спецификации?

dimon555 ★★★★★
()
Ответ на: комментарий от O02eg

А это-то причём? Зависит исключительно от упаковки. Веса там всего ничего, так что даже если ронять будут — ничего не случится.

Evgueni ★★★★★
() автор топика

это попытка продвинуть параллельные технологии в массы

Только зачем массам эти параллельные технологии? Для счета лучше иметь один мощный узел, чем 16 дохлых

annulen ★★★★★
()
Ответ на: комментарий от Evgueni

Уточню: для международной пересылки там просят 20 долларов. Этого хватит для вменяемой упаковки, а не бумажного конвертика. Я примерно год получаю товары по почте. К самой почте России у меня в основном только две претензии: а) неторопливость доставки, причём тормоза в основном на последнем этапе доставки, б) очереди. Проблем с порчей и воровством товаров у меня не было, но я не покупал ничего дороже 300 долларов.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от annulen

Когда тебе нужно выжать максимальную вычислительную мощность, то у тебя есть следующие ограничивающие параметры: частота с которой работает одно ядро (де факто уже упёрлись в стенку), мощность на одно ядро (тут дохлые делают мощных вовсе не пропорционально различиям в мощности, конкретно Parallela — это 5 Вт, причём 3 из них — это ARM), число этих самых ядер (формфактор платки — размеры кредитки).

Так же важно как именно можно параллелить расчёты — IMHO сейчас это самое проблематичное и непонятное, так как требует приложения интеллекта.

В любом случае следует понимать, что конкретно это проект нацелен на энтузиастов и исследователей, а также тех, кто хочет научиться параллельному программированию.

Evgueni ★★★★★
() автор топика
Последнее исправление: Evgueni (всего исправлений: 1)

И смысл? Писать под dsp в 90% случаях это примерно как спариваться с кактусом. Оценят только те, у кого есть задачи, и самое главное, желание их ускорять на DSP.

AiFiLTr0 ★★★★★
()
Ответ на: комментарий от AiFiLTr0

Там есть OpenCL и просто C. То, что рост мощности одного компьютера будет идти за счёт роста числа ядер IMHO очевидно. С ними придётся как-то научиться работать в любом случае.

Evgueni ★★★★★
() автор топика

А для серьёзных дел оно подойдёт?
OpenMP и MPI видимо под неё работать будет, это хорошо.

aptyp ★★★★
()
Ответ на: комментарий от Evgueni

Если раньше не будет технологического скачка, начнут ядра виртуализировать, склеивая кучу мелких в одно большое. Параллельные вычисления на прикладном уровне - это удел специфических числодробильных задач.

pekmop1024 ★★★★★
()
Последнее исправление: pekmop1024 (всего исправлений: 1)

Интересны отличия от ПЛИС в плане производительности на примере bitcoin. На данный момент: GPGPU быстрее, но горячее; FPGA медленнее, холоднее. По цене, кажись, FPGA дороже будет. Интересно, как этот проект впишется в текущую расстановку игроков.

Bitcoin рассматриваю как benchmark. Есть лучшие? Для GPGPU & FPGA?.

Авось, к выходу этого устройства, Altera выдаст уже какой-нибудь beta OpenCL для своих ПЛИС...

gag ★★★★★
()
Ответ на: комментарий от Evgueni

Ну есть, и что ты с ними будешь делать с этими ядрами?

AiFiLTr0 ★★★★★
()
Ответ на: комментарий от AiFiLTr0

Любая за ту же цену, что и ожидаемый девайс.

gag ★★★★★
()
Ответ на: комментарий от gag

Интересно, как этот проект впишется в текущую расстановку игроков.

Никак, на подходе ASIC.

O02eg ★★★★★
()
Ответ на: комментарий от pekmop1024

Извини, но первое твоё предложение для меня выглядит какой-то бессмысленностью. А по поводу прикладного уровня — необходим весьма нехило вложиться, чтобы «спрятать» множество ядер, а для этого нужна простенькая тестовая платформа на которой можно экспериментировать с вариантами. Этим Parallella и является.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от pekmop1024

начнут ядра виртуализировать, склеивая кучу мелких в одно большое.

времена ускорения за счёт железа прошли, теперь программисты должны выправлять руки.

dimon555 ★★★★★
()
Ответ на: комментарий от gag

Умножения матриц? Всяческие разностные схемы?

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

Извини, но первое твоё предложение для меня выглядит какой-то бессмысленностью

В чем бессмысленность? Сейчас все современные процессоры представляют из себя «черный ящик» + транслятор инструкций (будь то x86 или ARM). Если всякие интелы и дальше захотят растить мощность, им придется ваять распараллеливающий транслятор.

pekmop1024 ★★★★★
()
Ответ на: комментарий от dimon555

времена ускорения за счёт железа прошли, теперь программисты должны выправлять руки.

Слышу эту фразу с детства, т.е. уже больше 20 лет.
Не работает.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Ну и ты хоть какую-нибудь идею можешь на этот счёт подкинуть, в смысле как именно распараллеливать? Для этого и нужно, чтобы как можно больше людей этим вопросом озадачились, потому что те, что уже есть элементарно не справляются.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от pekmop1024

Почти достигли предела по размеру элемента. Ну, скажем ещё порядок возможен, но меньше атома транзистр не сделаешь. Увы и ах. Чисто стенка. Так что наконец-то можешь к этому заявлению отнестись со всей серьёзностью.

Evgueni ★★★★★
() автор топика

это попытка продвинуть параллельные технологии в массы

массы смогут еще быстрее обрабатывать фотографии котиков в инстаграмме?

druganddrop-2 ★★
()
Ответ на: комментарий от druganddrop-2

Ну, например, может появится вменяемый анализатор голоса в реальном времени, чтобы печатать хотя бы небольшие тексты под диктовку можно было бы.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

Я-то давно к нему отнесся. Товарищи чиповыпекатели на своих конференциях вообще еще пару лет назад сказали, что все техпроцессы после 45нм - нужно считать маркетингом. Да судя по тепловыделению, так и есть - просто оптимизация текущих технологий.

Я могу подозревать, что если они таки раскошелятся на вакуумный техпроцесс, смогут доползти до 5-7 нм, но это в лучшем случае.

А что качается идей - это не ко мне. Я просто выдвинул гипотезу того, как будет решаться проблема производительности одного потока.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Вы вообще-то сказали что-то вроде «придёт макаронный монстр и сделает всем хорошо» — это про гипотезу.

5-7 нм — это меньше сотни атомных слоёв. IMHO тут проблемы вакуума далеко не самые большие.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

придёт макаронный монстр и сделает всем хорошо.

Я сказал не «как сделают», а «что будут делать». Разница понятна, или нет?

5-7 нм — это меньше сотни атомных слоёв. IMHO тут проблемы вакуума далеко не самые большие.

Пока что они и эту проблему решать банально не хотят - дорого им, видите ли.

pekmop1024 ★★★★★
()
Ответ на: комментарий от Evgueni

Подкинут денежек в квантовую физику, для просчета использования квантовых эффектов на таком уровне в свою пользу. То есть путь не обхода квантовых эффектов за счет различных ухищрений, но изменение принципа работы с ними, обращение в свою пользу. Мне это видится так.

XVilka ★★★★★
()
Ответ на: комментарий от XVilka

Вы рассуждаете по привычки предполагая, что на таких масштабах ничего не меняется. А это не так, так как дислокации (которые будут гарантировано) имеют дурную привычку мигрировать. На это плевать когда разговоры идут о тысячах слоёв, но когда речь начинается о десятках вы тупо получаете нестабильную машину.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от pekmop1024

Я сказал не «как сделают», а «что будут делать».

Хорошо, перефразирую: «не придёт макаронный монстр и всё сделает», а «будут ждать прихода макаронного монстра, который всё сделает». Легче стало?

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от XVilka

Вы не представляете какая эта морока. В России ровно один холодильник для гелиевых температур aka детандер. Лучше параллельные вычисления — я гарантирую это.

Evgueni ★★★★★
() автор топика
Последнее исправление: Evgueni (всего исправлений: 2)

KRoN73 уже высказывался на эту тему про «построить ещё больший экскаватор, чтобы добывать ещё больше руды».

pacify ★★★★★
()
Ответ на: комментарий от Evgueni

Хорошо, перефразирую: «не придёт макаронный монстр и всё сделает», а «будут ждать прихода макаронного монстра, который всё сделает». Легче стало?

Ты не прав.
Хотя бы потому, что путей решения проблемы производительности одного потока несколько, а я всего лишь указал на самый вероятный. Прорабатывать конкретные трансляторы должны те, кому это интересно, а не анонимные аналитика с ЛОРа. Тебе не смешно самому, какого ты ответа от меня ждал?

pekmop1024 ★★★★★
()
Ответ на: комментарий от Evgueni

Эх, если бы только дислокации. В удачных случаях они анигилируют, да и сдвиг на одну экстраплоскость невелика беда. Хуже, что ядро дислокации сгребает ещё примеси, как экскаватор. Но, верующих в вакуум и гелий, на лоре не переубедить. :D

imul ★★★★★
()
Ответ на: комментарий от pekmop1024

начнут ядра виртуализировать, склеивая кучу мелких в одно большое

Не начнут. Слишком быстрый интерконнект для такого нужен. Собственно, Intel уже идет в сторону «много мелких ядер».

tailgunner ★★★★★
()
Ответ на: комментарий от pekmop1024

Ты так говоришь, будто виртуализировать одно ядро на куче ядер - это что-то априори реальное без диких потерь производительности.

Ramen ★★★★
()
Ответ на: комментарий от Ramen

Ты так говоришь, будто виртуализировать одно ядро на куче ядер - это что-то априори реальное без диких потерь производительности.

Когда-то и обычная виртуализация была с дикими потерями. Сделали же.
А до того все боялись потерь на х86-трансляторе... и тоже сделали.
Даже если процентов 30 потери будут, этим можно пренебречь - все равно будет в разы, если не в десятки и сотни раз быстрее одного толстого ядра.

pekmop1024 ★★★★★
()
Ответ на: комментарий от tailgunner

Не начнут. Слишком быстрый интерконнект для такого нужен. Собственно, Intel уже идет в сторону «много мелких ядер».

Что мешает сделать быстрый интерконнект внутри кристалла? Это же не внешние девайсы.

pekmop1024 ★★★★★
()
Ответ на: комментарий от Evgueni

мощность на одно ядро

Совершенно бесполезная характеристика. Мощность на гига- или терафлопс еще можно понять.

annulen ★★★★★
()
Ответ на: комментарий от pekmop1024

Быстрый интерконнект - брат трехмерных электрических схем. Так что, думаю, в этом направлении скоро будет большой скачок.

XVilka ★★★★★
()
Ответ на: комментарий от XVilka

Пока только память собираются делать, но да, что-то в этом есть.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Что мешает сделать быстрый интерконнект внутри кристалла?

Достаточно быстрый интерконнекто можно сделать только внутри.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Я и не говорил, что надо брать многопроцессорную плату и эмулировать на ней один поток. Это все должно происходить внутри одного кристалла и для ОС вообще незаметно.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

s/кристалла/ядра/

Это все должно происходить внутри одного кристалла и для ОС вообще незаметно.

Максимум, чего ты добьешься - скорость обращения к «виртуализированному» регистру будет как скорость обращения к L1.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

скорость обращения к «виртуализированному» регистру будет как скорость обращения к L1.

строго говоря, можно и больше - но L1 больше не нужно на данном этапе, потому там больше нету. :)

pekmop1024 ★★★★★
()

Доживу ли я до времен, когда unbiased рендереры будут работать в рилтайме и с приличным разрешением?

sid350 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.