Parallella набрала необходимый объём средств.

0

4

Ссылка: http://www.kickstarter.com/projects/adapteva/parallella-a-supercomputer-for-e...

Вкратце: это попытка продвинуть параллельные технологии в массы. Сейчас основной модуль представляет из себя двухъядерный ARM A9, параллельный 16-ядерный сопроцессор Epiphany Multicore Accelerator, 1 ГБ ОЗУ (это пока ограничение текущей сборки), 2 порта USB 2.0, 16 ГБ MicroSD, HDMI и Gigabit Ethernet. Также с платой идёт открытый SDK (C, C++ и OpenCL). Кое-какие спецификации уже выложили в открытый доступ.

P.S. Чуть не забыл — там Убунта.

Ссылка

←	Ноут с хорошим охлаждением и дренажной системой.

Тем дипломной работы

→

← 1 2 →

невзлетит

Bad_ptr ★★★★★
(27.10.2012 15:25:11 +00:00)

Ссылка

Чем оно на практике лучше CUDA?

Sadler ★★★
(27.10.2012 15:34:30 +00:00)

Ответ на: комментарий от Sadler 27.10.2012 15:34:30 +00:00

Все ядра абсолютно независимы, обмен информации возможен ядро-ядро с терабитной скоростью, энергопотребление значительно ниже.

Evgueni ★★★★★
(27.10.2012 15:38:02 +00:00) автор топика
Последнее исправление: Evgueni 27.10.2012 15:38:27 +00:00 (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Sadler 27.10.2012 15:34:30 +00:00

Чем оно на практике лучше CUDA?

открытые спецификации?

dimon555 ★★★★★
(27.10.2012 15:40:45 +00:00)

Ссылка

Насколько беспроблемно оно переживёт рашкотаможню и рашкопочту?

O02eg ★★★★★
(27.10.2012 15:44:23 +00:00)

Ответ на: комментарий от O02eg 27.10.2012 15:44:23 +00:00

А это-то причём? Зависит исключительно от упаковки. Веса там всего ничего, так что даже если ронять будут — ничего не случится.

Evgueni ★★★★★
(27.10.2012 15:47:03 +00:00) автор топика

это попытка продвинуть параллельные технологии в массы

Только зачем массам эти параллельные технологии? Для счета лучше иметь один мощный узел, чем 16 дохлых

annulen ★★★★★
(27.10.2012 15:59:37 +00:00)

Ответ на: комментарий от Evgueni 27.10.2012 15:47:03 +00:00

Уточню: для международной пересылки там просят 20 долларов. Этого хватит для вменяемой упаковки, а не бумажного конвертика. Я примерно год получаю товары по почте. К самой почте России у меня в основном только две претензии: а) неторопливость доставки, причём тормоза в основном на последнем этапе доставки, б) очереди. Проблем с порчей и воровством товаров у меня не было, но я не покупал ничего дороже 300 долларов.

Evgueni ★★★★★
(27.10.2012 16:01:01 +00:00) автор топика

Ссылка

Ответ на: комментарий от annulen 27.10.2012 15:59:37 +00:00

Когда тебе нужно выжать максимальную вычислительную мощность, то у тебя есть следующие ограничивающие параметры: частота с которой работает одно ядро (де факто уже упёрлись в стенку), мощность на одно ядро (тут дохлые делают мощных вовсе не пропорционально различиям в мощности, конкретно Parallela — это 5 Вт, причём 3 из них — это ARM), число этих самых ядер (формфактор платки — размеры кредитки).

Так же важно как именно можно параллелить расчёты — IMHO сейчас это самое проблематичное и непонятное, так как требует приложения интеллекта.

В любом случае следует понимать, что конкретно это проект нацелен на энтузиастов и исследователей, а также тех, кто хочет научиться параллельному программированию.

Evgueni ★★★★★
(27.10.2012 16:08:18 +00:00) автор топика
Последнее исправление: Evgueni 27.10.2012 16:09:12 +00:00 (всего исправлений: 1)

И смысл? Писать под dsp в 90% случаях это примерно как спариваться с кактусом. Оценят только те, у кого есть задачи, и самое главное, желание их ускорять на DSP.

~~AiFiLTr0~~ ★★★★★
(27.10.2012 16:08:48 +00:00)

Ответ на: комментарий от AiFiLTr0 27.10.2012 16:08:48 +00:00

Там есть OpenCL и просто C. То, что рост мощности одного компьютера будет идти за счёт роста числа ядер IMHO очевидно. С ними придётся как-то научиться работать в любом случае.

Evgueni ★★★★★
(27.10.2012 16:11:40 +00:00) автор топика

А для серьёзных дел оно подойдёт?
OpenMP и MPI видимо под неё работать будет, это хорошо.

aptyp ★★★★
(27.10.2012 16:12:32 +00:00)

Ссылка

Ответ на: комментарий от Evgueni 27.10.2012 16:11:40 +00:00

Если раньше не будет технологического скачка, начнут ядра виртуализировать, склеивая кучу мелких в одно большое. Параллельные вычисления на прикладном уровне - это удел специфических числодробильных задач.

pekmop1024 ★★★★★
(27.10.2012 16:14:13 +00:00)
Последнее исправление: pekmop1024 27.10.2012 16:15:13 +00:00 (всего исправлений: 1)

Интересны отличия от ПЛИС в плане производительности на примере bitcoin. На данный момент: GPGPU быстрее, но горячее; FPGA медленнее, холоднее. По цене, кажись, FPGA дороже будет. Интересно, как этот проект впишется в текущую расстановку игроков.

Bitcoin рассматриваю как benchmark. Есть лучшие? Для GPGPU & FPGA?.

Авось, к выходу этого устройства, Altera выдаст уже какой-нибудь beta OpenCL для своих ПЛИС...

gag ★★★★★
(27.10.2012 16:19:43 +00:00)

Ответ на: комментарий от Evgueni 27.10.2012 16:11:40 +00:00

Ну есть, и что ты с ними будешь делать с этими ядрами?

~~AiFiLTr0~~ ★★★★★
(27.10.2012 16:21:43 +00:00)

Ссылка

Ответ на: комментарий от gag 27.10.2012 16:19:43 +00:00

Смотря какая FPGA, опять же.

~~AiFiLTr0~~ ★★★★★
(27.10.2012 16:22:30 +00:00)

Ответ на: комментарий от AiFiLTr0 27.10.2012 16:22:30 +00:00

Любая за ту же цену, что и ожидаемый девайс.

gag ★★★★★
(27.10.2012 16:24:14 +00:00)

Ссылка

Ответ на: комментарий от gag 27.10.2012 16:19:43 +00:00

Интересно, как этот проект впишется в текущую расстановку игроков.

Никак, на подходе ASIC.

O02eg ★★★★★
(27.10.2012 16:30:52 +00:00)

Ссылка

Ответ на: комментарий от pekmop1024 27.10.2012 16:14:13 +00:00

Извини, но первое твоё предложение для меня выглядит какой-то бессмысленностью. А по поводу прикладного уровня — необходим весьма нехило вложиться, чтобы «спрятать» множество ядер, а для этого нужна простенькая тестовая платформа на которой можно экспериментировать с вариантами. Этим Parallella и является.

Evgueni ★★★★★
(27.10.2012 16:32:01 +00:00) автор топика

Ответ на: комментарий от pekmop1024 27.10.2012 16:14:13 +00:00

начнут ядра виртуализировать, склеивая кучу мелких в одно большое.

времена ускорения за счёт железа прошли, теперь программисты должны выправлять руки.

dimon555 ★★★★★
(27.10.2012 16:47:38 +00:00)

Ответ на: комментарий от gag 27.10.2012 16:19:43 +00:00

Умножения матриц? Всяческие разностные схемы?

Evgueni ★★★★★
(27.10.2012 17:05:49 +00:00) автор топика

Ссылка

Ответ на: комментарий от Evgueni 27.10.2012 16:32:01 +00:00

Извини, но первое твоё предложение для меня выглядит какой-то бессмысленностью

В чем бессмысленность? Сейчас все современные процессоры представляют из себя «черный ящик» + транслятор инструкций (будь то x86 или ARM). Если всякие интелы и дальше захотят растить мощность, им придется ваять распараллеливающий транслятор.

pekmop1024 ★★★★★
(27.10.2012 17:07:42 +00:00)

Ответ на: комментарий от dimon555 27.10.2012 16:47:38 +00:00

времена ускорения за счёт железа прошли, теперь программисты должны выправлять руки.

Слышу эту фразу с детства, т.е. уже больше 20 лет.
Не работает.

pekmop1024 ★★★★★
(27.10.2012 17:08:12 +00:00)

Ответ на: комментарий от pekmop1024 27.10.2012 17:07:42 +00:00

Ну и ты хоть какую-нибудь идею можешь на этот счёт подкинуть, в смысле как именно распараллеливать? Для этого и нужно, чтобы как можно больше людей этим вопросом озадачились, потому что те, что уже есть элементарно не справляются.

Evgueni ★★★★★
(27.10.2012 17:16:33 +00:00) автор топика

Ссылка

Ответ на: комментарий от pekmop1024 27.10.2012 17:08:12 +00:00

Почти достигли предела по размеру элемента. Ну, скажем ещё порядок возможен, но меньше атома транзистр не сделаешь. Увы и ах. Чисто стенка. Так что наконец-то можешь к этому заявлению отнестись со всей серьёзностью.

Evgueni ★★★★★
(27.10.2012 17:18:36 +00:00) автор топика

это попытка продвинуть параллельные технологии в массы

массы смогут еще быстрее обрабатывать фотографии котиков в инстаграмме?

~~druganddrop-2~~ ★★
(27.10.2012 17:25:55 +00:00)

Ответ на: комментарий от druganddrop-2 27.10.2012 17:25:55 +00:00

Ну, например, может появится вменяемый анализатор голоса в реальном времени, чтобы печатать хотя бы небольшие тексты под диктовку можно было бы.

Evgueni ★★★★★
(27.10.2012 17:27:50 +00:00) автор топика

Ссылка

Ответ на: комментарий от Evgueni 27.10.2012 17:18:36 +00:00

Я-то давно к нему отнесся. Товарищи чиповыпекатели на своих конференциях вообще еще пару лет назад сказали, что все техпроцессы после 45нм - нужно считать маркетингом. Да судя по тепловыделению, так и есть - просто оптимизация текущих технологий.

Я могу подозревать, что если они таки раскошелятся на вакуумный техпроцесс, смогут доползти до 5-7 нм, но это в лучшем случае.

А что качается идей - это не ко мне. Я просто выдвинул гипотезу того, как будет решаться проблема производительности одного потока.

pekmop1024 ★★★★★
(27.10.2012 17:33:13 +00:00)

Ответ на: комментарий от pekmop1024 27.10.2012 17:33:13 +00:00

Вы вообще-то сказали что-то вроде «придёт макаронный монстр и сделает всем хорошо» — это про гипотезу.

5-7 нм — это меньше сотни атомных слоёв. IMHO тут проблемы вакуума далеко не самые большие.

Evgueni ★★★★★
(27.10.2012 17:40:25 +00:00) автор топика

Ответ на: комментарий от Evgueni 27.10.2012 17:40:25 +00:00

придёт макаронный монстр и сделает всем хорошо.

Я сказал не «как сделают», а «что будут делать». Разница понятна, или нет?

5-7 нм — это меньше сотни атомных слоёв. IMHO тут проблемы вакуума далеко не самые большие.

Пока что они и эту проблему решать банально не хотят - дорого им, видите ли.

pekmop1024 ★★★★★
(27.10.2012 17:47:24 +00:00)

Ответ на: комментарий от Evgueni 27.10.2012 17:40:25 +00:00

Подкинут денежек в квантовую физику, для просчета использования квантовых эффектов на таком уровне в свою пользу. То есть путь не обхода квантовых эффектов за счет различных ухищрений, но изменение принципа работы с ними, обращение в свою пользу. Мне это видится так.

XVilka ★★★★★
(27.10.2012 17:48:29 +00:00)

Ответ на: комментарий от XVilka 27.10.2012 17:48:29 +00:00

Вы рассуждаете по привычки предполагая, что на таких масштабах ничего не меняется. А это не так, так как дислокации (которые будут гарантировано) имеют дурную привычку мигрировать. На это плевать когда разговоры идут о тысячах слоёв, но когда речь начинается о десятках вы тупо получаете нестабильную машину.

Evgueni ★★★★★
(27.10.2012 17:59:09 +00:00) автор топика

Ответ на: комментарий от pekmop1024 27.10.2012 17:47:24 +00:00

Я сказал не «как сделают», а «что будут делать».

Хорошо, перефразирую: «не придёт макаронный монстр и всё сделает», а «будут ждать прихода макаронного монстра, который всё сделает». Легче стало?

Evgueni ★★★★★
(27.10.2012 18:03:11 +00:00) автор топика

Ответ на: комментарий от Evgueni 27.10.2012 17:59:09 +00:00

Значит будут вкладываться в охлаждение. Жидкий гелий в каждый дом!

XVilka ★★★★★
(27.10.2012 18:19:34 +00:00)

Ответ на: комментарий от XVilka 27.10.2012 18:19:34 +00:00

Вы не представляете какая эта морока. В России ровно один холодильник для гелиевых температур aka детандер. Лучше параллельные вычисления — я гарантирую это.

Evgueni ★★★★★
(27.10.2012 18:24:18 +00:00) автор топика
Последнее исправление: Evgueni 27.10.2012 18:26:59 +00:00 (всего исправлений: 2)

Ссылка

KRoN73 уже высказывался на эту тему про «построить ещё больший экскаватор, чтобы добывать ещё больше руды».

pacify ★★★★★
(27.10.2012 18:24:59 +00:00)

Ссылка

Ответ на: комментарий от Evgueni 27.10.2012 18:03:11 +00:00

Хорошо, перефразирую: «не придёт макаронный монстр и всё сделает», а «будут ждать прихода макаронного монстра, который всё сделает». Легче стало?

Ты не прав.
Хотя бы потому, что путей решения проблемы производительности одного потока несколько, а я всего лишь указал на самый вероятный. Прорабатывать конкретные трансляторы должны те, кому это интересно, а не анонимные аналитика с ЛОРа. Тебе не смешно самому, какого ты ответа от меня ждал?

pekmop1024 ★★★★★
(27.10.2012 18:30:14 +00:00)

Ответ на: комментарий от Evgueni 27.10.2012 17:59:09 +00:00

Эх, если бы только дислокации. В удачных случаях они анигилируют, да и сдвиг на одну экстраплоскость невелика беда. Хуже, что ядро дислокации сгребает ещё примеси, как экскаватор. Но, верующих в вакуум и гелий, на лоре не переубедить. :D

imul ★★★★★
(27.10.2012 18:38:07 +00:00)

Ссылка

Ответ на: комментарий от pekmop1024 27.10.2012 16:14:13 +00:00

начнут ядра виртуализировать, склеивая кучу мелких в одно большое

Не начнут. Слишком быстрый интерконнект для такого нужен. Собственно, Intel уже идет в сторону «много мелких ядер».

tailgunner ★★★★★
(27.10.2012 18:41:42 +00:00)

Ответ на: комментарий от pekmop1024 27.10.2012 18:30:14 +00:00

Ты так говоришь, будто виртуализировать одно ядро на куче ядер - это что-то априори реальное без диких потерь производительности.

Ramen ★★★★
(27.10.2012 18:43:48 +00:00)

Ответ на: комментарий от Ramen 27.10.2012 18:43:48 +00:00

Ты так говоришь, будто виртуализировать одно ядро на куче ядер - это что-то априори реальное без диких потерь производительности.

Когда-то и обычная виртуализация была с дикими потерями. Сделали же.
А до того все боялись потерь на х86-трансляторе... и тоже сделали.
Даже если процентов 30 потери будут, этим можно пренебречь - все равно будет в разы, если не в десятки и сотни раз быстрее одного толстого ядра.

pekmop1024 ★★★★★
(27.10.2012 18:54:09 +00:00)

Ответ на: комментарий от tailgunner 27.10.2012 18:41:42 +00:00

Не начнут. Слишком быстрый интерконнект для такого нужен. Собственно, Intel уже идет в сторону «много мелких ядер».

Что мешает сделать быстрый интерконнект внутри кристалла? Это же не внешние девайсы.

pekmop1024 ★★★★★
(27.10.2012 18:55:00 +00:00)

Ответ на: комментарий от Evgueni 27.10.2012 16:08:18 +00:00

мощность на одно ядро

Совершенно бесполезная характеристика. Мощность на гига- или терафлопс еще можно понять.

annulen ★★★★★
(27.10.2012 19:00:44 +00:00)

Ссылка

Ответ на: комментарий от pekmop1024 27.10.2012 18:55:00 +00:00

Быстрый интерконнект - брат трехмерных электрических схем. Так что, думаю, в этом направлении скоро будет большой скачок.

XVilka ★★★★★
(27.10.2012 19:06:05 +00:00)

Ответ на: комментарий от XVilka 27.10.2012 19:06:05 +00:00

Пока только память собираются делать, но да, что-то в этом есть.

pekmop1024 ★★★★★
(27.10.2012 19:10:56 +00:00)

Ссылка

Ответ на: комментарий от pekmop1024 27.10.2012 18:55:00 +00:00

Что мешает сделать быстрый интерконнект внутри кристалла?

Достаточно быстрый интерконнекто можно сделать только внутри.

tailgunner ★★★★★
(27.10.2012 19:23:47 +00:00)

Ответ на: комментарий от tailgunner 27.10.2012 19:23:47 +00:00

Я и не говорил, что надо брать многопроцессорную плату и эмулировать на ней один поток. Это все должно происходить внутри одного кристалла и для ОС вообще незаметно.

pekmop1024 ★★★★★
(27.10.2012 19:25:34 +00:00)

Ответ на: комментарий от pekmop1024 27.10.2012 19:25:34 +00:00

s/кристалла/ядра/

Это все должно происходить внутри одного кристалла и для ОС вообще незаметно.

Максимум, чего ты добьешься - скорость обращения к «виртуализированному» регистру будет как скорость обращения к L1.

tailgunner ★★★★★
(27.10.2012 19:29:58 +00:00)

Ответ на: комментарий от tailgunner 27.10.2012 19:29:58 +00:00

скорость обращения к «виртуализированному» регистру будет как скорость обращения к L1.

строго говоря, можно и больше - но L1 больше не нужно на данном этапе, потому там больше нету. :)

pekmop1024 ★★★★★
(27.10.2012 19:33:51 +00:00)

Ссылка

Доживу ли я до времен, когда unbiased рендереры будут работать в рилтайме и с приличным разрешением?

sid350 ★★★★★
(27.10.2012 20:01:53 +00:00)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	Ноут с хорошим охлаждением и дренажной системой.

Talks

Тем дипломной работы

→

Похожие темы