LINUX.ORG.RU

NVIDIA объявила начало продаж персонального суперкомпьютера Tesla

 , ,


0

0

Совместно со своими партнерами, компания NVIDIA разработала Персональный Суперкомпьютер Tesla, оснащенный графическими процессорами на основе архитектуры Cuda. Как было заявлено, компьютеры, использующие Tesla C1060 GPU, работают в 250 раз быстрее среднестатистического десктопа, что позволит выполнять ресурсоемкие вычисления и моделирования без доступа к обычным суперкомпьютерам. Пиковая производительность системы оценивается в 4 TFLops.

Цена одной карты Tesla C1060 $1,699. Полноценный рабочий суперкомпьютер будет стоить порядка $10,000.

Основные характеристики архитектуры:

  • 240 ядер в одном графическом процессоре,
  • операции с целыми числами и числами с плавающей точкой одинарной и двойной точности (IEEE 754),
  • производительность каждого графического процессора при работе с числами с плавающей точкой одинарной точности - 933 GFlops, двойной точности - 78 GFlops,
  • пиковая пропускная способность памяти - 102 GB/s.

Средства для разработки, входящие в комплект поставки, включают в себя компилятор языка С, отладчик и профайлер. А также некоторые численные библиотеки (FFT, BLAS) и библиотеку CuDPP (CUDA Data Parallel Primitives).

Технические характеристики суперкомпьютера:

  • 3 или 4 вычислительных процессора Tesla C1060 с 4 Гб (dedicated) ОЗУ для каждого процессора,
  • 2.33 ГГц 4-ядерный AMD Phenom или Opteron, или же 4-ядерный Intel Core 2 или Xeon,
  • БП 1200-1350 Watt, подключается к обычной розетке,
  • уровень шума < 45dbA.

Среди поддерживаемых операционных систем заявлены дистрибутивы GNU/Linux Red Hat Enterprise Linux 4/5 и SUSE 10.1, 10.2, 10.3 (как 32-битные, так и 64-битные).

Более детельно ознакомиться с описанием системы можно на соответствующем сайте NVIDIA Tesla Personal Supercomputer.

Компании, которые будут продавать Tesla Personal Supercomputers: Dell, Lenovo, Asus, Western Scientific и некоторые другие.

>>> Подробности

для сравнения: начальная цена Cray CX1 (на тех же Теслах) $25000

Jeepston ★★★
() автор топика

> компьютеры, использующие Tesla C1060 GPU работают в 250 раз быстрее среднестатистического десктопа

это на всех задачах? т.е. не только при расчетах с плавающей точкой, а и, например, при компиляции, работе с БД и т.п.?

lester ★★★★
()
Ответ на: комментарий от lester

Сия тайна покрыта мраком (в прес-релизах не указали). Скорее всего только при вычислениях.

Jeepston ★★★
() автор топика

Ну что же, лет через семm-восемь будем собирать эти теслы на барахолках, вспоминать былые годы, когда это считалось суперкомпьютером... :)

Aceler ★★★★★
()
Ответ на: комментарий от lester

>это на всех задачах? т.е. не только при расчетах с плавающей точкой, а и, например, при компиляции, работе с БД и т.п.?

ну, очевидно, на задачах, где можно эффективно заюзать Cuda. интересно посмотреть работу http://code.google.com/p/pyrit/ с этим чудом.

по теме: заверните!

volh ★★
()

> Среди поддерживаемых операционных систем заявлены дистрибутивы GNU/Linux Red Hat Enterprise Linux 4/5 и SUSE 10.1, 10.2, 10.3 (как 32-хбитные, так и 64-хбитные).

гентушнеги негодуют.

isden ★★★★★
()
Ответ на: комментарий от heilnull

никак нет. сегодня в толксы еще не заглядывал %)

мне новость в рассылке пришла (не с оупеннет)

Jeepston ★★★
() автор топика

"Полноценный рабочий (!!) сперкомпьютер" Спёр компьютер полноценный, ай ай ай

anonymous
()

Сабж - какой-то из последних гефорсов с изменёнными 2 байтами в прошивке а-ля Quadro и с отрезанным выходом на монитор. Может лучше обычную видюшку купить? Там вроде CUDA такое же....

anonymous
()

учитывая то что на паралельные процессы куда накладывает огромные ограничения, круг задач этой штуки ограничен лишь некоторыми задачами моделирования. процеессоры эти все должны обрабатывать одни и те же операции тупого вычисления, с ветвлениями туго.. см описание этой куды. кстати смешно что у них увеличение точности вызвало падение производительности почти в 10 раз. [сори если не прав, кто знает куду лучше поправят :)]

anonymous
()
Ответ на: комментарий от isden

Дайте два!

>гентушнеги негодуют

Я лично впал бы в зауныние, если меня избавили от столь замечательного процесса, как созерцание собирающегося <подставить имя пакета>

Gary ★★★★★
()
Ответ на: комментарий от lord_pnevmoslon

>Сколько ФПС в ждалкере?

Карты Tesla в отличии от GeForce GTX280 не имеют видео выходов, зато имеют больше памяти (на тесле 4GB GDDR3), в остальном вроде как идентичны. А ну ещё цена теслы как за два GeForce GTX280. Если задача влезает в гигабайт памяти GTX280*количество карт, то какой смысл платить больше? 4xGTX280=2000$ + процессор, мать, память, корпус, блок питания, ... ну никак не получается $10,000

anonymous
()
Ответ на: комментарий от MiklerGM

Возвращение рабочих станций, фигли :)

anonymous
()
Ответ на: комментарий от anonymous

> Карты Tesla в отличии от GeForce GTX280 не имеют видео выходов, зато имеют больше памяти (на тесле 4GB GDDR3), в остальном вроде как идентичны. А ну ещё цена теслы как за два GeForce GTX280. Если задача влезает в гигабайт памяти GTX280*количество карт, то какой смысл платить больше? 4xGTX280=2000$ + процессор, мать, память, корпус, блок питания, ... ну никак не получается $10,000

ну смысл наверное в том, что предлагается уже готовое и оттестированное решение, которое должно работать с основными серверными версиями линукса "искаропки". опять же, у них скорее всего есть техподдержка всего этого чуда и пр. все это стоит денег.

// wbr

klalafuda ★☆☆
()
Ответ на: комментарий от anonymous

> кстати смешно что у них увеличение точности вызвало падение производительности почти в 10 раз

В GTX280 для 32-х битных и 64-х битных вычислений используются разные потоковые процессоры. 32-х битных - 240. 64-х битных - 30. Отсюда и разница в скорости

anonymous
()

это чтобы файрфокс и опенофис не тормозили? :-)

anonymous
()

Херня полная, реальный прирост от 1.1 до 6.0 раз на крайне узком круге задач + ОХРЕНИТЕЛЬНАЯ ПРИВЯЗКА К ВЕНДОРУ.

Gharik
()
Ответ на: комментарий от anonymous

имхо лучше бы тогда они использовали 32-х битные процессоры для 64 бит вычислений. Просели бы раза в три, а не в десять.

AVL2 ★★★★★
()

интересно, а final cut и прочий макосный софт может использовать эту теслу для своиз rt-эффектов?

AVL2 ★★★★★
()
Ответ на: комментарий от anonymous

> учитывая то что на паралельные процессы куда накладывает огромные ограничения, круг задач этой штуки ограничен лишь некоторыми задачами моделирования

А никто это и не пропогандировал это как серебряную пулю.

sv75 ★★★★★
()

>240 ядер в одном графическом процессоре

Чего-то я не понял... Именно ЯДЕР ?

anonymous
()

>ена одной карты Tesla C1060 $1,699. Полноценный рабочий сперкомпьютер будет стоить порядка $10,000.

Ничего себе так, приемлемо..

MiracleMan ★★★★★
()

О, нам как раз нужен компьютер чтоб карты отрисовывать (с довольно частыми изменениями). И недорого и игрушка :-)

kost-bebix ★★
()
Ответ на: комментарий от Gharik

>Чиркаю бритвой Оккама по твоим волосатым йайцам, сынок ;)

fail, батя.

volh ★★
()
Ответ на: комментарий от anonymous

Графический чип G200, такой же, как и на GTX280\260. 240 - число унифицированных шейдерных процессоров. А ядро одно, собственно G200 :)

anonymous
()
Ответ на: комментарий от AVL2

> интересно, а final cut и прочий макосный софт может использовать эту теслу для своиз rt-эффектов?

См Open CL

Да, сможет. Причем паралельно несколько обсчитывать, если что - и на CPU можно считать, если нет подходящих GPU

namezys ★★★★
()
Ответ на: комментарий от AVL2

> а драйвера то есть? А то в макоси с ними весьма плохо...

Ну с учетом того, что вроде даже Framework вышел, да и выход Снежного Леопарда будет достаточно скоро - есть

Честно, пока не ставил. Может быть поставлю когда доберусь до своей домашней машинки

Идея хорошоя, и простая. Они перестают разделать GPU и CPU

namezys ★★★★
()
Ответ на: комментарий от AVL2

> имхо лучше бы тогда они использовали 32-х битные процессоры для 64 бит вычислений. Просели бы раза в три, а не в десять.

Увы. Кроме +-/*, есть ещё квадратный корень, синусы и прочая дрянь, расчёт которой с увеличенной точностью ЧРЕЗВЫЧАЙНО трудоёмок. О замедлении в 3 раза на мат. функциях речь идти не может; на порядок -- дай-то Бог. Именно хорошо и БЫСТРО рассчитываемые мат. функции с четырехкратной точностью делают спарку незаменимой: на реализации этих функций написана не одна докторская диссертация.

Orlusha ★★★★
()

Ну для расчёта CGH пойдёт, конечно. Правда, уже давно народ пользует обычные видюхи для этого, что гораздо дешевле.

Типа вот - http://www.opticsinfobase.org/viewmedia.cfm?uri=oe-14-17-7636&seq=0

На Nvidia 7800 - 0.4 fps голограммы приемлемого качества ч/б. Ну из этой штуки можно будет наверно 4-5 fps выжать. Уже хоть для какого-то применения, помимо демонстрации реальности "CGH в реальном времени" может пригодиться.

Глядишь, лет через 5 и до голографических дисплеев дело дойдёт. Правда маленьких, дюйма так на 3.

anonymous
()

Среди вас есть хоть кто-то кто знает как работают ос?

IO-block и context switching вам о чем-то говорит?

Эти карты разработаны для научных вычислений.

Ultracpp
()

Кому нужны эти флопсы на целочисленных или далеко не ушедших от них вычислениях. Сплошное втюхивание.

TheMixa ★★★
()
Ответ на: комментарий от TheMixa

> Кому нужны эти флопсы на целочисленных или далеко не ушедших от них вычислениях.

Выкладки, показывающую недостаточность для вас двойной точности, будут?

sv75 ★★★★★
()
Ответ на: комментарий от anonymous

это смотря что называть ядрами. мааркетологи нвидии называют штуки, которые могут одновременно скопом выполнять одни и те же действия, вплоть до идентичных ветвлений, ядрами.

а вообще-то эта хрень - ничто иное как продолжения принципов "а давайте мы оторвем функционал из готового чипа и будем продавать как лоу и мидл енд. а некастрированный продукт будет называться хай ендом и стоить в 5 раз дороже". ничего нового технологически продукт из себя не представляет. продукт создан и оттестирован под графикой, и почти только для нее полезен. все кому надо давно уже под свои узкие задачи купили дешевые графические карты, которые работают под той же кудой и мало отличаются от теслы.

нвидия не сделала даже самых минимальныз телодвижений для приведения своего продукта в соответствие с задачами ниши научных вычислителей - даже не заменили ненужные 32-битные ядра на 64-битные.. то есть вообще ничего не сделано кроме увеличения памяти. зато цену они подняли в несколько раз. типичный маркетоидный выхлоп.

anonymous
()

CUDA... ну и название для испаноговорящего :D

XWolverineX
()

Там не так все просто. Для того что бы получить реальный прирост производительности задача должна быть укладываемой на эту КУДу. Но если укладывается то на 2 порядка можно ускорить - я сам сперва не поверил когда свою задачу попробовал на тэсле посчитать - в 30 раз ускорение с первуого же теста - после допилки в 49 раз. Но у меня задача с тривиальным распаралеливанием (паралельный СТ) - ежели такого нет то во первых заипаццо можно на этой куде писать, а во вторых прирост производительности будет не так явен. В результате сейчас заказываем кластер с 512 теслами + 512 квад (изначально планировали 1024 квада без видио) - оно того стоит. Но прежде чем покупать теслы потестите кудовский код на домашних Г-форсах - чтобы понять нужно ли вам это.

anonymous
()

был когда то такой api - Glide. хороший был апи, но работал только на карточках 3dfx. и где он сейчас? вот и с куда так. пока опенсл не будет работать на карточках нвидии, ати и интел использовать такие вещи особенного смысла нет. потому что -> написал прогу для куда -> прикрыли -> переписал прогу -> глупо:) хотя демки смотрел, ниче так.

anonymous
()

ати свое прикрыла кстати. название не помню. работает над опенсл.

anonymous
()

Плохо представляю, кому может понадобиться это чудо для персонального использования (заявлено-то оно как "Персональный Суперкомпьютер").

P.S. А что же это они вендамс7 не поддерживают? Уж на такой-то махине новый калькулятор показал бы себя во всей красе.

Laz ★★★★★
()

у ати был стм - close to metal. вспомнил:)

anonymous
()
Ответ на: комментарий от isden

> гентушнеги негодуют.

Позор на седую голову тому гентушнику, который не смог разглядеть ебилд для куды в портеже.

const86 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.