NVIDIA объявила начало продаж персонального суперкомпьютера Tesla

0

0

Совместно со своими партнерами, компания NVIDIA разработала Персональный Суперкомпьютер Tesla, оснащенный графическими процессорами на основе архитектуры Cuda. Как было заявлено, компьютеры, использующие Tesla C1060 GPU, работают в 250 раз быстрее среднестатистического десктопа, что позволит выполнять ресурсоемкие вычисления и моделирования без доступа к обычным суперкомпьютерам. Пиковая производительность системы оценивается в 4 TFLops.

Цена одной карты Tesla C1060 $1,699. Полноценный рабочий суперкомпьютер будет стоить порядка $10,000.

Основные характеристики архитектуры:

240 ядер в одном графическом процессоре,
операции с целыми числами и числами с плавающей точкой одинарной и двойной точности (IEEE 754),
производительность каждого графического процессора при работе с числами с плавающей точкой одинарной точности - 933 GFlops, двойной точности - 78 GFlops,
пиковая пропускная способность памяти - 102 GB/s.

Средства для разработки, входящие в комплект поставки, включают в себя компилятор языка С, отладчик и профайлер. А также некоторые численные библиотеки (FFT, BLAS) и библиотеку CuDPP (CUDA Data Parallel Primitives).

Технические характеристики суперкомпьютера:

3 или 4 вычислительных процессора Tesla C1060 с 4 Гб (dedicated) ОЗУ для каждого процессора,
2.33 ГГц 4-ядерный AMD Phenom или Opteron, или же 4-ядерный Intel Core 2 или Xeon,
БП 1200-1350 Watt, подключается к обычной розетке,
уровень шума < 45dbA.

Среди поддерживаемых операционных систем заявлены дистрибутивы GNU/Linux Red Hat Enterprise Linux 4/5 и SUSE 10.1, 10.2, 10.3 (как 32-битные, так и 64-битные).

Более детельно ознакомиться с описанием системы можно на соответствующем сайте NVIDIA Tesla Personal Supercomputer.

Компании, которые будут продавать Tesla Personal Supercomputers: Dell, Lenovo, Asus, Western Scientific и некоторые другие.

>>> Подробности

Ссылка

←	Встреча пользователей Moscow MySQL User Group

Как быть хорошим (и ленивым) сисадмином

→

← 1 2 3 →

для сравнения: начальная цена Cray CX1 (на тех же Теслах) $25000

Jeepston ★★★
(24.11.08 19:39:33 MSK) автор топика

Ссылка

> компьютеры, использующие Tesla C1060 GPU работают в 250 раз быстрее среднестатистического десктопа

это на всех задачах? т.е. не только при расчетах с плавающей точкой, а и, например, при компиляции, работе с БД и т.п.?

~~lester~~ ★★★★
(24.11.08 19:51:39 MSK)

Ответ на: комментарий от lester 24.11.08 19:51:39 MSK

Сия тайна покрыта мраком (в прес-релизах не указали). Скорее всего только при вычислениях.

Jeepston ★★★
(24.11.08 19:55:13 MSK) автор топика

Ссылка

Ну что же, лет через семm-восемь будем собирать эти теслы на барахолках, вспоминать былые годы, когда это считалось суперкомпьютером... :)

Aceler ★★★★★
(24.11.08 20:14:51 MSK)

Ссылка

Ответ на: комментарий от lester 24.11.08 19:51:39 MSK

>это на всех задачах? т.е. не только при расчетах с плавающей точкой, а и, например, при компиляции, работе с БД и т.п.?

ну, очевидно, на задачах, где можно эффективно заюзать Cuda. интересно посмотреть работу http://code.google.com/p/pyrit/ с этим чудом.

по теме: заверните!

volh ★★
(24.11.08 20:20:28 MSK)

Ссылка

> Среди поддерживаемых операционных систем заявлены дистрибутивы GNU/Linux Red Hat Enterprise Linux 4/5 и SUSE 10.1, 10.2, 10.3 (как 32-хбитные, так и 64-хбитные).

гентушнеги негодуют.

isden ★★★★★
(24.11.08 21:49:43 MSK)

http://www.linux.org.ru/view-message.jsp?msgid=3276676

Вы что, блин, сговорились?

heilnull ★★
(24.11.08 22:04:29 MSK)

Ответ на: комментарий от heilnull 24.11.08 22:04:29 MSK

никак нет. сегодня в толксы еще не заглядывал %)

мне новость в рассылке пришла (не с оупеннет)

Jeepston ★★★
(24.11.08 22:34:34 MSK) автор топика

Ссылка

Сколько ФПС в ждалкере?

lord_pnevmoslon
(24.11.08 22:54:02 MSK)

"Полноценный рабочий (!!) сперкомпьютер" Спёр компьютер полноценный, ай ай ай

anonymous
(24.11.08 22:58:11 MSK)

Ссылка

кто сперкомпьютер?! :]

rudchenkos ★
(24.11.08 23:02:30 MSK)

Ссылка

Сабж - какой-то из последних гефорсов с изменёнными 2 байтами в прошивке а-ля Quadro и с отрезанным выходом на монитор. Может лучше обычную видюшку купить? Там вроде CUDA такое же....

anonymous
(24.11.08 23:03:31 MSK)

Ссылка

учитывая то что на паралельные процессы куда накладывает огромные ограничения, круг задач этой штуки ограничен лишь некоторыми задачами моделирования. процеессоры эти все должны обрабатывать одни и те же операции тупого вычисления, с ветвлениями туго.. см описание этой куды. кстати смешно что у них увеличение точности вызвало падение производительности почти в 10 раз. [сори если не прав, кто знает куду лучше поправят :)]

anonymous
(24.11.08 23:04:51 MSK)

Ответ на: комментарий от isden 24.11.08 21:49:43 MSK

Дайте два!

>гентушнеги негодуют

Я лично впал бы в зауныние, если меня избавили от столь замечательного процесса, как созерцание собирающегося <подставить имя пакета>

Gary ★★★★★
(24.11.08 23:07:48 MSK)

Ссылка

Ответ на: комментарий от lord_pnevmoslon 24.11.08 22:54:02 MSK

>Сколько ФПС в ждалкере?

Карты Tesla в отличии от GeForce GTX280 не имеют видео выходов, зато имеют больше памяти (на тесле 4GB GDDR3), в остальном вроде как идентичны. А ну ещё цена теслы как за два GeForce GTX280. Если задача влезает в гигабайт памяти GTX280*количество карт, то какой смысл платить больше? 4xGTX280=2000$ + процессор, мать, память, корпус, блок питания, ... ну никак не получается $10,000

anonymous
(24.11.08 23:11:04 MSK)

нвидиясошла с ума

MiklerGM ★★
(24.11.08 23:12:56 MSK)

Ответ на: комментарий от MiklerGM 24.11.08 23:12:56 MSK

Возвращение рабочих станций, фигли :)

anonymous
(24.11.08 23:18:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.11.08 23:11:04 MSK

> Карты Tesla в отличии от GeForce GTX280 не имеют видео выходов, зато имеют больше памяти (на тесле 4GB GDDR3), в остальном вроде как идентичны. А ну ещё цена теслы как за два GeForce GTX280. Если задача влезает в гигабайт памяти GTX280*количество карт, то какой смысл платить больше? 4xGTX280=2000$ + процессор, мать, память, корпус, блок питания, ... ну никак не получается $10,000

ну смысл наверное в том, что предлагается уже готовое и оттестированное решение, которое должно работать с основными серверными версиями линукса "искаропки". опять же, у них скорее всего есть техподдержка всего этого чуда и пр. все это стоит денег.

// wbr

~~klalafuda~~ ★☆☆
(24.11.08 23:19:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.11.08 23:04:51 MSK

> кстати смешно что у них увеличение точности вызвало падение производительности почти в 10 раз

В GTX280 для 32-х битных и 64-х битных вычислений используются разные потоковые процессоры. 32-х битных - 240. 64-х битных - 30. Отсюда и разница в скорости

anonymous
(24.11.08 23:21:17 MSK)

это чтобы файрфокс и опенофис не тормозили? :-)

anonymous
(24.11.08 23:38:48 MSK)

Ссылка

Херня полная, реальный прирост от 1.1 до 6.0 раз на крайне узком круге задач + ОХРЕНИТЕЛЬНАЯ ПРИВЯЗКА К ВЕНДОРУ.

~~Gharik~~ ☆
(24.11.08 23:53:54 MSK)

Ответ на: комментарий от anonymous 24.11.08 23:21:17 MSK

имхо лучше бы тогда они использовали 32-х битные процессоры для 64 бит вычислений. Просели бы раза в три, а не в десять.

~~AVL2~~ ★★★★★
(24.11.08 23:56:20 MSK)

интересно, а final cut и прочий макосный софт может использовать эту теслу для своиз rt-эффектов?

~~AVL2~~ ★★★★★
(24.11.08 23:58:01 MSK)

Ответ на: комментарий от anonymous 24.11.08 23:04:51 MSK

> учитывая то что на паралельные процессы куда накладывает огромные ограничения, круг задач этой штуки ограничен лишь некоторыми задачами моделирования

А никто это и не пропогандировал это как серебряную пулю.

sv75 ★★★★★
(24.11.08 23:58:58 MSK)

Ответ на: комментарий от Gharik 24.11.08 23:53:54 MSK

>реальный прирост от 1.1 до 6.0

график на странице pyrit опровергнуть сможешь?

volh ★★
(24.11.08 23:59:57 MSK)

Ответ на: комментарий от volh 24.11.08 23:59:57 MSK

> график на странице pyrit опровергнуть сможешь?

Чиркаю бритвой Оккама по твоим волосатым йайцам, сынок ;)

~~Gharik~~ ☆
(25.11.08 00:27:03 MSK)

>240 ядер в одном графическом процессоре

Чего-то я не понял... Именно ЯДЕР ?

anonymous
(25.11.08 00:29:42 MSK)

>ена одной карты Tesla C1060 $1,699. Полноценный рабочий сперкомпьютер будет стоить порядка $10,000.

Ничего себе так, приемлемо..

MiracleMan ★★★★★
(25.11.08 00:33:27 MSK)

Ссылка

О, нам как раз нужен компьютер чтоб карты отрисовывать (с довольно частыми изменениями). И недорого и игрушка :-)

kost-bebix ★★
(25.11.08 00:34:31 MSK)

Ссылка

Ответ на: комментарий от Gharik 25.11.08 00:27:03 MSK

>Чиркаю бритвой Оккама по твоим волосатым йайцам, сынок ;)

fail, батя.

volh ★★
(25.11.08 00:38:38 MSK)

Ссылка

Ответ на: комментарий от sv75 24.11.08 23:58:58 MSK

пропАганда.

~~AVL2~~ ★★★★★
(25.11.08 00:58:46 MSK)

Ссылка

Ответ на: комментарий от anonymous 25.11.08 00:29:42 MSK

Графический чип G200, такой же, как и на GTX280\260. 240 - число унифицированных шейдерных процессоров. А ядро одно, собственно G200 :)

anonymous
(25.11.08 01:00:25 MSK)

Ссылка

Ответ на: комментарий от AVL2 24.11.08 23:58:01 MSK

> интересно, а final cut и прочий макосный софт может использовать эту теслу для своиз rt-эффектов?

См Open CL

Да, сможет. Причем паралельно несколько обсчитывать, если что - и на CPU можно считать, если нет подходящих GPU

namezys ★★★★
(25.11.08 01:27:50 MSK)

Ответ на: комментарий от namezys 25.11.08 01:27:50 MSK

а драйвера то есть? А то в макоси с ними весьма плохо...

~~AVL2~~ ★★★★★
(25.11.08 01:36:44 MSK)

Ответ на: комментарий от AVL2 25.11.08 01:36:44 MSK

> а драйвера то есть? А то в макоси с ними весьма плохо...

Ну с учетом того, что вроде даже Framework вышел, да и выход Снежного Леопарда будет достаточно скоро - есть

Честно, пока не ставил. Может быть поставлю когда доберусь до своей домашней машинки

Идея хорошоя, и простая. Они перестают разделать GPU и CPU

namezys ★★★★
(25.11.08 01:39:25 MSK)

Ссылка

Ответ на: комментарий от AVL2 24.11.08 23:56:20 MSK

> имхо лучше бы тогда они использовали 32-х битные процессоры для 64 бит вычислений. Просели бы раза в три, а не в десять.

Увы. Кроме +-/*, есть ещё квадратный корень, синусы и прочая дрянь, расчёт которой с увеличенной точностью ЧРЕЗВЫЧАЙНО трудоёмок. О замедлении в 3 раза на мат. функциях речь идти не может; на порядок -- дай-то Бог. Именно хорошо и БЫСТРО рассчитываемые мат. функции с четырехкратной точностью делают спарку незаменимой: на реализации этих функций написана не одна докторская диссертация.

Orlusha ★★★★
(25.11.08 02:17:54 MSK)

Ну для расчёта CGH пойдёт, конечно. Правда, уже давно народ пользует обычные видюхи для этого, что гораздо дешевле.

Типа вот - http://www.opticsinfobase.org/viewmedia.cfm?uri=oe-14-17-7636&seq=0

На Nvidia 7800 - 0.4 fps голограммы приемлемого качества ч/б. Ну из этой штуки можно будет наверно 4-5 fps выжать. Уже хоть для какого-то применения, помимо демонстрации реальности "CGH в реальном времени" может пригодиться.

Глядишь, лет через 5 и до голографических дисплеев дело дойдёт. Правда маленьких, дюйма так на 3.

anonymous
(25.11.08 03:03:47 MSK)

Среди вас есть хоть кто-то кто знает как работают ос?

IO-block и context switching вам о чем-то говорит?

Эти карты разработаны для научных вычислений.

Ultracpp ★
(25.11.08 04:04:29 MSK)

Кому нужны эти флопсы на целочисленных или далеко не ушедших от них вычислениях. Сплошное втюхивание.

TheMixa ★★★
(25.11.08 04:41:11 MSK)

Ответ на: комментарий от TheMixa 25.11.08 04:41:11 MSK

> Кому нужны эти флопсы на целочисленных или далеко не ушедших от них вычислениях.

Выкладки, показывающую недостаточность для вас двойной точности, будут?

sv75 ★★★★★
(25.11.08 04:46:57 MSK)

Ответ на: комментарий от anonymous 25.11.08 00:29:42 MSK

это смотря что называть ядрами. мааркетологи нвидии называют штуки, которые могут одновременно скопом выполнять одни и те же действия, вплоть до идентичных ветвлений, ядрами.

а вообще-то эта хрень - ничто иное как продолжения принципов "а давайте мы оторвем функционал из готового чипа и будем продавать как лоу и мидл енд. а некастрированный продукт будет называться хай ендом и стоить в 5 раз дороже". ничего нового технологически продукт из себя не представляет. продукт создан и оттестирован под графикой, и почти только для нее полезен. все кому надо давно уже под свои узкие задачи купили дешевые графические карты, которые работают под той же кудой и мало отличаются от теслы.

нвидия не сделала даже самых минимальныз телодвижений для приведения своего продукта в соответствие с задачами ниши научных вычислителей - даже не заменили ненужные 32-битные ядра на 64-битные.. то есть вообще ничего не сделано кроме увеличения памяти. зато цену они подняли в несколько раз. типичный маркетоидный выхлоп.

anonymous
(25.11.08 07:58:16 MSK)

Компьютер Тесла ?

С нетерпением ждем винтовку Гаусса.

anonymous
(25.11.08 08:14:59 MSK)

CUDA... ну и название для испаноговорящего :D

XWolverineX
(25.11.08 08:20:43 MSK)

Ссылка

Там не так все просто. Для того что бы получить реальный прирост производительности задача должна быть укладываемой на эту КУДу. Но если укладывается то на 2 порядка можно ускорить - я сам сперва не поверил когда свою задачу попробовал на тэсле посчитать - в 30 раз ускорение с первуого же теста - после допилки в 49 раз. Но у меня задача с тривиальным распаралеливанием (паралельный СТ) - ежели такого нет то во первых заипаццо можно на этой куде писать, а во вторых прирост производительности будет не так явен. В результате сейчас заказываем кластер с 512 теслами + 512 квад (изначально планировали 1024 квада без видио) - оно того стоит. Но прежде чем покупать теслы потестите кудовский код на домашних Г-форсах - чтобы понять нужно ли вам это.

anonymous
(25.11.08 08:20:53 MSK)

Ссылка

был когда то такой api - Glide. хороший был апи, но работал только на карточках 3dfx. и где он сейчас? вот и с куда так. пока опенсл не будет работать на карточках нвидии, ати и интел использовать такие вещи особенного смысла нет. потому что -> написал прогу для куда -> прикрыли -> переписал прогу -> глупо:) хотя демки смотрел, ниче так.

anonymous
(25.11.08 08:51:29 MSK)

ати свое прикрыла кстати. название не помню. работает над опенсл.

anonymous
(25.11.08 08:52:18 MSK)

Ссылка

Плохо представляю, кому может понадобиться это чудо для персонального использования (заявлено-то оно как "Персональный Суперкомпьютер").

P.S. А что же это они вендамс7 не поддерживают? Уж на такой-то махине новый калькулятор показал бы себя во всей красе.

Laz ★★★★★
(25.11.08 08:52:27 MSK)

у ати был стм - close to metal. вспомнил:)

anonymous
(25.11.08 08:54:50 MSK)

Ссылка

Ответ на: комментарий от isden 24.11.08 21:49:43 MSK

> гентушнеги негодуют.

Позор на седую голову тому гентушнику, который не смог разглядеть ебилд для куды в портеже.

const86 ★★★★★
(25.11.08 09:05:43 MSK)

Ссылка

Ответ на: комментарий от anonymous 25.11.08 08:14:59 MSK

> С нетерпением ждем винтовку Гаусса.

О, первый комментарий по теме.

~~Gharik~~ ☆
(25.11.08 09:27:46 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 →

←	Встреча пользователей Moscow MySQL User Group

Кластеры

Как быть хорошим (и ленивым) сисадмином

→

Похожие темы