LINUX.ORG.RU

2000 гигафлоп производительности в модуле 1U


0

0

Компания NVIDIA представила суперкомпьютер на основе её собственных графических процессоров в формате 1U c производительностью две тысячи гигафлоп. Машина названа именем Tesla. Среди поддерживаемых ОС названы 32х и 64х битные версии Red Hat Enterprise Linux 3, 4 и 5, 32х и 64х версии SUSE Enterprise Linux 10.1, 10.2 и 10.3, а также 32х битная версия Windows XP (Vista не поддерживается).

>>> Подробности

концовка в скобках порадовала:)) Наверное из-за тормозов...

UserUnknown ★★★★★
()

Пусть сначала спецификации откроют, тогда посмотрим.

Sikon ★★★
()

Ну на фик, напичкали туда GF8xxx в количестве четырёх штук и радуются.

ZDK-musashi
()

Ну и кому нахрен нужны эти долбаные 2000 попугаев на FP16 точности? Пусть 80/128-битный полноскоростной лонг-дабл обеспечат с минимальным оверхедом, тогда и можно будет вести базары.

Gharik
()
Ответ на: комментарий от Gharik

> Пусть 80/128-битный полноскоростной лонг-дабл обеспечат с минимальным оверхедом, тогда и можно будет вести базары.

1. Лонгдабл в МАССОВЫХ графических процессорах НЕ НУЖЕН. Он нужен только в специализированных картах для ГИС, но таковых пока никто не делает, а Матрокса уже не хватает, так что можно ждать, но по ценам ОТНЮДЬ НЕ МАССОВЫМ, и суперкомпьютер будет недешевым (хотя и дешевле всех конкурентов).

2. На 128-разрядную плавающую арифметику (в т.ч. спарковские процессоры) есть экспортные ограничения США, так что даже если такую ШТУЧЧЧКУ и сделают, в магазине в Москве она продаваться точно не будет.

orlusha
()

Это для фанатов брутфорса видимо :)

Salv
()

как-то на ЛОРе пробегала новость про nVidia CUDA. Хотел узнать, работает ли у кого и как с этим на ноутах?

/me atiшнег

shahid ★★★★★
()

Оригинал новости порадовал воей некомпетентностью, перевод тоже. Какой нафиг "SUSE Enterprise Linux 10.1, 10.2 и 10.3"? Или "openSUSE 10.1, 10.2 и 10.3", которая ни разу не Enterprise или уж "SUSE Linux Enterprise 10", которая просто 10, а не 10.х

StrangerTeam
()

о луди пошли не вту сторону пошли по пути SGI скорей бы их intel купил

alexsx06
()

>в формате 1U c производительностью две тысячи гигафлоп...

>(Vista не поддерживается)...

Производительности не хватило? :)

furs
()
Ответ на: комментарий от Gharik

>Пусть 80/128-битный полноскоростной лонг-дабл обеспечат с минимальным оверхедом, тогда и можно будет вести базары.



наличие компьютера с определёнными свойствами, равно как и погрешность измерений- часть условия задачи.
или на месте Резерфорда ты остановил бы все работы пока не изобретут достаточно мощный микроскоп?:)

Anonymous ★★★★★
()

так флопсы-то одиночной точности, т.е. только для обработки изображений (и чего-то подобного) и годятся

vadiml ★★★★★
()
Ответ на: комментарий от orlusha

> На 128-разрядную плавающую арифметику (в т.ч. спарковские процессоры) есть экспортные ограничения США

а как же мы покупает процессоры amd и intel? там же в последних sse как раз 128-битная плавающая арифметика есть?

vadiml ★★★★★
()
Ответ на: комментарий от orlusha

> На 128-разрядную плавающую арифметику (в т.ч. спарковские процессоры) есть экспортные ограничения США

клон спарков (причем более быстрый чем есть сейчас у sun, выпускает fuji-siemens, и японцам-немцам наплевать на экспортные ограничения сша )

ЗЫ Power6 собираются продавать в россии, а они помощнее будут

vadiml ★★★★★
()
Ответ на: комментарий от Anonymous

> наличие компьютера с определёнными свойствами, равно как и погрешность измерений- часть условия задачи.
> или на месте Резерфорда ты остановил бы все работы пока не изобретут достаточно мощный микроскоп?:)

Представь себе, что "подождать" на мало-мальски длительных задачах выйдет дешевле и быстрее - ибо кому нафиг нужны чипы, что по любому просядут на порядок при переходе с FP16 на FP32, а затем ещё на порядок - на FP32 -> FP64. Надеюсь не нужно пояснять, что двойная точность общепринята и общеиспользуема, в противном же случае дешевле выйдет купить такие же 1U серваки на Cell'ах у IBM (или вообще блейды, что порвут нвидию в хлам), а уж 20 гигафлопсов - это и обычное x86 железо без всякой кластеризации выдать может.

Gharik
()
Ответ на: комментарий от orlusha

>На 128-разрядную плавающую арифметику (в т.ч. спарковские процессоры) есть экспортные ограничения США, так что даже если такую ШТУЧЧЧКУ и сделают, в магазине в Москве она продаваться точно не будет.

а разве то что у нас в Москве продается клепается в США? %). Я так понимаю что бОльщуя часть железок клепают китайцы и иже с ними... %).

Sagrer
()
Ответ на: комментарий от KRoN73

> А сколько на такой машинке займёт пересборка мира в Gentoo? ;)

Бесконечность, т.к. целочисленный счёт там не при делах.

Gharik
()
Ответ на: комментарий от Gharik

>Бесконечность, т.к. целочисленный счёт там не при делах.

интересно, а как там тогда вообще ОСи живут?? или им целочисленный счёт побоку, он по твоему только для компиляции необходим?? )))))

vasist
()
Ответ на: комментарий от Gharik

>Надеюсь не нужно пояснять, что двойная точность общепринята и общеиспользуема, в противном же случае дешевле выйдет купить такие же 1U серваки на Cell'ах у IBM (или вообще блейды, что порвут нвидию в хлам), а уж 20 гигафлопсов - это и обычное x86 железо без всякой кластеризации выдать может.

А можно в ценах за операцию или флопс?

jackill ★★★★★
()
Ответ на: комментарий от KRoN73

>А сколько на такой машинке займёт пересборка мира в Gentoo? ;)

я так думаю раза в 2-3, ибо к великому моему сожалению, скорость винчестеров от их количества не зависит)))) + распаралелить процесс компиляции штука имхо непростая

vasist
()
Ответ на: комментарий от Anonymous

Русская ссылка это вобще черный пиар... Вот например, "Атмосферная эмуляция облаков" --- ускорение 50 раз...

А на сайте "For example, lighting the clouds shown below required 21 seconds on a single NVIDIA G80 Quadro, compared to 15 minutes on a 2.0GHz AMD Opteron 246"

15*60/21 = 42,9 РАЗА

С учетом того, что AMD 2.0 Ггц, вроде бы, даже 1 ГФлопс не давал, весь это выигрыш смешон. Ведь 2000/1 = 2000 Раз --- где же этот прирост?

ИМХО, гениальная поделка для желающих точить свои задачи на Си, заботясь о загрузке всей это своры (8x128) процессоров...

P.S. А сколько он стоит? ИМХО, рулит не размер, а стоимость одного вычисления...

mky ★★★★★
()

а в гигафлопах написали чтобы быстрее казалось?

AcidumIrae ★★★★★
()
Ответ на: комментарий от anonymous

> Что такое пересборка мира? У кого то крыша поехала?

Необразованный виндузятник, даже таких элементарных вещей не знаешь как emerge -Du world, стыд тебе и позор.

anonymous
()

> а также 32х битная версия Windows XP (Vista не поддерживается).

Таки вистовсу капец.

anonymous
()

> Среда разработки NVIDIA CUDA в настоящий момент поддерживается операционными системами Linux и Microsoft® Windows® XP.

На бсдшников, у которых нынче появилась крутая файловая система tmpfs, как обычно, забили болт. Одумайтесь, наверные, покайтесь, примите нашу веру и тогда вы будете прощены и приняты в клан линуксоидов, вместе мы устроим вендекапец мерзкой, гадкой, глючной и дырявой поделке билли! :)))

anonymous
()

Интсресно, сколько фпс покажет на ней glxgears :)

AiLr ★★
()
Ответ на: комментарий от jackill

> А можно в ценах за операцию или флопс?

Цен на поделку нвидии не приводилось, остальное - в top500.

Gharik
()
Ответ на: комментарий от Sagrer

>>На 128-разрядную плавающую арифметику (в т.ч. спарковские процессоры) есть экспортные ограничения США, так что даже если такую ШТУЧЧЧКУ и сделают, в магазине в Москве она продаваться точно не будет.

>а разве то что у нас в Москве продается клепается в США? %). Я так понимаю что бОльщуя часть железок клепают китайцы и иже с ними... %).

Спарку клепают в странах, для которых это ограничение снято, то есть явно не в Китае, скорее в Японии или в самих Штатах: в результате цена спарковских процессоров не маленькая, в несколько раз дороже сопоставимого по классу Интела или даже ИБМ. Так, 1,6 ГГц одноядерный SPARC IV+ с 2 МБ кэша, насколько я помню, стоит порядка 1000$.

orlusha
()
Ответ на: комментарий от vadiml

> а как же мы покупает процессоры amd и intel? там же в последних sse как раз 128-битная плавающая арифметика есть?

Увы, это не так. Ознакомьтесь с интеловской документацией на официальном сайте. В sse3 есть 128-разрядный РЕГИСТР XMM, кторый используется под ДВА операнда команды sse3, лабоающей с 8-байтовыми вещественными числами. Результат помещается также в половину регистра XMM. Так что в SSE3 нет даже 80-разрядной плавающей арифметики, а 128-разрядной и подавно.

Так что, покупая процессоры amd и intel, Россия не нарушает экспортных правил США.

Кстати сказать, у хваленого Итаниума 128-разрядной плавающей арифметики ТОЖЕ НЕТ. На СЕРИЙНЫХ процессорах нет ни у IBM, ни у HP - ни у кого, кроме Сана. А на НЕсерийных я слышал и про 256-разрядные плавающие числа для каких-то астрономических применений, правда, не помню, где и когда.

orlusha
()
Ответ на: комментарий от orlusha

> Так, 1,6 ГГц одноядерный SPARC IV+ с 2 МБ кэша, насколько я помню, стоит порядка 1000$.

не бывает одноядерных IV+, как и IV+ на частоте 1.6 GHz, хотя вот в последнем я могу заблуждаться, но вроде бы были только 1.5, 1.8 и 2.1

paul7
()
Ответ на: комментарий от StrangerTeam

> Оригинал новости порадовал воей некомпетентностью, перевод тоже.

Я версиях Suse не силён (ибо никогда им не пользовался) - так что ваши выпады не принимаются.

birdie ★★★★★
() автор топика
Ответ на: комментарий от vasist

>интересно, а как там тогда вообще ОСи живут??

Там есть обычный (GP) процессор а GPU только для счёта (типа сопроцессора)

PS: кстати чтобы такое чудо более менее загрузить нужно еще задачу поискать Пиковые террафлопсы и реальные это немного разные попугаи.

sS ★★★★★
()
Ответ на: комментарий от mky

>С учетом того, что AMD 2.0 Ггц, вроде бы, даже 1 ГФлопс не давал, весь это выигрыш смешон

Что значит "вроде бы ?"

Вы арифметику в школе учили ?

2*2=?

sS ★★★★★
()
Ответ на: комментарий от mky

> С учетом того, что AMD 2.0 Ггц, вроде бы, даже 1 ГФлопс не давал, весь это выигрыш смешон. Ведь 2000/1 = 2000 Раз --- где же этот прирост?

Лучше молчать, и казаться идиотом, чем сказать и развеять все сомнения. Как это Opteron не даст 1 GFlops, если даже мой Core 2 Duo в сетевом тесте Linpack (который использует MPI-функции для обмена между процессами, а следовательно на локальной машине притормаживает) и то давал порядка 8 GFlops на матрице размерностью 8000?

anonymous
()
Ответ на: комментарий от anonymous

>>SUSE Enterprise Linux 10.1, 10.2 и 10.3 ээ это как?

Машина времени. А ты уже поставил 12ю слаку?

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от vadiml

>32-битная не тянет

А 64х-битная не тянет этот "суперкомпьютер"

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от anonymous

> Как это Opteron не даст 1 GFlops, если даже мой Core 2 Duo в сетевом тесте Linpack (который использует MPI-функции для обмена между процессами, а следовательно на локальной машине притормаживает) и то давал порядка 8 GFlops на матрице размерностью 8000?

Человек просто арифметики не знает ;)

246 оптерон даёт в пике 4 гигафлопса

Формула для расчёта элементарна: Rpeak = число процессоров*число ядер*число fp операций за секунду*частота

ЗЫ: MPI на линпаке почти ничего не тормозит, ведь это "плотная" FP задача то есть число вычислений существенно больше числа пересылок.

Даже на 10 узловом кластере (с IB в качестве интерконнекта) эффективность к примеру оптеронов на такой задаче порядка 0.82, на большой матрице разумеется (65400)

sS ★★★★★
()
Ответ на: комментарий от sS

Лол, sS непролазный умник, так никто не считает.

А так мощная вещуга, для рейтресинга ее бы притартачить. 16 битная точность как раз хватает. А килобитный проц у IBM был.

anonymous
()
Ответ на: комментарий от orlusha

>Кстати сказать, у хваленого Итаниума 128-разрядной плавающей арифметики ТОЖЕ НЕТ. На СЕРИЙНЫХ процессорах нет ни у IBM, ни у HP - ни у кого, кроме Сана.

А зачем нам кузнец, когда 1879BM3 проивзодит 128-разрядные вычисления? :) Правда, только на 600МГц и за два такта, но зато от -40° до +85° и 4Вт :)

KRoN73 ★★★★★
()

>Vista не поддерживается

Ресурсов не хватило???

Orlangoor ★★★★★
()
Ответ на: комментарий от orlusha

> На СЕРИЙНЫХ процессорах нет ни у IBM, ни у HP - ни у кого, кроме Сана.

Кстати, что там про Cell и его SPU? Если мне не изменяет склероз, в них 128 128-разрадных регистров...

anonymous
()
Ответ на: комментарий от anonymous

Сам нашёл:

http://www.3dnews.ru/cpu/cell/

"Правда, при этом большинство арифметических инструкций представляют собой 128-разрядные векторы, разделённые на четыре 32-битных элемента."

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.