LINUX.ORG.RU

Новая Linux-система, производства компании Cray


0

0

Linux-система, производства компании Cray, с кодовым названием Baker, оснащенная 24 тыс. гнезд для процессоров Opteron, будет установлена в Национальной лаборатории Окридж в 2008 г.
Ожидаемая производительность - один петафлопс.

>>> Подробности



Проверено: Shaman007 ()

> с кодовым названием Baker, оснащенная 24 тыс. гнезд для процессоров

Очевидно, хитрая архитектура внутренних шин должна называться Baker street ;) А процесс-монитор по умолчанию выполняется на процессоре с внутренним адресом 0x0221B ;)

svu ★★★★★
()
Ответ на: комментарий от lester_dev

Нифига! Sherlock - это, что получится, когда гугл себе купит этот утюг и переведет на него все хозяйство ...

svu ★★★★★
()
Ответ на: комментарий от Lockywolf

>Дак... что же это такое. в 96 году погиб, а компьютеры делает?

Погиб основатель -- Сеймур Крей. А компания жива и делает компьютеры, только вот дела ее чертвски неважны, увы...

bigc ★★
()
Ответ на: комментарий от del

> А почему не написали, что на нем будет Линукс?

Кхм, это я что-то заголовок не прочитал. Мой косяк. :)

del
()

>Linux-система, производства компании Cray, с кодовым названием Baker, оснащенная 24 тыс. гнезд для процессоров Opteron, будет установлена в Национальной лаборатории Окридж в 2008 г

чтобы собирать на ней gentoo.

dn2010 ★★★★★
()

Странно... По тестам вроде linux по полной отстает от AIX и соляры при высоком числе процессоров.

Orlangoor ★★★★★
()

Странно что никто еще не сказал, что линух там сразу снесут, и поставять пераццкую венду

Orlangoor ★★★★★
()
Ответ на: комментарий от Orlangoor

> Странно что никто еще не сказал, что линух там сразу снесут, и поставять пераццкую венду

А почему бы и нет? Теперь же есть window$ server compute cluster! :)

zenith ★★★
()

А где, собственно, петафлоп? Или я чего-то не понимаю, или нас где-то нае^Wобманывают.

Пусть будут двухядерные Opteron'ы 2.6 GHz, множитель у них 2, так что получаем: 2.6*2*2*24000=249600 или 250 терафлопс.

Где-то я не прав?

Shmuma
()
Ответ на: комментарий от MiracleMan

>Ничего себе.. Хочу себе домой такое чудо.. ;-)

А оно поместится? завидую твоему дому :)

v12aml ★★
()
Ответ на: комментарий от Shmuma

>Пусть будут двухядерные Opteron'ы 2.6 GHz, множитель у них 2, так что получаем: 2.6*2*2*24000=249600 или 250 терафлопс.

>Где-то я не прав?

Молодец, арифметику не забыл!

Dubrovsky
()

Скоро компы опять станут большими и для них снова начнут строить бассейны для охлаждения... Что-то будет..

fugu
()
Ответ на: комментарий от Shmuma

> Пусть будут двухядерные Opteron'ы 2.6 GHz, множитель у них 2, так что получаем: 2.6*2*2*24000=249600 или 250 терафлопс.

> Где-то я не прав?

Ты почему-то считаешь что один такт процессора = одна операция с плавающей точкой. Это не так.

an
()
Ответ на: комментарий от const86

Ну уж... Вы еще про MMX вспомните. Почему же в top500 при расчете пиковой производительности SSE не учитывают?

Одно объяснение петафлопу в статье -- надеются что к 2008-му, как обещает AMD, выйдут восьмиядерные процессора.

Shmuma
()
Ответ на: комментарий от Shmuma

> надеются что к 2008-му, как обещает AMD, выйдут восьмиядерные процессора.

АМД 4-ядерный-то сделать не могут.

Relan ★★★★★
()
Ответ на: комментарий от dik

Разницу между пиковой производительностью и производительностью по linpack знаем?

В тесте по ссылке на Xeon'е получена производительность 3.7 GFlops на Linpack, что составляет 72% от пика в 5.2 GFlops.

Про linpack разговора не было, петафлопа на существующих процессорах даже в пике не получается.

Shmuma
()
Ответ на: комментарий от Shmuma

>Где-то я не прав? ну ты тоже - напишешь не подумав. их же разгонять будут!

Sancho_s_rancho
()
Ответ на: комментарий от Shmuma

> я же написал что множитель 2 -- две операции за такт

операция с плавающей точкой (FLOP), инструкция и такт в данном случае - три разных вещи, поскольку рассматриваемый процессор 1) многоконвейерный и 2) имеет векторные расширения (SSE и проч).

an
()
Ответ на: комментарий от an

Хорошо. Вдумчиво смотрим вот сюда: http://www.supercomputers.ru/?page=rating

Берем строчку номер 2: пиковая производительность 2534.4, процессоров 576, частота 2.2.

Снова немного арифметики: 2534.4 / 576 / 2.2 == 2.

Вот эта-то двойка и является количеством операций с плавающей точкой за такт. И, прошу заметить, никаких SSE!

Для особо упорных, предлагаю то же самое проделать для списка top500.

Shmuma
()
Ответ на: комментарий от Shmuma

> Берем строчку номер 2: пиковая производительность 2534.4, процессоров 576, частота 2.2.

> Снова немного арифметики: 2534.4 / 576 / 2.2 == 2.

> Вот эта-то двойка и является количеством операций с плавающей точкой за такт. И, прошу заметить, никаких SSE!

Вы мне напоминаете фокусника. А объяснить происхождение этой двойки слабо ? А без знания конкретной архитектуры конкретного процессора ?

Я утверждаю, что при вычислении "пиковой производительности" учитываются возможности Opteron процессора именно в векторных вычислениях (например, SSE). Также учитываются возможности процессора по распараллеливанию инструкций.

И именно на основе этих данных появляется наша волшебная двойка.

an
()
Ответ на: комментарий от an

Смотрим вот сюда: http://www.beowulf.org/archive/2005-September/013806.html

Еще раз: никаких SSE/MMX/что-там-еще-маркетоиды-придумали при расчете пиковой производительности не используется, только количество флопов за такт процессора.

Shmuma
()
Ответ на: комментарий от Shmuma

> Еще раз: никаких SSE/MMX/что-там-еще-маркетоиды-придумали при расчете пиковой производительности не используется, только количество флопов за такт процессора.

А как по-Вашему высчитывается "количество флопов за такт процессора" ? ;-)

an
()
Ответ на: комментарий от Shmuma

>Хорошо. Вдумчиво смотрим вот сюда: http://www.supercomputers.ru/?page=rating

>Берем строчку номер 2: пиковая производительность 2534.4, процессоров 576, частота 2.2.

>Снова немного арифметики: 2534.4 / 576 / 2.2 == 2.

>Вот эта-то двойка и является количеством операций с плавающей точкой за такт. И, прошу заметить, никаких SSE!

>Для особо упорных, предлагаю то же самое проделать для списка top500.

Да, то что ты считал это пиковая производительность, только к реальной производительности она имеет очень слабое отношение, если верить им то пень4 при той же частоте имеет такую же производительность что и атлон64, а мы то знаем что это мягко говоря ... ;) Кстати похоже речь идет именно о пиковых петафлопах, если использовать восьмиядерьный оптерон с частотой 2.8

Те числа по которым определяют место в топах на самом деле вычисляются с помощью linpack. Вот запустили тест, получили цифирьку и послали эту цифирьку при регистрации, а может и не эту, ну приврали немного, кто проверять будет (за исключением возможно первых мест)?

Dubrovsky
()
Ответ на: комментарий от Dubrovsky

> Да, то что ты считал это пиковая производительность, только к реальной производительности она имеет очень слабое отношение

Само, собой, обсуждался только пик. Linpack в нормальной системе = ~75% от пика, реальные задачи ~50%.

> Те числа по которым определяют место в топах на самом деле вычисляются с помощью linpack. Вот запустили тест, получили цифирьку и послали эту цифирьку при регистрации, а может и не эту, ну приврали немного, кто проверять будет (за исключением возможно первых мест)?

Ага, вот только если по linpack мы напишем производительность больше пика, то нас засмеют как минимум :-).

Восьмиядерных operon'ов 2.8 пока в продаже нет, так что, это всего лишь прогноз, который в Top500 не идет. Учитывая динамику этого самого Top500, очень может быть что петафлоп и раньше 2008 соберут.

Кстати, если бы они делали на уже существующих cell'ах, то процов до петафлопа потребовалось бы ровно в 10 раз меньше. Там пик около 200 на камень, если не ошибаюсь.

Shmuma
()
Ответ на: комментарий от an

Во, нашел: http://www.informit.com/articles/article.asp?p=130978&seqNum=8&rl=1

Если верить написанному, SSE позволяет обрабатывать до 4 float-значений за такт. Так что двойка, в данном случае, никак не получается. MMX, насколько я знаю работу с float не поддерживает, так что тоже мимо кассы.

Остается только распараллеливание на уровне инструкций, что уже больше похоже на правду.

Shmuma
()
Ответ на: комментарий от del

А откуда известно что будет Linux? оно все вилами по воде, может к тому моменту идею CNL окончательно похоронят и оставят catamount, или придумают еще что-нибудь ужасное.

green ★★★★★
()
Ответ на: комментарий от Shmuma

> Во, нашел: http://www.informit.com/articles/article.asp?p=130978&seqNum=8&rl=1

> Если верить написанному, SSE позволяет обрабатывать до 4 float-значений за такт. Так что двойка, в данном случае, никак не получается. MMX, насколько я знаю работу с float не поддерживает, так что тоже мимо кассы.

Все потому, что написаное следует проверять, прежде чем верить.

SIMD enables multiple operations to be performed per processor instruction. Specifically SSE supports up to four floating point operations per cycle; that is, a single instruction can operate on four pieces of data simultaneously.

Первое предложение - корректно. Второе - корректно лишь частично и вот почему: исполнение инструкции FLOP действительно может произойти за один цикл (по крайней мере на Opteron), но только когда до нее не было FLOP инструкции, использующей те же функциональные блоки процессора. Например, для достижения пресловутой двойки, советуют чередовать MUL и ADD (типичный случай для 3d игр, FFT).

Если кому-то интересна более детальная информация по вопросу, советую сначала почитать первоисточник - "Software Optimization Guide for AMD Athlon 64 and AMD Opteron Processors", раздел "Achieving Two Floating-Point Operations per Clock Cycle" ;-)

an
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.