LINUX.ORG.RU

SPARC T3

 , ,


0

1

Позавчера, 20 сентября 2010 года, Oracle анонсировала новый процессор SPARC T3 (Rainbow Falls, Niagara-3) и системы на его основе.

Характеристики процессора SPARC T3:

  • 64 бита
  • 16 ядер
  • 8 аппаратных потоков на ядро
  • 6Мб L2 кеш
  • SMP до четырёх процессоров без дополнительной логики
  • Встроенный четырёхканальный контроллер DDR3
  • Встроенный контроллер PCIe
  • 16 встроенных криптографических ускорителей
  • Два встроенных 10GigE интерфейса
  • 2,4 Тб/с на сокет

Одновременно представлены три новых сервера и один blade-сервер на процессорах T3 с частотой 1,65ГГц: SPARC T3-1, SPARC T3-2, SPARC T3-4 и SPARC T3-1B.

Ждём, появится ли OpenSPARC T3.

>>> Подробности

★★★★★

Проверено: svu ()
Последнее исправление: MuZHiK-2 (всего исправлений: 3)
Ответ на: комментарий от r

> Если он не такой: http://www.mpe.lv/mpe2/data/uploads/phone.jpg то процессор тм есть.

Есть у меня почти такой, разговариваю по нему довольно много, иногда контакт в меди похоже терятся, а так нормально.

Если она не такая: http://bt.rix.com.ua/sm/site/fileslibrary/new_rew/Stirka/st_0.jpg то процессор там тоже есть.

Аааа! Такой машинки нет! Хочу! Срочно!

www_linux_org_ru ★★★★★
()
Ответ на: комментарий от registrant

Это понятно — контроллеры один ближе к другому, но что там делает СЕТЕВОЙ ИНТЕРФЕЙС? Может они и слоты памяти на проце разместили?

Praporshik ★★
()

Я так понимаю, это специальные CPU для джавы, и джава, соответственно будет оптимизироваться для сих процов?

Censo
()
Ответ на: комментарий от exst

Ну и где там написано, что AIX 7.1 выпущена и поддерживается? То, что она есть в списке выбора, еще ни о чем не говорит, ибо там же неподалеку в списке поддерживаемых она не числится:

http://www-947.ibm.com/systems/support/fixes/en/fixcentral/help/supported.html

mukoh
()
Ответ на: комментарий от Praporshik

> Это понятно — контроллеры один ближе к другому, но что там делает СЕТЕВОЙ ИНТЕРФЕЙС? Может они и слоты памяти на проце разместили?

Это больше, чем просто процессор, это система-на-кристалле. Там не только 10Gbit Ethernet, там еще и PCIe2 имеется.

mukoh
()
Ответ на: комментарий от bolmer

>>Возможно, где-то, в эльфийских царствах, они и есть.

судя по аватаре, там то их как раз и нет ;)
это как суслик - ты его не видишь, но он есть.
я потому и написал 'иногда', что иногда...

EvgGad_303 ★★★★★
()
Ответ на: комментарий от Censo

>> джава, соответственно будет оптимизироваться для сих процов?

треш какой-то

kto_tama ★★★★★
()

>Встроенный контроллер PCIe

Два встроенных 10GigE интерфейса

странно, почему туда не впилили жёсткий диск и блок питания?

anonymous
()
Ответ на: комментарий от Praporshik

> Только вот не видел там и близко сетевых _интерфейсов_.

Слушай, хочу спросить, а XGMII — это сетевой интерфейс или нет?

На борту может не быть PHY, но весь MAC там, и наружу явно выходит стандартный сетевой интерфейс, не городить же огород велосипедов. Явно ведь физика разная может быть.

Ещё вопрос: вот перед глазами коммутатор с 24 слотами SFP, сколько у него сетевых интерфейсов?

Может они и слоты памяти…

Это, друг, а где разъем у сетевого интерфейса lo0?

baka-kun ★★★★★
() автор топика
Ответ на: комментарий от baka-kun

Говорю же, у меня извращённые, видимо, понятия о значении терминов. Кстати, а где эти самые 2 интерфейса? Что-то я не совсем понимаю значения части аббревиатур: http://upload.wikimedia.org/wikipedia/en/7/76/UltraSPARCT3_Die_Micrograph_Dav...

Praporshik ★★
()
Ответ на: комментарий от Praporshik

> Кстати, а где эти самые 2 интерфейса?

«XAUI is a standard for extending the XGMII (10 Gigabit Media Independent Interface)…

baka-kun ★★★★★
() автор топика
Ответ на: комментарий от Praporshik

>Это понятно — контроллеры один ближе к другому, но что там делает СЕТЕВОЙ ИНТЕРФЕЙС? Может они и слоты памяти на проце разместили?

епт, контроллер MAC работает в режиме прямого доступа к памяти, т.е. связь такая MAC-контроллер памяти-память + прерывание на CPU. если контроллер памяти вынесен в мост, тогда конечно нет смысла MAC в проц пихать, а здесь контроллер памяти выполнен на кристалле процессора, вот MAC и запихали туда же, латентность поменьше и все такое. все так делают, и армы, и другие. вот, например, http://www.freescale.com/webapp/sps/site/prod_summary.jsp?code=MSC8156. мода такая нынче.

registrant ★★★★★
()
Ответ на: комментарий от bolmer

> У меня нет прав постить в ту тему. В первую очередь, результат не корректен без оптимизаций.

В данном случае результат некорректен именно из-за оптимизации: результат вычисления в цикле нигде не используется, поэтому оптимизатор прибил сами вычисления а затем и пустой цикл

anonymous
()
Ответ на: комментарий от exst

> Я запускал линпак. Слив p6 в три раза. Запускал циклы в Oracle и бенчмарк в мускуле. Слив в три раза! Какой еще тест нужен?

Не обижайтесь, но нужно не только запускать тест, нужно, во-первых, понимать, что делаешь, а, во-вторых, уметь интерпретировать результат.

Ваш синтетический тест не плох, но при правильной компиляции компилятор увидет, что результат не используется и цикл проигнорирует. Поставьте return (int)b;, и удивитесь.

Это же касается Linpack. Как Вы выбирали размер задачи? Что сравнивали? Как компилировали? Надеюсь, не gcc?

VIT
()
Ответ на: комментарий от Hokum

Поэтому я и написал «надеюсь, не gcc» в комментарии выше. Gcc не следует использовать для вычислений, и особено на Power, PowerPC.

VIT
()
Ответ на: комментарий от VIT

Вот, кстати, показательный пример. Все тот же синтетический тест с измененнjyм return:

Intel(R) Xeon(R) CPU E5430 @ 2.66GHz

icc -O -o test test.c 2.37 с

gcc -O5 -o test test.c 2.39 с

PPC970MP, 2497.500000MHz

xlc -o test test.c -O4 1.857 c

gcc -o test test.c -O5 13.449 c

Какой вывод?

VIT
()
Ответ на: комментарий от VIT

> Какой вывод?

Вывод: не используйте GCC. А вообще я в тестах использовал xlC. Мускуль собирал им же =)

exst ★★★★
()
Ответ на: комментарий от Xenius

> Ждем компов и может ноутов с ними на прилавках магазинов.

Ноут с Т3 я бы прикупил за вменяемую цену. Еще неплохо бы чтоб ядра можно было программно отключать.

exst ★★★★
()
Ответ на: комментарий от VIT

> Это же касается Linpack. Как Вы выбирали размер задачи? Что сравнивали? Как компилировали? Надеюсь, не gcc?

Детали не вспомню. Но точно помню, что он был реализован на Яве.

exst ★★★★
()
Ответ на: комментарий от EvgGad_303

>>>а где эти самые 2 интерфейса?

опциональные карточки, написано же в спеках ;)

ходят в pcie слоты 0 и 1.



Сча мистер педант опять спросит где там на процессоре слоты PCIe2..

anonymous
()
Ответ на: комментарий от exst

> Детали не вспомню. Но точно помню, что он был реализован на Яве.

В Java принято, что все в big endian формате. Этот формат - родной для Sparc и Power. На x86 любой JVM приходится извращаться и тратить время впустую. Сам видел как на одном и том же тесте старый Mac G4 Cube уделывал PIII с приличной частотой. Конечно, это видимо лишь один из многих факторов.

rtvd ★★★★★
()
Ответ на: комментарий от Praporshik

> Кстати, а где эти самые 2 интерфейса?

NIU - Network Interface Unit

Вот это они и есть, а рядышком там XAUI для интерфейса с внешним PHY

Что-то я не совсем понимаю значения части аббревиатур:


MCU - Memory Controller Unit
PEU - PCI Express Unit
SIU - System Interface Unit
COU - Coherence Unit
CLC - Coherence unit to Link Connectivity
L2T - L2 Cache Controller (L2 Tags)
L2D - L2 Cache Bank (L2 Data)
CCX - Core to L2 Cache Crossbar (Core Cache Xbar)

CTU - Clock Test Unit ???
NCU - ???

mukoh
()
Ответ на: комментарий от exst

Результат не в пользу p6


Ну видимо P6 и T3 как вычистители никакие, да и частота маленькая. В кризис короче на них не порубиться, они чисто для I/O, быстрой одновременной обработки запросов и транзакций я так понимаю

Karapuz ★★★★★
()
Ответ на: комментарий от tailgunner

>> В Java принято, что все в big endian формате.

Что-то бредово звучит. Пруфлинк есть?


Это сперва звучит бредово, а потом начинает казаться нормой.

Хоть это и не катит на «все», вот пример из класса DataOutputStream:

public final void writeLong(long v) throws IOException {
writeBuffer[0] = (byte)(v >>> 56);
writeBuffer[1] = (byte)(v >>> 48);
writeBuffer[2] = (byte)(v >>> 40);
writeBuffer[3] = (byte)(v >>> 32);
writeBuffer[4] = (byte)(v >>> 24);
writeBuffer[5] = (byte)(v >>> 16);
writeBuffer[6] = (byte)(v >>> 8);
writeBuffer[7] = (byte)(v >>> 0);
out.write(writeBuffer, 0, 8);
   incCount(8);
}

И кстати, с какого перепугу Sun ориентировалась бы на little endian если их SPARCи - big endian? Все нормуль.

rtvd ★★★★★
()
Ответ на: комментарий от Karapuz

> Ну видимо P6 и T3 как вычистители никакие, да и частота маленькая.

Только одно НО! Частота у p6 немаленькая.

exst ★★★★
()
Ответ на: комментарий от Praporshik

>>взаимоисключающие параграфы в различного рода внутренней документации....

хмм, странно. примерчиком не поделитесь?
а то в другой ветке один товарищЪ уже приводил «взаимоисключающие» параграфы...

EvgGad_303 ★★★★★
()
Ответ на: комментарий от Praporshik

> Мсье задолбался читать взаимоисключающие параграфы в различного рода внутренней документации....

Может ты c Т2 и Т2+ что-то путаешь? В Т2 на кристалле есть 2 10GE, в T2+ нету, ибо ими пожертвовали, чтобы освободить место для реализации Coherency Unit.

mukoh
()
Ответ на: комментарий от Hokum

> не репрезентативный тест.

Согласен, но за неимением гербовой, пишем на простой. Господин exst утверждал, что конкретно на этом тесте, цитирую, «Power сливает» ;)

лучше использовать bzip2 и какой-нибудь эталонный файл.

А еще лучше каждый процессор использовать по прямому назначению. Вот показательный пример.

На Power5 1654.344000MHz, обсуждаемый тест при xlc -O4 дает 3.663 с. Но стоит только 1) заменить float на double, и 2) ввести double c = 1./30.;, заменив деление на умножение (результат неизменен), то получим 0.461 с. Объяснение оставлю на потом.

Кстати, bzip2 - плохой пример для Power, но хороший для Xeon. Можем подискутировать, почему так.

VIT
()
Ответ на: комментарий от exst

>> Это же касается Linpack. Как Вы выбирали размер задачи? Что сравнивали? Как компилировали? Надеюсь, не gcc?

Детали не вспомню. Но точно помню, что он был реализован на Яве.

Тогда Вас кто-то обманул. Существует 2 реализации Linpack - serial на Фортран, и parallel HPL на Си. Джава не является языком вычислительного программирования, и все реализации вычислительных тестов на ней - от лукавого.

VIT
()
Ответ на: комментарий от tailgunner

>> Хоть это и не катит на «все»

Вот именно. Кроме потоков ввода-вывода, endianness я ве нигде не проявляется.

Иногда это как раз и немало.

Кроме того, байткод самой Java обязан быть big endian

http://java.sun.com/docs/books/jvms/second_edition/html/ClassFile.doc.html

А бывает что JVM его компилит даже после фазы активного прогрева.

Плюс кое-какие файлы тоже в big endian. По-моему шрифты и jpeg точно в этом списке. А значит, работать с ними менее напряжно на big endian железе.

rtvd ★★★★★
()
Ответ на: комментарий от Mobyshvein

Я думал этот разврат кончился с развалом СССР


Кончился-кончился. Америка вступает в новую гонку, на этот раз технологическую с Китаем. Вона http://tech.slashdot.org/story/10/09/24/141206

Нас уже США не догнать http://tech.slashdot.org/story/09/07/29/1759237 в Сарове же суперкомпьютер сделали, так хоть с Китаем посоревнуются, хех :-)

Karapuz ★★★★★
()
Ответ на: комментарий от VIT

Меня интересует такой тест, который бы более-менее показал преимущества высокой частоты. В практических задачах разве не будут архиваторы примером такого теста?

Hokum ☆☆☆☆
()
Ответ на: комментарий от VIT

Джава не является языком вычислительного программирования,


легкое гугление дало это http://hal.inria.fr/inria-00504630/ «We also show that the performance of the Java version is close to the Fortran one on computational intensive benchmarks»

Karapuz ★★★★★
()
Ответ на: комментарий от Hokum

>Меня интересует такой тест, который бы более-менее показал преимущества высокой частоты.

Странно, обычно интерес состоит в том, чтобы железка показывала хорошие результаты при решении определенных задач, а не чтобы задача иллюстрировала преимущества высокой частоты. Или ты таки маркетоид?

А так если хочешь подобрать задачу - подбирай так, чтобы ога в кэш влезала, причем чем ближе кэш к процессору, тем лучше будут результаты. Ибо как только начинаются промахи, частота перестает играть роль, ибо память гораздо медленне процессора, и время ожидания данных от внутренней частоты профессора не зависит.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.