LINUX.ORG.RU

Duo vs Quad


0

0

Для массовых вычислений в институте собираемся брать новый кластер. Выбираем между процессорами серии Е51хх (Duo) и Е53хх (Quad). На каждом отдельном сервере хотим 32ГБ памяти и 2 процессора. Будет ли реальный прирост от 2*Е53хх = 8 ядер на сервер или шины процессоров, контроллер памяти или еще чего-то там не позволят полноценно загрузить 8 потоков (или 8 задач)? Или лучше за теже деньги взять на 25%-30% пошустрее Е51хх?


Интель в плане ПСП - полное гавно, но Birdie как всегда оказался вежливее ;)

И вообще, не торопились бы вы там, до прихода на рынки барселоны...

Gharik
()
Ответ на: комментарий от birdie

> <offtopic>Opteron'ы на Barcelona 4х ядерные масштабируются гораздо лучше.</offtopic>

Вообще, по уму, нужно брать у вендора систему "на посмотреть" и считать ка квсё получится в данном конкретном случае. Но берут меня сомнения, дадут ли "институту" поиграться с серьёзным оборудованием.

Gharik
()

>Для массовых вычислений в институте собираемся брать новый кластер. Выбираем между процессорами серии Е51хх (Duo) и Е53хх (Quad). На каждом отдельном сервере хотим 32ГБ памяти и 2 процессора. Будет ли реальный прирост от 2*Е53хх = 8 ядер на сервер или шины процессоров, контроллер памяти или еще чего-то там не позволят полноценно загрузить 8 потоков (или 8 задач)? Или лучше за теже деньги взять на 25%-30% пошустрее Е51хх?

Зависит от задачи.

Двукратного прироста конечно не будет но если задачки небольшие (влезают в кеш или около того) то прирость будет хороший. Если же наоборот задача большая и чувствительна к ПСП то рекомендую 51xx

В любом случае сначала рекомендую потестировать типичные задачки на том и на другом.

sS ★★★★★
()
Ответ на: комментарий от birdie

>Opteron'ы на Barcelona 4х ядерные масштабируются гораздо лучше

+1

Но частоты у них пока не для HPC и на старых (HT1) линках масштабирование не настолько уж шоколадно ....

sS ★★★★★
()
Ответ на: комментарий от Gharik

>Но берут меня сомнения, дадут ли "институту" поиграться с серьёзным оборудованием.

Здря ;) Нам почти навязывали на поиграться ;) (двушки на дуалкорах и на квадкорах на выбор)

sS ★★★★★
()
Ответ на: комментарий от Gharik

>Интель в плане ПСП - полное гавно

ПСП это еще розы, вот латентность памяти это точно гАвно ;)

sS ★★★★★
()
Ответ на: комментарий от Gharik

>И вообще, не торопились бы вы там, до прихода на рынки барселоны...

Дык уже. Но "приход" уж больно слаб ;)

sS ★★★★★
()

Если можете, то подождите Penryn на 45nm с Quick Path Interconnect и on Die Memory Controller ;-) Е51хх (Duo) и Е53хх (Quad) - просто детство по сравнению с этим будущем.

birdie ★★★★★
()

> Будет ли реальный прирост от 2*Е53хх = 8 ядер на сервер или шины процессоров, контроллер памяти или еще чего-то там не позволят полноценно загрузить 8 потоков (или 8 задач)?

Вообще говоря, от задачи зависит, но для 90% случаев ответ на этот вопрос -- "Да". Будет реальный прирост от 2*Е53хх = 8 ядер на сервер.

Die-Hard ★★★★★
()
Ответ на: комментарий от sS

>>И вообще, не торопились бы вы там, до прихода на рынки барселоны...

>Дык уже. Но "приход" уж больно слаб ;)

Как-то Барселона меня совершенно не впечатлила...

Однако, нам уже Harpertown (54xx) предлагают.

Вот, можно посмотреть сравнение с Барселоной:

http://www.anandtech.com/IT/showdoc.aspx?i=3099

Die-Hard ★★★★★
()
Ответ на: комментарий от sS

> ПСП это еще розы, вот латентность памяти ...

У меня такое впечатление, что народ вспоминает ситуацию двухгодичной давности... Я последние несколько месяцев и Оптероны, и Ксеоны гонял десятками фирм -- да, ПСП _немного_ хуже, проблем с латентностью FB не замечено, масштабируются Оптероны чуть получше, но при прочих равных Ксеоны все равно шустрее и почти в 2 раза дешевле.

Кстати, ИБМ, например, предлагает Ксеоны аж на 16 корок (M2) и памятью RDIMM, а не FBDIMM.

Die-Hard ★★★★★
()
Ответ на: комментарий от Die-Hard

>Кстати, ИБМ, например, предлагает Ксеоны аж на 16 корок (M2) и памятью RDIMM, а не FBDIMM.

К слову сказать 16-коровую систему на Оптеронах (8 сокетов) я тестировал полгода назад. Результат мягко говоря не впечатлил. Те же 8 сокетов но в 4-х нодах, связанных IB, рвут этого монстра как бобик грелку. Правда задача изначально была адаптирована под кластер.

sS ★★★★★
()
Ответ на: комментарий от sS

Я, кстати, с полгода назад тоже 16-коровую систему на Оптеронах тестировал, и результат просто потрясающий получился -- оно масштабировалось лучше Альтикса! Мы уж совсем хотели их закупить, но 8-корковые Ксеоны оказались существенно дешевли, и мы переключили внимание на них.

Вообще, как я понял, на таких монстрах не столько от процессора все зависит, сколько от мамки с прочими дисками и чипсетами.

Ну и от задачи, естественно :)

Die-Hard ★★★★★
()
Ответ на: комментарий от sS

> Там проблема не в самой памяти а в контроллере.

:) Я думал, опять на FB накат.

Конечно, за счет интегрированного контроллера к _своей_ памяти доступ побыстрее. Но Интел вообще всю память симметрично держит!

Вообще, 54xx линейка уже доступна (в отличие от Барселоны) на нормальной частоте, так что с ней надо сравнивать.

Die-Hard ★★★★★
()
Ответ на: комментарий от Die-Hard

> Как-то Барселона меня совершенно не впечатлила...

Когда выпустят 3ГГц вариант - будут, по идее, весьма неплохие результаты.

> Однако, нам уже Harpertown (54xx) предлагают.
> Вот, можно посмотреть сравнение с Барселоной:

Мне ведь неспроста кажется, что в барселоне что-то гнусное сделали с контроллером памяти? Такое ощущение, что явно не хватает 2-х каналов, даже независимых, а вычислительной мощи там аж с завалом, и если алгоритм хорошо оптимизирован с т.з. обращений к ОЗУ - то барселона всех рвёт, даже несмотря на низкую частоту.

Похоже на старый расклад с введением DDR2-поддержки.

Gharik
()
Ответ на: комментарий от Die-Hard

>Вообще, как я понял, на таких монстрах не столько от процессора все зависит, сколько от мамки с прочими дисками и чипсетами.

Именно так. Там основная жопа была что нужно было изначально правильно выделять память (+правильно выставить affinity) но даже это не спасало когда обмен воркеров шёл в 2 и более хопов. В 2x2 системах с быстрым интерконнектом типа IB топология проще получается + минимальная пропускная способность между воркерами строго детерминирована (порядка 1Gbps) и задачу при этом гораздо проще сбалансировать.

sS ★★★★★
()
Ответ на: комментарий от Gharik

>Когда выпустят 3ГГц вариант - будут, по идее, весьма неплохие результаты.

Это сильно не спасёт, у ней микроархитектура ядра по любому будет проигрывать коре за исключением некоторых случаеаи. Вот HT3 может сильно помочь.

>Мне ведь неспроста кажется, что в барселоне что-то гнусное сделали с контроллером памяти?

Ничего не делали, просто сейчас в 2 раза больше ядер на один контроллер и это сильно чувствуется. Квадкоровые зеоны этот затык слегка компенсируют существенно большим кешем ... По идее у барсы же при _равномерной_ загрузке ядер суммарный объём кеша ровно такой же как у дуалкоровый оптеронов (512 L2 + 512 L3 против 1Mb L2) а вот контроллеров памяти стало в 2 раза меньше на одно ядро ;)

sS ★★★★★
()

Спасибо за советы! Проконсультируюсь у поставщика насчет цен на сервера на AMD.

kianvl
() автор топика
Ответ на: комментарий от sS

> В 2x2 системах с быстрым интерконнектом типа IB топология проще получается + минимальная пропускная способность между воркерами строго детерминирована (порядка 1Gbps) и задачу при этом гораздо проще сбалансировать.

:-) Так не совсем честно! Разумеется, при наличии хитрой топологии задачи SMP (особенно в NUMA-инкарнации) всегда сольет специально заточенным под топологию сетям.

У меня -- простая "звезда", и SMP себя вполне достойно ведет. И у меня получалось, что 16-корковый Оптерон выдавал спидап-кривулину лучше, чем Альтикс (до этого Альтикс был вне конкуренции).

Die-Hard ★★★★★
()
Ответ на: комментарий от Gharik

> Когда выпустят 3ГГц вариант - будут, по идее, весьма неплохие результаты.

Но Интел УЖЕ имеет 3+ГГц вариант ("Harpertown"), который не уступает Барселоне почти по всем показателям и при этом основан на Коре! В след. году они обещают Nehalem, который будет СОВЕРШЕННО новым, без FSB, с интегрированным контроллером и переменным числом каналов "точка-точка" (аналогов Гипертранспрта) -- там, как мне объясняли Делловцы, проблемы с патентами есть, поскольку АМД запатентовал ГиперТранспорт, и Интелу пришлось изобретать нечто новое, чтобы патент обойти.

Die-Hard ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.