LINUX.ORG.RU

Два кластера — какой лучше?


0

0

Интересно мнения послушать.

Речь идет о HPC. Есть некая параллельная аппликуха, есть некая сумма денег, надо купить на эту сумму кластер под эту аппликуху. После интенсивных полугодовых тестирований определились с платформой: ноды с двумя четырехкорковыми Ксеонами, свзанные ИнфиниБэндом.

Куча предложений от разных фирм, но реально выбрать надо из двух:

1. SGI предлагает 24 ноды, связанные аж 5 свичами. Процессоры E5472 (FSB 1600 MT/s, TDP 80W), чипсеты Seaburg, память 800MHz FB-DIMMs.

2. Dell предлагает аж 32 ноды, связанные 2 свичами. Процессоры X5450, (FSB 1333 MT/s, TDP 120W), чипсеты Greencreek, память 667 MHz FB-DIMMs.

То есть Dell предлагает на треть больше, но конфигурация -- типичная воркстейшн, а у SGI -- платформа, которую Интел аж по имени назвал (Stoakley) и позиционирует как заточенную под HPC.

Делать бенчмарки не получается ни там, ни там.

★★★★★

А расширябельность какая у них ?

PS: Мне больше нравится N1 ;) (меньше TPD, быстрее память)

Кстати 5 свитчей это зачем ? Чего там по портам IB ?

sS ★★★★★
()
Ответ на: комментарий от sS

> А расширябельность какая у них ?

У обоих никакая, шкафы под завязку. У Делла формфактор -- минитауэр, 4 шкафа!

Плюс, кстати, сегодня выяснилось, у SGI шкафы подходят для водяного охлаждения.

> Кстати 5 свитчей это зачем ?

Уже ни за чем, один остался...

5 штук они предлагали для > 24 нод, там их почему-то только хитрая толстая топология устраивала. Они что-то говорили про "block-free transfer", но конкретно не распространялись.

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

>У обоих никакая, шкафы под завязку. 

Понятно.

>У Делла формфактор -- минитауэр, 4 шкафа!

Мини ? ;))

У меня был  один из первых кластеров из 4-х чифтековских бигтауэров с 2-х головыми оптеронами. По сравнению со стойкой есть несколько плюсов.

1) Шумели _значительно_ меньше (можно было регулировать обороты вентилей на процах)
2) При покупке нового кластера мы его просто слегка разукомплектовали
Получилось 2 толстых девелоперских десктопа + 1 девелоперский кластер на 2 ноды для экспериментов.
3) Гораздо более расширябельны по периферии чем 1U и разумеется чем блейд 

sS ★★★★★
()
Ответ на: комментарий от sS

Кстати шкурный вопрос про цену (если не секрет). Можно на почту.

Интересно сравнить с нашими ценами.

sS ★★★★★
()
Ответ на: комментарий от VIT

"Звезда", мастер читает с диска массивы данныех (целые числа), колет на куски и пересылает рабочим посредством MPI. Рабочие это дело опять-таки пишут на диск/читают обратно, перелопачивают в другие массивы (тоже целые числа) и посылают порциями обратно мастеру (опять MPI). Мастер все это сортирует (опять с помощью диска, поскольку никакой памяти не хватает), и цикл повторяется.

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от VIT

Одинаково -- 6 локальных дисков в ноде, страйпнутые RAID0 в один том. Все пишут скречи локально.

Сантехники предлагали три файлсервера (через еще один IB), даже дали один сервер поиграть -- хреново он работает, половину заявленной производительности не дает. То есть, на мелких файлах все ок, но нас интересуют ОЧЕНЬ большие, с "плоским" последовательным доступом, а на них что-там заедает.

Наша аппликуха очень хорошо бегала на распределенной файлухе под HP Lustra с динамической балансировкой, но оно было связано QsNET II.

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

ВСё понятно. Это та задача, что мы обсуждали в топике про Барсилону.

По моим представлениям, узкое место задачи - доступ к RAID массивам.

Если IO одиноков, то оба кластера идентичны для этой задачи.

VIT
()
Ответ на: комментарий от VIT

:-)

Делловский кластер разогреет комнату в 2 раза сильнее, а мы почти на пределе:( Кроме того, там чипсет 5000X -- кто знает, как его спуп фильтр сработается с кышом Harpetron'а!

С др. стороны, на треть больше нодов...

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

>Сантехники предлагали три файлсервера (через еще один IB), даже дали один сервер поиграть -- хреново он работает, половину заявленной производительности не дает. То есть, на мелких файлах все ок, но нас интересуют ОЧЕНЬ большие, с "плоским" последовательным доступом, а на них что-там заедает.

Большие файлы это как раз случай для PVFS2+MPI-ROMIO поверх кучи IB линков...

>Наша аппликуха очень хорошо бегала на распределенной файлухе под HP Lustra с динамической балансировкой, но оно было связано QsNET II.

Собственно люстра это подтверждает ...

sS ★★★★★
()

Сдаётся мне, что Силиконы знают о чём говорят, а Деллу с Хулетами стоит оставмть тот сегмент, на коем они и до того кормились. Принтеры там всякие...

Интуиция старого еврея чего-то стоит? ;)

Gharik
()
Ответ на: комментарий от sS

> Собственно люстра это подтверждает ...

Кстати, на новом "большом" сервере, связанном IB, ластра себя как-то не очень показала...

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

>Кстати, на новом "большом" сервере, связанном IB, ластра себя как-то не очень показала...

На скольких нодах она "размазана" ?

sS ★★★★★
()
Ответ на: комментарий от Die-Hard

> 750 нодов, каждая о 4 корках.

В смысле, клиентов.

Серверная часть -- 8+2=10 двухголовых Оптеронов, 8 держат данные, 2 -- метаданные.

Вообще хреново работает, чем дальше, тем хуже! Буквально, в шареной директории говоришь "ls", и оно ждет с полминуты.

Но длинные файлы пишет шустро, сравнимо со старым вариантом (порядка десятков мегабайт/секунду на корку).

Die-Hard ★★★★★
() автор топика

Все, решили в пользу SGI.

Оказалось, я сначала не понял их -- второй шкаф почти пустой. Заодно одну дверь с водяным охлаждением выклянчили, так что -- без вариантов просто.

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

>Серверная часть -- 8+2=10 двухголовых Оптеронов, 8 держат данные, 2 -- метаданные. Вообще хреново работает, чем дальше, тем хуже! Буквально, в шареной директории говоришь "ls", и оно ждет с полминуты.

ls это обращение к серверу метаданных. Но цифра в полминутны вообще говоря это нонсенс. Что-то в консерватории не так.

>Но длинные файлы пишет шустро

странно если бы было иначе.

sS ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.