Товарищи из LBNL (Lawrence Berkeley National Laboratory) провели первое формальное академическое исследование пытаясь ответить на вопрос даст ли CELL выигрыш в high-performance computing (HPC). Тестами являлись небольшие куски кода, реализующие вычислительные алгоритмы, такие как: быстрое преобразование Фурье, перемножение матриц. Для сравнения использовались Cray X1E, AMD Opteron, Intel's Itanium2.
Исследование проводилось на точном-до-такта симуляторе от IBM, дающем очень близкую к реальности производительность, вполне возможно реальный CELL будет иметь даже лучшие характеристики.
Изначально оптимизированный под игрушки процессор показывает максимальную производительность на вычислениях с одинарной точностью, оставляя далеко позади конкурентов. На двойной почти во всех тестах побеждает противников. Авторы статьи предлагают небольшие улучшения в микроархитектуре (названные CELL+), позволяющие получить значительный выигрыш в вычислениях с двойной точностью.
Код тестов был вручную оптимизирован под CELL с учётом задержек передачи данных и его иерархии памяти (!), что позволила сделать модель программирования, основанная на параллелизме уровня данных, а не задач, которая проталкивается IBM на рынок игрушек. Если CELL будет продаваться только в составе PS3, то очень вероятно, что найдутся товарищи попытающиеся собрать кластер для HPC из пары сотен приставок. Не следует ожидать таких же успехов процессора на более широком классе алгоритмов, реализуемых на более высоком уровне абстракции железа и использующих параллелизм уровня задач.
Статья: http://www.cs.berkeley.edu/~samw/proj...
>>> Подробности