История изменений
Исправление aist1, (текущая версия) :
Та же история с r9 3900X (256÷64×2×12×3.8=364), где лоровец по ссылке выше намерил 542 гигафлопса.
Я тут поигрался с настройками. С включенным агрессивным PBO я получаю 90С температуры (по сравнению с 73С) и где-то на 5-10% большую производительность. Если поставлю водянку, получу еще 5% пунктов.
Дело в том, что эти многоядерные чипы ограничены температурой с одной стороны, и каналом в память — с другой. 5900Х получился заметно лучше, чем 3900Х, а вот 5950Х уже не сильно-то лучше, чем 3950Х. Я думаю, что 5950Х упирается уже в канал в память.
Т.е. результаты в 545 GFlops для 3900Х и мой 550 GFlops для 5950Х выглядят правдоподобными, так как для данной задачи мы упираемся в теплопакет. AVX2-блоки очень горячие.
Что же касается GFlops-ов, то надо смотреть, как конкретно Linpack свою формулу рассчитывает. Я согласен, что выглядит так, что еще двойку нужно куда-то вставить. Скорее всего, FMAC считается за 2 операции.
UPD. Короче, да. FMA считается за 2 операции. И у 5950Х должен быть 1 TFlops в FP64 на 4GHz, но частота падает до 2.2GHz из-за температуры блоков AVX2. Поэтому эффективно получается только в районе половины от теоретического.
Исправление aist1, :
Та же история с r9 3900X (256÷64×2×12×3.8=364), где лоровец по ссылке выше намерил 542 гигафлопса.
Я тут поигрался с настройками. С включенным агрессивным PBO я получаю 90С температуры (по сравнению с 73С) и где-то на 5-10% большую производительность. Если поставлю водянку, получу еще 5% пунктов.
Дело в том, что эти многоядерные чипы ограничены температурой с одной стороны, и каналом в память — с другой. 5900Х получился заметно лучше, чем 3900Х, а вот 5950Х уже не сильно-то лучше, чем 3950Х. Я думаю, что 5950Х упирается уже в канал в память.
Т.е. результаты в 545 GFlops для 3900Х и мой 550 GFlops для 5950Х выглядят правдоподобными, так как для данной задачи мы упираемся в теплопакет. AVX2-блоки очень горячие.
Что же касается GFlops-ов, то надо смотреть, как конкретно Linpack свою формулу рассчитывает. Я согласен, что выглядит так, что еще двойку нужно куда-то вставить. Скорее всего, FMAC считается за 2 операции.
Исходная версия aist1, :
Та же история с r9 3900X (256÷64×2×12×3.8=364), где лоровец по ссылке выше намерил 542 гигафлопса.
Я тут поигрался с настройками. С включенным агрессивным PBO я получаю 90С температуры (по сравнению с 73С) и где-то на 5-10% большую производительность. Если поставлю водянку, получу еще 5% пунктов.
Дело в том, что эти многоядерные чипы ограничены температурой с одной стороны, и каналом в память — с другой. 5900Х получился заметно лучше, чем 3900Х, а вот 5950Х уже не сильно-то лучше, чем 3950Х. Я думаю, что 5950Х упирается уже в канал в память.
Т.е. результаты в 545 GFlops для 3900Х и мой 550 GFlops для 5950Х выглядят правдоподобными, так как для данной задачи мы упираемся в теплопакет. AVX2-блоки очень горячие.
Что же касается GFlops-ов, то надо смотреть, как конкретно Linpack свою формулу рассчитывает. Я согласен, что выглядит так, что еще двойку нужно куда-то вставить.