LINUX.ORG.RU

История изменений

Исправление grem, (текущая версия) :

Я запускал сегодня через BLAS(от netlib.org) используя их бинарную сборку для Win32 - получилось медленнее чем реализация через циклы в лоб с оптимизациями при сборке (с предварительным транспонированием). Но, возможно, потому, что второй массив надо было всё же указать транспонированным. Да, ответ он мне выдаёт в виде транпонированной матрицы, видимо, сказывается, что библиотека фортрановская.

А вот с использованием бинарной сборки от OpenBLAS и флагом сборки -pthread выдаёт результат быстрее чем код с циклами (и транспонированиме) с использованием openmp (-fopenmp). Всё эьто для mingw64-4.9.3. Емнип, получилось в 2-2.5 раза быстрее кода с openmp.

Исходная версия grem, :

Я запускал сегодня через BLAS(от netlib.org) используя их бинарную сборку для Win32 - получилось медленнее чем реализация через циклы в лоб с оптимизациями при сборке (с предварительным транспонированием). Но, возможно, потому, что второй массив надо было всё же указать транспонированным. Да, ответ он мне выдаёт в виде транпонированной матрицы, видимо, сказывается, что библиотека фортрановская.

А вот с использованием бинарной сборки от OpenBLAS и флагом сборки -pthread выдаёт результат быстрее чем код с циклами (и транспонированиме) с использованием openmp (-fopenmp). Всё эьто для mingw64-4.9.3.