История изменений
Исправление grem, (текущая версия) :
Я запускал сегодня через BLAS(от netlib.org) используя их бинарную сборку для Win32 - получилось медленнее чем реализация через циклы в лоб с оптимизациями при сборке (с предварительным транспонированием). Но, возможно, потому, что второй массив надо было всё же указать транспонированным. Да, ответ он мне выдаёт в виде транпонированной матрицы, видимо, сказывается, что библиотека фортрановская.
А вот с использованием бинарной сборки от OpenBLAS и флагом сборки -pthread выдаёт результат быстрее чем код с циклами (и транспонированиме) с использованием openmp (-fopenmp). Всё эьто для mingw64-4.9.3. Емнип, получилось в 2-2.5 раза быстрее кода с openmp.
Исходная версия grem, :
Я запускал сегодня через BLAS(от netlib.org) используя их бинарную сборку для Win32 - получилось медленнее чем реализация через циклы в лоб с оптимизациями при сборке (с предварительным транспонированием). Но, возможно, потому, что второй массив надо было всё же указать транспонированным. Да, ответ он мне выдаёт в виде транпонированной матрицы, видимо, сказывается, что библиотека фортрановская.
А вот с использованием бинарной сборки от OpenBLAS и флагом сборки -pthread выдаёт результат быстрее чем код с циклами (и транспонированиме) с использованием openmp (-fopenmp). Всё эьто для mingw64-4.9.3.