Оказалось, что gfortran сильно, СИЛЬНО, ОЧЕНЬ СИЛЬНО замедляется на вычислениях с двойной точностью. Т.е. использую REAL(4) - скорость сопоставима с платным компилером и Watcom-ом, разница хоть и есть, но не критичная. Однако, при использовании REAL(8) производительность падает в два с лишним раза, тогда как у платного менее, чем на 5%. Попытался найти опции в компилере, отвечающие за двойную точность и все, что с ней связано. Использовал в итоге следующие опции
-Wall -O3 -march=i686 -malign-double -mfpmath=sse -mmmx -msse2 -ffast-math
Процессор на машине pentium4m, но никакой особой разницы по сравнению с неуказанием опции -march я не нашел.
Может, кто знает, что еще можно покрутить в нем?