Может кому интересно будет. Недавно опять начал писать под PC платформу, алгоритм с интенсивными вычислениями матриц - и выяснились интересные факты про производительность Core2Duo.
Вобщем, блок Floating Point реализован в нём просто отлично - с GCC получается, что принудительное использование SSE регистров вместо FP сопроцессора понижает скорость на ~20-30%; а переключение с типа float на тип long вообще не дало повышения производительности :-O Отличный процессор от Intel, наконец-то у них получилось :)