Глядя на то, какое сильное ускорение даёт сборка ПО с дополнительными процессорными инструкциями, я решил проверить NEON на ARM. Скомпилировал cpuminer на Raspberry Pi 3 - сначала без neon-а, а потом с ним.
./minerd --benchmark
4 miner threads started, using 'scrypt' algorithm.
Total: 3.75 khash/s
Никуда не годится. Компилируем с поддержкой NEON: CFLAGS="-O3 -mfpu=neon" ./configure
Total: 2.41 khash/s
Upd: А ещё оно стало зависать при попытке запустить бинарник с Неоном. Может, у меня проц дефектный? А если вручную указать не 4 потока, а --threads 2
и 3, то появляется прирост относительно бинарника без неона (на двух - 2,49 против 1,91), и не зависает.
Пишите в комментариях ваши истории успеха/неуспеха, много ли конкретно у вас даёт прироста производительности этот самый NEON, можно ли сравнивать с SSE?