Сегодня запустил тест acovea для обнаружения оптимальных CFLAGS для реализации алгоритма Хаффмана.
В итоге получил 20% прирост производительности bzip2 на сжатии каталога с сырцами linux kernel. То же самое проделал с gzip(никаких плюсов после перекомпиляции) и 7zip(после перекомпиляции стало ещё медленне).
CFLAGS="-O1 -march=athlon64 -msse3 -pipe -fno-merge-constants -fno-defer-pop -momit-leaf-frame-pointer -fno-if-conversion2 -fno-tree-ccp -fno-tree-dominator-opts -fno-tree-lrs -fno-tree-sra -fno-tree-copyrename -fno-tree-fre -fno-move-loop-invariants -fcse-skip-blocks -fgcse -fforce-mem -fpeephole2 -fschedule-insns2 -fregmove -fstrict-aliasing -freorder-blocks -fsched-interblock -fsched-spec -freorder-functions -funit-at-a-time -falign-loops -falign-labels -ftree-vrp -ftree-pre -finline-functions -funswitch-loops -fno-inline -fpeel-loops -funswitch-loops -funroll-all-loops -fbranch-target-load-optimize -fgcse-las -ftree-loop-linear -fbtr-bb-exclusive -mno-push-args -maccumulate-outgoing-args -D__NO_MATH_INLINES"
У самого amd64(turion ML-32).