LINUX.ORG.RU

[гентушникам-экстемалам]Про -ftree-vectorize


0

2

Привет, ЛОР и особенно гентушники-экстемалы!
Вот думаю я мир собрать с -ftree-vectorize на ~x86 (gcc, соответственно, 4.5.2).

CFLAGS="-O2 -march=core2 -ftree-vectorize -mfpmath=sse -msse4.1 -fexcess-precision=fast --param l1-cache-size=32 --param l1-cache-line-size=64 --param l2-cache-size=3072 -fomit-frame-pointer -pipe"
CXXFLAGS="${CFLAGS}"
Какие проблемы я могу словить и на каких конкретно пакетах? Собираюсь использовать KDE 4.6, в качестве браузера rekonq.
Отпишитесь, пожалуйста, об историях успеха с -ftree-vectorize.


Ответ на: комментарий от megabaks

А разве приоритеты не ограничивают аппетиты приложений к ресурсам cpu?

tmpusr
() автор топика
Ответ на: комментарий от tmpusr

если не указывать, то будет равным указанному -march

Sylvia ★★★★★
()

может кто-нибудь помучает acovea ?
вообще пользы от всех этих оптимизаций много меньше, чем тратится времени в обсуждениях о пользе или вреде того или иного флажка ;)

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

$ grep CFLAGS /etc/makepkg.conf
CFLAGS="-march=native -O2 -pipe

:3

x3al ★★★★★
()
Ответ на: комментарий от anon_666

core2 E7200

[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.365s
user	0m18.563s
sys	0m0.847s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.414s
user	0m18.568s
sys	0m0.846s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.386s
user	0m18.580s
sys	0m0.851s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.334s
user	0m18.482s
sys	0m0.847s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.348s
user	0m18.496s
sys	0m0.854s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.286s
user	0m18.481s
sys	0m0.857s
[ megabaks@desktop ] ~/testio $ 
первые три без генерика
все тесты в tmpfs с отключенным свопом и троекратным сбросом кэша перед каждым time *
имхо в пределах погрешности

megabaks ★★★★
()
Ответ на: комментарий от tmpusr

у меня core2duo t5500

2 гига оперативы.

Gentoo 64 nomultilib. Кстати работает всё сильно быстрее, чем в бубунте х86. Правда у меня в основном проц на предельной работает, да и задачи именно те,к. юзают sse (перекодировка медии из веб-сервиса)

Deleted
()
Ответ на: комментарий от anon_666
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.177s
user	0m18.439s
sys	0m0.793s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.182s
user	0m18.351s
sys	0m0.886s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.204s
user	0m18.384s
sys	0m0.860s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.165s
user	0m18.460s
sys	0m0.787s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.271s
user	0m18.462s
sys	0m0.852s
[ megabaks@desktop ] ~/testio $ time `gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip * &&gunzip * && gzip *`

real	0m20.210s
user	0m18.363s
sys	0m0.876s
[ megabaks@desktop ] ~/testio $ 

это к кэшу - первое 512, второе 3072 (реальный) - тоже в пределах погрешности, но в пользу 512

megabaks ★★★★
()
Ответ на: комментарий от anon_666

сейчас перепроверил с -fno-align-functions -fno-align-labels
раньше профит был
сейчас регресс
жуть какая-то
короче -O2 -march=core2 -mtune=generic -mfpmath=sse -msse4.1 -fomit-frame-pointer
и нахер извраты эти :3

megabaks ★★★★
()
Ответ на: комментарий от megabaks

ну наконец-то, от версии к версии что-то меняется, причем меняется иногда с точностью до обратного, и даже в минорных версиях, не говоря уже о больших релизах, поэтому «особую уличную магию» каждый раз приходится адаптировать к новой версии, причем для конкретных пакетов немножко по-своему

Sylvia ★★★★★
()
19 марта 2011 г.

Ahtung! Ahtung!!

Уважаемые, хотел бы обратить ваше внимание: http://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html и строки:

l1-cache-line-size The size of cache line in L1 cache, in bytes.

и

l1-cache-size The size of L1 cache, in kilobytes.

Что думаете по этому поводу?

Noveon
()
Ответ на: комментарий от Sylvia

>может кто-нибудь помучает acovea ?

А что это и зачем?

frak
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.