LINUX.ORG.RU

Gentoo относительно Xubuntu

 ,


1

3

Короче, представим такую ситуацию: дефолтная xubuntu и скомпиленная gentoo (с хардкорными оптимизациями для конкретного железа) c xfce. Понятно что гентоо куда шустрее будет, но на сколько примерно, в процентах относительно дефолтной ксубунты? Как сама система, так и софт, начиная от отклика xfce, заканчивая прикладным, например gimp (бинарный) в ксубунте и в гентоо скомпиленный c оптимизациями. То есть, устанавливая гентоо (предположим что у устанавливающего руки прямые), на какой в целом процент увеличения производительности стоит рассчитывать?



Последнее исправление: makeB (всего исправлений: 1)
Ответ на: комментарий от makeB

С первым и вторым стейджем мороки намного больше (компилировать придётся не один раз и не два, чтобы всё срослось как надо), а в итоге получится 3-ий.

1. Настоятельно рекомендую изучить английский handbook (русский сильно устарел).

2. Уже потом стоит определится с CFLAGS для процессора, если хотите сразу собирать систему с хорошей производительностью. Тестировать можно на nbench.

3. Затем стоит определится с глобальными USE флагами. Для каждого отдельного пакета USE флаги можно перед компиляцией определять. Этот пункт сильно влияет на функциональность системы, а также, как и предыдущий, включает опции увеличивающие производительность.

glibych ★★
()
Ответ на: комментарий от glibych

AMD FX 8120@4000 (200x20) + Samsung DDR3-1600@2133 (9-10-10-28)

Linux 3.6.6 x86_64

-march=amd64 -O2 :

TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 1472.8 : 37.77 : 12.40
STRING SORT : 596.4 : 266.49 : 41.25
BITFIELD : 4.8898e+08 : 83.88 : 17.52
FP EMULATION : 312.8 : 150.10 : 34.63
FOURIER : 17636 : 20.06 : 11.27
ASSIGNMENT : 40.838 : 155.39 : 40.31
IDEA : 8100 : 123.89 : 36.78
HUFFMAN : 3346.5 : 92.80 : 29.63
NEURAL NET : 53.786 : 86.40 : 36.34
LU DECOMPOSITION : 1697.6 : 87.94 : 63.50
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 112.381
FLOATING-POINT INDEX: 53.414
MEMORY INDEX : 30.768

-march=bdver1 -O3 -ffast-math -mfpmath=both -fno-tree-pre -funroll-all-loops :

TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 2181.6 : 55.95 : 18.37
STRING SORT : 732.8 : 327.44 : 50.68
BITFIELD : 5.1563e+08 : 88.45 : 18.47
FP EMULATION : 517.6 : 248.37 : 57.31
FOURIER : 50411 : 57.33 : 32.20
ASSIGNMENT : 60.558 : 230.44 : 59.77
IDEA : 11280 : 172.52 : 51.22
HUFFMAN : 3306.7 : 91.69 : 29.28
NEURAL NET : 73.507 : 118.08 : 49.67
LU DECOMPOSITION : 2022.8 : 104.79 : 75.67
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 146.768
FLOATING-POINT INDEX: 89.184
MEMORY INDEX : 38.250
devl547 ★★★★★
()

Подсказываю команду: sudo apt-build world со своими флагами компиляции.

LongLiveUbuntu ★★★★★
()
Ответ на: комментарий от makeB

intel core 2 duo, geforce 8600 gt, 3 hynix-а по 1gb, hdd samsung (модель не помню, но кажись 5200 об/м и 16mb кеш).

Я то думал, что постарше. Памяти для браузера хватит, а остальное взлетит и так.

AlexVR ★★★★★
()
Ответ на: комментарий от devl547

Ничего себе так разница по сравнению со стандарными параметрами.. Вероятно ключ -O2 в бинарных дистрибутивах выбирают исходя из того, что компиляция в этом режиме в 1,5+ раза быстрее. А потом удивляются почему это так джента в отрыв уходит)

glibych ★★
()
Ответ на: комментарий от LongLiveUbuntu

Ccache можно применять только если ключи уже зафиксированы. При смене ключей из кеша будет доставаться старый кусок. И всё кеш можно обнулять - снова бесполезен. Вместо /dev/shm лучше использовать tmpfs и если памяти не хватит, то на эту часть будет задействован своп. Памяти лучше иметь гигов 16, чтобы компиляция происходила быстро, а достаточно столько, на скольки запустится сама система. Мне хватает 2 гигов, но в своп иной раз и по 9 улетает.

glibych ★★
()

В Gentoo не важна скорость, важна длина у тебя после установки.

anonymous
()
Ответ на: комментарий от glibych

Это скорее демонстрация того, что буль - офигенный процессор. Главное его правильно использовать.

Вероятно ключ -O2 в бинарных дистрибутивах выбирают исходя из того, что компиляция в этом режиме в 1,5+ раза быстрее.

Нет. Потому что собирают под сферический процессор и главное, чтоб косяки не вылезли.

devl547 ★★★★★
()
Ответ на: комментарий от SjZ

А что мешает просто в любой системе собрать ядро?

Что мешает на шестерку поставить спойлер?

В Gentoo не важна скорость, важна длина у тебя после установки.

20 в холодной воде ;)

devl547 ★★★★★
()
Ответ на: комментарий от glibych

Еще для информации - у меня так и не удалось заставить Open64 5.0 и PathScale EkoPath 5 (последняя бета от 13.01.2013) выдавать в nbench годные результаты.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Надо глянуть, чем они от пентиум про отличаются. Будет время - посмотрю.

glibych ★★
()

хубунту тормоз. крыса тут ни при чём. попробуйте zenwalk, например. будет быстрее. и компилить не надо

BattleCoder ★★★★★
()
Ответ на: комментарий от devl547

fx-8150 на референсных частотах. запущены иксы и куча всякой бороды.

-march=bdver1 -O3 -ffast-math -mfpmath=both -fno-tree-pre -funroll-all-loops :

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          2203.7  :      56.51  :      18.56
STRING SORT         :          736.32  :     329.01  :      50.92
BITFIELD            :      5.2339e+08  :      89.78  :      18.75
FP EMULATION        :          529.96  :     254.30  :      58.68
FOURIER             :           50495  :      57.43  :      32.25
ASSIGNMENT          :          62.685  :     238.53  :      61.87
IDEA                :           11664  :     178.40  :      52.97
HUFFMAN             :          3402.5  :      94.35  :      30.13
NEURAL NET          :            74.8  :     120.16  :      50.54
LU DECOMPOSITION    :          2088.7  :     108.21  :      78.14
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 149.947
FLOATING-POINT INDEX: 90.718
MEMORY INDEX        : 38.948
INTEGER INDEX       : 36.310
FLOATING-POINT INDEX: 50.316

ей богу ничего не подтасовывал. немного тебя обгоняю =)

punya ★★
()
Ответ на: комментарий от punya

fx-8150 на референсных частотах.

Turbo frequency: 4.2GHz

А у меня всего на 4.0 проц стоит пока (на выходных хочу взять Noctua NH-C14 и погнать до 4500, мать обдувать надо).

Так как nbench однопоточный - то на то и выходит.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

ЗЫ

-Ofast -pipe -fomit-frame-pointer -march=native
-mprefer-avx128 -funroll-all-loops -fprefetch-loop-arrays --param prefetch-latency=300
-minline-all-stringops -fno-tree-pre -ftree-vectorize -mieee-fp -ffast-math -mfpmath=both

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :            2244  :      57.55  :      18.90
STRING SORT         :           755.2  :     337.44  :      52.23
BITFIELD            :      5.3168e+08  :      91.20  :      19.05
FP EMULATION        :          535.36  :     256.89  :      59.28
FOURIER             :           51464  :      58.53  :      32.87
ASSIGNMENT          :          62.335  :     237.20  :      61.52
IDEA                :           11638  :     178.00  :      52.85
HUFFMAN             :          3409.2  :      94.54  :      30.19
NEURAL NET          :           74.32  :     119.39  :      50.22
LU DECOMPOSITION    :          2126.8  :     110.18  :      79.56
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 151.311
FLOATING-POINT INDEX: 91.649
MEMORY INDEX        : 39.411
INTEGER INDEX       : 36.564
FLOATING-POINT INDEX: 50.832

punya ★★
()
Ответ на: комментарий от punya

погонял lame (однопоток+не синтетика же):

Дефолт:

devl547@devl547 ~/Desktop $ time lame puryx\ \&\ jco\ -\ Revision\ 2012\ demotune.wav 
LAME 3.99.5 64bits (http://lame.sf.net)
Using polyphase lowpass filter, transition band: 16538 Hz - 17071 Hz
Encoding puryx & jco - Revision 2012 demotune.wav
      to puryx & jco - Revision 2012 demotune.mp3
Encoding as 44.1 kHz j-stereo MPEG-1 Layer III (11x) 128 kbps qval=3
    Frame          |  CPU time/estim | REAL time/estim | play/CPU |    ETA 
 10657/10657 (100%)|    0:08/    0:08|    0:08/    0:08|   31.315x|    0:00 
-----------------------------------------------------------------------------------------------------------------------
   kbps        LR    MS  %     long switch short %
  128.0       12.3  87.7        91.8   4.6   3.6
Writing LAME Tag...done
ReplayGain: -8.2dB

real    0m8.976s
user    0m8.880s
sys     0m0.025s

Новые CFLAGS:

devl547@devl547 ~/Desktop $ time lame puryx\ \&\ jco\ -\ Revision\ 2012\ demotune.wav
LAME 3.99.5 64bits (http://lame.sf.net)
Using polyphase lowpass filter, transition band: 16538 Hz - 17071 Hz
Encoding puryx & jco - Revision 2012 demotune.wav
      to puryx & jco - Revision 2012 demotune.mp3
Encoding as 44.1 kHz j-stereo MPEG-1 Layer III (11x) 128 kbps qval=3
    Frame          |  CPU time/estim | REAL time/estim | play/CPU |    ETA 
 10657/10657 (100%)|    0:07/    0:07|    0:07/    0:07|   36.727x|    0:00 
-----------------------------------------------------------------------------------------------------------------------
   kbps        LR    MS  %     long switch short %
  128.0       12.3  87.7        91.8   4.6   3.6
Writing LAME Tag...done
ReplayGain: -8.2dB

real    0m7.642s
user    0m7.569s
sys     0m0.026s

devl547 ★★★★★
()

Заметный глазу прирост будет только в вычислительных задачах, скорость открытия менюшек останется той же.

MyNameIsWinner
()
Ответ на: комментарий от devl547
-march=native -O3 -ffast-math -mfpmath=both -mavx -fno-tree-pre -funroll-all-loops


TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          2996.5  :      76.85  :      25.24
STRING SORT         :          1375.8  :     614.75  :      95.15
BITFIELD            :      6.6939e+08  :     114.82  :      23.98
FP EMULATION        :          717.76  :     344.41  :      79.47
FOURIER             :           65613  :      74.62  :      41.91
ASSIGNMENT          :          78.657  :     299.30  :      77.63
IDEA                :           13696  :     209.48  :      62.20
HUFFMAN             :          6970.4  :     193.29  :      61.72
NEURAL NET          :           129.4  :     207.87  :      87.44
LU DECOMPOSITION    :          4059.2  :     210.29  :     151.85
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 216.976
FLOATING-POINT INDEX: 148.298
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 : 8 CPU GenuineIntel Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz 4101MHz
L2 Cache            : 8192 KB
OS                  : Linux 3.7.4-geek
C compiler          : x86_64-pc-linux-gnu-gcc
libc                : 
MEMORY INDEX        : 56.164
INTEGER INDEX       : 52.677
FLOATING-POINT INDEX: 82.252
Kindly_Cat
()
Ответ на: комментарий от devl547

в 2 раза дороже

4.2

Кстати, в том же Хаффмане, как видно, превосходство тоже двукратное. И в LU DECOMPOSITION. И в STRING SORT - почти.

Kindly_Cat
()
Ответ на: комментарий от Kindly_Cat

4.2

Толсто. 9000/4457 столько будет?

в том же Хаффмане, как видно, превосходство тоже двукратное.

Давно известно, что у Intel однопоток намного круче.
Да и оптимизация gcc под буль хз как сделана, open64 местами в полтора-два раза быстрее.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

9000/4457 столько будет?

На яндекс.маркете Core i7 стоит 45000, а FX-8350 - 32500. Где тут в 2 раза?

Давно известно, что у Intel однопоток намного круче.

А т.к. большинство задач однопоточные... ну ты понял.

Kindly_Cat
()
Ответ на: комментарий от Kindly_Cat

Эмм.. Это в зимбабвийских долларах?
И еще у меня проц 8120, а не 8350

ну ты понял.

Конечно понял. Хомячье должно платить)
Особенно после выхода PS4/XBOX720

devl547 ★★★★★
()
Ответ на: комментарий от devl547

И еще у меня проц 8120, а не 8350

Всё равно минимальная цена - 24277.

Хомячье должно платить)

Ололол, илитка в треде.

Особенно после выхода PS4/XBOX720

Консоли - УГ.

Kindly_Cat
()
Ответ на: комментарий от Kindly_Cat

Консоли - УГ.

Текущие одноядерные - да. В новых процессоры многоядерные будут. Оттуда и оптимизации игор пойдут.

Ололол, илитка в треде.

Реалист. Мне избыточная производительность для фапа на бенчмарки не нужна.

Всё равно минимальная цена - 24277.

Разница - в 1.85 раза. Что как-бы намекает.

devl547 ★★★★★
()
Ответ на: комментарий от devl547

Текущие одноядерные - да. В новых процессоры многоядерные будут

А нормальные видеокарты когда в них ставить начнут? А нормальную мышь с клавиатурой?

Реалист

Аххахаха

Мне избыточная производительность для фапа на бенчмарки не нужна

Ты что-то весь тред фапал на бенчмарки, а как пришёл человек с Core i7, ты сразу встал в позу, лол.

Что как-бы намекает

Да, что амдшные камни стали настолько УГ, что иначе их брать не будут.

Kindly_Cat
()
Ответ на: комментарий от devl547

как «процессоры многоядерные» помогут от текстур 128x128 и маппинга всех действий в игре на одну кнопку.

anonymous
()
Ответ на: комментарий от Kindly_Cat

Ты что-то весь тред фапал на бенчмарки, а как пришёл человек с Core i7, ты сразу встал в позу, лол.

Вот у тебя пригорело то.
Тред про то, сколько профита от оптимизаций gcc, а не от половых проблем интелофанатов.

devl547 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.