История изменений
Исправление I-Love-Microsoft, (текущая версия) :
Судя по всему эти тесты написаны под классическую архитектуру интелов и амд, и компилятор не может распараллелить код как надо.
Предлагаю придумать какие-то тесты, где всё было бы явно параллельно.
# generic options for gcc
CFLAGS = -s -static -ffast -fno-inline -mcpu=elbrus-2c+ -Wall -O3
./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 239.03 : 6.13 : 2.01
STRING SORT : 125.93 : 56.27 : 8.71
BITFIELD : 3.3521e+07 : 5.75 : 1.20
FP EMULATION : 14.362 : 6.89 : 1.59
FOURIER : 9142.8 : 10.40 : 5.84
ASSIGNMENT : 7.4754 : 28.45 : 7.38
IDEA : 650.13 : 9.94 : 2.95
HUFFMAN : 332.82 : 9.23 : 2.95
NEURAL NET : 11.587 : 18.61 : 7.83
LU DECOMPOSITION : 245.82 : 12.73 : 9.20
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 11.993
FLOATING-POINT INDEX: 13.508
Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU : Dual MONOCUB E2C+DSP 500MHz
L2 Cache :
OS : Linux 2.6.33-elbrus.033.6.21.rt
C compiler : gcc version 4.4.0 compatible.
libc : libc-2.16.so
MEMORY INDEX : 4.258
INTEGER INDEX : 2.297
FLOATING-POINT INDEX: 7.492
Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
* Trademarks are property of their respective holder.
./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 2196.5 : 56.33 : 18.50
STRING SORT : 1235.8 : 552.21 : 85.47
BITFIELD : 6.8257e+08 : 117.08 : 24.46
FP EMULATION : 733.08 : 351.76 : 81.17
FOURIER : 53369 : 60.70 : 34.09
ASSIGNMENT : 70.031 : 266.48 : 69.12
IDEA : 13826 : 211.47 : 62.79
HUFFMAN : 6143.7 : 170.37 : 54.40
NEURAL NET : 126.12 : 202.61 : 85.22
LU DECOMPOSITION : 3408.4 : 176.57 : 127.50
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 198.863
FLOATING-POINT INDEX: 129.487
Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU : 4 CPU GenuineIntel Intel(R) Core(TM) i5-4570 CPU @ 3.20GHz 800MHz
L2 Cache : 6144 KB
OS : Linux 3.13.0-39-generic
C compiler : gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1)
libc :
MEMORY INDEX : 52.473
INTEGER INDEX : 47.590
FLOATING-POINT INDEX: 71.819
Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
* Trademarks are property of their respective holder.
Исходная версия I-Love-Microsoft, :
Судя по всему эти тесты написаны под классическую архитектуру интелов и амд, и компилятор не может распараллелить код как надо.
Предлагаю придумать какие-то тесты, где всё было бы явно параллельно.
./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 239.03 : 6.13 : 2.01
STRING SORT : 125.93 : 56.27 : 8.71
BITFIELD : 3.3521e+07 : 5.75 : 1.20
FP EMULATION : 14.362 : 6.89 : 1.59
FOURIER : 9142.8 : 10.40 : 5.84
ASSIGNMENT : 7.4754 : 28.45 : 7.38
IDEA : 650.13 : 9.94 : 2.95
HUFFMAN : 332.82 : 9.23 : 2.95
NEURAL NET : 11.587 : 18.61 : 7.83
LU DECOMPOSITION : 245.82 : 12.73 : 9.20
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 11.993
FLOATING-POINT INDEX: 13.508
Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU : Dual MONOCUB E2C+DSP 500MHz
L2 Cache :
OS : Linux 2.6.33-elbrus.033.6.21.rt
C compiler : gcc version 4.4.0 compatible.
libc : libc-2.16.so
MEMORY INDEX : 4.258
INTEGER INDEX : 2.297
FLOATING-POINT INDEX: 7.492
Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
* Trademarks are property of their respective holder.
./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 2196.5 : 56.33 : 18.50
STRING SORT : 1235.8 : 552.21 : 85.47
BITFIELD : 6.8257e+08 : 117.08 : 24.46
FP EMULATION : 733.08 : 351.76 : 81.17
FOURIER : 53369 : 60.70 : 34.09
ASSIGNMENT : 70.031 : 266.48 : 69.12
IDEA : 13826 : 211.47 : 62.79
HUFFMAN : 6143.7 : 170.37 : 54.40
NEURAL NET : 126.12 : 202.61 : 85.22
LU DECOMPOSITION : 3408.4 : 176.57 : 127.50
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX : 198.863
FLOATING-POINT INDEX: 129.487
Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU : 4 CPU GenuineIntel Intel(R) Core(TM) i5-4570 CPU @ 3.20GHz 800MHz
L2 Cache : 6144 KB
OS : Linux 3.13.0-39-generic
C compiler : gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1)
libc :
MEMORY INDEX : 52.473
INTEGER INDEX : 47.590
FLOATING-POINT INDEX: 71.819
Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
* Trademarks are property of their respective holder.