LINUX.ORG.RU
ФорумTalks

openssl speed: exynos 4412 vs allwinner a10 vs intel atom D410

 ,


1

2

Как обещал, выкладываю openssl speed на йехуносе 4412 прайм. Во избежание вопросов лишних: openssl speed загружает только одно ядро из 4х, соответственно в многопоточном приложении это можно домножать на 4.

Текущие настройки PLL'ек:

[    0.000000] EXYNOS4: PLL settings, A=1000000000, M=880000000, E=96000000 V=350000000
[    0.000000] EXYNOS4: ARMCLK=1000000000, DMC=440000000, ACLK200=176000000
[    0.000000] ACLK100=110000000, ACLK160=176000000, ACLK133=146666666

Не совсем понятно разогнан он до 2Ghz, или на 1.7Ghz заявленных пашет, так как устройство клокового дерева не раскуривал пока еще, убут стоит на eMMC стоковый, cpufreq пока выпилен, так как выставляет весьма актуальные 0 вольт на ядро при загрузке.


root@fireblade:~# uname -a 
Linux fireblade 3.8.13-fireblade+ #12 SMP PREEMPT Sun May 19 
15:47:49 MSK 2013 armv7l GNU/Linux

root@fireblade:~# cat /proc/cpuinfo 
processor       : 0
model name      : ARMv7 Processor rev 0 (v7l)
BogoMIPS        : 1992.29
Features        : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls 
CPU implementer : 0x41
CPU architecture: 7
CPU variant     : 0x3
CPU part        : 0xc09
CPU revision    : 0

processor       : 1
model name      : ARMv7 Processor rev 0 (v7l)
BogoMIPS        : 1992.29
Features        : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls 
CPU implementer : 0x41
CPU architecture: 7
CPU variant     : 0x3
CPU part        : 0xc09
CPU revision    : 0

processor       : 2
model name      : ARMv7 Processor rev 0 (v7l)
BogoMIPS        : 1992.29
Features        : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls 
CPU implementer : 0x41
CPU architecture: 7
CPU variant     : 0x3
CPU part        : 0xc09
CPU revision    : 0

processor       : 3
model name      : ARMv7 Processor rev 0 (v7l)
BogoMIPS        : 1992.29
Features        : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls 
CPU implementer : 0x41
CPU architecture: 7
CPU variant     : 0x3
CPU part        : 0xc09
CPU revision    : 0

Hardware        : ODROIDX2
Revision        : 0000
Serial          : 0000000000000000


OpenSSL 1.0.1e 11 Feb 2013
built on: Mon Mar 18 21:48:12 UTC 2013
options:bn(64,32) rc4(ptr,char) des(idx,cisc,16,long) aes(partial) blowfish(ptr) 
compiler: gcc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -DL_ENDIAN -DTERMIO -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Werror=format-security -D_FORTIFY_SOURCE=2 -Wl,-z,relro l
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes
md2                  0.00         0.00         0.00         0.00         0.00 
mdc2                 0.00         0.00         0.00         0.00         0.00 
md4               6529.09k    23272.49k    67641.09k   130539.18k   179271.00k
md5               5364.99k    18026.07k    47725.48k    81412.10k   102629.38k
hmac(md5)         6038.71k    19773.80k    50689.19k    83475.46k   103011.67k
sha1              5158.83k    15600.62k    35575.55k    52458.50k    60912.98k
rmd160            4654.14k    13679.91k    29962.33k    42733.23k    48846.17k
rc4              60824.26k    68389.57k    71433.73k    72127.49k    72302.59k
des cbc          15824.01k    16744.32k    16994.56k    17059.16k    17080.32k
des ede3          6165.09k     6336.28k     6389.25k     6385.66k     6387.03k
idea cbc             0.00         0.00         0.00         0.00         0.00 
seed cbc         18145.35k    19757.85k    20186.03k    20319.91k    20351.66k
rc2 cbc          11042.71k    11582.12k    11731.20k    11772.93k    11782.83k
rc5-32/12 cbc        0.00         0.00         0.00         0.00         0.00 
blowfish cbc     23803.83k    26288.21k    26973.87k    27162.97k    27232.94k
cast cbc         21904.79k    23836.82k    24805.38k    24956.59k    24928.26k
aes-128 cbc      16797.56k    18162.84k    18586.03k    18691.41k    18721.45k
aes-192 cbc      14392.34k    15302.08k    15594.07k    15649.79k    15684.95k
aes-256 cbc      12652.89k    13416.55k    13629.27k    13693.61k    13691.56k
camellia-128 cbc    23610.66k    26229.91k    27077.21k    27371.52k    27437.74k
camellia-192 cbc    19005.77k    20596.71k    21206.78k    21354.50k    21402.97k
camellia-256 cbc    18978.20k    20698.30k    21227.18k    21365.42k    21402.97k
sha256            3825.71k     8879.13k    15610.20k    19273.39k    20762.20k
sha512             942.77k     3758.95k     5322.15k     7229.92k     8115.54k
whirlpool         1391.82k     2829.87k     4549.97k     5411.16k     5687.98k
aes-128 ige      15903.52k    17479.45k    17902.51k    18032.98k    18101.59k
aes-192 ige      13769.01k    14905.49k    15244.89k    15333.38k    15298.08k
aes-256 ige      12133.72k    12951.27k    13191.51k    13269.67k    13342.04k
ghash            15372.38k    15852.33k    16080.47k    16138.58k    16154.62k
                  sign    verify    sign/s verify/s
rsa  512 bits 0.001919s 0.000167s    521.0   5973.9
rsa 1024 bits 0.010215s 0.000494s     97.9   2025.5
rsa 2048 bits 0.060848s 0.001613s     16.4    620.0
rsa 4096 bits 0.394231s 0.005510s      2.5    181.5
                  sign    verify    sign/s verify/s
dsa  512 bits 0.001736s 0.001917s    576.0    521.7
dsa 1024 bits 0.004950s 0.005666s    202.0    176.5
dsa 2048 bits 0.016077s 0.018571s     62.2     53.8
                              sign    verify    sign/s verify/s
 160 bit ecdsa (secp160r1)   0.0010s   0.0043s   1046.1    232.1
 192 bit ecdsa (nistp192)   0.0010s   0.0047s    963.9    212.5
 224 bit ecdsa (nistp224)   0.0013s   0.0059s    787.7    170.8
 256 bit ecdsa (nistp256)   0.0015s   0.0075s    656.3    133.5
 384 bit ecdsa (nistp384)   0.0031s   0.0160s    327.6     62.5
 521 bit ecdsa (nistp521)   0.0083s   0.0442s    121.0     22.6
 163 bit ecdsa (nistk163)   0.0020s   0.0080s    496.0    124.8
 233 bit ecdsa (nistk233)   0.0042s   0.0156s    240.1     64.0
 283 bit ecdsa (nistk283)   0.0064s   0.0295s    156.0     33.9
 409 bit ecdsa (nistk409)   0.0166s   0.0686s     60.2     14.6
 571 bit ecdsa (nistk571)   0.0425s   0.1581s     23.5      6.3
 163 bit ecdsa (nistb163)   0.0020s   0.0087s    499.5    114.9
 233 bit ecdsa (nistb233)   0.0041s   0.0174s    242.3     57.3
 283 bit ecdsa (nistb283)   0.0064s   0.0333s    156.0     30.1
 409 bit ecdsa (nistb409)   0.0166s   0.0782s     60.3     12.8
 571 bit ecdsa (nistb571)   0.0425s   0.1822s     23.5      5.5
                              op      op/s
 160 bit ecdh (secp160r1)   0.0036s    279.9
 192 bit ecdh (nistp192)   0.0039s    253.8
 224 bit ecdh (nistp224)   0.0050s    199.4
 256 bit ecdh (nistp256)   0.0064s    155.8
 384 bit ecdh (nistp384)   0.0133s     75.3
 521 bit ecdh (nistp521)   0.0365s     27.4
 163 bit ecdh (nistk163)   0.0040s    252.7
 233 bit ecdh (nistk233)   0.0078s    128.9
 283 bit ecdh (nistk283)   0.0146s     68.4
 409 bit ecdh (nistk409)   0.0337s     29.7
 571 bit ecdh (nistk571)   0.0787s     12.7
 163 bit ecdh (nistb163)   0.0042s    237.8
 233 bit ecdh (nistb233)   0.0087s    115.2
 283 bit ecdh (nistb283)   0.0164s     61.1
 409 bit ecdh (nistb409)   0.0390s     25.6
 571 bit ecdh (nistb571)   0.0906s     11.0

Для сравнения, Intel Atom, который пока еще исполняет роль сервачка:

[root@ariel ~]$ uname -a
Linux ariel.home 3.8.8-2-ARCH #1 SMP PREEMPT Tue Apr 23 10:28:14 CEST 2013 x86_64 GNU/Linux
[root@ariel ~]$ cat /proc/cpuinfo 
processor       : 0
vendor_id       : GenuineIntel
cpu family      : 6
model           : 28
model name      : Intel(R) Atom(TM) CPU D410   @ 1.66GHz
stepping        : 10
microcode       : 0x107
cpu MHz         : 1666.794
cache size      : 512 KB
physical id     : 0
siblings        : 1
core id         : 0
cpu cores       : 1
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 10
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx lm constant_tsc arch_perfmon pebs bts rep_good nopl aperfmperf pni dtes64 monitor ds_cpl tm2 ssse3 cx16 xtpr pdcm movbe lahf_lm dtherm
bogomips        : 3334.48
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 1
vendor_id       : GenuineIntel
cpu family      : 6
model           : 28
model name      : Intel(R) Atom(TM) CPU D410   @ 1.66GHz
stepping        : 10
microcode       : 0x107
cpu MHz         : 1666.794
cache size      : 512 KB
physical id     : 0
siblings        : 1
core id         : 0
cpu cores       : 0
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 10
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx lm constant_tsc arch_perfmon pebs bts rep_good nopl aperfmperf pni dtes64 monitor ds_cpl tm2 ssse3 cx16 xtpr pdcm movbe lahf_lm dtherm
bogomips        : 3334.48
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

OpenSSL 1.0.1e 11 Feb 2013
built on: Sun Feb 17 13:43:48 CET 2013
options:bn(64,64) md2(int) rc4(16x,int) des(idx,cisc,16,int) aes(partial) idea(int) blowfish(idx) 
compiler: gcc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -Wa,--noexecstack -march=x86-64 -mtune=generic -O2 -pipe -fstack-protector --param=ssp-buffer-size=4 -D_FORTIFY_SOURCE=2 -m64 -DL_ENDIAN -DTERMIO -O3 -Wall -DOPENSSL_IA32_SSE2 -DOPENSSL_BN_ASM_MONT -DOPENSSL_BN_ASM_MONT5 -DOPENSSL_BN_ASM_GF2m -DSHA1_ASM -DSHA256_ASM -DSHA512_ASM -DMD5_ASM -DAES_ASM -DVPAES_ASM -DBSAES_ASM -DWHIRLPOOL_ASM -DGHASH_ASM
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes
md2               1628.29k     3432.53k     4378.62k     5258.24k     5428.57k
mdc2              2814.97k     2648.83k     2967.55k     2380.12k     2419.24k
md4              11747.02k    37872.11k   101679.45k   285940.18k   378224.64k
md5              12270.20k    42342.34k   118185.22k   217204.39k   249691.61k
hmac(md5)         8920.68k    41763.39k   118152.70k   217108.82k   287825.92k
sha1             13964.91k    42654.51k    98013.44k   145717.93k   170876.93k
rmd160           10778.05k    29382.93k    60047.45k    81468.07k    91018.58k
rc4              82619.43k   136546.88k   165707.35k   176259.07k   179623.25k
des cbc          16169.89k    16991.08k    17272.41k    17340.07k    16673.62k
des ede3          5527.56k     6200.51k     6238.98k     5211.78k     5062.66k
idea cbc         14184.29k    14992.43k    15199.40k    11955.54k    11756.48k
seed cbc         21706.14k    23271.02k    23736.32k    29682.35k    29810.69k
rc2 cbc          16107.42k    17199.57k    17483.52k    17555.80k    17574.57k
rc5-32/12 cbc        0.00         0.00         0.00         0.00         0.00 
blowfish cbc     37352.15k    42513.75k    43964.59k    44407.81k    44537.17k
cast cbc         31234.14k    31685.93k    34859.18k    32732.84k    30663.46k
aes-128 cbc      15881.35k    18612.07k    17783.13k    26146.25k    26228.05k
aes-192 cbc      19154.37k    20981.87k    21630.63k    16891.90k    20507.40k
aes-256 cbc      16747.72k    18007.85k    18391.81k    18501.29k    18524.84k
camellia-128 cbc    23880.61k    36693.78k    42322.52k    44083.20k    44619.09k
camellia-192 cbc    20403.17k    28919.21k    32499.11k    33528.15k    33838.42k
camellia-256 cbc    20399.84k    28917.87k    32497.92k    33524.39k    33832.96k
sha256           13351.27k    29992.70k    51826.60k    63556.61k    68029.10k
sha512           10114.77k    40552.53k    62496.51k    88201.22k   100382.04k
whirlpool         5361.45k    11312.23k    18665.47k    22377.13k    23748.61k
aes-128 ige      22774.05k    24335.23k    24827.90k    24946.01k    24816.30k
aes-192 ige      16358.46k    19176.35k    20822.36k    20933.29k    20952.41k
aes-256 ige      16750.58k    17436.35k    17805.65k    17870.17k    17883.14k
ghash            53090.65k    81907.97k    94487.47k    98891.00k    99789.48k
                  sign    verify    sign/s verify/s
rsa  512 bits 0.000482s 0.000038s   2075.5  26355.4
rsa 1024 bits 0.002233s 0.000117s    447.8   8516.7
rsa 2048 bits 0.013731s 0.000420s     72.8   2379.2
rsa 4096 bits 0.100400s 0.001608s     10.0    621.7
                  sign    verify    sign/s verify/s
dsa  512 bits 0.000441s 0.000457s   2266.5   2189.5
dsa 1024 bits 0.001539s 0.001531s    649.6    653.2
dsa 2048 bits 0.004205s 0.005038s    237.8    198.5
                              sign    verify    sign/s verify/s
 160 bit ecdsa (secp160r1)   0.0004s   0.0014s   2731.2    692.7
 192 bit ecdsa (nistp192)   0.0004s   0.0018s   2338.4    568.7
 224 bit ecdsa (nistp224)   0.0005s   0.0012s   2160.2    861.2
 256 bit ecdsa (nistp256)   0.0008s   0.0021s   1299.5    479.3
 384 bit ecdsa (nistp384)   0.0014s   0.0074s    699.2    136.0
 521 bit ecdsa (nistp521)   0.0030s   0.0074s    334.2    135.6
 163 bit ecdsa (nistk163)   0.0011s   0.0053s    883.6    190.2
 233 bit ecdsa (nistk233)   0.0022s   0.0055s    455.9    182.7
 283 bit ecdsa (nistk283)   0.0033s   0.0115s    306.6     86.9
 409 bit ecdsa (nistk409)   0.0071s   0.0235s    140.3     42.5
 571 bit ecdsa (nistk571)   0.0156s   0.0592s     63.9     16.9
 163 bit ecdsa (nistb163)   0.0010s   0.0042s   1012.4    236.3
 233 bit ecdsa (nistb233)   0.0019s   0.0058s    527.4    171.5
 283 bit ecdsa (nistb283)   0.0032s   0.0125s    307.8     80.2
 409 bit ecdsa (nistb409)   0.0071s   0.0343s    140.2     29.1
 571 bit ecdsa (nistb571)   0.0208s   0.0646s     48.0     15.5
                              op      op/s
 160 bit ecdh (secp160r1)   0.0012s    814.6
 192 bit ecdh (nistp192)   0.0015s    659.5
 224 bit ecdh (nistp224)   0.0008s   1198.4
 256 bit ecdh (nistp256)   0.0016s    630.5
 384 bit ecdh (nistp384)   0.0061s    164.2
 521 bit ecdh (nistp521)   0.0052s    192.0
 163 bit ecdh (nistk163)   0.0020s    510.8
 233 bit ecdh (nistk233)   0.0027s    375.8
 283 bit ecdh (nistk283)   0.0055s    182.4
 409 bit ecdh (nistk409)   0.0116s     86.2
 571 bit ecdh (nistk571)   0.0258s     38.7
 163 bit ecdh (nistb163)   0.0021s    477.4
 233 bit ecdh (nistb233)   0.0028s    354.5
 283 bit ecdh (nistb283)   0.0063s    157.7
 409 bit ecdh (nistb409)   0.0197s     50.7
 571 bit ecdh (nistb571)   0.0335s     29.9


Наконец, openssl speed на allwinner a10 (cubieboard) Камень (cortex a8) - 1Ghz, память DDR3

root@frostblade:~$ uname -a
Linux frostblade 3.4.29-frostblade+ #13 PREEMPT Wed Feb 20 18:32:26 MSK 2013 armv7l GNU/Linux
root@frostblade:~$ cat /proc/cpuinfo 
Processor       : ARMv7 Processor rev 2 (v7l)
BogoMIPS        : 59.63
Features        : swp half thumb fastmult vfp edsp neon vfpv3 tls 
CPU implementer : 0x41
CPU architecture: 7
CPU variant     : 0x3
CPU part        : 0xc08
CPU revision    : 2

Hardware        : sun4i
Revision        : 0000
Serial          : 0000000000000000

OpenSSL 1.0.1e 11 Feb 2013
built on: Mon Mar 18 21:48:12 UTC 2013
options:bn(64,32) rc4(ptr,char) des(idx,cisc,16,long) aes(partial) blowfish(ptr) 
compiler: gcc -fPIC -DOPENSSL_PIC -DZLIB -DOPENSSL_THREADS -D_REENTRANT -DDSO_DLFCN -DHAVE_DLFCN_H -DL_ENDIAN -DTERMIO -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Werror=format-security -D_FORTIFY_SOURCE=2 -Wl,-z,relro -Wa,--noexecstack -Wall
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes
md2                  0.00         0.00         0.00         0.00         0.00 
mdc2                 0.00         0.00         0.00         0.00         0.00 
md4               3836.65k    21655.45k    65253.37k   129043.80k   182678.86k
md5               4745.66k    16494.77k    46431.70k    83781.63k   110018.56k
hmac(md5)         5889.62k    19830.08k    52413.27k    89145.73k   110886.91k
sha1              4824.06k    15002.67k    35610.03k    54326.11k    64088.37k
rmd160            4386.36k    13280.11k    30255.45k    44843.64k    51982.73k
rc4              68046.46k    76740.91k    80890.35k    81775.48k    82204.94k
des cbc          17426.22k    18522.80k    19014.79k    18994.86k    19002.71k
des ede3          6845.03k     7014.53k     7084.69k     7081.35k     7045.12k
idea cbc             0.00         0.00         0.00         0.00         0.00 
seed cbc         19515.29k    21735.58k    22375.59k    22660.88k    22701.98k
rc2 cbc          13061.30k    13905.10k    14040.58k    14105.60k    14143.57k
rc5-32/12 cbc        0.00         0.00         0.00         0.00         0.00 
blowfish cbc     26473.72k    29112.23k    30361.26k    30348.97k    30324.33k
cast cbc         25595.32k    28268.54k    29115.48k    29309.27k    29409.01k
aes-128 cbc      18499.38k    20337.09k    21028.52k    21200.57k    21251.67k
aes-192 cbc      16019.72k    17364.91k    17876.42k    18046.80k    17940.48k
aes-256 cbc      14008.74k    15162.41k    15496.05k    15567.88k    15597.68k
camellia-128 cbc    24860.18k    28272.41k    29428.22k    29873.74k    29990.44k
camellia-192 cbc    20353.59k    22497.75k    23315.29k    23599.95k    23397.36k
camellia-256 cbc    20254.65k    22707.44k    23324.16k    23661.99k    23491.93k
sha256            4002.91k     9521.19k    17102.76k    21525.30k    23180.63k
sha512             796.41k     3201.46k     4357.02k     6139.55k     6824.84k
whirlpool         1187.75k     2445.98k     3949.99k     4697.39k     4967.43k
aes-128 ige      16839.74k    19126.35k    19316.39k    19827.71k    20299.50k
aes-192 ige      14772.68k    16384.38k    16654.73k    17008.30k    17091.36k
aes-256 ige      13142.42k    14365.74k    14586.18k    14829.23k    14942.87k
ghash            14760.38k    15350.45k    15694.18k    15643.91k    15613.95k
                  sign    verify    sign/s verify/s
rsa  512 bits 0.002263s 0.000201s    441.9   4978.8
rsa 1024 bits 0.012082s 0.000585s     82.8   1708.2
rsa 2048 bits 0.072555s 0.001949s     13.8    513.2
rsa 4096 bits 0.473182s 0.006687s      2.1    149.5
                  sign    verify    sign/s verify/s
dsa  512 bits 0.002043s 0.002277s    489.5    439.2
dsa 1024 bits 0.005887s 0.006810s    169.9    146.8
dsa 2048 bits 0.019341s 0.022733s     51.7     44.0
                              sign    verify    sign/s verify/s
 160 bit ecdsa (secp160r1)   0.0011s   0.0048s    940.7    207.4
 192 bit ecdsa (nistp192)   0.0011s   0.0052s    883.4    193.9
 224 bit ecdsa (nistp224)   0.0014s   0.0067s    704.7    148.6
 256 bit ecdsa (nistp256)   0.0017s   0.0083s    595.8    120.2
 384 bit ecdsa (nistp384)   0.0036s   0.0186s    278.9     53.9
 521 bit ecdsa (nistp521)   0.0098s   0.0521s    101.9     19.2
 163 bit ecdsa (nistk163)   0.0021s   0.0081s    472.7    123.5
 233 bit ecdsa (nistk233)   0.0044s   0.0157s    225.2     63.9
 283 bit ecdsa (nistk283)   0.0068s   0.0288s    146.3     34.7
 409 bit ecdsa (nistk409)   0.0187s   0.0667s     53.6     15.0
 571 bit ecdsa (nistk571)   0.0451s   0.1529s     22.2      6.5
 163 bit ecdsa (nistb163)   0.0021s   0.0088s    484.8    113.9
 233 bit ecdsa (nistb233)   0.0044s   0.0175s    227.8     57.0
 283 bit ecdsa (nistb283)   0.0068s   0.0322s    147.0     31.0
 409 bit ecdsa (nistb409)   0.0187s   0.0760s     53.5     13.2
 571 bit ecdsa (nistb571)   0.0447s   0.1765s     22.4      5.7
                              op      op/s
 160 bit ecdh (secp160r1)   0.0041s    242.5
 192 bit ecdh (nistp192)   0.0044s    229.7
 224 bit ecdh (nistp224)   0.0055s    182.1
 256 bit ecdh (nistp256)   0.0070s    142.4
 384 bit ecdh (nistp384)   0.0157s     63.8
 521 bit ecdh (nistp521)   0.0434s     23.1
 163 bit ecdh (nistk163)   0.0040s    249.6
 233 bit ecdh (nistk233)   0.0077s    129.5
 283 bit ecdh (nistk283)   0.0142s     70.3
 409 bit ecdh (nistk409)   0.0328s     30.5
 571 bit ecdh (nistk571)   0.0764s     13.1
 163 bit ecdh (nistb163)   0.0042s    237.9
 233 bit ecdh (nistb233)   0.0086s    116.1
 283 bit ecdh (nistb283)   0.0160s     62.6
 409 bit ecdh (nistb409)   0.0379s     26.4
 571 bit ecdh (nistb571)   0.0879s     11.4

Сухой остаток:

* Одно ядро атома где-то в два раза быстре одного ядра йехуноса на сферических тестах.

* Для многих тестов боттлнеком является скорость DDR2, так, например, allwinner a10 с DDR3 уделывает одно йехуноса на некоторых тестах, при том, что работает почти на в два раза меньшей частоте.

* Судя по флагам, многие алго под атом оптимизнуты ручками на ассемблере, в то время как на арме, надо полагать, трудится исключительно выхлоп компилятора.

* арм таки жрет в разы меньше. при максимальной нагрузке он хавал от лабораторного БП меньше 10 ватт.

★★★★★

Последнее исправление: AiFiLTr0 (всего исправлений: 7)
Ответ на: комментарий от kranky

Пойми, 1.5 миллиарда транзисторов не могут при работе потреблять меньше, чем 300 миллионов транзисторов.

Узнай, что такое тех.процесс и подумай еще раз.

zgen ★★★★★
()
Ответ на: комментарий от tailgunner

Переход сам по себе не так уж и много стоит, ведь есть уже аппараты на x86. Да и софт переписать проблем нет - один фиг сторонние разработчики это делают, да ещё для них это возможность срубить бабла на повторной продаже софтины.

Вот только ARM делали именно производительным изначально. См. Acorn Archimedes. Проблема арма нынче в производителях, которые любят делать банальные огорождения.

Quasar ★★★★★
()
Ответ на: комментарий от Quasar

Переход сам по себе не так уж и много стоит

Ты не отрицаешь, что он чего-то стоит - уже неплохо.

ARM делали именно производительным изначально. См. Acorn Archimedes.

Колян, ну хоть истории меня не учи %)

tailgunner ★★★★★
()
Ответ на: комментарий от zgen

Узнай, что такое тех.процесс и подумай еще раз.

Чтобы в данном примере у обоих процов было хотя бы равное потребление, первый должен быть произведён по 22нм, а второй - по 130нм. К сожалению производителей миллиардников, такого разрыва нет, а через пару лет они вообще поравняются, я гарантирую это.

kranky ★★★★★
()

1) -o3 даст очень весомый пинок арму. на некоторых задачах - двухкратное увелечение производителности.

via http://www.opennet.ru/opennews/art.shtml?num=34074

2) у штеуда, емнип, были аппаратные инструкции для ускорения шифрования. может стоит попробывать более нейтральный тест?

Ford_Focus ★★★★★
()

зы: 4412 уже протух, ждем Octa

Ford_Focus ★★★★★
()
Ответ на: комментарий от kranky

Всегда очень смешно участвовать в срачах arm vs intel, от приверженцев arm слышно всегда только «скоро и завтра ... всех порвем».


а через пару лет они вообще поравняются, я гарантирую это.

Вот через пару лет и приходите.

zgen ★★★★★
()
Ответ на: комментарий от zgen

слышно всегда только «скоро и завтра ... всех порвем».

Избирательная глухота.

kranky ★★★★★
()

Судя по флагам, многие алго под атом оптимизнуты ручками на ассемблере, в то время как на арме, надо полагать, трудится исключительно выхлоп компилятора.

gcc под arm выдаёт странный код. Три команды по 4 байта и 4 байта константы в коде, чтобы загрузить эту самую константу. Итого 16 байт. И так несколько раз подряд. Без понятия, какие там использовались ключи (бинарник собран ndk-build). Условное выполнение используется только для переходов. Кодогенератор выдаёт корректный код, но на этом всё.

i-rinat ★★★★★
()
Ответ на: комментарий от tailgunner

Пойми, x86 отличается от ARM только наличием блока перевода x86-инструкций во внутренний RISC-формат.

Правильнее так: x86 отличается от ARM наличием блока перевода именно x86-инструкций во внутренний RISC-формат

Т.к. практически во всех современных производительных ПЦ имеется декодер, транслирующий инструкции в микрооперации, уже непосредственно исполняемые процессором

frame ★★★
()

Откуда такое ядро свеженькое на odroid? А то пришёл мой odroid-u2, я накатил арчик и.... 3.0.80 и нужные мне фишки (perf stat) не пашут.

true_admin ★★★★★
()

Пока что gcc для арма - то еще дерьмо, так что на дробильных тестах сравнивать смысла не много

vasily_pupkin ★★★★★
()
Ответ на: комментарий от AiFiLTr0

Спасибо, а нет под рукой ссылки как это всё собирать и как оно вообще грузится? Я в этом нуб, видел только твой пост что там (с моей точки зрения) экстримальный ППЦ с цепочкой загрузчиков.

true_admin ★★★★★
()
Ответ на: комментарий от true_admin

сначала crosstool-ng'шкой собираешь тулчейн.

далее
export PATH=$PATH:~/x-tools/arm-odroid-gnueabi/bin
cd path/to/kernel
cp arch/arm/configs/config .config (выбирай под u2)
ARCH=arm CROSS_COMPILE=arm-odroid-gnueabi- make menuconfig
ARCH=arm CROSS_COMPILE=arm-odroid-gnueabi- zImage

Собственно все, кладешь ядро туда, откуда можешь его ext2load'ить. uImage не собирай, в убуте хардокернела оно поломано нахрен, так что грузиться приходится через zImage. Чтобы не мучиться с модулями, я все что нужно вкомпиливаю в ядро. В планах у меня поднятие репы с ядрами для дебилиана, но никак руки не доходят скрипты нарисовать. Загрузчик юзай уже прошитый в eMMC, особенного смысла собирать из сырцов нет.

AiFiLTr0 ★★★★★
() автор топика
Последнее исправление: AiFiLTr0 (всего исправлений: 2)
Ответ на: комментарий от Reset

А мерить потребление проца без обвяза, это в общем случае как мерить расход бензина на ДВС без машины. Если проц жрёт 10, а обвяз ещё 25, то расход будет таки 35, а не 10.

Dark_SavanT ★★★★★
()
Ответ на: комментарий от tailgunner

Я уже писал, что без обвяза, мериться энергопотреблением бессмысленно. Армы обычно запиханы в SoC и немалая часть потребления платформы идёт на нём. x86, кроме Clover tail, или как его там, идут как проц + южный мост(северный вроде уже утрамбовывают на кристалл с процом), так что без южного моста мерить потребление бессмысленно. Какой толк от 10W процессора, если южный мост отъедает ещё столько же? Тесты Clover tail дадут несколько более близкую к реальности картину.

Dark_SavanT ★★★★★
()
Ответ на: комментарий от Dark_SavanT

Я уже писал, что без обвяза, мериться энергопотреблением бессмысленно

Энергопотреблением ядер меряться вполне осмысленно.

потребления платформы

Естественно, энергопотребление ядра - это только часть энергопотребления платформы. Но таки SoC сделать проще, чем ядро, да и нет^Wхромобуки на Atom уже потребляют вполне на уровне хромобуков на ARM.

tailgunner ★★★★★
()
Последнее исправление: tailgunner (всего исправлений: 1)
Ответ на: комментарий от tailgunner

Энергопотреблением ядер меряться вполне осмысленно.

Только для этого нужны несколько иные тесты, железо и методики расчёта.

хромобуки на Atom уже потребляют вполне на уровне хромобуков на ARM.

Я что-то пропустил?

Dark_SavanT ★★★★★
()
Ответ на: комментарий от AiFiLTr0

Спасибо, всё получилось. Правда, в итоге решил собирать на самом девайсе на всякий случай. А бывают какие-нить bootmenu там типа как в grub? Или только ручками setenv blah-blah-blah ...?

Ещё вопрос, а где можно поправить настройки лоадера? Я хочу чтобы таймаут при загрузки был больше одной секунды.

true_admin ★★★★★
()
Ответ на: комментарий от true_admin

какой тулчейн? crosstool тебе собирает кроссовый тулчейн, какие версии и чего юзать ты сам указываешь.

AiFiLTr0 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.