LINUX.ORG.RU
ФорумTalks

интелокапец близок

 , ,


1

1

На самом деле не очень :)

Но первые звоночек прозвенел: http://www.overclockers.ru/hardnews/73553/amd-oficialno-predstavila-processor...

Для Ъ: Амд представила восьмиядернички на A57 для серверов. Где купить и по чём продают не сказано. Ходят слухи что около 150 баксов: http://www.extremetech.com/extreme/221282-amds-first-arm-based-processor-the-...

Но всё же есть опасения что до прилавков оно не дойдёт (я бы сказал что это очень даже вероятно). Зачем делать бумажные анонсы — хз, какой-то странный маркетинг :) Производительность тоже неизвестна. Если честно, я даже не понимаю зачем это кто-то захочет покупать :).

В общем, я бы пока не торопился сдавать в утиль старые сервера. Мне кажется, лет 5 ещё послужат, а там видно будет. АРМы потихонечку пробиваются, но с большим скрипом. Серверные решения, не смотря на многочисленные новости год-два назад, не появляются. Ну, кроме scaleway.com, но особый сегмент.

★★★★★
Ответ на: комментарий от svr4

90W зеона - это ниачом, на фоне пачки хардов, криптопроцессора и т.п.

Когда их 2-4 штуки, да ещё эти южные-северные мосты, да ещё память - то выходит как-то уже невесело. А когда таких машин не одна, а десятки - то в сумме нехилые такие киловатты набираются. Пачек хардов, к счастью нет. Вернее есть пара таких монстров с десятками хардов, но как бы они рояля не играют.

Да и не жрут интела свой TDP из арка, если на них не гонять линпак 24/7.

TDP не жрут, да. Вот только то, что они жрут - хорошо если в 1.5 раза меньше TDP. Хотя долбаный роскомнадзорский фильтр TDP по-моему уже выжирает. Придётся ещё тачку ставить. Кстати, как раз тот случай, когда лучше 16 нежручих тачек на армах, чем одна жручая с 16 ядрами.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

южные-северные мосты

Северный мост уже 6 лет как переехал в процессор, у тебя криокамера протекла.

Южный занимается малозначимой хуитой уровня встроенного SATA контроллера, звука (на серверной мамке его и нет) и т.п.

Видюха (в 90% случаев Matrox G200) жрёт чуть менее чем ничего, да и тоже большей частью не задействована.

Вместо 16 недосерваков проще иметь 16 виртуалок - суммарно электричества жрать будут меньше.

Ещё есть лезвия (например, лет 6-7 назад был очень актуален Intel MFSYS 25).

Ну и для совсем больших дядь есть IBM System Z. Правда это явно не твой случай.

svr4
()
Последнее исправление: svr4 (всего исправлений: 1)
Ответ на: комментарий от Stanson

Олсо, если до усрачки хочется SoC - есть UltraSPARC T2. Там даже сеть запихана в процессор зачем-то. И видюхи нет, переустановка OS - онли по serial console.

svr4
()
Ответ на: комментарий от svr4

Северный мост уже 6 лет как переехал в процессор, у тебя криокамера протекла.

Да и хер с ним, есть всякая левая многоногая (многошариковая?) ботва вокруг процев которая тоже весьма ощутимо греется. Я даже разбираться не хочу, что это за мост и какого хера вообще до сих пор существует такая срань как «чипсет».

Южный занимается малозначимой хуитой уровня встроенного SATA контроллера, звука (на серверной мамке его и нет) и т.п.

Да пофиг чем он занимается, главное греется, а значит жрёт лишнее электричество.

Видюха (в 90% случаев Matrox G200) жрёт чуть менее чем ничего, да и тоже большей частью не задействована.

Ну это да, видюха на сервере чисто чтоб в бивисе полазать при первом включении. Было бы совсем странно, если б ещё и видюха печку изображала.

В любом случае оно жрёт и греется. Одних кондеев на пару-тройку десятков кВт тепловой мощности стоит, и они даже сейчас, в холода молотят.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

греется

Ну у меня в десктопе на южном мосту радиатор вида «цельный кусок люменя толщиной пол-сантиметра» на терможувачке.

Пальцем трогаешь - холодный, датчик тоже показывает аж целых 35 градусов. Это при том, что там толстенный техпроцесс, 0.65 по-моему.

Короче, нихрена он не жрёт.

svr4
()
Ответ на: комментарий от svr4

Вместо 16 недосерваков проще иметь 16 виртуалок - суммарно электричества жрать будут меньше.

Вот только прерывания от сетевух будут обрабатывать всё те же несколько процев, и в память лазать они будут по одной шине.

Ну и 16 виртуалок как бы будут жрать чуть больше, чем то же самое но запущенное на 16 ядрах.

Так что лучше 16 недосерваков, каждый со своей памятью и со своими сетевухами.

Ну и для совсем больших дядь есть IBM System Z. Правда это явно не твой случай.

Да ну нафиг, это ж монстер.

Олсо, если до усрачки хочется SoC - есть UltraSPARC T2. Там даже сеть запихана в процессор зачем-то.

Это очень круто, кстати, и там оно не просто засунуто, но и фабрика небольшая есть, и сеть там 10Gb, причём в двух экземплярах. Вот только оно давно discontinued и даже б/у стоит весьма прилично. На Нетру давно ещё облизывались.

Stanson ★★★★★
()
Ответ на: комментарий от svr4

Видимо в двух-четырёхксеоновых серваках оно что-то ещё делает.

Кстати, у меня дома в древнючем ProLiant DL140 G1 2004 года выпуска оно тоже не греется, даже если ядро на обоих ксеонах компилять. А в новых греется.

Stanson ★★★★★
()
Ответ на: комментарий от svr4

Внешне CISC, внутренне RISC. То же, к слову, пытался сделать Линупс Штольман в трансмете, но не осилил, потому что для этого скиллов надо чуть побольше, чем скопировать Minix на коленке.

Они же даже продавались, - ноуты например на базе трансметы. Т.е. сделали таки. А вот что коммерческого успеха не возымели - другой вопрос.

qrck ★★
()
Ответ на: комментарий от svr4

Я не про secureboot, а про разные микропрограммки (кроме cpu microcode) от производителя, без кототых проц не стартует. К примеру IME интела и PSP в apu от amd.

nighthawk
()
Ответ на: комментарий от Ford_Focus

Ну, если сравнивать с Core i3, то скорее с Core i3 6100 или следующим поколением, когда оно появится. Тут то речь идёт о ещё не вышедшем проце. Разница между 2100 и 6100, если верить http://cpuboss.com/cpus/Intel-Core-i3-6100T-vs-Intel-Core-i3-2100T в производительности на Ватт те самые два раза.

Если сравнивать с тем серверным атомом(INTEL ATOM C2750), который упоминался выше, то там аналогичная разница (http://cpuboss.com/cpus/Intel-Core-i3-2100T-vs-Intel-Atom-C2750). Атом вышел в 2013-ом году и в этом году будет обновлён. Понятно, что новый арм будет вполне неплох, но какого-то фундаментального прорыва в производительности на Ватт пока не просматривается, что ставит под вопрос всю затею с серверным армом.

YesSSS ★★★
()
Ответ на: комментарий от Stanson

у арма как минимум в 2 раза меньше площадь кристалла.

У арма не та производительность. Надо сравнивать равные вещи. Почему ты сравниваешь самые быстрые процессоры на планете с процессорами для мобильных телефонов? Естественно, для мобильников кристалл будет меньше, при меньшей же производительности.

Вот тебе другой пример: https://en.wikipedia.org/wiki/Apple_A9X . Это 165mm^2, техпроцесс 14/16nm. Усё, нету больше никакого отстования по техпроцессу. Вон, на оверах недавно пролетало что TSMC строит планы аж до 5nm и собирается отнять хлеб у самсунга.

А вот как выглядят площади кристаллов: http://www.techpowerup.com/img/15-08-18/77a.jpg http://blogs-images.forbes.com/brookecrothers/files/2015/11/a9x-die-chipworks...

Да, арм пока меньше, но и тормознее. И каждый последующий прирост даётся всё тяжелее. И, повторюсь, я считаю им это не нужно. Самый большой рынок это мобильники (миллиард устройств в год делают?), потом немного планшетов. Ноуты и сервера не в приоритете, поэтому откуда взяться конкуренции? Поэтому даже если у них уже есть возможность выпускать конкурентные чипы они этого не делают. Им сейчас важнее видеоядро качать :)

Вряд-ли ARM будет для каждого процессора с нуля переписывать весь Verilog.

Уверен 100%, делает. Лень писать, между cortex-m и современными a-XX пропасть. Посмотри на отличия даже между a-7 и a-53. Что уж говорить про различия между микроконтроллером и процессором. Ты понимаешь что ты сравниваешь техпроцессы 14nm и 90nm+?

true_admin ★★★★★
() автор топика
Ответ на: комментарий от true_admin

У арма не та производительность. Надо сравнивать равные вещи. Почему ты сравниваешь самые быстрые процессоры на планете с процессорами для мобильных телефонов?

Потому что мир вовсе не вокруг производительности крутится.

Естественно, для мобильников кристалл будет меньше, при меньшей же производительности.

Кристалл меньше потому что арм на порядок проще x86. И производительность тут никаким боком.

Вот тебе другой пример: https://en.wikipedia.org/wiki/Apple_A9X . Это 165mm^2, техпроцесс 14/16nm. Усё, нету больше никакого отстования по техпроцессу

Замечательно. Только на этом кристалле система целиком, и большую часть занимает GPU. И подобных SoC на x86 вообще нету никаких. Либо процессор с GPU но без периферии, либо процессор с периферией но без GPU. А с ARM'ами на один кристалл не только всю периферию и GPU запихивают, но и на всякие VPU, FPGA и пр. место остаётся. И с теплоотводом проблем нету.

Уверен 100%, делает. Лень писать, между cortex-m и современными a-XX пропасть.

Откуда там пропасть? Набор регистров одинаков, pipelining и там и там есть, ALU одинаковые. Да, для 64 битных это всё расширили до 64 бит, но это опять же не требует создания архитектуры с нуля.

Посмотри на отличия даже между a-7 и a-53.

Ну замечательно же. Отличная архитектура позволяющая делать как ultra low-power однокристалки по полдоллара за штуку, так и мощные многоядерные SoC. x86 до такой масштабируемости ещё срать и срать.

Что уж говорить про различия между микроконтроллером и процессором.

И какие между ними различия? Миркоконтроллер - это всего лишь процессор к которому на кристалл добавлена периферия и пр. барахло. Что, кстати, в случае ARM и MIPS делается легко и непринуждённо, а для x86 так до сих пор ничего стоящего никто сваять не смог.

Ты понимаешь что ты сравниваешь техпроцессы 14nm и 90nm+?

А какая разница? В любом случае x86 будет жрать больше чем ARM, независимо от того, по какой технологии они произведены, если технология одинакова.

Stanson ★★★★★
()
Последнее исправление: Stanson (всего исправлений: 1)
Ответ на: комментарий от Stanson

А какая разница? В любом случае x86 будет жрать больше чем ARM, независимо от того, по какой технологии они произведены, если технология одинакова.

За счёт чего? По отношению к ARM - в x86 дополнительно только жрёт блок, транслирующий код x86 в RISC. Но это же маленький блок, я даже не уверен что он хотябы 1 Ватт потребляет при текущем процессе.

Зато, код x86 гораздо более компактный по сравнению с любым кодом RISC (на сегодняшний момент). Значит, при прочих равных, больше интструкций попадёт в кэш, отсюда получаем большую энергоэффективность.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

За счёт чего? По отношению к ARM - в x86 дополнительно только жрёт блок, транслирующий код x86 в RISC. Но это же маленький блок, я даже не уверен что он хотябы 1 Ватт потребляет при текущем процессе.

Во-первых, нет никакого RISC внутри x86. Все целочисленные команды и ветвления hardwired чуть ли не со времён Pentium III. Это в любом исследовании касательно microcode reverse engineering написано. Во-вторых, микрокод работает только для FPU и SIMD инструкций, так что «транслятор» может вообще не работать при определённых условиях. По отношению к ARM в x86 дополнительно жрут вообще все элементы CPU, потому что все они в несколько раз сложнее чем в ARM.

Зато, код x86 гораздо более компактный по сравнению с любым кодом RISC (на сегодняшний момент). Значит, при прочих равных, больше интструкций попадёт в кэш, отсюда получаем большую энергоэффективность.

Это решается размером кэша например. Да и взаимосвязь компактности кода и кэша - штука относительная. Например, в популярных RISC любая команда может быть условной, что достаточно часто приводит к отсутствию в коде ветвлений, которые, в свою очередь сильно напрягают как кэш, так и всякое предсказание ветвлений.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Во-первых, нет никакого RISC внутри x86.

Intel не согласится. Начиная с Pentium Pro, «Micro-ops Fusion of certain sub-instructions mediated by decoding units. x86 commands can result into fewer RISC micro operations and thus require less processor cycles to complete».

Все целочисленные команды и ветвления hardwired чуть ли не со времён Pentium III.

Ну так, одно не противоречит другому. К тому же, hardwiring - это обычно максимально эффективный способ делать конкретную задачу.

Это в любом исследовании касательно microcode reverse engineering написано.

Например?

Зато, код x86 гораздо более компактный по сравнению с любым кодом RISC (на сегодняшний момент). Значит, при прочих равных, больше интструкций попадёт в кэш, отсюда получаем большую энергоэффективность.

Это решается размером кэша например.

Т.е. увеличением числа транзисторов, которые жрут.

Например, в популярных RISC любая команда может быть условной, что достаточно часто приводит к отсутствию в коде ветвлений

Это есть и в x86_64: http://www.tptp.cc/mirrors/siyobik.info/instruction/CMOVcc.html

Пойми меня правильно, я не считаю процессоры Intel идеальными (лично мне, куда приятнее писать на ассемблере SPARC), но я не вижу им альтернативы. У OpenPOWER все шансы оказаться там же, где OpenSPARC, а ARM отстаёт существенно.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

Intel не согласится. Начиная с Pentium Pro, «Micro-ops Fusion of certain sub-instructions mediated by decoding units. x86 commands can result into fewer RISC micro operations and thus require less processor cycles to complete».

Can != should

Например?

google it.

Типа http://www.agner.org/optimize/microarchitecture.pdf

Там найдёшь всякого типа:

Instructions that generate more than 4 μops use microcode ROM and take multiple clock cycles to decode.

В общем, микрокод используется только для инструкций которые генерируют больше 4 микроопераций начиная с Core2.

Это есть и в x86_64

Это лишь одна дополнительная команда, а не весь набор инструкций.

ARM отстаёт существенно.

Отстаёт в чём? В абсолютной скорости? Да, отстаёт. А вот по энергоэффективности и стоимости отстаёт интель.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Только на этом кристалле система целиком, и большую часть занимает GPU. И подобных SoC на x86 вообще нету никаких. Либо процессор с GPU

но без периферии, либо процессор с периферией но без GPU.

USB канает за перефирию?

http://ark.intel.com/products/85474/Intel-Atom-x5-Z8500-Processor-2M-Cache-up...

alt-x ★★★★★
()
Ответ на: комментарий от Stanson

А вот по энергоэффективности и стоимости отстаёт интель.

На каких тестах? А то опять же тут

http://ark.intel.com/products/85474/Intel-Atom-x5-Z8500-Processor-2M-Cache-up...

SoC на каких-то (предположим, что удобных Интелу) тестах потребляет аж целых 2 Ватта.

alt-x ★★★★★
()
Ответ на: комментарий от Stanson

нет никакого RISC внутри x86

Intel не согласится. Начиная с Pentium Pro, «Micro-ops Fusion of certain sub-instructions mediated by decoding units. x86 commands can result into fewer RISC micro operations and thus require less processor cycles to complete».

Can != should

Тут важно, не can или should. Тут важно RISC.

alt-x ★★★★★
()
Ответ на: комментарий от alt-x

USB канает за перефирию?

Как-то не очень. Сеть, SATA, всякие интерфейсы к камерам и LCD, и всё это сразу, включаяя и USB - оно как-то посерьёзнее будет.

SoC на каких-то (предположим, что удобных Интелу) тестах потребляет аж целых 2 Ватта.

Это очень дохера. Я хотел бы посмотреть на x86 SoC (полноценный, а не обрубок) который потребляет 0.2 Ватта.

Тут важно, не can или should. Тут важно RISC.

Ну ты хоть понимаешь, что RISC в понятии маркетолухов интеля - это всего лишь баззворд для развода лохов? Микрооперации CPU считать командами некоего RISC-процессора - это надо очень специфический мозг иметь. Так и 80386 тоже можно в RISC записать, и какой-нибудь 68000. Ты не поверишь, там тоже есть микрооперации, но оно от этого не становится RISC ни разу.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Я хотел бы посмотреть на x86 SoC (полноценный, а не обрубок) который потребляет 0.2 Ватта.

А покажи ARM SoC с «сетью, SATA, всякими интерфейсами к камерам и LCD, и всё это сразу, включая и USB», который потреблял бы 0.2 Вт.

tailgunner ★★★★★
()
Ответ на: комментарий от Stanson

Посмотри всякие OMAP'ы, TI Sitara, ARxxx, Marvel

О, Ситарочка... если верить TI, там на чисто процессорных тестах до 1.1 Вт (http://processors.wiki.ti.com/index.php/AM335x_Power_Consumption_Summary); подозреваю, что если подключить обмен по сети, потребление сильно возрастет.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

О, Ситарочка... если верить TI, там на чисто процессорных тестах до 1.1 Вт

Кстати, очень даже ничего циферки, для Cortex-A8. У Allwinner A10 даже хуже.

подозреваю, что если подключить обмен по сети, потребление сильно возрастет.

Вряд ли сильно. Да и то, заметно будет, если гигабит полностью забить. Ethernet не особо жручая хрень.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

О, Ситарочка... если верить TI, там на чисто процессорных тестах до 1.1 Вт

Кстати, очень даже ничего циферки, для Cortex-A8

Но это отнюдь не 0.2 Вт, а проц там медленнее Атома и кэша меньше. Наверное, он всё равно выиграет по удельной энергоемкости, но вряд ли даже в разы.

Ethernet не особо жручая хрень.

Ну, курочка же по зернышку... вот USB Bonnie дает 0.5-0.7Вт.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Но это отнюдь не 0.2 Вт, а проц там медленнее Атома и кэша меньше. Наверное, он всё равно выиграет по удельной энергоемкости, но вряд ли даже в разы.

Ну может Sitara не сильно удачный пример low-power, но тем не менее 1.1Вт с дристоуном на полном форсаже всё равно почти в 2 раза меньше Атома. Это не считая что SDP (да в общем-то и TDP тоже) - это такой сферический конь в вакууме, особенно учитывая нынешнюю моду на всякий Burst.

Ну, курочка же по зернышку... вот USB Bonnie дает 0.5-0.7Вт.

Оно не сильно отличается от OS Idle.

Stanson ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.