LINUX.ORG.RU
ФорумTalks

Процессор Huawei обогнал топовый чип Intel

 ,


0

1

https://www.tomshardware.com/news/huaweis-24-core-7nm-kunpeng-920-cpu-allegedly-outmatches-core-i9-9900k-in-multi-core-performance

ARM-процессор компании Huawei сумел обойти по производительности один из топовых процессоров Intel – Core i9-9900K.

Kunpeng 920 3211K имеет 24 вычислительных ядра с пиковой тактовой частотой 2,6 ГГц. CPU построен на базе архитектуры ARM Neoverse N1, также известной под названием Ares. Чип выпускался по 7-нанометровой технологии на мощностях тайваньской компании TSMC.

3211K – это один из младших представителей линейки Hi1620 или Kunpeng 920. В нее входят процессоры с количеством ядер от 24 до 64 и частотой от 2,4 до 3 ГГц. Каждый чип располагает по 512 КБ кэша второго уровня на каждое ядро, а объем кэш-памяти третьего уровня варьируется от 24 до 64 МБ и зависит от конкретной модели.

В процессорах есть восьмиканальный интерфейс DDR4-3200, 40 линий PCIe 4.0 и два контроллера 100 GbE. В зависимости от числа ядер и их тактовой частоты уровень TDP процессоров составляет от 100 до 200 Вт.

Huawei готовит к выпуску настольный компьютер Pangu для китайского рынка, построенный на чипе Kunpeng 920 3211K.


Ответ на: комментарий от anti_win

. И это значительно быстрее, чем на одном ядре. Как тебе еще объяснить?

Ответь пож-та на один вопрос, что будет быстрее: 5GHz проц с одним ядром или проц с 6 ядрами, но по 800Mhz, при условии равной производительности ядер на 1MHz.

vasya_pupkin ★★★★★
()
Ответ на: комментарий от gremlin_the_red

Ну да идея понятна, но несколько тяжелых многотактных операций подряд сожрут весь конвеир. Тут слишком много статистики и усреднений.

zloelamo ★★★★
()
Ответ на: комментарий от Landgraf

Скорее всего и arm-лицензию отберут.

Ну будут тогда пиратские процессоры. Думаю после всего хуавею уже насрать.

praseodim ★★★★★
()

24 вычислительных ядра обогнали..сколько там 8?
а по ипц что?

darkenshvein ★★★★★
()

не, если по амд сумеют приблизиться и по демократ. цене, то я подумаю, почему бы и нет

darkenshvein ★★★★★
()

Ну чо, Китай будет новым мировым жандармом? Хоть бы Сибирь не отжали)

goingUp ★★★★★
()
Ответ на: комментарий от vasya_pupkin

Ответь пож-та на один вопрос, что будет быстрее: 5GHz проц с одним ядром или проц с 6 ядрами, но по 800Mhz, при условии равной производительности ядер на 1MHz.

при условии что скорость работы ядра памяти - несколько сот мгц, разница сколько процессор будет ждать эту память при активной работе с памятью запросто может сожрать всё преимущество в жигагерцах.

ясно только одно, если запустить тест уровня i++ в одномпоточном режиме, победит более жижагерцовый.

n_play
()
Ответ на: комментарий от Morin

Ну да, схемы бывают разные, но они так или иначе упираются в то, что мы размениваем время (такты), на количество элементов. От банального увеличения разрядности сумматоров, до всяких хитрых схем, гарантирующих работу за log n. Ну и я не слышал чтобы кто-нибудь делал умножение за такт. Вообще не очень правильно помню возможно ли это теоретически, ну кроме очевидного хранения всей таблицы умножения в схеме.

zloelamo ★★★★
()
Ответ на: комментарий от vasya_pupkin

Прелесть многоядерности в том, что имея несколько ядер ты можешь продолжать считать, пока один процесс/поток ожидает ввод/вывод. В целом, будет гораздо меньше простоев. Плюс, хорошо параллелящиеся задачи будут быстрее на шестиядерном процессоре. Общая производительность, как я думаю, все же будет выше у шестиядерного. При меньшем потреблении энергии.

anti_win ★★
()
Ответ на: комментарий от vasya_pupkin

Допустим, ты работаешь в блендере. У тебя идет симуляция жидкости. И тут ты захотел наложить текстуру на модель из другой сцены. Ты открываешь диалог выбора файла. Одноядерный процессор вынужден будет переключится на новый поток (а если у него нет гипертрейдинга — переключение займет достаточно много тактов) и ждать, пока ты выберешь текстуру, котороя считывается с диска не моментально (с точки зрения процессора). В то время, как 6 ядерный процессор просто перебросит одно ядро на поток диалога выбора файлов, а остальные пять ядер будут считать симуляцию. В реальности у тебя будет гораздо больше процессов, но это уточнение будет в пользу, опять же, шестиядерного процессора, а не одноядерного.

anti_win ★★
()

А результаты тестов где? Какой-то рекламный высер для привлечения внимания.

Tigger ★★★★★
()
Ответ на: комментарий от Morin

а исполнение за один такт

у армов разве деление и умножение за один такт выполняются? особенно флоатов? тогда это не risc по этому определению

next_time ★★★★★
()
Ответ на: комментарий от gremlin_the_red

load-store архитетуры (из-за которой все операции в ALU выполняются только над регистрами)

у интела с рождения такая архитектура, вообще по-другому сделать можно, но непросто, 90% исполняемых инструкций так или иначе будут только с регистрами работать

next_time ★★★★★
()
Ответ на: комментарий от Morin

В армы целая Java-машина встроена (Jazelle). Т.е. это почти что сферический CISC в вакууме. Другое дело, что есть arm-ы помельче, те ещё можно RISC называть.

next_time ★★★★★
()
Ответ на: комментарий от anti_win

Так это, блин, и ежу понятно. Но это уже многозадачность. И это значительно быстрее, чем на одном ядре. Как тебе еще объяснить?

А вот и не угадали. Вполне реальный пример на который я наткнулся год назад. Вводные. Ребята запилили некий сайт, для достаточно узкой аудитории, но в пики востребованности активно посещаемый. Работало все это дело на VDS-ки с одним ведром, c частотой 3400MHz. Работало успешно лет восемь. Теперь потребовалось перенести эту фигню на другую VDS где уже два ведра, но с частотами 2100MHz. И фигак мы получаем таймауты при открытии страниц. Итого. От того, что ведер стало больше но медленней каждое, скорость обработки уменьшилась.

anc ★★★★★
()
Ответ на: комментарий от Lzzz

Без пруфов, описания методики тестирования и, видимо, проверяли на их китайском болдженосе, который не известно вообще как скомпилирован был под интел.

WitcherGeralt ★★
()
Ответ на: комментарий от lenin386

Мало того, что виндузятник, так ещё и бестолковый. Даже в маздае есть приоритет и привязка к ядру.

WitcherGeralt ★★
()
Ответ на: комментарий от amd_amd

Что конкретно было «не одинаковым»?

У меня противоположные впечатления от Nvidia Jetson tx2. Я вообще без проблем мог бы на нём работать.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от RazrFalcon

Готов. Дефолтная Убунта с Хромиумом покрывают, наверное, 90% потребностей сферического пользователя, а это под армом прекрасно работает.

WitcherGeralt ★★
()
Ответ на: комментарий от WitcherGeralt

А есть разница? Декстоп используют или для работы или для игр. Других предназначений не осталось.

RazrFalcon ★★★★★
()

Ну Интел, компанию делающие отсталые процессоры, обогнать не мудрено. Пусть АМД попробуют обогнать, тогда посмотрим :)

bonta ★★★★★
()
Ответ на: комментарий от bonta

Вы стоите друг дуга, одному больше двух ядер не нужно, а у второго Интел отсталый.

WitcherGeralt ★★
()
Ответ на: комментарий от anc

Во-первых, с какого процессора и на какой вы перенесли. Во-вторых, возможно, сайт надо было переписать для более эффективного использования ядер. Не все так однозначно.

anti_win ★★
()
Ответ на: комментарий от next_time

Да в принципе посрать, что туда наворотили, смотрите шире, в армах прослоек меньше чем в интеле, в перспективе это куда проще для конечного погромиста. Да не забываем что у интеля много лет сраный гибрид, да да лвл1 кэш это уже гарвард блин, про транслятор в risc уже говорил выше.

ну так почему же выкидывание ненужных в принципе сущностей должно затормозить архитектуру, если под капотом у вашего идола все тоже самое.

Morin ★★★★★
()
Ответ на: комментарий от Morin

в армах прослоек меньше чем в интеле

каких именно?

у интеля много лет сраный гибрид

arm тоже давно гибрид

ну так почему же выкидывание ненужных в принципе сущностей должно затормозить архитектуру, если под капотом у вашего идола все тоже самое.

не должно. просто x86 и arm == теорема Эскобара

next_time ★★★★★
()
Ответ на: комментарий от Morin

ИМХО, сейчас вообще нет смысла в делении на RISC и CISC. RISC позволял экономить размер кристалла из-за отсутствия кучи команд, CISC - экономить на количестве загружаемых из памяти команд.

Сейчас, из-за жирных кешей, всяких сложных штук вроде предскзателей перехода, обилия векторных наборов инструкций оба подхода становятся неактуальны.

next_time ★★★★★
()

Процессоры уже давно меряются не скоростью, а эффективностью. Тот же i9-9900K почему-то имеет энергопотребление не 300-500 Вт, хотя число ядер позволяет. Можно засунуть на кристалл еще больше ядер — смотри зеоны. К слову, «Kunpeng 920 3211K имеет 24 вычислительных ядра» — это заметно меньше, чем у i9-9900K.

byko3y ★★★★
()
Ответ на: комментарий от next_time

ИМХО, сейчас вообще нет смысла в делении на RISC и CISC. RISC позволял экономить размер кристалла из-за отсутствия кучи команд, CISC - экономить на количестве загружаемых из памяти команд

Не согласен. ARM, как типичная CISC архитектура, показала конкурентное преимущество по сравнению с RISC. Все-таки плотность команд решает. Будут ли команды транслироваться микрокодом или мимокрокодилом — это уже дело десятое. Посмотри на видеокарты — там тоже переняли моду на условное выполнение команд.

И нет, экономия на транзисторах не является ключевым фактором, потому что в итоге по мере добавления конвееров экономия куда-то пропадает. RISC с самого начала получило популярность именно благодаря перспективам суперскаляризации, с которой были проблемы у того же x86 (и не было у ARM потому, что другая ниша). Впоследствии научились суперскаляризовать x86, потом подтянулся и ARM, таким образом эти две CISC архитектуры обыграли RISC на их же поле, отбросив RISC на окраины рынка, вроде каких-нибудь дешевеньких контроллеров или SPARC с сотней потоков на процессор (поскольку там архитектура и ядра простые и дешевые) — а сетевой эффект неизбежно приводит к тому, что в конкурентной сфере более популярная архитектура вытеснит менее популярную. И в итоге оракл продает сервера на зеоне.

byko3y ★★★★
()
Ответ на: комментарий от gremlin_the_red

ну вот, пришел и все испортил (: такой анекдот был

давай добью, нет процессора АРМ, есть ядра, ну а поверх можно хоть жабо, хоть питоно машину натянуть и обозвать это cisc

Morin ★★★★★
()
Ответ на: комментарий от gremlin_the_red

ARM === Advanced RISC Machine

И?

ARM вполне CISC

ARM is clearly CISC-y: variable length instructions, instructions that read/write multiple registers (push/pop), and a variety of odd instructions in Neon (floating point), just to name a few. These complex instruction crack into a variable number of ops, which is no-no in RISC.

loads/store pair, load/store with auto increment, arithmetic/logic with shifts, vector ld/st instructions in Neon to do strided reads/writes, etc. Again, fairly CISC-y. ARM instructions encode more information than say your typical DEC Alpha instruction; it’s closer to x86 than Alpha/SPARC in that sense.

Опять же есть кеш инструкций и декодер инструкций, вполне себе признак CISC.

fsb4000 ★★★★★
()
Последнее исправление: fsb4000 (всего исправлений: 1)
Ответ на: комментарий от gremlin_the_red

ARM === Advanced RISC Machine

Нет, это чистейший CISC, с микрокодом в первой же реализации, и поголовно составными инструкциями, вариациями которых являются упрощенные случаи, ровно как и на x86.

byko3y ★★★★
()
Ответ на: комментарий от Morin

давай добью, нет процессора АРМ, есть ядра, ну а поверх можно хоть жабо, хоть питоно машину натянуть и обозвать это cisc

Ага, нет процессора x86, есть ядра, ну а поверх... ну ты понял.

byko3y ★★★★
()
Ответ на: комментарий от anti_win

Во-первых, с какого процессора и на какой вы перенесли

Уже не вспомню, но если выхлопы из /proc не врали что-то сопоставимое, даже скорее старенький постарее был.

возможно, сайт надо было переписать для более эффективного использования ядер. Не все так однозначно.

Хто ж спорит. Но сайт написан давно и переписывать его не планируют. Мне этот перенос достался в виде разовой задачи. Ну увеличил таймауты где можно было, заработало, хоть и медленнее. Заказчику пофигу а мне тем более. Мое дело кукарекнуть про данный факт было.
Однако я писал про другое, это пример когда кол-во ядер но по медленнее не дало профита, а с точностью до наоборот. И таких примеров в жизни будет чуть больше чем дофига. Далеко не весь софт паралелится на выполнение мелких операций.

anc ★★★★★
()
Ответ на: комментарий от byko3y

в том и цимес, они плюс минус одинаковые, в зависимости от того кто упаковал тот самый арм себе в чип. Но тут крики «нас не догонят»

Morin ★★★★★
()

томшхардваре пишет, что какой-то китайский сайтик пишет, что кто-то получил какой-то репорт, что какой-то китайский проц обгоняет какой-то интеловский и9 в каком-то мультитрединговом тесте. Классический ОБС.

seiken ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.