LINUX.ORG.RU
ФорумTalks

Процессор Huawei обогнал топовый чип Intel

 ,


0

1

https://www.tomshardware.com/news/huaweis-24-core-7nm-kunpeng-920-cpu-allegedly-outmatches-core-i9-9900k-in-multi-core-performance

ARM-процессор компании Huawei сумел обойти по производительности один из топовых процессоров Intel – Core i9-9900K.

Kunpeng 920 3211K имеет 24 вычислительных ядра с пиковой тактовой частотой 2,6 ГГц. CPU построен на базе архитектуры ARM Neoverse N1, также известной под названием Ares. Чип выпускался по 7-нанометровой технологии на мощностях тайваньской компании TSMC.

3211K – это один из младших представителей линейки Hi1620 или Kunpeng 920. В нее входят процессоры с количеством ядер от 24 до 64 и частотой от 2,4 до 3 ГГц. Каждый чип располагает по 512 КБ кэша второго уровня на каждое ядро, а объем кэш-памяти третьего уровня варьируется от 24 до 64 МБ и зависит от конкретной модели.

В процессорах есть восьмиканальный интерфейс DDR4-3200, 40 линий PCIe 4.0 и два контроллера 100 GbE. В зависимости от числа ядер и их тактовой частоты уровень TDP процессоров составляет от 100 до 200 Вт.

Huawei готовит к выпуску настольный компьютер Pangu для китайского рынка, построенный на чипе Kunpeng 920 3211K.


Ответ на: комментарий от no-such-file

«от 24 до 64» ядер это скорее для сервера. Чо б с зеоном тогда не сравнить?

Потому что сейчас таки есть десктопные чипы с 24-64 ядрами. Тот же Threadripper.

Хотя наличие 100GbE намекает, что это скорее чип для магистральных роутеров или какого-нибудь дикого NAS.

hateyoufeel ★★★★★
()
Ответ на: комментарий от lenin386

ну тобишь свое видео монтировать они не могут, музыку писать не могут, компилять им ленин запретил, моделить им боженька не разрешает. Я тебя правильно понял?

Morin ★★★★★
()
Ответ на: комментарий от lenin386

Ты почему-то начал рассказывать, что многозадачность невозможна, если процессов больше чем ядер. Понятное дело, что в таком случае работает вытесняющая многозадачность, но это не значит, что система не способна задействовать оба ядра. А если система задействовала оба ядра, то в каждый момент времени у тебя будет одновременно выполнятся две программы, просто с течением времени шедулер будет их переключать.

anti_win ★★
()
Ответ на: комментарий от anti_win

но это не значит, что система не способна задействовать оба ядра.

Я такого никогда не говорил. Это придумали вы. Я говорил про то, что все ваши 896 мелких потоков на деле схлопнутся на одно ядро ! Благодаря алгоритмам вытесняющей многозадачности.

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 2)
Ответ на: комментарий от lenin386

Могу. Но они же всё равно будут прерываться

Так это, блин, и ежу понятно. Но это уже многозадачность. И это значительно быстрее, чем на одном ядре. Как тебе еще объяснить?

anti_win ★★
()
Ответ на: комментарий от anti_win

И это значительно быстрее, чем на одном ядре.

Вот это не очевидно. Если у тебя два жирных, грузящих камень на 100% потоков - да, будет быстрее. Но где на десктопе такое встречается ?

lenin386 ★★★★
()
Ответ на: комментарий от Morin

ну тобишь свое видео монтировать они не могут,

Нет.

музыку писать не могут,

Для этого больше 1 ядра не надо.

компилять им ленин запретил

Запретил.

моделить им б-женька не разрешает.

Не нужно.

lenin386 ★★★★
()
Ответ на: комментарий от lenin386

а ну раз ленин сказал тогда ладно, пойду себе и знакомым винты почищу, скажу ленин с лора так велел, идите палкой копалкой яму на мамонта ройте

зы: забана бы тебе, за толстоту, уже моник в жире утонул, что не твой комент, то ведерко подставлять надо

Morin ★★★★★
()
Ответ на: комментарий от lenin386

Вот это не очевидно. Если у тебя два жирных, грузящих камень на 100% потоков - да, будет быстрее. Но где на десктопе такое встречается ?

Не надо так толсто. В любом случае быстрее. Особенно, на камне без гипертреадинга. И на десктопе такое возможно — запусти компиляцию ядра и посмотри.

anti_win ★★
()
Ответ на: комментарий от anti_win

запусти компиляцию ядра

Зачем мне на десктопе запускать компиляцию ядра ? зачем мне её вообще запускать ? Я вендузятник. А мож мне ещё HTTP сервер поднять или SQL ?

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 2)
Ответ на: комментарий от gremlin_the_red

А у i9 — 95Вт.

У 9900K PL1 = 95 Вт, а вот PL2 = 210 Вт, потому у него такие буст частоты.

numas13
()
Ответ на: комментарий от lenin386

Зачем мне на десктопе запускать компиляцию ядра ? зачем мне её вообще запускать ? Я вендузятник

Пикассо забыл пропускной билет, его не пускают на всемирную выставку в Париже:

— Докажите, что вы — Пикассо

Тот одним взмахом рисует голубя мира, его пускают.

Фурцева тоже забыла свой билет:

— Я же министр культуры СССР!

— Докажите. Вот, Пикассо забыл свой билет, но смог подтвердить свою личность.

— А кто такой Пикассо?

— Все в порядке, госпожа министр культуры СССР, проходите.

anti_win ★★
()
Ответ на: комментарий от anti_win

Я вам могу на это только одно сказать, товарищ Пикассо : удачных покупок. Только для себя эти изделия покупайте, и сами мучайтесь тормозами, а не людей, которых вы ненавидите, заставляйте на этом сидеть.

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 2)
Ответ на: комментарий от lenin386

Сколько поциентов развелось! Так успокоительного на всех не напасешься!

anti_win ★★
()
Последнее исправление: anti_win (всего исправлений: 1)
Ответ на: комментарий от no-such-file

Но с ним почему-то не сравнили. Совпадение?

Маркетинг. Впрочем, я бы хотел увидеть цену на чипы от Huawei. Но да, пока что они больше на Threadripper похожи, в том числе по TDP.

hateyoufeel ★★★★★
()
Ответ на: комментарий от anti_win

ну я думал вместо привычного дистра x86_64, придется какой нибудь arm дистр использовать - только и всего, а все остальное будет совершенно одинаковым, но с самого начала все пошло не так, что очень расстроило меня и отбило всю охоту использовать в дальнейшем подобные процессоры… это не значит что они плохие - просто мне не понравилось… как сыр - ты любишь сыр? я ненавижу! молоко, кефир, простоквашу и прочее - пью, сметану и творог - хаваю, а сыр даже запаха не переношу - любой фу гадость…

amd_amd ★★★★★
()
Последнее исправление: amd_amd (всего исправлений: 1)
Ответ на: комментарий от numas13

Ну если собрать 100500 ардуинок, то тоже наверно можно суммарную производительность больше, чем у интела получить

cvs-255 ★★★★★
()

Это всё, конечно, хорошо, но сколько он в Blender benchmark выдаёт?

MageasteR ★★★★★
()
Ответ на: комментарий от next_time

Потребителю не важно сколько ядер.

Ага, да. Конечно. Оно Курочке Рябе важно. Это для неё рекламу про два ядра, два гига снимают.

lenin386 ★★★★
()
Последнее исправление: lenin386 (всего исправлений: 3)
Ответ на: комментарий от lenin386

8 потоков на unreal engine, 4 потока на стримминг видео - вот уже в типичной хомячковой задаче набежало 12 потоков

next_time ★★★★★
()
Ответ на: комментарий от lenin386

Совершенно верно. Количество ядер - оно лишь мерило возможной производительности. А то так-то, формально, в GPU больше ядер, чем в любом цпу, но рекламу об этом почему-то не снимают

next_time ★★★★★
()
Ответ на: комментарий от RazrFalcon

пишу с Orange pi4 с гентушного десктопа, что готов. Помоимо в либреофисе редактирую текст, слушаю(и вполглаза смотрю) ролик с ютуба в mpv. Чего ещё надо?

burato ★★★★★
()
Ответ на: комментарий от burato

Чего ещё надо?

Ага, сначала нужно забить лор кучей тем о том, что ничего не собирается, а потом радоваться.

Ну и проблема ARM в SIMD. У них есть NEON, кое-где, но до SSE/AVX им далеко, насколько я знаю. А без этого нормальной производительность нет и не будет.

RazrFalcon ★★★★★
()

Простите, а это вообще технологически возможно? Как я понимаю, в каких-то конретных тестах RISK(ARM) - могут выиграть у Intel (CISC), но в широком смысле всегда будут отставать. Это какой-то дико частный случай, скорее всего.

/по ссылкам не ходил, не читал/

Gonzo ★★★★★
()
Ответ на: комментарий от token_polyak

Амазон утверждает, что их новые армы по производительности на ватт уделывают x86 в разы. И тесты с ними, в принципе, согласны.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от RazrFalcon

Тебя от скорости на куски порвёт в итоге))

burato ★★★★★
()
Ответ на: комментарий от lenin386

ДА ! Но только в случае, если количество потоков в системе <= количества ядер

Нет, это утверждение некорректно. Каждое современное ядро может держать больше чем один поток одновременно, распределяя задачи на разные АЛУ. Таким образом от ОС не требуется переключение контекста. Для ОС это отдельные ядра, неотличимые от настоящих. Это называется SMT. В современных процессорах величина параллельности держится от SMT2 (Intel/AMD) до SMT8 (Power). Бывает впрочем и больше, но это экзотика.

Другой вопрос, что не всех АЛУ по 8 в SMT8 (вообще их может быть как меньше 8, так и больше) и если несколько потоков хотят конкретную АЛУ, то приходится ждать. Поэтому и общая производительность никогда не кратна числу SMT, а выражается сложной функцией в зависимости от типа задач.

zloelamo ★★★★
()
Ответ на: комментарий от RazrFalcon

https://sun9-3.userapi.com/cfm_InYXNv0q_MGcD9O4bSaOZBX-RaF6gjjxIA/oAMD5oX7NwA...

И при всём этом десктоп довольно откликабельный! Там ещё ворд либреофис открыт и я переодически пописываю в документ.

burato ★★★★★
()
Последнее исправление: burato (всего исправлений: 1)
Ответ на: комментарий от Gonzo

с прошки в интелах под капотом тоже risc, только его сверху обмазали cisc вазелином, ибо легаси, ибо вменяемых программистов было мало, чтоб так быстро все переписать. Да так и оставили это все по сей день, кривое и убогое, за что вменяемые люди мечтают выдать интелю хорошего пеньделя.

В хорошем смысле risc это не усеченный набор команд, он может быть по боле чем у иного cisc, а исполнение за один такт

Morin ★★★★★
()
Ответ на: комментарий от Morin

В хорошем смысле risc это не усеченный набор команд, он может быть по боле чем у иного cisc, а исполнение за один такт

Все старые риски выполняли команды за несколько тактов. Всё ровно наоборот — это из-за усечённого набора команд, включающего в себя наиболее простые действия, и из-за load-store архитетуры (из-за которой все операции в ALU выполняются только над регистрами), команды выполняются максимально быстро.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от gremlin_the_red

сколько лет я прожил зря :) а может посмотрим старые и новые проци с RISC? перестанем упарываться аппаратными трансляторами и осознаем в чем отличие?

ну уокей, давай чтоб не вносить сумятицу заменим такт на цикл, так будет правильней

Morin ★★★★★
()
Последнее исправление: Morin (всего исправлений: 1)
Ответ на: комментарий от Morin

а исполнение за один такт

Это не реально. Конечно раньше такие попытки были, но сделать в один такт умножение и деление невозможно. Да и доступ к памяти занимает много тактов.

zloelamo ★★★★
()
Ответ на: комментарий от zloelamo

я уже поправил себя :) читай чуть выше

ключевое - многие команды cisc исполняются за много циклов, так как требуют дополнительного обращения к памяти

Morin ★★★★★
()
Ответ на: комментарий от zloelamo

хм, а вообще смотри в сторону dsp, кстати вполне применяется, часть задач по умножению можно решить комбинаторикой

Morin ★★★★★
()
Ответ на: комментарий от zloelamo

Это не реально

Нереально выполнить команду за такт, но вполне реально выполнять по команде за такт. Для этого и была придумана такая штука, как конвейер. Пока не будет ошибки предсказателя перехода, команды будут как бы выполняться за такт. Ошибка предсказателя, конечно, тут сильно испортит картину, потому что весь конвейер надо будет очищать и заполнять заново.

gremlin_the_red ★★★★★
()
Ответ на: комментарий от lenin386

Потому что на десктопе более 2ух ядер не нужно нафег.

Бред собачий.

dimgel ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.