LINUX.ORG.RU
ФорумTalks

Китайский ARM обошёл китайский Intel в целочисленке

 , yitian


0

1

Продолжается экстенсивное наращивание производительности. На этот раз китайский Alibaba Cloud выпустили свой Yitian 710, 128-ядерный ARM, который берет не качеством, а количеством, обходя в целочисленном тесте серверного конкурента AMD на 15%, и интелы вроде как еще больше.

https://www.tomshardware.com/news/china-designed-128-core-cpu-takes-overall-integer-performance-lead

★★★★★
Ответ на: комментарий от apt_install_lrzsz

Пока неясно, сильно зависит от реальной производительности, потому и запросили демо юнит.

pekmop1024 ★★★★★
()

128-ядерный ARM

А потом на нем стартует питон, который может только одно ядро, и все, добрый вечер

upcFrost ★★★★★
()

Ох уж этот маркетинг.

Люди покупают компы не для целочисленных тестов.

Вот когда китайский ARM порвет китайский Intel в Крузисе, или хотя бы в 0AD на стопицот тыщ юнитах - тогда и приходите.

windows10 ★★★★★
()
Ответ на: комментарий от anonymous2

тогда мне это мешало только в играх, которые активно юзали операции с FPU. И мне очень интересно будет ли FPU иметь хоть малейшее значение при применении этих ARM-серверов не как числодробилок, а обычных серверов: воркеров k8s, http-серверов и прочем. Но да, с времён PR-факторов признаю Intel only, хотя apple M1 опять заставил меня с интересом относиться к альтернативам.

stalkerbss
()
Ответ на: комментарий от windows10

Вот когда китайский ARM порвет китайский Intel в Крузисе

этот проц для серверных применений, а не для игр и научных расчетов

seiken ★★★★★
() автор топика
Ответ на: комментарий от seiken

этот проц для серверных применений, а не для игр и научных расчетов

Чем «серверное применение» отличается от игр и научных расчетов ? Ничем.

Ну окай, select * from left join group by из таблицы в пару мильонов строк - когда сделает быстрее штеуда - тогда приходите.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

Чем «серверное применение» отличается от игр и научных расчетов ? Ничем.

Это был ответ на «когда перегонит в крайзис, приходите». Очевидно, что для раздавачи типовых вебстранички по HTTP(-S), да и ради запросов к БД - FPU не играет роли.

seiken ★★★★★
() автор топика
Ответ на: комментарий от I-Love-Microsoft

Каждый из которых будет как 1/128 штеуда. Ну такое, разве что статику раздавать

upcFrost ★★★★★
()
Ответ на: комментарий от seiken

ради запросов к БД - FPU не играет роли

В смысле ? Четверть алгоритмов MySQL построена с использованием float, а MySQL - это не только MySQL, а еще и системная реализация работы с памятью, работа с ФС и так далее.

для раздавачи типовых вебстранички по HTTP(-S)

Нужно открыть TCP-сессию, прилетевшую из Ethernet, в свою очередь обработанном через PCI (или чего хуже USB), и все это тоже требует процессорное время и рассчетов с запятой.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

не в том об’еме, как в играх

seiken ★★★★★
() автор топика
Ответ на: комментарий от sparkie

Какая разница обогнали же. Тоесть везде где что угодно кроме float/double они быстрее. Тоесть в большинстве случаев. Хотя его выигрышь в целочисленке будет нивелироваться тормозами с флоатами ибо последние понатыканы сейчас везде, даже там где не надо =).

LINUX-ORG-RU ★★★★★
()
Последнее исправление: LINUX-ORG-RU (всего исправлений: 1)
Ответ на: комментарий от sparkie

Обработку целочисленных данных гораздо проще организовать.

С другой стороны практически всё - целочисленные данные (текстовые процессоры, браузеры, телеграммы.. имя им Легион)

Достиженьице так себе, нет?

Круто на самом деле. но это ж 128 ядер против скольки? вероятно одно vs oдно ядро, арм всё таки сливает (но я не в курсе).

Но для серверов - почему нет?

Штука в том что такой многопоток ещё пойди организуй. Хотя М1 говорят рвёт интел как тузик грелку в компиляции явы по крайней мере. Так что вполне может и на десктопе вырулит когда то.

AndreyKl ★★★★★
()
Ответ на: комментарий от windows10

для раздавачи типовых вебстранички по HTTP(-S)

Нужно открыть TCP-сессию, прилетевшую из Ethernet, в свою очередь обработанном через PCI (или чего хуже USB), и все это тоже требует процессорное время и рассчетов с запятой.

Зачем float в tcp соединении? И зачем при работе с pci ?

anc ★★★★★
()
Ответ на: комментарий от LINUX-ORG-RU

Какая разница обогнали же. Тоесть везде где что угодно кроме float/double они быстрее.

F1 на родной трассе быстрее чем «лада баклажан». :) Но в условиях города на кого поставите? И так как «условия города» более распространены, чем трассы F1, что предпочтете для перемещения? :)

anc ★★★★★
()
Ответ на: комментарий от AndreyKl

Хотя М1 говорят рвёт интел как тузик грелку в компиляции явы по крайней мере. Так что вполне может и на десктопе вырулит когда то.

Жрет конечно как не в себя, но жить вроде можно... наверное... долбанистическая загрузка камня на «простых» вещах. Понял что уже привык к тому, что график загрузки цпу показывает сильно отличные от нуля проценты, на интеле это было около нуля при тех же задачах :) Нет, все-таки на интеле около нуля, при большем кол-ве задач, специально посмотрел. :)

anc ★★★★★
()
Последнее исправление: anc (всего исправлений: 1)
Ответ на: комментарий от anc

Ну эт понятно =) Но всё равно молодцы. Уж чего чего, а целочисленные вычислялки заоптимизировать надо суметь ибо они везде уже переоптимизированы до дыр в процессорах в прямом и переносном смысле гыгы. А целочисленка это не только 2+2*4-5/6+648 а вся логика, операции с указателями, может битовые операции, но я тут хз может мудрю. Круто же. А если завтра они и флотаты забустят? То всё, на стольких то ядрах можно и без видюхи в простые 3д игры играть можно будет с софтовым режимом опенгля! =)

LINUX-ORG-RU ★★★★★
()
Последнее исправление: LINUX-ORG-RU (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

То всё, на стольких то ядрах можно и без видюхи в простые 3д игры играть можно будет с софтовым режимом опенгля! =)

От неее, про игори ещё не надо пожалуйста... вообще загрузка пугает :) Оно робит конечно, но блина... вспоминаются старые времена и шутеры, когда каждую опцию подбираешь под машинку, что бы она «не чихала» :)

anc ★★★★★
()
Ответ на: комментарий от anc

вспоминаются старые времена и шутеры, когда каждую опцию подбираешь под машинку, что бы она «не чихала» :)

Ты вырос и зажралсо! Я так до сих пор делаю! Хотя ты наверное о очень старых временах, но один фиг у меня сейчас от современных инди, пиксель арт лагает, а сурс игры «бородатые» с херовой горой интерактивности сотку фпс выдают (на средних)

LINUX-ORG-RU ★★★★★
()
Последнее исправление: LINUX-ORG-RU (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

Ты вырос и зажралсо!

Нет. Я «вырос»(наверное) и не играю :) Ну почти... честно пробую, но... потом забиваю на это дело :) Опять пробую и опять забиваю :) Я блин даже SC2 честно купленный! всё ещё никак пройти не осилю... Вот вы напомнили... а играть не тянет... ну вот совсем... :)

Хотя ты наверное о очень старых временах

Естесссно о них. Знаетели, разница в видяхе 512Кб и 1Мб видомозгов была существенной :)

anc ★★★★★
()
Последнее исправление: anc (всего исправлений: 1)
Ответ на: комментарий от LINUX-ORG-RU

Какая разница обогнали же.

Я вот возьму Жыгуль копейку, вкосячу туда бумеровский движок с трансмиссией, уделаю на нём Альфа-Ромео Ждей-Ти-Ви и скажу, «какая разница, обогнал же!»

Целочисленные вычисления - это целочисленные вычисления. Не настолько круто, чтобы обозначать это за достижение.

Во времена создания ФОРТРАН-4 (ты его не застал, как я понимаю) организация вычислений каких-нибудь сложных алгоритмов матмоделирования было ещё той задачей. Потому что аппаратная реализация FPU в те времена была научно-технической задачей. Вот тогда имел смысл гордится скоростью целочисленных вычислений.

sparkie ★★★★★
()
Ответ на: комментарий от AndreyKl

С другой стороны практически всё - целочисленные данные (текстовые процессоры, браузеры, телеграммы.. имя им Легион)

Нет. За текстовый процессор не скажу, а браузеры точно содержат алгоритмы обработки данных с плавающей точкой. Иначе система просто захлебнулась бы. Да и алгоритмы браузерных движков тоже стали бы сложнее. Насколько актуально превосходство в целочисленных вычислениях, вопрос дискуссионный.

Но для серверов - почему нет?

А что сервер? Там разве настолько актуально превосходство именно в целочисленных вычислениях? Сервер, по крайней мере, должен обрабатывать запросы СУБД. А это по дефолту плавающая точка. Под сервером ты имеешь ввиду файлопомойку? Тогда да, покатит.

Короче, не знаю, не уверен. Лично под свои задачи я бы не рисковал.

sparkie ★★★★★
()
Ответ на: комментарий от anc

Зачем float в tcp соединении? И зачем при работе с pci ?

Не задавай глупых вопросов. Просто попробуй поднять большое количество соединений на каком-нибудь ARM и рядом на какой-нибудь затычке типа Селерона, сам увидишь разницу.

Я по этому поводу провел много тестов. Да, ARM говно by design, а у кукаретиков с той стороны единственным аргументом всегда было «не тот ARM ты взял».

Можно конечно делать всякие ухищрения типа 100500 тормознутых ядер и впаивать память в проц - но это банальное лечение поноса затыканием жопы, и угрёбищности ARM как архитектуры это не отменяет.

В случае конкретно с этим ЦПУ - все еще прозаичнее. Взяли один заточенный тест умеющий в многопоточность, и решили что оно готово для продакшена. Результаты будут те же что и в прошлые разы: полтора анонимуса погоняют, поймут что шлак, забросят, купят старый добрый штеуд, а об этом поделии забудут как о страшном сне.

windows10 ★★★★★
()
Ответ на: комментарий от ponchik-2

а что в 2022 еще остались адепты i386? Рвет и будет все больше рвать.

Рвать будет только конкретная реализация, и только она а не какая другая.

Когда мы говорим «M1 порвал Core i7» - это значит что x86_64 был порван конкретно M1, а не ARM'ом.

Как там приводили в пример выше, если F1 порвал Porsche, это не значит что теперь Порш будет рвать любая тачанка красного цвета с четырьмя колесами с задним расположением двигла.

Ну а новостей стиля «сервер на арм в 100500 раз круче интела» мы уже лет 10 как читаем, но в дата-центрах все по-старому =)

windows10 ★★★★★
()
Ответ на: комментарий от windows10

Не задавай глупых вопросов.

Ясно. Мне почему-то так и показалось, что ответа на мой вопрос я не получу.

anc ★★★★★
()
Ответ на: комментарий от windows10

Зачем float в tcp соединении? И зачем при работе с pci ?

А мне кстати тоже интересно, а зачем плав запятая в tcp и в pci? И в Вашем эмоциональном коментарии ответа всё-таки нет.

VIT
()
Ответ на: комментарий от VIT

А мне кстати тоже интересно, а зачем плав запятая в tcp и в pci? И в Вашем эмоциональном коментарии ответа всё-таки нет.

Сабж не про tcp и pci, а про процессор, посему дискуссии в этих рамках.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

Сабж не про tcp и pci, а про процессор, посему дискуссии в этих рамках.

Так и вопрос про то. Показан процессор с высокими характеристиками обработки целочисленных данных. Вы стали указывыать некоторые области использования процессоров, где это не важно или не нужно. Резонно возник вопрос, а почему?

VIT
()
Ответ на: комментарий от windows10

float нахер не нужен, если у тебя не графон или ии. Всякие bignumber'ы - целочисленные.

crutch_master ★★★★★
()
Ответ на: комментарий от windows10

тормознутых ядер

Ничего страшного, там обход защиты от спектра на х86 завезли, новый патч микрокота обещают, который процентов на 15 производительность порежет. Так АРМ и победит.

agentgoblin
()
Ответ на: комментарий от agentgoblin

Ничего страшного, там обход защиты от спектра на х86 завезли, новый патч микрокота обещают, который процентов на 15 производительность порежет. Так АРМ и победит.

Если в самом ARM ничего не найдут. А скорее всего найдут, потому что нет никакого «ARM», у каждого реализация со своими читами, и не факт что эти читы не подвержены уязвимостями.

Это еще просто M1 никто всерьез не занялся ))

windows10 ★★★★★
()
Ответ на: комментарий от sparkie

Достиженьице так себе, нет?

Для впсов и веба пойдет

goingUp ★★★★★
()
Ответ на: комментарий от sparkie

Сервер, по крайней мере, должен обрабатывать запросы СУБД. А это по дефолту плавающая точка.

Где именно? Хеши в основном целочисленные, индексы тоже. А посчитать сумму флоатов по колонке много FPU мощи не надо, справится.

goingUp ★★★★★
()
Ответ на: комментарий от goingUp

Где именно?

В основном в исполняемом коде, при чем повсеместно. Только в одном хранилище MyISAM (а это наверное 5% от всего MySQL-кода) 61 функция юзающая float'ы. А ведь есть еще и double. И это не ПОЛЬЗОВАТЕЛЬСКИЕ ДАННЫЕ, хеши индексы и прочая лабуда: это именно низкоуровневый код для обработки ключей, сортировки, кеширования, поиска и тд.

От того что ты присвоишь float test = 5; - test не станет обрабатываться как целочисленное. Что поделаешь, C++ для имбецилов, динамическая типизация рулит.

windows10 ★★★★★
()
Ответ на: комментарий от kirill_rrr

Да, только для 10000 пользователей одновременно по одному неработающему питону

Починил. На одно такое армовое ядро даже staging вряд ли посадишь

upcFrost ★★★★★
()
Ответ на: комментарий от windows10

В основном в исполняемом коде, при чем повсеместно. Только в одном хранилище MyISAM (а это наверное 5% от всего MySQL-кода) 61 функция юзающая float’ы.

Шикарная аналитика. Хрен с ним что myisam уже никем не используется, но ты походу думаешь, что у этого проца вообще нет fpu. Там может быть хоть 10000 функций, использующих float’ы, если они вызываются максимум раз в секунду и всё использование флоатов там уровня a / b, то это даже проц без fpu перемолет и не заметит.

Чтобы это было вообще хоть сколько-нибудь заметной проблемой, нужно чтобы fpu-вычисления были бутылочным горлышком, и были им постоянно.

Ivan_qrt ★★★★★
()
Ответ на: комментарий от upcFrost

А 10 потоков на 1 интеловское ядро вешать это нормально? Там же оверхед на переключение контекста вполне себе 10% может достигать.

kirill_rrr ★★★★★
()
Ответ на: комментарий от anc

Ну, вероятно зависит. Но ведь можно подобрать какое нибудь решение, в котором не придётся решать эту задачу. Например много мелких ядер.

kirill_rrr ★★★★★
()
Ответ на: комментарий от kirill_rrr

От обратного это тоже работает.

anc ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.