LINUX.ORG.RU

Мысли про архитектуру Alder Lake

 , ,


1

1

Чего-то чем далее, тем более оно странно выглядит. Запишу-ка на память.

1) Это как надо было упороться, чтобы разным ядрам (производительным и энергоэффективным) дать разные CPUID, ну вот зачем, чтобы жизнь медом не казалась? Оно кажется логичным только с первого взгляда, но CPUID - это до сих пор был идентификатор устройства а не ядра в нем. Отсюда уже пошли приколы в некоторых приложениях.

Мне как-то очевидно даже, что правильный подход - это или совсем новую инструкцию придумать или расширение для CPUID с дополнительной информацией в регистрах, но так чтобы оно не конфликтовало с прежним подходом. Т.е. CPUID общий, но есть специальные расширения, если хочется узнать какое ядро задействовано.

С другой стороны, учитывая, что ряд инструкций не доступен на E-cores и эту ситуацию надо как-то учитывать ... В общем дурдом.

2) Планировщик задач. Если подумать, сложно представить, как вообще должен работать тут правильный планировщик, потому что в зависимости от сценария использования и ОС и приложения могут быть разные подходы. Сейчас юзеры жалуются, что можно запустить что-то тяжелое, например рендеринг, переключиться на браузер и планировщик (виндовый) вытолкает рендеринг на слабое ядро, хотя логично было бы наоборот. Но планировщику не известно как правильно, хотя бы потому что браузер тоже может жрать ресурсы и по другой логике его таки правильно определить на P-Core.

3) До сих пор что-то не особо выходит компенсировать аппаратные усложнения правильным софтописательством. Или получается, но для ограниченного круга задач, обычно серверных решений.

★★★★★
Ответ на: комментарий от anonymous

у вас на десктопах возможно +- несколько ватт пофиг. А на ноуте перекомпиляция мира в генте с отключением этого говна докидывает часик автономности. При том что основной массе народа ну нахрен не впилась добыча крипты на ультрабуке или еще какая экзотика когда эти avx-512 могут хотя-бы теоретически понадобиться. Ну где-то кроме попугаеметров написанных по заказу маркетологов интел чтобы продемонстрировать преимущество интела перед АМД.

По моему опыту сравнения райзена ренуара о 8 ядрах с тайгерлеком о 4-х - райзен на порядок лучше. Меньше жрет, компиляция быстрее, всякая запаковка-распаковка архивов с включенной многопоточностью тоже. Все бы хорошо если бы не отсутствие нормальных драйверов ноутбучной графики АМД под онтопик. Дрова веги - это адский ад, и останется адским адом ибо амд переходит на RDNA2 (слава аллаху что так) - и все работы по веге будут закопаны. ПОэтому приходится пользоваться интелом, ибо там драйвера и поддержка онтопика традиционно хороши. А все эти экзотические кейсы когда из AVX-512 можно получить чуток профита как с козла молока - это адская экзотика даже в мире серверов. На ноутбуках AVX-512 не нужен от слова совсем и никогда. Отключить это говно к сожалению нельзя - ну благо можно не компилировать эти инструкции в совою систему и эти прожорливые блоки не будут гадить.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Jetty

Что там по поводу теста? Возмутительно быстрая. Возмутительно быстро - это сколько. А с выключенными E ядрами сколько?

serg002 ★★★
()
Ответ на: комментарий от Qui-Gon

Simd инструкции сами по себе по определению энергоэффективнее обычных, потому что приводят сразу к нескольким полезным вычислениям при единоразовой затрате на декодирование инструкции и тд. Это подтверждено научными публикациями. Какие-то твои личные опыты меряют только влияние каких-то побочных факторов. Выдавать сравнение интелов на старых техпроцессах с амд на новых за сравнение между инструкциями это сам понимаешь какой тупак.

anonymous
()
Ответ на: комментарий от anonymous

Ну к сожалению интелом управляют маркетологи, а не инженеры. Они уже один раз обосрались много лет назад когда заявили что главное в процессоре - гигагерцы, и выпустили пентиум 4. Который выдавал дофига гигагерцев, грелся как чернобыльский реактор и работал как говно. То есть выдавал ровно гигагерцы и специальные тесты интеловских маркетологов - а в реальных жизненных задачах позорно сливался.

AVX-512 -это пентиум-4 наших дней. Нечто греющееся как реактор, работающее как говно но позволяющее выдать в интеловских же тестах много много попугаев в однопоточном режиме в сравнении с конкурентом ( в данном случае райзеном). Но вот нахрен не нужное - разве что майнерам и возможно в каких-то задача рендера.

Но тут есть некоторая надежда - понятно и поручику Киже что работать комбинация little-big с разными системами команд будет через задницу без тотального переписывания софта и интелу так или иначе придется этот avx-512 прибить. ОНи там повыеживаются пытаясь его и так и так вкорячить- но по итогу сдохнет он в страшных мучениях как и желал того Линус. Останется где-то в ксеонах где есть достаточно питания, охлаждения, и возможно будут под это задачи.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

интелом управляют маркетологи, а не инженеры. Они уже один раз обосрались много лет назад когда заявили что главное в процессоре - гигагерцы, и выпустили пентиум 4

Про ps3 почитай, там было то же самое в том числе.

AVX-512 -это пентиум-4 наших дней

4.2 Оно натурально обратно пню4. Максимальный IPC при минимальных частотах, а жор растёт как раз непропорционально частоте.

однопоточном режиме

Кучей ядер высокий IPC не заменить, поскольку всё время будет тратитьсся на обмен между ядрами, вместо полезных вычислений. Прекращай уже читать чушь от ламерков.

anonymous
()
Ответ на: комментарий от anonymous

да перестаньте вы гнать пургу про старые техпроцессы. Равноценные там техпроцессы. У интеля затвор прямоугольнй 10нм шириной, а амд - трапеция с тонким концом 7нм а толстым поболе 10. Площадь затвора пропорциональная емкости - то на то. Но понятно что маркетологи АМД также хватаются мерять тонкий конец затвора и верещать о более тонком техпроцессе как маркетологи интел - о чудотворной необходимости AVX-512. Кто лучше обманет - тот больше продаст.

Инструкция эффективна если у вас этот вектор забит однотипынми операциями на все 512. А если там 10 операций в этой инструкции из 512 возможных - то эффективность будет говно. А весли вы не майните крипту то скорее всего эти векторные инструкции будут тупо работать в холостую. Как показывает опыт в просто домашнем ноуте эти инструкции не нужны даром. А силикон они жрут. И эти транзисторы жрут батарею когда ваше ядро занимается куда более прозаичными вещами вместо добычи биткоина и выполения интеловских синтетических тестов. И если интел выпилит - или хотя-бы реально отключит блоки AVX-512 не чтобы они скрывались от системы а чтобы на них питание не подавалось совсем - то ноуты станут лучше.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

да перестаньте вы гнать пургу

Нет, ты. Сейчас интелы конечно частично исправили ситуацию, но всё равно ясно что у амд техпроцесс энергоэффективнее, 5950x vs 12900K недвусмысленно намекает.

Инструкция эффективна если у вас этот вектор забит однотипынми операциями на все 512. А если там 10 операций в этой инструкции из 512 возможных

Ты тут в очередной раз ошибочно себя считаешь умнее инженеров. Векторные блоки выключены стоят пока на них не начинает прилетать достаточно длительная нагрузка, после чего они включаются на полную ширину.

anonymous
()
Ответ на: комментарий от anonymous

Да не нужны основной массе народа эти потоковые однотипные вычисления. Для декодирования медиа есть аппаратные декодеры в видеокарте. Для обычного компьютера 256 вектора за глаза хватает, 512 НЕ НУЖЕН.

Ну не поймет пользователь криптофермы или рендер-фермы пользователья ультрабука. И мозга не хватит понять что не нужны эти вычисления нахрен 99% пользователей, и что 2 ватта разницы потребления энергии это ОЧЕНЬ блин МНОГО. В отличии от «ламерка» Торвальдса - который прекрасно умеет разделять мух от котлет.

Qui-Gon ★★★★★
()
Ответ на: комментарий от anonymous

Если векторные блоки отключены - кто тогда жрет мою батарею? Санта-Клаус? Может они жрут ее не на всю дурь - на всю дурь они и 150 ватт выжрут, но мне и те 2 ватта которые они жрут подубрать бы. Отключить полностью это на 10-м-11-м поколении увы нельзя.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

Везде, где используются simd инструкции, там avx512 полезен. А используется он много где, начиная прям с glibc. Многим недостаточно качества аппаратного кодирования, так что про него можешь забыть сходу, а с учётом того, что постоянно вводят новые кодеки, то и быстро оазывается, что аппаратного декодера для нужного кодека просто нет.

anonymous
()
Ответ на: комментарий от Qui-Gon

на ноуте перекомпиляция мира в генте с отключением этого говна докидывает часик автономности

А можно пример из жизни? В каких обстоятельствах нужно было что-то компилять без розетки, чтобы каждый час был на счету?

chenbr0
()
Ответ на: комментарий от Qui-Gon

Если говорить целиком про платформу, то может жрать что угодно.

anonymous
()
Ответ на: комментарий от chenbr0

Имелась в виду перекомпиляция того же браузера чтобы компилятор никгде там не засунул инструкцию AVX-512. А то будешь читать plain html страничку под жужжание вентиляторов охлаждающих векторые блоки.

Qui-Gon ★★★★★
()
Ответ на: комментарий от anonymous

Вот для того чтобы он в Glibc не использовался и надо плясать с бубном при компиляции. И батарея говорит спасибо - а вот каких-то неудобств не заметил.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

SIMD инструкции упираются в скорость памяти, так что могу предположить, что у тебя в говнобуке слишком медленная память и проц впустую простаивает в её ожидании. По идее энергосбережение в курсе кэшмиссов даже уже и должно сбрасывать частоту проца, но может вендор ноутбука отключил эту фичу, или она недостаточно агрессивно работает.

anonymous
()
Ответ на: комментарий от anonymous

https://www.phoronix.com/scan.php?page=article&item=rocket-lake-avx512

Говенность avx512 чудесным образом протестирована на форониксе. Можно сколько угодно рассказывать какой линукс идиот а аномимус - гений - но вот обычные объективные тесты. Демонстрирующие что линус прав на все 100500.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

Фороникс дно, его в другом тесте засмеяли разработчики gcc, которые не смогли воспроизвести его результатов, да он потом и сам не смог.

Более серьёзные источники говорят об обратном:

Conclusions … there is a huge difference in energy efficiency since SIMD cost much less power.

https://ntnuopen.ntnu.no/ntnu-xmlui/bitstream/handle/11250/2626529/main.pdf

https://hal.archives-ouvertes.fr/hal-02167083v2/document

anonymous
()
Ответ на: комментарий от anonymous

«более серьезные» источники гоняли соответствующие тесты требующие активных вычислений - то есть реально тематические для avx-512 задачи. В отличии от фороникса который гонял не решения систем уравнений и матмоделирование, а повседневные задачи. Я и не утверждаю что avx-512 плох если мы майним крипту или гоняем еще какую-то задачу в виде моделирвания плазмы. Avx-512 плох когда мы сидим на лоре, чатимся в телеге , читаем почту и смотрим pdf. То есть в 99.99% случаев использования ноутбука. Да и по «более серьезным» источникам преимущество avx-512 над avx-256 не столь ощутимо.

Но с другой стороны - зачем на десктопе (или сервере? ) - энергоэффективные ядра? Ну вот стоит гроб который жрет 200 ват просто показывая картинку заставки - но вот какой-нибудь mp3 мы будем проигрывать на энергоэффективном ядре чтобы он начал жрать не 202 ватта а 201.5 ? да чушь полная. Очень похоже на возвращение пентиум-4. По ходу АМД сейчас засунет синих в задницу с их новым маркетингом и придется им таки начать платить не маркетологам а инженерам. И вышвырнуть avx-512 из ноутбучных чипов не формально а каленым железом выжечь. А в серверах и десктопах исключть энергоэффективные ядра.

Qui-Gon ★★★★★
()
Ответ на: комментарий от fsb4000

традиционно интел продолжает повышать планку производительности, конкурентам не желающим обанкротиться придётся следовать за ним

anonymous
()
Ответ на: комментарий от praseodim

Ну хз, у меня опыт скорее обратный. Но то у каждого свой опыт :)

Jetty ★★★★★
()
Ответ на: комментарий от serg002

На глазок где-то 15-20 минут на пересборку всего сорс-пакета (ет когда и хедеры и РТ кернел и клауд кернел , всякие док,дбг,етц и т.д.). Само собой все упиралось по класике в I/O (винты трещали по максимуму). Пробовал еще на Е коре покомпилить небольшой проект в j1 не заметил чтоб оно было какое-то ущербное. Сопоставимое с кором моего прошлого проца (i7-5820K). Имхо никакое оно не ущербное, просто без НТ и я так понимаю бустовые крылышки ему подрезали…

Jetty ★★★★★
()

Вот геймеры жалуваются по поводу статоров из-за E-core. https://www.youtube.com/watch?v=A95NEmw9HUo

в этом же видево коммент

Интересное сравнение и весьма любопытное. Однозначно лайк! Я больше склоняюсь к версии, что E-ядра делали в первую очередь для i9 чтобы нарастить многопоточную производительность и тягаться на равных с 5900х/5950х не раздувая при этом транзисторный бюджет и теплопакет до небес. Плюс конечно маркетинг - по факту физических ядер 16 и пофигу что половина из них дохлые. А в младшие их скорее просто "по инерции" добавили если можно так выразиться.

Ещё в случае с i9 посадить на кольцевую шину 16 быстрых ядер куда сложнее чем 8+огрызки. Эффективность кольцевой шины в таком случае заметно упадёт, а MESH лепить для настольного сегмента - ну такое себе.

Не стоит забывать ещё что и по размеру 1 быстрое ядро занимает на кристале место примерно как 4 огрызка. И если смотреть именно с этой точки зрения, было бы неплохо сравнивать 6P+4E vs. 7P+0E. Или совсем бредвоая мысль - из i9 делать условные 6P+8E vs. 8P+0E. Но это уже из разряда придирок. В целом картина и так ясна чуть менее чем полностью!

И я полностью с ним согласен. В итоге «революционная» архитектура революционна не для юзера, а для производителя. Чтобы можно было охватывать десктоп и мобайл, при этом оставаясь на рынке(и не теряя его) и зарабатывая бабло, оставаясь на техпроцессе 5-летней давности

serg002 ★★★
()
Последнее исправление: serg002 (всего исправлений: 1)
 тесты мобильного Intel Core i9-12900HK — потребление до 113 Вт, температура до 99 °C 

Что это за архитектура такая? =(

sfedosenko
()
Ответ на: комментарий от serg002

архитектура революционна не для юзера, а для производителя.

Прямо в точку.

sfedosenko
()
Ответ на: комментарий от serg002

4.2 Даже тут полно народа жравших кукурузные ядра fx и нахваливавшие их, так что как раз всё для юзера)))

anonymous
()
Ответ на: комментарий от Rost

У райзена HT тоже есть но таки не жрет.

У AVX-512 есть основной показатель уюлюдочности - активация этого дерьма вызывает поднятие напряжения питания процессора. В геймерских биосах MSI эту величину можно подстроить, но мам факт наличия этого параметра весьма показателен.

Жаль что на тигре нельзя это дективировать также как на 12gen.

Qui-Gon ★★★★★
()
Ответ на: комментарий от anonymous

Многим недостаточно качества аппаратного кодирования

Угум-с. Вот прямо недостаточно, а денег на новое оборудование нет.

а с учётом того, что постоянно вводят новые кодеки

Без аппаратного декодирования на железе? Проще железо купить новое, см. п.1.

tiinn ★★★★★
()
Ответ на: комментарий от Qui-Gon

Ну вот стоит гроб который жрет 200 ват

На гробе, который жрёт 200 ватт - не нужно. На гробе, который жрёт 60 ватт - очень надо.

tiinn ★★★★★
()
Ответ на: комментарий от Qui-Gon

Вы считаете, что должно быть падение напряжения?

А что же там у эталона народной компании из главной палаты мер и весов, у АМД?

Ах, ну да: никогда не жили цивилизованно - неча и начинать

Да запикано ненужон нам ваш AVX-512!!

А вот зато в Советском Союзе пендосы нам так завидовали, что только у нас был православный набор инструкций 3DNow!

anonymous
()
Ответ на: комментарий от anonymous

у эталонной компании все шикарно. Своей сраной вегой сто лет давности они отвесили синим крепкого пендаля под жопу что тем пришлось отказаться от их концептуальной идеи «встроенное видео не должно быть производительным - 10 лет жили на HD и еще 100 проживете». И заставили синих прорелизить таки Iris XE. Но теперь краные вынули из кармана встройку RDNA2 - а вот тут то я опасаюсь у синих нет в занашнике наработок, так что в ближайшие пару лет красные будут доминировать.

По процессорам - пока синие упираются в свой уродливый AVX-512 для криптовалютчиков и делают уродцев на 400ватт, красные удвоили количество ядер без этого уродца - и как ни странно криптовалютчики предпочитают красных. Ну AVX-512-это убогая попытка реализовать на CPU то чему место в GPU (см. Линус) - которое ни в какие сравнения с GPU по практической применимости не идет, а CPU превращает в адскую печку. Опять поимели.

Так что под оффтопиком покупать ноут на синем процессоре ну полный бред. Под онтопиком - традиционно хорошая поддержка интелом драйверов пока перевешивает местами ( конкретно - в ноутбуках), но красные там наняли еще несколько дополнительных разработчиков линукс-дров и догоняют.

Эппл с интела ушел - еще один жирный намек на «нужность» avx-512 и «достаточность» UHD встройки.

Так что нравится не нравится - интелу придется менять концепцию либо проваливаться на глубокое второе место.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

Манямирок прорвало

Своей сраной вегой сто лет давности

А чо не 200 лет давности сраными соккетами FM1, FM2 и FM2+ аж на 12 ядер?

Была же какая-то рекламная акция, что один из бесплатных оффисов таки научили таблички считать через OpenCL, который, кстати, от другой корпорации, на которую вы так молитесь - Apple

Позвольте спросить, и где же он сейчас?

встроенное видео не должно быть производительным

А где-то оно быстрее RTX 3090? Уж не консольный ли вы сектант, случаем?

пока синие упираются в свой уродливый AVX-512 для криптовалютчиков

Что, простите? Вы давно из дурки сбежали?

Уж кому-кому, а Интелу крипта либо абсолютно параллельна, либо только во вред…

(см. Линус)

https://www.youtube.com/watch?v=Rlg4K16ujFw

Эппл с интела ушел - еще один жирный намек на «нужность» avx-512 и «достаточность» UHD встройки.

Вас из Apple не уволят за слитые инсайды?

Так что нравится не нравится - интелу придется менять концепцию либо проваливаться на глубокое второе место.

И сколько готовы на это поставить?

https://finance.yahoo.com/quote/AMD/

anonymous
()
Ответ на: комментарий от Qui-Gon

Тебя avx512 в детстве изнасиловал или что? Эпол с интела свалил из-за лажи того с техпроцессом. Они до этого точно так же свалили с померписи, и как раз на такой случай давно сами разрабатывали процессоры.

anonymous
()
Ответ на: комментарий от anonymous

Эппл свалил с интела по причине его негодной энергоэффективности. На техпроцесс им покакать. И на то каким образом эта самая энергоэффективность будет достигнута. И пока собственная разработка эппл порвала интел да и амд. Жаль только что под линуксом это не будет работать никогда. Ну запустить то можно будет - посмотреть и закрыть.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

Линус

Петух.

CPU то чему место в GPU

Давно уже в hpc армах сделали 2048-бит simd. Повсеместное наращивание ширины simd это естественный и непрерывные процесс, амд твоё тоже никуда от этого не денется.

anonymous
()
Ответ на: комментарий от Qui-Gon

В реальном мире у нас именно техпроцесс это одна из основных составляющих энергоэффективности. Учитывая, что микроархитектуры разрабатываются под техпроцесс, на него завазаны обе две основные составляющие.

anonymous
()
Ответ на: комментарий от anonymous

потому что у амд как и у интела проблемы с производством и дефицит чипов. Если интел как-то скомпенсировал дефицит выбросив на рынок 14нм рокетлейки , то для амд такого варианта нет. Тот редкий случай когда рынок готов сожрать все что произведется - а производство не тянет.

Qui-Gon ★★★★★
()
Ответ на: комментарий от anonymous

только чипы амд идут не только в эппл. А тут одно дело вложиться в производство собственных чипов - другое дело чужих.

Qui-Gon ★★★★★
()
Ответ на: комментарий от anonymous

Волосы гладкие и шелковистые...

Эта традиция с регулярным употреблением шампуня - ещё со времён `IBM`. Седые старики ещё помнят заседания Совета Министров СССР... После этого раз в пятилетку портировали согласно мануалам на новое инструментальное ПО.

Mirage1_
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.