LINUX.ORG.RU

Гибридная архитектура Intel уже готова для Linux?

 


2

4

Сабж. Несколько лет уже прошло, остались ли какие-нибудь косяки планировщика/чего угодно ещё с этими P/E ядрами на Linux? Особенно, если речь не о самых распоследних версиях ядра Linux, а, скажем, 6.8.

Надо выбрать между мобильными i9-11950H и i9-13900H. Понятно, что выбор несложный и в пользу последнего, но может есть какие-то невероятно раздражающие факторы направляющие в пользу первого, т.к. использоваться будет только онтопик с убунтовским LTS-ядром.



Последнее исправление: OSBuster (всего исправлений: 1)
Ответ на: комментарий от MOPKOBKA

Не понял про что ты, давай не будем отходить от темы, компиляция кода это реальная задача? Если да, то почему AMD не в два раза быстрее?

С чего это он должен быть в два раза быстрее при сопоставимой мощности?

Вот берем к примеру 9950X (16 ядерный) и 285K(24 ядерный: 8P + 16E) и компилим ядро Linux: https://www.phoronix.com/review/intel-core-ultra-9-285k-linux/4

Время компиляции сопоставимо при этом 9950X в среднем потреблял 192 Ватт а 285K уже 225 Ватт даже с охренеть разогнанной DDR5-8000 памятью. И где хваленная двойная производительность Intel и супер энергоэффективность? А ведь Arrow Lake это переработанная и гораздо энергоэффективная архитектура в отличии от предыдущих печек от Intel.

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Как это нет

Там разница 10%, общий итог из чего строится, из Intel работающем в играх на 1080p и бенчмарках на скоростях DDR4?

Тем что не нужно возьни с планировщиком когда кидает потоки не на те типы ядер.

У AMD свои проблемы, обсудили выше, и обсуждаем ниже.

MOPKOBKA ★★★★★
()
Ответ на: комментарий от V1KT0P

Сразу не заметил что там сравнивается 8 ядерный AMD с 8P + 16E ядрами Intel. 24 ядерный процессор Intel на 70% быстрее кодирует чем 8 ядерный AMD, охренеть достижение.

Какие 24 ядра, ты вроде на позиции что они неполноценные. Так что тут максимум 16 ядер против 8 ядер.

MOPKOBKA ★★★★★
()
Ответ на: комментарий от MOPKOBKA

Там разница 10%, общий итог из чего строится, из Intel работающем в играх на 1080p и бенчмарках на скоростях DDR4?

Так я привел графики где 285K последний на текущий момент мощный процессор от Intel с DDR5-8000 оперативкой, но никакого отрыва от 9950X ни в производительности ни в эффективности не видно.

У AMD свои проблемы, обсудили выше, и обсуждаем ниже.

Меня зацепило утверждение про мифическую производительность и энергоэффективность у Intel, а на проверку ни того ни друго нету.

V1KT0P ★★
()
Ответ на: комментарий от MOPKOBKA

Какие 24 ядра, ты вроде на позиции что они неполноценные. Так что тут максимум 16 ядер против 8 ядер.

Именно! По идеи Intel должен показывать 100% отрыв, но в реальности всего 70%.

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Вот берем к примеру 9950X (16 ядерный) и 285K(24 ядерный: 8P + 16E)

Это некорректное сравнение. У амд 16 полноценных ядер, у интела 8 ядер и 16 недоядер каждое из которых где-то в половину полноценного ядра если не меньше. То есть полный паритет - 16 и 16.

По энергоэффективности в полной нагрузке АМД чуть лучше. По энергоэффективности в легкой офисной нагрузке лучше как ни странно интел - ну если конечно обеспечить переключение на малые ядра.

Сама архиетктура ArrowLake скорее всего переходная - интел отключил SMT но сомневаюсь что они выпилили все хардверные блоки которые это SMT обеспечивали - слишком спешат реабилитироваться за прошлый факап.

Qui-Gon ★★★★★
()
Ответ на: комментарий от V1KT0P

Вот берем к примеру 9950X (16 ядерный) и 285K(24 ядерный: 8P + 16E) и компилим ядро Linux: https://www.phoronix.com/review/intel-core-ultra-9-285k-linux/4

И держим в уме что это старый бенчмарк, и даже там минимальное потребление Ultra Core в два раза меньше чем минимальное потребление амуде.

с охренеть разогнанной DDR5-8000 памятью

Для фаната амуде все что выше DDR4 это охренеть разогнанная память, потому что амуде в DDR5 не шмогла.

И где хваленная двойная производительность Intel и супер энергоэффективность?

Энергоэффективность я не произносил, вообще тут лучше смотреть на Intel N200, вот там да, потребление низкое. А если вернуться к 285k то вот например, https://www.club386.com/wp-content/uploads/2024/10/system-power-consumption-i...

Ты показывал 10% в пользу амуде, вот даже у phoronix есть в пользу интела 40% https://phoronix.com/benchmark/result/intel-core-ultra-9-285k-linux-benchmark...

Смысл отдельные показания смотреть? Да еще и старые.

MOPKOBKA ★★★★★
()
Последнее исправление: MOPKOBKA (всего исправлений: 2)
Ответ на: комментарий от V1KT0P

Так я привел графики где 285K последний на текущий момент мощный процессор от Intel с DDR5-8000 оперативкой, но никакого отрыва от 9950X ни в производительности ни в эффективности не видно.

Читай выше, на момент запуска было много проблем. Именно поэтому я скидывал более новые сравнения. Стоило бы внимательнее почитать, прежде чем бежать защищать любимый бренд.

MOPKOBKA ★★★★★
()
Ответ на: комментарий от V1KT0P

Не должен, смотрим по самым высоким показателям, то есть Ryzen 9950x vs 285k, но такие мне не удалось найти, если ты найдешь, то было бы интересно посмотреть.

Я как раз стою на идее что 8+8 не дает 100%+100%.

MOPKOBKA ★★★★★
()
Последнее исправление: MOPKOBKA (всего исправлений: 1)
Ответ на: комментарий от V1KT0P

annulen вот компиляция ядра (в комментарии на который я отвечаю), по мне так очень хороший бенчмарк, несмотря на то что у Intel E-ядра, он стоит сильно дешевле, и по скорости не уступает.

Не все вычислительные задачи такие

Получается это нереальные примеры, но какие реальные тогда? Я вообще знаю мало вещей которые не распараллеливается, приведи примеры, а я поищу бенчмарки.

MOPKOBKA ★★★★★
()
Последнее исправление: MOPKOBKA (всего исправлений: 1)
Ответ на: комментарий от MOPKOBKA

компиляция кода это реальная задача? Если да, то почему AMD не в два раза быстрее?

Потому что embarassingly parallel задача вроде компиляции может эффективно использовать «медленные» ядра, не заставляя потоки на «быстрых» ядрах замедляться до скорости «медленных»

annulen ★★★★★
()
Ответ на: комментарий от MOPKOBKA

несмотря на то что у Intel E-ядра, он стоит сильно дешевле, и по скорости не уступает.

Смотрю стоимость 9950X в Amazon $600 при заявленой стартовой стоимости $650, заявленная стартовая стоимость 285K составляет $590 (На Amazon почему-то нету в наличии старшего процессора) что всего на $10 дешевле. И где это сильно дешевле? Сомневаюсь что в ближайшее время Intel скинет сильно цену на свой топовый процессор. Может где-то локально так и есть, но в общем не должно быть если только специально цену на Amd не завысят.

V1KT0P ★★
()
Ответ на: комментарий от annulen

что для компиляции интеловская архитектура, скорее всего, нормально подойдёт.

Единственное превосходство 16E против 8P что приходит на ум это алгоритмы где узкое место это случайное чтение памяти не из кеша. Но у AMD для этого есть SMT.

V1KT0P ★★
()
Ответ на: комментарий от annulen

А можно по идее для проверки запускать однопоточный бенчмарк, просто запущенный по разным ядрам, несколько инстансов? И проверить как AMD держит ядра?

MOPKOBKA ★★★★★
()
Последнее исправление: MOPKOBKA (всего исправлений: 1)
Ответ на: комментарий от V1KT0P

Тут я ошибся, не туда посмотрел, цена плюс минус одинаковая. Хотя матплаты у AMD были намного дороже когда я покупал i9-14900K, но сейчас новые процессоры трудно найти и железо под них, так что не буду сравнивать.

MOPKOBKA ★★★★★
()
Последнее исправление: MOPKOBKA (всего исправлений: 2)
Ответ на: комментарий от MOPKOBKA

А можно по идее для проверки запускать однопоточный бенчмарк, просто запущенный по разным ядрам?

Ты имеешь в виду, например, запустить через GNU parallel N копий однопоточной архивации одного и того же файла? Да, это хороший бенчмарк.

Edit: Только нужна не сумма всех результатов, а все. На одинаковых ядрах должно быть примерно одно и то же время выполнения у всех процессов.

annulen ★★★★★
()
Последнее исправление: annulen (всего исправлений: 1)
Ответ на: комментарий от MOPKOBKA

А можно по идее для проверки запускать однопоточный бенчмарк, просто запущенный по разным ядрам? И проверить как AMD держит ядра?

Что ты имеешь ввиду «держит ядра»? Если это типа «Turbo Boost» то есть 1-2 ядра которые могут держать частоту выше чем оставшиеся, на винде фирменная утилита показывает лучшие ядра. Если же ты имеешь ввиду что частота падает если нагружены все ядра, так это у всех процессорах так ибо упираются либо в потребление либо в нагрев.

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Единственное превосходство 16E против 8P что приходит на ум это алгоритмы где узкое место это случайное чтение памяти не из кеша

Я в качестве потенциального превосходства 16E рассматриваю только возможную экономию энергии, в ситуации с офисно-игровыми задачами. Но тут интелы и соврут не дорого возьмут

annulen ★★★★★
()
Последнее исправление: annulen (всего исправлений: 1)
Ответ на: комментарий от Qui-Gon

А как же бумага и 10-15 минут?

Гуманитарий, повторяю для пребывающих в перманентной гипоксии головного мозга, для расчётов полёта на луну не нужны численные методы :) Про численные методы был ответ на твой унылый вброс про задачу трёх тел. Начитаются китайских порнокнижек и бредят потом :)

Потому как в этой области ты полный профан. Задача трех - вернее минимум 4 - тел - это так, первая прикидка в нулевом приближении. И приведена она была просто ткнуть тебя носом как нашкодившего кота в твое вранье про бумажку и 15 минут.

Так обычно и бывает, ткнуть хотел меня, но жидко обосрался сам не снимая боевых шаровар :)

ну за 30 - спроектируешь ему старшип

Пациент окончательно поплыл, смешал проектирование технически сложного изделия и элементарную задачу навигации для 7-го класса :) Гуманитарий, чего с тебя взять.

Pohmetolog
()
Ответ на: комментарий от annulen

Ну чтобы была экономия энергии надо обеспечить использование именно этих ядер.

Опять же на примере своего ноута - 4P 8E 2LP. Запускаю видео на ютубе и отпускаю ядра в свободное плавание - ядро 6.13-rc3 + экспериментальные патчи на intel_pstate. Жрет 12-13 ватт.

Через Intel_lpmd убираю P ядра из раздачи задач - потребление в районе 10-11 ватт.

То есть E-ядра вполне полезная фича в теории - а на практике их еще надо научиться готовить.

Qui-Gon ★★★★★
()
Ответ на: комментарий от Qui-Gon

ядро 6.13-rc3 + экспериментальные патчи на intel_pstate

это та разработка построенная на Energy Aware Scheduler(писали на 1 странице)? если да, не поделитесь ссылками на патчи? я искал не нашел в бивасе SMT отключил, так что патчи должны заработать

intel_lpmd попробовал, оч круто, спасибо, хочется попробовать еще что-то

kotc9
()
Ответ на: комментарий от kotc9

https://git.kernel.org/pub/scm/linux/kernel/git/rafael/linux-pm.git/log/?h=experimental/intel_pstate-testing

вот тут самая свежая серия.

Но мне кажется с точки зрения именно батареи lpmd эффективнее. Хотя шут его знает - у меня они вместе работают, возможно усиливают эффект друг друга.

Qui-Gon ★★★★★
()
Последнее исправление: Qui-Gon (всего исправлений: 1)
Ответ на: комментарий от kotc9

ЕЩе один интересный патч

https://patchwork.freedesktop.org/patch/629271/

открывет в sysfs возможность понизить агрессивность видеоядер в драйвере i915 по поднятию частоты. Не процессором единым - чтобы батарея работала долго попугаев надо душить. Всех.

Qui-Gon ★★★★★
()
Последнее исправление: Qui-Gon (всего исправлений: 1)
Ответ на: комментарий от Qui-Gon

А причем здесь амолед? Вот так примерно выглядит загрузка при проигрывании 1920х1080 на ютубе. А экран, чипсет и вайфай с твердотельником, да оперативной памятью - это все левое и ненужное для понимания сколько потребляет процессор.

core:             1.338 W
package-0:        4.463 W
uncore:           1.495 W
anonymous
()
Ответ на: комментарий от greenman

В обзорах все пишут ровно обратное - да, жрет только в путь зато картинка какая.

Энергоэффективность это если смотреть на пустой черный экран с парой зеленых буковок - ибо IPS подсвечивается всегда а в амоледе светится каждый пиксель самомтоятельно.

Qui-Gon ★★★★★
()
Ответ на: комментарий от LongLiveUbuntu

Предполагаю что плебейские 60FPS его не устраивают, ему нужно минимум 120. Ну и наверняка нищебродский FullHD его не устраивает тоже, у него 4К видимо, причём апскейл и DLSS3 наверняка травмируют его киберкотлетный организм с генами мухи. Тут да, 4070 будет мизерно мало, и захочется чего то стоимостью в половину китайского автомобиля.

Ну а если серьёзно — 4070 не такая уж и быстрая карта, она как ни странно не аналог 3070. Из за урезания шины 40XX получились слегка медленнее их аналогов 30XX, кроме флагманов. Так что 4070 примерно соответствует 3060ti, а это действительно не особо быстрая карта даже в FullHD. А с учётом 8гб VRAM и тем как Линукс менеджерит видеопамять (никак) вообще такоэ...

Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 2)
Ответ на: комментарий от LongLiveUbuntu

Энергопотребление стационарника меня не волнует совсем, вообще. Так что я не интересовался и не вникал. БП у меня с очень большим запасом по мощности куплен. Видел на ютубе что если у топовых карт питальник засунуть не до конца, или перегнуть, разъём может расплавиться.

Из иных плюшек — DLSS3, нужно это тебе или нет решай сам. Мне нужно, но и на 30XX работает универсальный аналог DLSS3 — FSR3.1

Лично мне кажется что смысла переходить прямо сейчас нет, потому что ну вот смотри: если у тебя 3060ti, которая 8gb — 4060 медленнее, 4070 сравнимо, но те же 8гб, а я считаю (IMHO) что под Линукс обязательно нужно больше, по причине неумения dxvk и драйверов (любых драйверов, не только Nvidia, ATI и Intel тоже не умеют) в менеджмент vram сравнимый с тем что в Виндовс. Значит апгрейдиться нужно на 4070 с 12gb, а такие карты чот как то неприлично много стоят в РФ сейчас. Менять же на 4070 с 8gb это шило на мыло менять, с переплатой непонятно за что. Ну а если у тебя 3060 с 12gb — лично я смысла в апгрейде не вижу вообще.

Да и 50XX поколение на подходе, возможно младшие и средние 40XX подешевеют наконец.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Неправильно считаете, хотя в случае CS2 движок в линукс версии жрет почти намного больше видеопамяти. В то же время виндовая версия жрет столько же, сколько и на винде. Вот только не одна память требует освобождения, но и сам чип. Но тут уже были ссылки в теме на то как работает пара видеочипов, хоть разных производителей, с тестами в паре со встройкой. Эти все «8 гигабайт мало» несутся от тех у кого рабочий стол жрет более 2-х гигабайт видеопамяти. На деле 8 гигабайт хватает для высоких настроек подавляющего большинства игр даже без использования оперативной памяти для подкачки, потому что игра может тянуть за собой например карты и так далее, но на деле использовать одну карту непосредственно во время игры и таким образом 11 гигабайт могут почти умещаться в 4-х гигабайтах видеопамяти. Так что помимо того что можно оптимизировать, используя ту же встройку, есть еще и холостые и полу холостые виды нагрузки. Но они конечно все равно могут портить работу того же FSR, которому требуется дополнительная свободная видеопамять. Так что наличие технологии не говорит о бескостыльности реализации и управление видеопамятью обычно на дне и реального доступа к настройкам в играх не дают, хотя могли бы дать опции типа «вот это вот все держать в оперативной памяти для ускорения загрузки», чтобы уже в процессе работы скорость не была убогой. Но обычно всех посылают в задницу с их хотелками - все равно никто же не узнает что их в задницу послали разработчики.

anonymous
()
Ответ на: комментарий от anonymous

таким образом 11 гигабайт могут почти умещаться в 4-х гигабайтах видеопамяти

Видел сравнение этих огрызков с 4-6 гигами памяти в новых играх, на производительность почти не влияет но вот идет постоянно подгрузка текстур. Сперва 1-2 секунды мыла и затем уже чёткая текстура, отвернулся уже другие текстуры подгружаются а та уже выгрузилась повернулся и снова мыло на 1-2 секунды.

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Может и так, но у меня не было мыла нигде. Там когда видеокарта без нагрузки все всего пару десятков мегабайт отнимается видеопамяти. Так что в Quake Champions высокие текстуры и в 4К вполне работоспособны с 4 гигами видеопамяти. С ультрами потяжелее, но там разница практически отсутствует в качестве картинки, а вот количество кадров проседает серьезно. Собственно во многих играх и 4 гигабайта могут тянуть 4К разрешение внезапно так. В новых конечно только на каких-нибудь средних-низких настройках качества текстур. Но вот эти выхлопы что 8 гигабайт недостаточно для 4К с ультра текстурами в общем полный бред. Плюс количество кадров сильно выше одной видеокарты, фризов нет, лагов нет, даже при 30 кадрах. Никакого подергивания даже. Так что мыло это опять же нехватка видеопамяти, но обычно ее хватает.

anonymous
()