LINUX.ORG.RU

Понимание широкой команды, VLIW

 ,


4

2

Лорчик, у меня тут вопрос возник, чисто теоретический.

Есть VLIW, архитектура e2k. Если посмотреть ассемблерный код, то команда там будет в фигурных скобках. Это и есть одна широкая команда.

Пример:

{
  nop 2
  istofd,3    %g17, %g18
}
{
  nop 7
  sdivs,5     %g17, %g16, %g16
}

В документации сказано, что одна такая широкая команда выполняется процессором за 1 такт. Справедливости ради, нужно заметить, что здесь ни слова про ядра. Просто сказано, что за один такт.

Дальше отсебятина, точнее «отменятина». Как бы суть-то широкой команды именно в том, чтобы распределить мелкие команды внутри этой широкой между ядрами процессора. Т.е. смысл фразы «за один такт» - это просто распараллеливание по ядрам.

Поскольку e2k не содержит жуткого блока предсказаний, как на обычном х86_64 и не умеет распаралеливать команды сам. За него это делает компилятор. Вот для этого и нужна эта широкая команда - компилятор распаралелил, перетасовал команды и сказал как их надо выполнить.

А теперь вот вопрсик в связи с этим. Получается, что прогу для e2k придется пересобирать для разных e2k процессоров с разным числом ядер?

Допустим прога собрана для Эльбрус 8С, у которого 8 ядер. Значит в фигурных скобках будет много команд. Т.е. широкая команда будет ну очень широкой, широчайшей прям! А запустится ли этот получившийся бинарник, скажем на 4С, у которого только 4 ядра? А на 1С? В смысле без пересборки.

★★★★★
Ответ на: комментарий от anonymous

И как он участвует в распространении электрического сигнала по проводникам?

Напрямую. Скорость распространения волны в проводнике зависит от его погонных ёмкости и индуктивности. Ёмкость зависит от диэлектрической проницаемости, индуктивность от магнитной проницаемости.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Напрямую. Скорость распространения волны в проводнике зависит от его погонных ёмкости и индуктивности. Ёмкость зависит от диэлектрической проницаемости, индуктивность от магнитной проницаемости.

первый аноним

Это применимо ко всей цепочке провод - транзистор - провод или только к транзистору?

anonymous
()
Ответ на: комментарий от anonymous

Это применимо ко всей цепочке провод - транзистор - провод или только к транзистору?

Ко всей цепочке, но главным образом к проводам, потому что транзистор очень маленький и у него свои задержки, не связанные со скоростью распространения (но связанные с параметрами диэлектрика).

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Ко всей цепочке, но главным образом к проводам, потому что транзистор очень маленький и у него свои задержки, не связанные со скоростью распространения (но связанные с параметрами диэлектрика).

Я правильно понимаю, что из-за волнообразности сигнала в силу вступает индуктивность и препятствует падению напряжения на каком-то участке, что вносит дополнительные задержки в скорость распространения волны?

anonymous
()
Ответ на: комментарий от Puzan

Тогда надо использовать диэлектрическую проницаемость кремния (а не оксида), которая составляет основную массу, окружающую проводники в микросхеме.

anonymous
()
Ответ на: комментарий от anonymous

Тогда надо использовать диэлектрическую проницаемость кремния

Нет, важна проницаемость диэлектрика между двумя проводниками, по которым течет ток. То, что снаружи, значения не имеет (можно пренебречь в нашем случае). По кремнию важнее его электрические параметры, например сопротивление.

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Я правильно понимаю…

Нуу, что-то похожее на правду в этом есть. Только ёмкость тоже нужно учитывать.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Нуу, что-то похожее на правду в этом есть. Только ёмкость тоже нужно учитывать.

Спасибо за информацию. Раньше я как-то не задумывался над этим.

Не получается ли, что чем больше транзисторов в цепи, тем сильнее это проявляется?

anonymous
()
Ответ на: комментарий от anonymous

Не получается ли, что чем больше транзисторов в цепи, тем сильнее это проявляется?

Ну тут надо разделять транзисторы и линии передачи. У транзисторов своя сосредоточенная задержка, а у линии своя, распределенная. Конечно, можно сделать полноволновой анализ, чтобы увидеть влияние всех компонентов, но это лишнее. Тем более в контексте этой темы.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Слушай, а если у нас параллельно два провода, а по ним навстречу идёт 2 волны. У каждого провода своё электромагнитное поле. Они будут замедлять распространение волны?

anonymous
()
Ответ на: комментарий от Puzan

диэлектрика между двумя проводниками

А там точно оксид кремния, а не воздух или другой изолятор-напыление (натравление, вытравление или как там правильно)?

anonymous
()
Ответ на: комментарий от Puzan

Металл на воздух особо не понапыляешь

А что оксид кремния напыляют?

Оксид кремния - это между проводником и подложкой-кремнием, а не между проводниками.

Что там напыляют в многослойных микрохемах? Неужели оксид кремния? :)

anonymous
()
Ответ на: комментарий от anonymous

Они будут замедлять распространение волны?

Из-за неоднородности диэлектрика такие взаимовлияния возможны, но они очень малы и ими можно пренебречь.

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Вы хоть подписывайтесь.

Что там напыляют в многослойных микрохемах? Неужели оксид кремния? :)

И его тоже. С повышением частот и скоростей задержка в проводах стала выше, чем в транзисторах, по этому стали искать диэлектрики с низкой проницаемостью. Их много, и в основном это соединения кремния, если я не ошибаюсь. И это точно не воздух :)

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

И его тоже. С повышением частот и скоростей задержка в проводах стала выше, чем в транзисторах, по этому стали искать диэлектрики с низкой проницаемостью. Их много, и в основном это соединения кремния, если я не ошибаюсь. И это точно не воздух :)

После этих разговоров ещё больше захотелось фотонный компьютер… =/

1

anonymous
()
Ответ на: комментарий от Puzan

в основном это соединения кремния

Как уже сказал, это для изоляции подложки-кремния. Тупо оксиляют, травят азотом или что там можно еще сделать с кремнием, чтобы получить диэлектрик.

Интереснее, чем заливают/напыляют остальные стороны - право, лево и верх, которых 3 раза больше одной стороны - низа, то есть больший вклад на диэлектрическую проницаемость. 1) когда однослойная микросхема, 2) если многослойная микросхема. В виду «прозрачности» - чем-то стеклоподобным, хотя стекло - это тоже смесь содержащая кремний.

anonymous
()
Ответ на: комментарий от anonymous

Как уже сказал, это для изоляции подложки-кремния.

Я говорю об межслойной изоляции (inter-metal dielectric).

Интереснее, чем заливают/напыляют остальные стороны - право, лево и верх,

Я уже сказал, что в основном это соединения кремния. Напыляют например осаждением из газовой фазы или центрифугированием с последующим отжигом.

Puzan ★★★★★
()
Последнее исправление: Puzan (всего исправлений: 1)
Ответ на: комментарий от Puzan

Много ли воздуха влезет в пору диаметром 1-2нм?

А много и не надо. Чем меньше материи, тем ближе к вакууму.

anonymous
()
Ответ на: комментарий от Puzan

Для снижения проницаемости, кстати

Кстати, проницаемость подбирают, скорее всего, под волновое сопротивление, фазовый сдвиг, или прочую ересь, которую я не знаю, что может дать выбросы при гигагерцовых частотах. А скорость света в среде - это в последнюю очередь, как следствие вышеприведенной ереси.

anonymous
()
Ответ на: комментарий от anonymous

Кстати, проницаемость подбирают, скорее всего, под волновое сопротивление, фазовый сдвиг, или прочую ересь, которую я не знаю, что может дать выбросы при гигагерцовых частотах.

В масштабах кристалла линии передачи можно считать объектами с сосредоточенными параметрами, по этому импеданс «и прочую ересь» можно не учитывать.

А скорость света в среде - это в последнюю очередь

Всё наоборот.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

В масштабах кристалла линии передачи можно считать …

… нехилыми конденсаторами и индуктивностями, плюс к настоящим. И заряжаются эти кондесаторы и индуктивности определенное время. А это время зависит от емкости и тока в амперах (электрический заряд нужный для зарадки). Поэтому кристаллы современных быстрых микросхем маленькие. А скорость света - не первый по важности. Я так думаю.

anonymous
()
Ответ на: комментарий от anonymous

… нехилыми конденсаторами и индуктивностями

Сосредоточенными. Отражений и стоячих волн в них нет, т.е. согласование не нужно, т.е. импеданс не имеет значения.

А ёмкость и индуктивность конечно учитываются на этапе верификации.

Кстати, чем выше диэлектрическая проницаемость - тем выше емкость. Т.е. проницаемость в любом случае выгодно уменьшать (для сигнальных проводников).

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

А ёмкость и индуктивность конечно учитываются на этапе верификации.

Еще бы не учитывался. :)

Скорость света в-хрен-пойми-какой-то-неоднородной-пористой-среде учитывается при верификации? Это к вопросу о важности скорости света.

Кстати, чем выше диэлектрическая проницаемость - тем выше емкость.

Кстати, я не спорил с этим.

И возвращаясь к изначальному посылу про скорость света и частоту для L1 кеша. Кеш - это очень много конденсаторов, у которых есть некоторые проблемы со временем зарядки.

anonymous
()
Ответ на: комментарий от anonymous

Скорость света в-хрен-пойми-какой-то-неоднородной-пористой-среде учитывается при верификации?

Конечно. И не «в-хрен-пойми-какой», а во вполне понятной с известными параметрами. Сам подумай: как не учитывать скорость распространения, если задержка в интерконнекте соизмерима с задержками в транзисторах?

И возвращаясь к изначальному посылу про скорость света и частоту для L1 кеша.

Это не ко мне вопрос, мне не охота вникать в ваши споры. Я только уточнил, что на кристалле скорость света ниже, чем в вакууме.

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Кеш - это очень много конденсаторов, у которых есть некоторые проблемы со временем зарядки.

Разве не SRAM?

anonymous
()
Ответ на: комментарий от Puzan

задержка в интерконнекте соизмерима с задержками в транзисторах

Проблема интерконнекта не в хрен-пойми-какой скорости света, а в синхронности.

Синхронность, например, обеспечивается одинаковостью проводов от тактового генератора. И не зависит от хрен-пойми-какой скорости света, главное чтоб она была одинакова для всех.

В общем, мне надоел этот «высокоинтеллектуальный» троллинг с твоей стороны. Ты похож на преподавателя на экзамене, который хочет завалить очередного студента.

anonymous
()
Ответ на: комментарий от anonymous

В общем, мне надоел этот «высокоинтеллектуальный» троллинг с твоей стороны

Настаивать не буду.

Если бы я был преподавателем, уже погнал бы ссаными тряпками за «хрен-пойми-какую скорость света» :)

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

за «хрен-пойми-какую скорость света»

Ну скажи уже точную, вычисленную по модели, скорость в некоторой известной микросхеме. И чтоб, изменение этой скорости на 10% (да даже на 30%) ломало модель.

А то вбросил скорость света в оксиде кремния, потом оксид заменил соединениями кремния, потом - пористые структуры. И ни слова про волновое сопротивление и «прочую ересь», что при некоторой частоте проводник тупо станет большим сопротивлением, почти обрывом.

anonymous
()
Ответ на: комментарий от anonymous

Ну скажи уже точную, вычисленную по модели, скорость в некоторой известной микросхеме.

Обратись на TSMC, они тебе подскажут.

что при некоторой частоте проводник тупо станет большим сопротивлением, почти обрывом.

Шта? Сам посчитаешь, какая частота резонанса стаба хотя бы 1мм длиной (не говоря про сотни-единицы микрометров)? А потом покажи мне цифровую микросхему, которая работает на такой частоте.

Кстати, тебе для информации: сопротивление проводников в микросхеме и так очень большое (до десятков килоом), по этому в моделях это обязательно учитывается (даже более важно, чем индуктивность).

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Он тут, вообще, не причем. Ты лучше подумай над своей теорией площади l1-кеша

  1. Он любит использовать это слово.

  2. Он несёт подобную пургу

    Кеш - это очень много конденсаторов, у которых есть некоторые проблемы со временем зарядки.

  3. Для него тоже «хрен-пойми-какая скорость света».

  4. Ему тоже не даёт покой L1$ и я.

  5. Он подозрительно давно не отвечает, что не свойственно.

  6. И так далее.

anonymous
()
Ответ на: комментарий от anonymous

Он любит использовать это слово.

Слово «чтоб» я использовал один раз, может быть два (вряд ли). Так же я использовал слово «чтобы»

Понимание широкой команды, VLIW (комментарий)

Я вообще не вижу разницы между словами «чтоб» и «чтобы».

Он несёт подобную пургу

Все несут пургу: и он, и я, и ты про скорость света и площадь L1 кеша (говорят, у Ryzen больше 500+ килобайт l1 кеша при 4 ГГц)

Для него тоже «хрен-пойми-какая скорость света».

У него самодостаточная «хрень» без уточнений.

Он подозрительно давно не отвечает, что не свойственно.

Щас бы иметь миллиард звезд и писать под анонимом в совершенно другом стиле. Не похоже на многозвездочных.

anonymous
()
Ответ на: комментарий от anonymous

Слово «чтоб» я использовал один раз, может быть два (вряд ли). Так же я использовал слово «чтобы»

Чтобы он тоже использует, но крайне редко.

Я вообще не вижу разницы между словами «чтоб» и «чтобы».

Чтобы используется намного чаще. У него обратная ситуация. Можно поискать и другие слова.

чтоб — Результатов: примерно 121 000 000.
чтобы — Результатов: примерно 1 090 000 000

говорят, у Ryzen больше 500+ килобайт l1 кеша при 4 ГГц

Очередной бред. Суммарно по всем ядрам, а на ядро по 32 L1i и 32 L1d у Intel.

Щас бы иметь миллиард звезд и писать под анонимом в совершенно другом стиле. Не похоже на многозвездочных.

Предела его глупости не видно.

anonymous
()
Ответ на: комментарий от anonymous

Я вот написал кое где фигню, но никто меня не поправил (конструктивно). Вот так вот на ЛОРе часто и бывает - кто нибудь с умным видом втирает дичь, и ему верят :)

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Я вот написал кое где фигню, но никто меня не поправил (конструктивно). Вот так вот на ЛОРе часто и бывает - кто нибудь с умным видом втирает дичь, и ему верят :)

Все ошибаются. Если никто не поправил, значит нет той компетенции или времени. Мы не на собрании светлейших умов человечества.

anonymous
()
Ответ на: комментарий от anonymous

Чтобы он тоже использует, но крайне редко.

Я использовал один раз «чтобы», и второй раз - «чтоб». И ты сделал глобальные выводы, как про площадь l1 кеша?

на ядро по 32 L1i и 32 L1d у Intel.

И этот размер не зависит от частоты процессоров. А у яблока размер растет (один раз выросло), но частота почти не меняется. Как ты вывел зависимость частоты и размера L1? Может быть, оптимальный размер просто зависит от архитектуры, а не от скорости света?

anonymous
()
Ответ на: комментарий от Puzan

Обратись на TSMC, они тебе подскажут.

Ну же, скажи нам, хоть какую-то точную цифру, ты же знаешь и используешь, и проектируешь размеры микросхем на основании знания скорости света. Не надо послать лесом.

Сам посчитаешь, какая частота резонанса стаба хотя бы 1мм длиной (не говоря про сотни-единицы микрометров)?

Нет, потому что для меня это - «ересь».

сопротивление проводников в микросхеме и так очень большое (до десятков килоом), по этому в моделях это обязательно учитывается

И это сопротивление зависит от линейных размеров. Чем не более важный повод для оптимизации линейных размеров, по сравнению со скоростью света?

(даже более важно, чем индуктивность).

Лучше расскажи про электроемкость.

anonymous
()
Ответ на: комментарий от anonymous

Ну же, скажи нам, хоть какую-то точную цифру

Я не TSMC, у меня нет никаких цифр.

ты же знаешь и используешь, и проектируешь размеры микросхем на основании знания скорости света.

Кто тебе такую глупость сказал?

Нет, потому что для меня это - «ересь».

Так о чем с тобой разговаривать?

И это сопротивление зависит от линейных размеров. Чем не более важный повод для оптимизации линейных размеров

Интересно, почему они делают наоборот (меньше размер - больше сопротивление)?

Лучше расскажи про электроемкость.

Погугли.

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Я использовал один раз «чтобы», и второй раз - «чтоб». И ты сделал глобальные выводы, как про площадь l1 кеша?

Это послужило подсказкой.

И этот размер не зависит от частоты процессоров.

Если он не зависит, то почему Intel и AMD не сделают такой же? Это положительно скажется на скорости вычислений. Но вместо этого они сделали тот самый L2. К L2 меньше требований по задержкам и его можно сделать больше и получать данные с задержкой в несколько таков.

А у яблока размер растет (один раз выросло), но частота почти не меняется. Как ты вывел зависимость частоты и размера L1? Может быть, оптимальный размер просто зависит от архитектуры, а не от скорости света?

Частота не меняется, а вот техпроцесс улучшается. С увеличением плотности размещения транзисторов растёт плотность хранения информации. К тому же транзисторы начинают быстрее переключаться. Так же, как мы выяснили, снижается погонная ёмкость и индуктивность. @Puzan Это ведь снизит задержки на распространение волны?

Структура L1 у всех почти одинаковая. Меняется размер L1, а зависит он от необходимой тактовой частоты. Физически невозможно сделать кэш площадью в МНОГО мм2 и тактовой частотой МНОГО ТГц. Это как с длинной волны электромагнитного излучения.

wiki

Название диапазона      Длины волн       Частоты
Инфракрасное излучение  1 мм — 780 нм    300 ГГц — 429 ТГц
Видимое излучение       780 — 380 нм     429 ТГц — 750 ТГц 

C ростом частоты уменьшается длинна волны. Потому что при разной частоте, скорость движения света одинаковая. Свет просто не может физически пройти большее расстояние.

Представь себе такой мысленный эксперимент. Тебе нужно доехать из точки А в точку Б. Ты законопослушный водитель автомобиля и не превышаешь скоростной режим в 60 км/ч (скорость электромагнитной волны). На пути у тебя много поворотов (транзисторов), перед каждым нужно замедлится. Везде эти плохие светофоры (индуктивности) на которых постоянно загорается красный, когда ты к ним подъезжаешь. На дорогах постоянные пробки (погонные ёмкости), пока машины не разъедутся дальше не проехать. В зависимости от расстояния, пробок, количества поворотов и светофорами, меняется время (такт) необходимое для совершения поездки. Например, если кто-то скажет что тебе надо добраться из Гамбурга в Красноярск за 1 минуту (43 ТГц), то это невыполнимо в таких условиях, а вот за месяц (1 ГГц) выполнимо.

Улучшение техпроцесса, это как уменьшение города/земли (повышения плотности). Твоя скорость остаётся прежней, а вот расстояние сокращается, на поворотах можно не так тормозить, красный горит меньше времени, в пробках меньше авто. Поэтому из точки А в точку Б ты добираешься быстрее.

anonymous
()
Ответ на: комментарий от Puzan

Я не TSMC, у меня нет никаких цифр.

Цифр нет, но выводы есть? И откуда могут появиться эти цифры про скорость света в неоднородной среде из проводников, полупроводников, диэлектриков, конденсаторов и тд и тп? Максимум эту скорость посчитали (измерили на реальном образце) для специальном образом проложенных проводов от тактового генератора, питающих линий и земли.

У меня есть подозрение, что ты говоришь про печатные платы, где еще можно гарантировать некоторое постоянство диэлекрической проницаемости. Про размеры и скорость света при размерах печатных промолчу.

Так о чем с тобой разговаривать?

Примени это же утверждение к себе - у тебя нет реальных цифр «скорости света».

Интересно, почему они делают наоборот (меньше размер - больше сопротивление)?

Опять «высокоинтелектуальный» троллинг. А они только толщину провода уменьшают, или длину тоже?

anonymous
()
Ответ на: комментарий от Puzan

И из-за нелинейности тоже

Исключительно из-за нелинейности.

Сами уравнения линейные, если в среде нет зависимостей параметров среды от E. Поэтому разные волны в линейных средах между собой не взаимодействуют.

Весь мир вокруг нас очень неоднородный, но подавляющей частью линейный. Воздух, земля, здания, люди. Тем не менее, радиоприемники очень хорошо выхватывают сигналы от разных радиостанций.

anonymous
()
Ответ на: комментарий от anonymous

Это послужило подсказкой.

Экстраполяция по двум точкам?

Если он не зависит, то почему Intel и AMD не сделают такой же? Это положительно скажется на скорости вычислений.

Большой размер кеша предполагает больше накладных раходов по синхронизации кешей, например.

Частота не меняется, а вот техпроцесс улучшается…

Многа букаф. Не читал, но осуждаю.

anonymous
()
Ответ на: комментарий от anonymous

Большой размер кеша предполагает больше накладных раходов по синхронизации кешей, например.

Ты про когерентность? Она тут при чём? Ну пришло сообщение, строка инвалидироваллась, дальше что?

Многа букаф. Не читал, но осуждаю.

В этом весь ты.

anonymous
()
Ответ на: комментарий от anonymous

Максимум эту скорость посчитали (измерили на реальном образце) для специальном образом проложенных проводов от тактового генератора, питающих линий и земли.

Чё? Ничего не понял.

У меня есть подозрение, что ты говоришь про печатные платы, где еще можно гарантировать некоторое постоянство диэлекрической проницаемости.

Для печатных плат это как раз сложнее сделать.

Примени это же утверждение к себе - у тебя нет реальных цифр «скорости света».

Зачем они тебе, я не пойму? Ты хочешь что-то конкретное рассчитать, или просто языком потрепать?

Опять «высокоинтелектуальный» троллинг. А они только толщину провода уменьшают, или длину тоже?

А самому подумать что мешает? Вот тебе задача: длина, ширина и высота уменьшились в два раза. Как изменится сопротивление?

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Ну пришло сообщение, строка инвалидироваллась, дальше что?

Прям только одно сообщение. :)

Чем больше кеш и чем больше этих кешей (для ядер), тем выше вероятность, что данные в кеше невалидны. И кеш превращается лишнее звено между памятью и процессором.

(И процессор с таким кешем превращается из процессора общего назначения в процессор последовательного выполнения команд над последовательно поступающими данными)

anonymous
()
Ответ на: комментарий от Puzan

Для печатных плат это как раз сложнее сделать.

Вот и не надо тащить проблемы проектирования печатных плат. Думаю, в микропроцессорах своих проблем хватает, кроме вычисления скорости света.

Вот тебе задача: длина, ширина и высота уменьшились в два раза. Как изменится сопротивление?

Продолжаешь троллить. Ответный троллинг. Зачем высоту уменьшать? Высота не влияет на площадь.

anonymous
()
Ответ на: комментарий от Puzan

Будешь травить «колодцы» в металле?

Незнаю, что за «колодцы». Но высота (толщина слоя) не напрямую зависит от линейных (длина и ширина) размеров.

anonymous
()
Ответ на: комментарий от anonymous

Но высота (толщина слоя) не напрямую зависит от линейных (длина и ширина) размеров.

Так всё таки зависит? Ты путаешься в показаниях.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Так всё таки зависит? Ты путаешься в показаниях.

Кто путается в показаниях? Ты предложил одинаковое (зависимое) изменение всех измерений в 2 раза. Я говорю, что некоторые измерения можно не менять (так же, как остальные).

anonymous
()
Ответ на: комментарий от anonymous

Прям только одно сообщение. :)

Поддержку скольких сделаешь, столько и будет. От размера кэша это не зависит.

(И процессор с таким кешем превращается из процессора общего назначения в процессор последовательного выполнения команд над последовательно поступающими данными)

Это зависит от количества потоков запрашивающих строку, а не от размера кэша. Мне кажется у тебя неправильное представление о том, как устроен кэш. Начиная с того, что ты писал что для него используют DRAM.

anonymous
()
Ответ на: комментарий от anonymous

Я говорю, что некоторые измерения можно не менять (так же, как остальные).

Во-первых, ты сказал, что «не напрямую зависит», не юли.

Во-вторых, если совсем не менять, то получатся высокие и узкие проводники. А если вспомнить, как они формируются (травлением), то станет понятно, что невозможно не уменьшать высоту с уменьшением ширины.

Хватит уже тупить. Или зарегистрируйся, чтоб народ знал своих героев.

Puzan ★★★★★
()
Ответ на: комментарий от Puzan

Во-первых, ты сказал, что «не напрямую зависит», не юли.

Ты тоже не юли. Ты предложил прямую зависимость всех измерений.

невозможно не уменьшать высоту с уменьшением ширины.

Неправду пишешь. Когда станет невозможно уменшать высоту, только тогда и уменьшат (есть достаточный запас ширины)

В добавок высота слоя влияет на диэлектрические способности слоя. Так что высота задается независимо (чтобы удовлетворить твоим требованиям «скорости света» :) )

anonymous
()
Ответ на: комментарий от anonymous

Ты предложил прямую зависимость всех измерений.

А ты какую предлагаешь?

Когда станет невозможно уменшать высоту, только тогда и уменьшат

Когда?

В добавок высота слоя влияет на диэлектрические способности слоя.

«В добавок» ты тупой. Во-первых: при чем тут диэлектрические свойства? Речь шла про сопротивление. Во-вторых: шта? Ты сморозил бред.

Puzan ★★★★★
()
Ответ на: комментарий от anonymous

Поддержку скольких сделаешь, столько и будет. От размера кэша это не зависит.

Причем тут поддержка (количества) сообщений?

Инвалидация (линий) кеша делает бесполезным существование этого кеша. Независимые кеши хороши только для работы с независимыми непересекающимися данными.

Скорее всего интел и амд экпериментально определили, что для x86 640 КБ 32 КБ (независмых данных) хватит всем. То есть, такой размер - архитектурное решение, а не влияние «скорости света».

Что там у эппла с arm, и какие архитектурные решения - я без понятия.

anonymous
()
Ответ на: комментарий от anonymous

Причем тут поддержка (количества) сообщений?

Вот и я не понимаю. Цитирую.

Большой размер кеша предполагает больше накладных раходов по синхронизации кешей, например.

Каких расходов, так и не узнали.

Инвалидация (линий) кеша делает бесполезным существование этого кеша. Независимые кеши хороши только для работы с независимыми непересекающимися данными.

Что это за бред?

Скорее всего интел и амд экпериментально определили, что для x86 640 КБ 32 КБ (независмых данных) хватит всем. То есть, такой размер - архитектурное решение, а не влияние «скорости света».

Каких независимых? Ты вообще знаешь про протоколы поддержки когерентности кэшей (MOESI)? Как это связано с размером кэша?

anonymous
()
Ответ на: комментарий от Puzan

А ты какую предлагаешь?

Я предложил высоту не менять.

Когда?

Что когда? Толщина слоя напыления металла не зависит от длины и ширины (конкретого) проводника. Как там делают проводники из поликремния - без понятия, какое у них сопротивление - тоже без понятия.

«В добавок» ты тупой.

Так и думал, что придирешься к грамматике.

Во-первых: при чем тут диэлектрические свойства?

При том, что толщина слоев (металлов и диэлектриков) задается незавсисимо от длины и ширины полосок проводников.

Речь шла про сопротивление.

Вот именно высота слоя проводника не зависит от того какие проводники из него нарисуют (вытравят).

Ты сморозил бред.

Никто не запрещает. Как и тебе.

anonymous
()
Ответ на: комментарий от anonymous

К аких расходов, так и не узнали.

Ты вообще знаешь про протоколы поддержки когерентности кэшей (MOESI)?

Протокол сам по себе без штрафов подгрузит инвалидированные данные из памяти? Обеспечение работы протокола также бесплатно дается?

Еще один верующий в то, что кеш - это только хорошо, кеш промах - это программист криворук.

anonymous
()
Ответ на: комментарий от anonymous

Протокол сам по себе без штрафов подгрузит инвалидированные данные из памяти?

Не неси чушь. Зачем из памяти? Из нижнего уровня кэша, если он общий для всех ядер.

Обеспечение работы протокола также бесплатно дается?

Большой размер кеша предполагает больше накладных раходов по синхронизации кешей, например.

Повторяю вопрос в сотый раз. Как это связано с размером кэша?

anonymous
()
Ответ на: комментарий от anonymous

Зачем из памяти? Из нижнего уровня кэша, если он общий для всех ядер.

Кеш - это не память? :)

Ты еще уровни (типы) памяти начни перечислять - регистры, кеши, оперативная, внешняя (от ssd до магнитных лент).

Повторяю вопрос в сотый раз. Как это связано с размером кэша?

Вот и напиши/нарисуй независящий от размера носителя данных(кеша) алгоритм (протокол) синхронизации данных на носителях. Сложность О(1) и по времени и по дополнительной памяти.

anonymous
()
Ответ на: комментарий от anonymous

Как это связано с размером кэша?

При этом ты @khrundel доказываешь про зависимость задержек от размера. Даже нашел объяснение этому - скорость света.

У тебя раздвоение личности или это разные анонимы?

anonymous
()
Ответ на: комментарий от anonymous

Кеш - это не память? :)

Не юли. Когда говорят про CPU кэш и память, то очевидно что под кэшем подразумевают L1-LN (обычно SRAM, быстро мало), а под памятью DDR (обычно DRAM, медленно много).

Ты еще уровни (типы) памяти начни перечислять - регистры, кеши, оперативная, внешняя (от ssd до магнитных лент).

Нижний уровень кэша обычно общий для группы/всех ядер. Лезть за недавно модифицированными данным в память не надо, они уже в кэше.

Вот и напиши/нарисуй независящий от размера носителя данных(кеша) алгоритм (протокол) синхронизации данных на носителях. Сложность О(1) и по времени и по дополнительной памяти.

Цитирую.

Ты: И этот размер не зависит от частоты процессоров.

Я: Если он не зависит, то почему Intel и AMD не сделают такой же? Это положительно скажется на скорости вычислений. Но вместо этого они сделали тот самый L2. К L2 меньше требований по задержкам и его можно сделать больше и получать данные с задержкой в несколько таков.

Ты: Большой размер кеша предполагает больше накладных раходов по синхронизации кешей, например.

  1. Ассоциативность:

    • кол-во компараторов (сравнение параллельное O(1))
    • мультиплексор O(log N))
    • размер памяти (площадь) под теги/данные
  2. Кол-во сетов:

    • мультиплексор O(log N).
    • размер памяти (площадь) под теги/данные
  3. На строку приходится 3 бита для MOESI. Этот размер никак не меняется от размера/ассоциативности кэша.

  4. Сложность поддержания когерентности зависит от количества обрабатываемых сообщений по протоколу MOESI O(N).

Увеличивая только размер кэша, на MOESI тратится 3 бита на строку. Капля (~0.5%) в море на фоне остального (512 бит данные + 55 бит тег). Давай ответ с аргументами, а не как обычно «вы всё врёте».

Мне уже надоела эта игра в одни ворота.

anonymous
()
Ответ на: комментарий от anonymous

При этом ты @khrundel доказываешь про зависимость задержек от размера. Даже нашел объяснение этому - скорость света.

Пытаешься запутать следы?

anonymous
()
Ответ на: комментарий от anonymous

Лезть за недавно модифицированными данным в память не надо, они уже в кэше.

Они возможно есть в кеше нижнего уровня, обращение к которому больше чем обращение к текущему кешу.

И почему ты регистры процессора не считаешь кешем (памятью)?

По твоей логике лучше сделать большой регистровый файл (блок, или как там правильно). И чем больше, тем лучше. Что ты мелочишься на каких-то кешах?

И что только 3 отвечает за поддержание синхронности (достоверности, целостности, когерентности) данных в памяти? Данные не надо копировать, перемещать? «Пришло всего лишь одно сообщение» и нужные данные сами материализовались?

Ты спецом тупишь, или оправдываешь тупостью свой бред?

Давай ты лучше сперва на реальных фактических данных нарисуешь график «частота – размер l1».

Минимум из 10 точек, а не из 2.

Любитель экстраполировать по 2 точкам.

Потом будем строить теории заговора свидетелей скорости света.

anonymous
()
Ответ на: комментарий от anonymous

Они возможно есть в кеше нижнего уровня, обращение к которому больше чем обращение к текущему кешу.

И почему ты регистры процессора не считаешь кешем (памятью)?

Почему ты кэш не считаешь регистрами (памятью)?

По твоей логике лучше сделать большой регистровый файл (блок, или как там правильно). И чем больше, тем лучше. Что ты мелочишься на каких-то кешах?

Ты не сможешь, для рег. файла нужно много портов.

Ты спецом тупишь, или оправдываешь тупостью свой бред?

Давай ты лучше сперва на реальных фактических данных нарисуешь график «частота – размер l1».

Минимум из 10 точек, а не из 2.

Любитель экстраполировать по 2 точкам.

Потом будем строить теории заговора свидетелей скорости света.

Что и требовалось доказать. Аргументация отсутствует.

Басня голубь и шахматы

anonymous
()
Ответ на: комментарий от anonymous

Почему ты кэш не считаешь регистрами (памятью)?

Это я начал разделять разные виды памяти, стрелочник-экстраполятор?

Я как задаю вопрос: почему ты прицепился к L1 и незамечешь «более эффектное» увеличение регистров?

Давай, вперед, рисуй график зависимости количества регистров от частоты процессора. Там тоже поищем теории заговора скорости света.

Аргументация отсутствует.

Смысл аргуметировать твой бред.

anonymous
()
Ответ на: комментарий от anonymous

O(log N)

Лучше бы здесь исправил, добавил константу c - скорость света, чтобы «аргументировать» зависимость от скорости света.

anonymous
()
Ответ на: комментарий от anonymous

Поправил. O(log2 N)

В военных условиях pi = 4, ой, то есть скорость света с = 2 (безразмерная величина)

Так держать. Продолжай «аргументировать».

anonymous
()
Ответ на: комментарий от i-rinat

O(log N)

Поправил. O(log2 N)

Продолжай «аргументировать».

Да ладно тебе, это же явно шутка.

Да ладно тебе. Шутки - это серъезная работа шута, в том числе меня.

anonymous
()
Ответ на: комментарий от i-rinat

Да ладно тебе, это же явно шутка.

Какая задержка в мультиплексоре? Я без шуток, мне интересно. Я обычно слышал про O(log2 n).

https://cpb-us-e1.wpmucdn.com/blogs.ntu.edu.sg/dist/8/1266/files/2017/01/multiplexer-2n48vly.pdf

CONCLUSION

In this work, efficient in-memory schemes with O(log2 n) delay for multiplexer and priority multiplexers have beenproposed using 1S1R arrays.

anonymous
()
14 февраля 2021 г.
Ответ на: комментарий от anonymous

в планковской системе единиц c=1

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.