LINUX.ORG.RU
ФорумTalks

RIP видеокарты AMD

 ,


0

2

https://www.nvidia.com/en-us/geforce/news/introducing-rtx-30-series-graphics-...

3070 — $499, производительность чуть лучше, чем у 2080ti.
3080 — $699.
3090 — $1499.

У «красных» просто нет шансов, и это печально. Отсутствие конкуренции ни к чему хорошему не приводит.

★★

Последнее исправление: pelmeshechka (всего исправлений: 2)
Ответ на: комментарий от peregrine

основных сюжетов не больше сотни. На самом деле и в других жанрах не лучше, но это тебе теоретики литературы могут рассказать

Все хэпи-энды это один и тот же жанр — жвачка для слесарей и обитателей офиса. Единственное значительное разделение в ширпотребе — это женский жанр и мужской. В мужском жанре обыкновенные японские сверхчеловеки превозмогают в честном бою, при этом мужественно сталкиваясь с роялями в кустах, и когда шанса уже нет — побеждают тысячу врагов единственным криком отчаяния. В женском жанре обиженная судьбой золушка с характером советской продавщицы капризничает и выносит всем мозги, при этом всё ее окружение настроено против нее, а она вопреки становится царицей.

Еще Пушкин троллил женский жанр своей золотой рыбкой, где при том же начальном сценарии в итоге золушка оказалась там же. где и начинала. Но бабам нужна золушка с хэпи-эндом, «если я чего-то не вижу — этого не существует». Справедливости ради, нужно заметить, что и сам Пушкин написал «Сказку о царе Салтане» — правда, это все-таки была переработка «По колена ноги в золоте, по локоть руки в серебре».

гугли классификацию сюжетов

https://ru.wikipedia.org/wiki/Тридцать_шесть_драматических_ситуаций

Список раздут для серьезности. Статья говорит: «Польти предложил 36 сюжетов, к которым сводятся известные пьесы. Многочисленные попытки дополнить этот список только подтвердили верность исходной классификации основных (или бродячих) сюжетов», но почему-то не желает упоминать, что пункты крайне похожи. Например: «Месть близкому за близкого», «Ненависть между близкими», «Соперничество между близкими», «Адюльтер, сопровождающийся убийством», «Невольное убийство близкого», «Жертва близким во имя долга», «Бесчестие любимого существа», «Безосновательная ревность» — это практически одна и та же болезнь но с разными симптомами, а именно — внутриплеменной конфликт по разным поводам. Я подчеркиваю, что не причинам — а поводам. Семейные психологи говорят, что основная причина семейных конфликтов — это что туфли в прихожей стоят не параллельно друг другу. У каких-нибудь кавказцев, например, в культуре нет никакой жертвы близкими во имя долга, потому что твоя семья является твоим единственным долгом. Если ты предаешь семью, то перестаешь быть ее членом и подлежишь уничтожению — всё просто и понятно, никакой драмы.

Особенно архаичным выглядит «Невольное кровосмешение» — нынешние японские порномультики очень даже успешно экплуатируют сценарий безо всякой драмы.

byko3y ★★★★
()
Ответ на: комментарий от Thero

новый охлад с точки зрения инженерки чума и лишён возможности косячнуть также как с фаундерами 2080 косячнули, но может конечно что и всплывёт неожиданное. на кастомах уже конечно зависит от качества сборки но там и с 2080 справились

Что еще за новый охлад? Каким образом он поможет спасти от отвала огроменного электронагревательного чипа? Чуть неравномерно пошел отвод тепла — и привет. И даже не обязательно самая пайка должна пострадать — глючить может начать сама микросхема, или перегореть близко расположенные электронные компоненты (как это было на некоторых картах 1070 и 1080). Что характерно, с мелкими чипами таких проблем почему-то нет, хотя, казалось бы, удельное тепловыделение по площади то же.

byko3y ★★★★
()
Ответ на: комментарий от praseodim

Что-то мне подсказывает, что если отставание от nvidia станет эпичным, и Сони и Майкрософт могут попробовать и пересмотреть договоренности

Какое еще «отставание»? Ты о чем вообще?

byko3y ★★★★
()
Ответ на: комментарий от grem

Дались вам эти зеркала. Лучи - это про честный GI без сношений. Чтобы зажёг в ванной единственную лампочку на сцене - и при открытых дверях, за счёт radiosity хватило освещенности сидеть в туалете.

TooPar
()
Ответ на: комментарий от grem

Даже в Unreal Tournament (1999) зеркала были, в которых можно было посмотреть на своего движущегося и стреляющего персонажа.

Кек, это и в duke nukem было

madcore ★★★★★
()
Ответ на: комментарий от TooPar

Дались вам эти зеркала. Лучи - это про честный GI без сношений. Чтобы зажёг в ванной единственную лампочку на сцене - и при открытых дверях, за счёт radiosity хватило освещенности сидеть в туалете

Обычные расчеты динамического света в прямом направлении (от моделей к камере) вполне себе справляются этой задачей.

byko3y ★★★★
()

Новые печи за много долларов впечатляют. Ещё бы игры годные подвезли, а не новомодный кал.

Valeg ★★★
()
Ответ на: комментарий от Valeg

Новые печи за много долларов впечатляют. Ещё бы игры годные подвезли, а не новомодный кал

Вот именно! Они тупо не нужны. 1030 лично мне хватает с головой, но я не шибко придирчив к графике.

byko3y ★★★★
()
Ответ на: комментарий от TooPar

Далось тебе это переотражение. Вон в doom3 всё расхваливали освещение и тени… в потёмках,где ничего не видно. Всё равно тогда уж имитировать постепенное привыкание к пониженной освещённости нужно реализовывать.

grem ★★★★★
()
Ответ на: комментарий от byko3y

-_- основной профит от лучей сначала будет для разработчиков игр и тридемоделеров. потому что убирает из их работы очень сложные ресурсоёмкие операции. и сделать красивый арт дирекшен можно будет дешевле, а арт дирекшен гораздо сильнее влияет на ощущение реализма. но да ладно не видно и не видно. не покупайте.

Thero ★★★★★
()
Ответ на: комментарий от RazrFalcon

Это ты к torvn77, я не разбираюсь, так краем глаза на толчке видел.

peregrine ★★★★★
()
Ответ на: комментарий от Meyer

у меня монитор даже не фуллхд... че тьі вааще как маленький...

Jetty ★★★★★
()
Ответ на: комментарий от Thero

основной профит от лучей сначала будет для разработчиков игр и тридемоделеров. потому что убирает из их работы очень сложные ресурсоёмкие операции

Какие? Я первый раз слышу о том, что триде модельеров колышет освещение.

byko3y ★★★★
()
Ответ на: комментарий от Thero

вы шо и презентацию не смотрели? о чём тогда разговор про технические детали?

Я думаю, что в официальной презентации для хомяков меньше всего актуальных технических деталей.

byko3y ★★★★
()
Ответ на: комментарий от Thero

знали бы вы как они делаются сейчас и что меняет РТХ

PTX? Parallel Thread Execution Virtual Machine? При чем тут это?

byko3y ★★★★
()
Ответ на: комментарий от WitcherGeralt

Если ты книжную серию не прочёл, тебе понять всю прелесть

Умудрился 200 часов наиграть, а глубины сюжета так и не уловил. В который раз оправдываешь комментарий в профиле.

Тут взаимоисключающие параграфы. Если игра не может полноценно раскрыться за 200 часов, то это проблема игры. Я тоже книгу не читал, в игру гриндил часов 100-120 и таки не могу сказать, что она меня чем-то зацепила.

filosofia
()
Ответ на: комментарий от sparkie

Походу придется немного подождать (с) нормальных бенчмарков на реальном железе.

Презентация от интела была ультраубогая.

Midael ★★★★★
()
Ответ на: комментарий от Thero

вы шо и презентацию не смотрели? о чём тогда разговор про технические детали?

Посмотрел презентацию: https://www.youtube.com/watch?v=E98hC9e__Xs

Что ж, поясню для тех, кто мыслит презентациями вместо технических данных.

Давайте начнем с машинного обучения. Нейронная сеть в общем своем виде представляет собой преобразование, которое для трех входов (x1, x2, x3) и четырех выходов нейронов (y1, y2, y3, y4) можно описать как:

y1 = f(x1 * W1_1 + x2 * W1_2 + x3 * W1_3)
y2 = f(x1 * W1_2 + x2 * W2_2 + x3 * W2_3)
y3 = f(x1 * W1_3 + x2 * W3_2 + x3 * W3_3)
y4 = f(x1 * W1_4 + x2 * W4_3 + x3 * W4_3)

где f — это передаточная функция нейрона. Здесь я для упрощения убрал смещение из вычислений.

Математически это перемножение матриц, после которого по результирующей матрице проходятся передаточной функцией:

                          | x1 |
                          | x2 |
                   Х      | x3 |

| W1_1   W1_2   W1_3 |   | y1(f) |
| W2_1   W2_2   W2_3 |   | y2(f) |
| W3_1   W3_2   W3_3 |   | y3(f) |
| W4_1   W4_2   W4_3 |   | y4(f) |

Мы умножили матрицу 3x4 на матрицу 1х3, затратив на это 4х3х1 = 12 умножений и 4х(3-1)х1 = 8 сложений. Если кто не в курсе, что такое умножение матриц:
https://ru.wikipedia.org/wiki/Умножение_матриц

Что такое тензорные ядра в нвидии. Это тупо вычислитель в составе потокового процессора, который берет три матрицы A, B, C размера 4х4, и вычисляет A x B + C. В данном случае матрица C — это смещения, которые нам не интересны. Сложность самого умножения матриц 4х4 — 4х4х4 = 64 умножения и 4х3х4 = 48 сложений.

Знакомый с продвинутой математикой человек сразу заметит, что в простой нейронной сети входные сигналы представляют собой одномерную матрицу, а вычислитель считает произведение двух двухмерных. Чтобы на полную катушку загрузить вычислитель, нужно иметь несколько наборов входных данных. А это именно то, что делает сверточная нейронная сеть — она проходит одной маской по всему изображению, уменьшая размерность данных. Таким образом одна большая входная картинка превращается в большое число маленьких входных картинок, пропускаемых по одним и тем же весам. То есть, тензорные ядра специализируются на ускорении обработки изображений.

Итак, 64 умножения и 48 сложений тензорное ядро выполняет за один цикл. По этой причине два таких ядра занимают столько же места, сколько 16 универсальных вычислителей с одинарной точностью, которые числа половинной точности считают по два за такт. При этом значения в матрицах A и B в операции «A x B + C» задаются в половинной точности (2 байта), а смещение C и результат — с одинарной точностью (4 байта). Ну типа сто помножить на сто — будет десять тысяч, число намного больше, потому множители вроде как должны быть меньше произведения по размеру.

Сколько же тактов нужно будет универсальным вычислителям для реализации тех же функций суперскоростных тензорных ядер? На 64 умножения половинной точности им нужно будет 64/16/2 = 2 цикла, на сложения с одинарной — 48/16 = 3 цикла. Итого 5 циклов, пятикратная разница производительности. Это примерно та цифра, которую вы увидите на реальных бенчах, например:

https://blogs.nvidia.com/blog/2020/05/14/tensorfloat-32-precision-format/#att...

то есть, 3-6 раз вместо маркетингового булшита про 8-20 раз ускорения.

Для тех, кто занимался высокопроизводительными вычислениями, может показаться логичным вопрос: а как весь этот массив данных будет читаться из памяти? Пропускная способность канала оперативной памяти не бесконечная, вы не можете просто пятикратно увеличить производительность процессора — нужно будет пятикратно увеличивать ширину канала памяти. Однако же, если вы посмотрите на спецификации, то увидете, что 1080 c 3840 шейдерными ядрами имела канал 550 Гб/с, а 3070 с 5900 ядрами имеет канал 512 Гб/с — удельная пропускная способность снизилась. Да, это первое, с чем столкнется юный программист сосбтвенных нейросеток на видеокарте — если плохо работать с кэшем, то никакого ускорения не будет. В случае грамотно реализованной сверточной сети маски остаются в кэше, а подгружаются части картинки.

Причем, как показали бенчи, где-то в районе матрицы 8129х8192 производительность тензорных вычислений падает эдак на 40%:
https://sci-hub.tw/10.1007/978-3-030-10549-5_35 - Benchmarking the NVIDIA V100 GPU and Tensor Cores

То есть, при применении самых оптимальных алгоритмов, карточка оптимизирована под изображение 8к. Причем, такого завала нет для обычных шейдеров.

Что же мы имеем в сухом остатке? 20% чипа заняты узкоспециализированными вычислителями для ускорения сверточных нейронных сетей, обрабатывающих изображения разрешением до 8к. Если бы вместо тензорных ядер нвидия поставила бы в два раза больше АЛУ одинарной точности, то 3-6 раз ускорения превратились бы в 2-3 раза ускорения, причем, не затыкающегося на больших разрешениях из-за ширины канала памяти.

Далее, перейдем к трассировке лучей. Это по сути ASIC, занимающий примерно 20% площади кристалла, интерфейсов программирования к которому у простого смертного нет, и всё, что мы о нем знаем — это что оно считает пересечение лучей с многогранниками, и делает это очень быстро. Замечательные алгоритмы для задания команд этим ASIC-ам будут содержаться исключительно в проприетарных драйверах нвидии. И если нвидия еще как-то пытается впарить перемножение матриц на тензорных ядрах для решения задач оптимизации/решения системы линейных уравнений (с половинной точностью, LOL), то трассировка лучей, судя по всему, настолько специализированная и бесполезная, что интерфейсы к ней даже не открыты.

А это значит, что драйвера нвидии станут больше, сложнее, и надежнее. Примерно как GeForce Experience, которая периодически превращает топовый графен-кинцо в тыкву с 10 фпс, и возвращает на 60 фпс после удаления софтины.

основной профит от лучей сначала будет для разработчиков игр и тридемоделеров

И вот я сижу и думаю: а чем же это лучи помогут мне проще разрабатывать игорь? Поскольку большинство карточек на рынке не имеют наглухо закрытых проприетарных интерфейсов для трассировки, особенно ноутбуки и игровые консоли, то разрабам придется делать версии с трассировкой и без — упростили себе работу? Не думаю.

В презентации упоминалось повышение разрешения изображния при помощи нейросеток. По сути, нейронная сеть распознает некоторые заранее изученные анимации по отдельным элементам, и воспроизводит анимацию в высоком разрешении. В презентации показан удачный пример — но они не показали неудачных примеров, когда нейросетка всовывает артефакты в изображения, некорректно распознавая анимацию. Недостаток нейросеток — это их плохая предсказуемость, так что артефакты вы не найдете до тех пор, пока не воспроизведете тестовую сцену. Чтобы максимизировать полезный эффект и минимизировать вредный, сцен должно быть меньше и нужно больше времени потратить на отыскивание нераспознающихся важных анимаций — как той самой надписи на ящике, которая даже в полном честно отрендереном разрешении отрисовывается хуже, чем в восстановленном нейросеткой из пониженного разрешения. Очевидно, на эту надпись разрабы сетку натаскали. Что делать разрабам рогаликов с открытым миром и случайными событиями в онном? Забыть про эту фичу, как про страшный сон.

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от Thero

Подведем итоги: 20% площади занимают тензорные ядра, еще 20% — трассировка лучшей. Если вы запускаете «старую» игру эдак 2015 года, то у вас будет работать только 60% кристалла. Это следствие маркетинговых особенностей изготовления микросхем по более тонкому техпроцессу: клепать мелкие чипы тупо невыгодно, проще засунуть больше бесполезных фич на кристалл, которые может быть когда-нибудь кому-то пригодятся, чем выпускать маленький бюджетный кристалл по цене всего-лишь чуть-чуть меньше. По этой причине нынче все десктопные центральные процессоры обязательно содержат графический ускоритель и контроллер памяти, а еще, желательно, кучу ядер, которые большую часть времени не будут использоваться. Напоминаю про проблему ширины канала памяти, в которую чип бы серьезно уперся, если бы шейдерных процессоров было бы еще в два раза больше.

Таким образом, со стороны нвидии маркетинговая ситуация выглядит так: амд подступает со стороны старых технологий. нам нужно придумывать что-то новое; все годные решения уже обсосаны по семь раз, нейросетки и трассировки лучей являются большими затратами ресурсов с малым выхлопом, потому массовому потребителю не нужны от слова «совсем»; нужно, как и раньше, уходить на более тонкие техпроцессы, с большей плотностью элементов при том же энергопотреблении, а значит больше шейдеров на чипе — но куда уже больше, если всё самое ресурсоемкое кинцо воспроизводится в разрешении 8к с 120 фпс в об глаза для VR? Принимается решение — количество шейдеров увеличивать, но не сильно, потому что расширять канал памяти будет дорого, а на освободившееся место закинуть мусор — какой-то процент лошар на него поведется, пусть и не все. У остальных же мы будем трясти перед лицом теоретическим ростом терафлопсов при неизменной цене, вроде «в два раза быстрее за те же деньги, вот же ж закон Мура в действии, а вы смеялись, мол, стагнация» — скромно при этом умалчивая, что 24 Гб GDDR6 стоит около $200, стоимость изготовления чипсета — порядка $50-100, а купите вы это дело в сборе за $1500, то есть, с 6-кратной наценкой за возможность прикоснуться к bleeding-edge.

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от Midael

Презентация от интела была ультраубогая

Не Стив Джобс, да? «О ГОСПОДИ, ПО ЭТОЙ КОРОБОЧКЕ МОЖНО ЗВОНИТЬ ЛЮДЯМ». Ну а что интелю можно придумать? Мы сделали самый такой же процессор для сужающегося рынка десктопов и ноутбуков?

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)

Не плохо, надо будет посмотреть на свой заработок в следующем году и может даже обновлю свою RX488.

Dred ★★★★★
()
Ответ на: комментарий от byko3y

блин.. люди и правда из любой информации стараются выцепить те детали которые подтверждают их убеждения, но не знал что это бывает настолько сильно выражено. пожалуй мы недопустимо приблизились к грани за которой я в чём-то вас убеждаю…

Thero ★★★★★
()
Ответ на: комментарий от byko3y

Интересно объяснили все. Маленькая поправка про

нынче все десктопные центральные процессоры обязательно содержат графический ускоритель и контроллер памяти, а еще, желательно, кучу ядер, которые большую часть времени не будут использоваться.

Видеоядро везде только у интеловских процессоров в обязательном порядке. Ядра я бы не сказал, что не используются.

Про трассировку лучей есть quake-2 в роли этакой демки. Когда уже древняя по компьютерным меркам игра стала намного реалистичней.

AMD что-то такое с трассировкой лучей обещала в будущих картах.

То есть, технология все же продвигается потихоньку.

praseodim ★★★★★
()
Ответ на: комментарий от byko3y

Я первый раз слышу о том, что триде модельеров колышет освещение.

Видишь ли, развёртку под запекаемые лайтмапы делают именно триде моделеры. И это ой какой геморрой.

MageasteR ★★★★★
()

Чёт как в 2001 году: nvidia быстрая, под линуксом/фрёй ATI только нормально GL рендерит, а Intel загадочен...

Shadow ★★★★★
()
Ответ на: комментарий от praseodim

Про трассировку лучей есть quake-2 в роли этакой демки. Когда уже древняя по компьютерным меркам игра стала намного реалистичней.

Она стала странной, а не реалистичной. Т.к. чтобы игры выглядела красиво нужно чтобы над игрой поработали дизайнеры которые делали эту игру. Теперь в куаке2 не к месту прикрученный рейтрейсинг.

wrangler2020
()
Ответ на: комментарий от Thero

блин.. люди и правда из любой информации стараются выцепить те детали которые подтверждают их убеждения, но не знал что это бывает настолько сильно выражено. пожалуй мы недопустимо приблизились к грани за которой я в чём-то вас убеждаю

К сожалению, мы приблизились к той грани, где ты просто некомпетентен и не способен ответить что-то по существу.

byko3y ★★★★
()
Ответ на: комментарий от wrangler2020

Естественно вторая квака сликом старая и не содержит реалистичных текстур, устаревший движок и т.п. Тем не менее, лучи добавили некоторой реалистичности, в частности с переменным освещением.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Видеоядро везде только у интеловских процессоров в обязательном порядке. Ядра я бы не сказал, что не используются

ты кресты компилируешь? Может у тебя и используется. Я вот в ведьмака играл, и для интереса посмотрел на графики загрузки ядер — примерно на 40% каждое из четырех загружено.

Про трассировку лучей есть quake-2 в роли этакой демки. Когда уже древняя по компьютерным меркам игра стала намного реалистичней

Потому что бесполезно демонстрировать технологию по сравнению с современным динамическим освещением — люди просто не заметят разницы. Никто не будет тебе показывать Quake 2 с классическим динамическим освещением против трассировки лучей.

byko3y ★★★★
()
Ответ на: комментарий от MageasteR

Видишь ли, развёртку под запекаемые лайтмапы делают именно триде моделеры. И это ой какой геморрой

Ты имеешь в виду автоматическую генерацию карт освещения во время разработки? UE использовал для разработки трассировку лучей черт знает каком году, для этого ему не нужно было никаких нвидий. Если говорить про то, что как бы карт освещений делать не нужно, а трассировка нвидии сделает магию за тебя — увы не сделает, на видео даже показаны конкретные моменты, где трассировка выдает полную дристню:

https://www.youtube.com/watch?v=sFhc951RhfI — Quake 2 Ray Tracing

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от praseodim

Естественно вторая квака сликом старая и не содержит реалистичных текстур, устаревший движок и т.п. Тем не менее, лучи добавили некоторой реалистичности, в частности с переменным освещением

В каком году OpenGL уже мог делать освещение из точки? Это я про свет от выстрелов и факелов. Если бы они на радость эпилептикам не сделали такое яркое сверкающее освещение, то внезапно оказалось бы, что теней от фигур уже и не заметно, и классические тени очень даже справляются с задачей.

Да, тени от движущихся объектов сделать сложнее, и отражения от неровных поверхностей тоже весьма ресурсоемко сделать, потому что проекция отрисовывается на неровной проверхности кучу раз со смещениями — тем не менее, это вполне себе реализовывалось и требовало намного меньше ресурсов, чем трассировка.

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от praseodim

Вообще-то не везде. В екстимах позже и7 позже и9 - обично нет гпу :)

Jetty ★★★★★
()

У «красных» просто нет шансов, и это печально. Отсутствие конкуренции ни к чему хорошему не приводит.

шо за вброс? шо за кипеш? амд хватит консолей, это раз. амд выкатит свой ответ чуть позже, а там и интел в средне-начальном сегменте конкуренции добавит всем.

grovekeeper
()
Последнее исправление: grovekeeper (всего исправлений: 1)
Ответ на: комментарий от grem

Вон в doom3 всё расхваливали освещение и тени

И? Для своего времени это был некстген и это очень добавляло атмосферности игре.

grovekeeper
()
Ответ на: комментарий от WitcherGeralt

На днях вышел Control в стиме, GTX 1080 в 4К на ультрах выдаёт 17фпс.

послезавта выйдет киберпанк и положит rtx 3xxx, что дальше?

grovekeeper
()
Ответ на: комментарий от KillTheCat

Похоже новую видюху я вместе с БП брать буду :)

держите нас в курсе

grovekeeper
()
Ответ на: комментарий от byko3y

Polaris30 XT aka RX 590 выдает 60% производительности 1080, а стоит в три раза дешевле.

А мне другое интересно, как при равной мощности 590 и 1080, полярисы умудряются отставать в производительности?

grovekeeper
()

У «красных» просто нет шансов, и это печально

фтопку, линукс не для игор

grovekeeper
()
Ответ на: комментарий от grovekeeper

И? Для своего времени это был некстген и это очень добавляло атмосферности игре.

Ничего оно не добавляло, все ругались.

grem ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.