LINUX.ORG.RU
ФорумTalks

Nvidia vs ATI: разный OpenCL?!

 , ,


0

1

AMD R9 280X и Nvidia GT210.
Т.е. довольно крутая видяха и затычка для монитора.

Есть две (проприетарных) моих рабочих софтины. Одна шьет панорамы а другая 3д-модели предметов по их фотографиям.

Случайно обнаружил дикий факт, фотоскан, тот который для 3д моделей, на двух opencl-ядрах нвидии шьет почти так же резво, как указанная амд на 32 opencl-ядрах!

Ну а в панорамном софте эта смешная 210я нвидия вообще не поддерживается.

Обе софтины для работы на видеокартах требуют OpenCL. Он что, «разный»?

Как так то?!


Вдогонку:
Нвидия точно умеет опенцл. Но почему майнеры поголовно на амд сидели?

dk-
() автор топика

Есть две (проприетарных) моих рабочих софтины.

Обе софтины для работы на видеокартах требуют OpenCL. Он что, «разный»?

Нет кода - можно считать, что разработчикам доплатила Nvidia/AMD или они быдлокодеры.

Был бы код - были бы более веские аргументы и факты, а так - гадание на кофейной гуще.

Chaser_Andrey ★★★★★
()
Ответ на: комментарий от sehellion

Но в играх же такого не наблюдалось вроде? (я хз. на прошлой неделе я впервые в жизни купил видеокарту)
А только в майниге на опенцл?

dk-
() автор топика
Ответ на: комментарий от Chaser_Andrey

Спору нет. Конкретики нет и не будет.

Хотя автор панорамного софта не видит никакой разницы между картами обоих лагерей. И от коллег не слышал, что бы невидии были негодны.

dk-
() автор топика
Ответ на: комментарий от sehellion

Потому что даже средние модели от амд обгоняли топовые зеленые карты

В подсчете целочисленных хэшей с применением битовых сдвигов, что GPU вообще не обязан быстро делать.

Kosyak ★★★★
()

ATI <...> AMD R9 280X

Каким боком тут ATI?

Случайно обнаружил дикий факт, фотоскан, тот который для 3д моделей, на двух opencl-ядрах нвидии шьет почти так же резво, как указанная амд на 32 opencl-ядрах!

Сдаётся мне, OpenCL в той программе задействован для галочки и основную работу выполняет всё равно CPU.

Там, где OpenCL используется полноценно, средненькая AMD многократно рвёт в клочья топовую Nvidia.

Quasar ★★★★★
()
Ответ на: комментарий от Chaser_Andrey

Nvidia вообще плохие GPGPU из игровых карт.

Quasar ★★★★★
()
Ответ на: комментарий от dk-

Было тестирование OpenCL на AMD и Nvidia. AMD во всех без исключения случаях показывала на порядки большую производительность. Ссылку сейчас не помню, но могу откопать. То есть, майнингом дело не ограничивается.

Quasar ★★★★★
()

Как так то?!

Написать неэффективный алгоритм - особого ума не надо. Кроме того, есть задачи, которые не параллелятся. Больше можно сказать только увидя код

zgen ★★★★★
()
Ответ на: комментарий от Quasar

4.2. Вообще-то это зависит от 1) целочисленные вычисления или с плавающей запятой, 2) если второе, то какая точность. Просто это известный факт, что у амд перекос в сторону целочисленных операций (и это далеко не всегда хорошо).

lu4nik ★★★
()
Ответ на: комментарий от lu4nik

Как раз у Nvidia перекос в сторону целочисленных операций, так как всё, что не Quadro, урезано по вычислениям с плавающей точкой. У AMD же урезаний нет, поэтому игровой Radeon унижает не только игровой GeForce в параллельных вычислениях, но и профессиональную Tesla, если смотреть на OpenCL (с CUDA у nvidia дела получше).

Quasar ★★★★★
()
Ответ на: комментарий от Quasar

Только вот новые максвеллы явно быстрее в вычислениях с плавающей запятой... правда при условии, что не будет израсходовано больше 3 гб видеопамяти. Они же с контроллером жестко накосячили.

steemandlinux ★★★★★
()

Nvidia vs ATI: разный OpenCL?!
шьет панорамы а другая 3д-модели предметов по их фотографиям.

В открытых дровах для AMD пока не реализован нативный обсчёт изображений.
Можешь блоб попробовать, как вариант.

Но почему майнеры поголовно на амд сидели?

Потому что AMD быстрее, выгоднее, майнинг идеально работает на открытых дровах. Сравнения на практических задачах есть тут.

shahid ★★★★★
()
Ответ на: комментарий от sluggard

Да вот тоже так считал. А теперь думаю, может ошибаюсь, ведь выше пишут:

Можешь блоб попробовать, как вариант.

greenman ★★★★★
()

Параллельное программирование на данный момент реально предоставляет пожалуй один из самых крупных в сегодняшнем мире программного обеспечения наборов методов опасно выстрелить себе в ногу. Результат зависит от многих факторов aka размера доступной памяти, типов этой самой памяти, числа ядер, скорости загрузки ядра программы в карту и прочее, а главное от человека, который всё это учитывает или игнорирует. И да, по большому счёту в идеале OpenCL без разницы где считаться на CPU или GPU, так что вполне возможно, что программа вообще на карте не считается, а только ядра CPU задействует.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 2)
Ответ на: комментарий от greenman

Не, я поганый вендузятник :(

dk-
() автор топика
Ответ на: комментарий от Evgueni

Про память:

Я взял для сравнения 2 версии 280Х, со стандартными 3гб памяти и с 6гб.

Пятигуй - очень отзывчив к количеству оперативки в видяхе (сам проверял, и авторы подтверждают). Но... что-то в драйверах накосячено, что пятигуй в 6гб версии карты все равно упорно считает, что их только 3.

Пришлось брать 290 с 4гб (



> так что вполне возможно, что программа вообще на карте не считается, а только ядра CPU задействует.

к счастью, у меня реально считают видяшки, разница с процом (а это неслабый 5820 в разгоне) - огромна, в разы, а в некоторых вещах в десятки раз (для амд).

dk-
() автор топика
Последнее исправление: dk- (всего исправлений: 1)
Ответ на: комментарий от dk-

Память в GPU очень разная и для разных вещей там доступны разные её объёмы. В разных ситуациях могут вылезать ограничения на её объём если доступиться к ней нужно быстро.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

там вообще черт ногу сломит.

автор софта пишет, что ггдр5 - сильно лучше ддр3, и пофиг размер если есть хотя бы 1гб.

на деле: нвидия 5х0М (не помню, ноутбучная) в редакции 2гб гддр5 - считает в 1.6-2 раза медленнее, чем в редакции 4гб ддр3

dk-
() автор топика
Ответ на: комментарий от dk-

Зависит от ситуации. У тебя может оказаться так, что размер текстуры не влезает в доступный для нити объём (не совпадает с полным объёмом памяти, причём сильно) и это всё автоматом вываливается в обычную компьютерную память с соответствующими издержками.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

Угу.

Темный лес блин :)
Сейчас 290-я считает одну операцию, мониторю нагрузки:
загрузка ГПУ либот 0 либо 100%. Лесенка уже несколько часов. Памяти тратит тольо 1.5гб из 4.

А вот у процессора все 6 ядер лежат на 100% не отрываясь. Общекомповая оперативка занята далеко не вся. ССД - утилизирован процента на 2-3.

\\но без видяхи считает в 6-8 раз медленнее.

dk-
() автор топика
Ответ на: комментарий от dk-

Пока да, но ситуация выправляется, правда, выправляется в самых дорогих на сегодня моделях (ядра в GPU становятся больше похожи на независимые процессоры), а с другой стороны идёт работа над тем, чтобы в CPU напихать сотни ядер. Ну и почти всё зависит от используемого алгоритма. Та же лесенка возникает из-за того, что где-то стоит точка синхронизации.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 2)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.