Nvidia vs ATI: разный OpenCL?!

0

1

AMD R9 280X и Nvidia GT210.
Т.е. довольно крутая видяха и затычка для монитора.

Есть две (проприетарных) моих рабочих софтины. Одна шьет панорамы а другая 3д-модели предметов по их фотографиям.

Случайно обнаружил дикий факт, фотоскан, тот который для 3д моделей, на двух opencl-ядрах нвидии шьет почти так же резво, как указанная амд на 32 opencl-ядрах!

Ну а в панорамном софте эта смешная 210я нвидия вообще не поддерживается.

Обе софтины для работы на видеокартах требуют OpenCL. Он что, «разный»?

Как так то?!

Ссылка

←	Беспроводные клава+мышь с двумя приемниками и выбором текущего активного?

Готовимся к FOSDEM

→

Вдогонку:
Нвидия точно умеет опенцл. Но почему майнеры поголовно на амд сидели?

~~dk-~~ ☆
(28.01.15 01:47:47 MSK) автор топика

Есть две (проприетарных) моих рабочих софтины.

Обе софтины для работы на видеокартах требуют OpenCL. Он что, «разный»?

Нет кода - можно считать, что разработчикам доплатила Nvidia/AMD или они быдлокодеры.

Был бы код - были бы более веские аргументы и факты, а так - гадание на кофейной гуще.

Chaser_Andrey ★★★★★
(28.01.15 01:49:37 MSK)

Ответ на: комментарий от dk- 28.01.15 01:47:47 MSK

Потому что даже средние модели от амд обгоняли топовые зеленые карты

sehellion ★★★★★
(28.01.15 01:49:58 MSK)

Ответ на: комментарий от dk- 28.01.15 01:47:47 MSK

Потому что nvidia хреново считает хэши sha256 из-за архитектуры.

Chaser_Andrey ★★★★★
(28.01.15 01:50:39 MSK)
Последнее исправление: Chaser_Andrey 28.01.15 01:58:00 MSK (всего исправлений: 1)

Ответ на: комментарий от sehellion 28.01.15 01:49:58 MSK

Но в играх же такого не наблюдалось вроде? (я хз. на прошлой неделе я впервые в жизни купил видеокарту)
А только в майниге на опенцл?

~~dk-~~ ☆
(28.01.15 01:51:22 MSK) автор топика

Ответ на: комментарий от dk- 28.01.15 01:47:47 MSK

https://en.bitcoin.it/wiki/Why_a_GPU_mines_faster_than_a_CPU#Why_are_AMD_GPUs...

Chaser_Andrey ★★★★★
(28.01.15 01:53:11 MSK)

Ссылка

Ответ на: комментарий от Chaser_Andrey 28.01.15 01:49:37 MSK

Спору нет. Конкретики нет и не будет.

Хотя автор панорамного софта не видит никакой разницы между картами обоих лагерей. И от коллег не слышал, что бы невидии были негодны.

~~dk-~~ ☆
(28.01.15 01:53:39 MSK) автор топика

Ссылка

Ответ на: комментарий от dk- 28.01.15 01:51:22 MSK

https://litecoin.info/Mining_hardware_comparison - как-то так.

Больше ничего сказать не могу, т.к. не разбираюсь

sehellion ★★★★★
(28.01.15 01:54:07 MSK)

Ссылка

Ответ на: комментарий от sehellion 28.01.15 01:49:58 MSK

Потому что даже средние модели от амд обгоняли топовые зеленые карты

В подсчете целочисленных хэшей с применением битовых сдвигов, что GPU вообще не обязан быстро делать.

Kosyak ★★★★
(28.01.15 06:02:48 MSK)

Ссылка

ATI <...> AMD R9 280X

Каким боком тут ATI?

Случайно обнаружил дикий факт, фотоскан, тот который для 3д моделей, на двух opencl-ядрах нвидии шьет почти так же резво, как указанная амд на 32 opencl-ядрах!

Сдаётся мне, OpenCL в той программе задействован для галочки и основную работу выполняет всё равно CPU.

Там, где OpenCL используется полноценно, средненькая AMD многократно рвёт в клочья топовую Nvidia.

~~Quasar~~ ★★★★★
(28.01.15 08:18:09 MSK)

Ответ на: комментарий от Chaser_Andrey 28.01.15 01:50:39 MSK

Nvidia вообще плохие GPGPU из игровых карт.

~~Quasar~~ ★★★★★
(28.01.15 08:19:17 MSK)

Ссылка

Ответ на: комментарий от dk- 28.01.15 01:51:22 MSK

Было тестирование OpenCL на AMD и Nvidia. AMD во всех без исключения случаях показывала на порядки большую производительность. Ссылку сейчас не помню, но могу откопать. То есть, майнингом дело не ограничивается.

~~Quasar~~ ★★★★★
(28.01.15 08:20:20 MSK)

Ссылка

Как так то?!

Написать неэффективный алгоритм - особого ума не надо. Кроме того, есть задачи, которые не параллелятся. Больше можно сказать только увидя код

~~zgen~~ ★★★★★
(28.01.15 09:12:26 MSK)

Ссылка

Ответ на: комментарий от Quasar 28.01.15 08:18:09 MSK

4.2. Вообще-то это зависит от 1) целочисленные вычисления или с плавающей запятой, 2) если второе, то какая точность. Просто это известный факт, что у амд перекос в сторону целочисленных операций (и это далеко не всегда хорошо).

lu4nik ★★★
(28.01.15 10:20:49 MSK)

Ответ на: комментарий от lu4nik 28.01.15 10:20:49 MSK

Как раз у Nvidia перекос в сторону целочисленных операций, так как всё, что не Quadro, урезано по вычислениям с плавающей точкой. У AMD же урезаний нет, поэтому игровой Radeon унижает не только игровой GeForce в параллельных вычислениях, но и профессиональную Tesla, если смотреть на OpenCL (с CUDA у nvidia дела получше).

~~Quasar~~ ★★★★★
(28.01.15 10:24:09 MSK)

Ответ на: комментарий от Quasar 28.01.15 10:24:09 MSK

Только вот новые максвеллы явно быстрее в вычислениях с плавающей запятой... правда при условии, что не будет израсходовано больше 3 гб видеопамяти. Они же с контроллером жестко накосячили.

steemandlinux ★★★★★
(28.01.15 10:39:38 MSK)

Ответ на: комментарий от steemandlinux 28.01.15 10:39:38 MSK

Там какой-то эпик феил после 3,25 гб вродебы.

~~dk-~~ ☆
(28.01.15 10:41:01 MSK) автор топика

Ответ на: комментарий от dk- 28.01.15 10:41:01 MSK

Ага. На теслах исправят наверное.

steemandlinux ★★★★★
(28.01.15 10:43:40 MSK)

Ссылка

Nvidia vs ATI: разный OpenCL?!
шьет панорамы а другая 3д-модели предметов по их фотографиям.

В открытых дровах для AMD пока не реализован нативный обсчёт изображений.
Можешь блоб попробовать, как вариант.

Но почему майнеры поголовно на амд сидели?

Потому что AMD быстрее, выгоднее, майнинг идеально работает на открытых дровах. Сравнения на практических задачах есть тут.

shahid ★★★★★
(28.01.15 11:01:17 MSK)

Ссылка

Софт под оффтопик?

greenman ★★★★★
(28.01.15 11:05:00 MSK)

Ответ на: комментарий от greenman 28.01.15 11:05:00 MSK

Так dk- ж виндузятник, видимо, да.

sluggard ★★★★★
(28.01.15 12:29:27 MSK)

Ответ на: комментарий от sluggard 28.01.15 12:29:27 MSK

Да вот тоже так считал. А теперь думаю, может ошибаюсь, ведь выше пишут:

Можешь блоб попробовать, как вариант.

greenman ★★★★★
(28.01.15 12:48:34 MSK)

Параллельное программирование на данный момент реально предоставляет пожалуй один из самых крупных в сегодняшнем мире программного обеспечения наборов методов опасно выстрелить себе в ногу. Результат зависит от многих факторов aka размера доступной памяти, типов этой самой памяти, числа ядер, скорости загрузки ядра программы в карту и прочее, а главное от человека, который всё это учитывает или игнорирует. И да, по большому счёту в идеале OpenCL без разницы где считаться на CPU или GPU, так что вполне возможно, что программа вообще на карте не считается, а только ядра CPU задействует.

Evgueni ★★★★★
(28.01.15 12:49:38 MSK)
Последнее исправление: Evgueni 28.01.15 12:50:48 MSK (всего исправлений: 2)

Ответ на: комментарий от greenman 28.01.15 12:48:34 MSK

Не, я поганый вендузятник :(

~~dk-~~ ☆
(28.01.15 12:53:04 MSK) автор топика

Ссылка

Ответ на: комментарий от Evgueni 28.01.15 12:49:38 MSK

Про память:

Я взял для сравнения 2 версии 280Х, со стандартными 3гб памяти и с 6гб.

Пятигуй - очень отзывчив к количеству оперативки в видяхе (сам проверял, и авторы подтверждают). Но... что-то в драйверах накосячено, что пятигуй в 6гб версии карты все равно упорно считает, что их только 3.

Пришлось брать 290 с 4гб (

> так что вполне возможно, что программа вообще на карте не считается, а только ядра CPU задействует.

к счастью, у меня реально считают видяшки, разница с процом (а это неслабый 5820 в разгоне) - огромна, в разы, а в некоторых вещах в десятки раз (для амд).

~~dk-~~ ☆
(28.01.15 12:54:50 MSK) автор топика
Последнее исправление: dk- 28.01.15 12:56:00 MSK (всего исправлений: 1)

Ответ на: комментарий от dk- 28.01.15 12:54:50 MSK

Память в GPU очень разная и для разных вещей там доступны разные её объёмы. В разных ситуациях могут вылезать ограничения на её объём если доступиться к ней нужно быстро.

Evgueni ★★★★★
(28.01.15 12:58:43 MSK)
Последнее исправление: Evgueni 28.01.15 12:59:28 MSK (всего исправлений: 1)

Ответ на: комментарий от Evgueni 28.01.15 12:58:43 MSK

там вообще черт ногу сломит.

автор софта пишет, что ггдр5 - сильно лучше ддр3, и пофиг размер если есть хотя бы 1гб.

на деле: нвидия 5х0М (не помню, ноутбучная) в редакции 2гб гддр5 - считает в 1.6-2 раза медленнее, чем в редакции 4гб ддр3

~~dk-~~ ☆
(28.01.15 13:00:52 MSK) автор топика

Ответ на: комментарий от dk- 28.01.15 13:00:52 MSK

Зависит от ситуации. У тебя может оказаться так, что размер текстуры не влезает в доступный для нити объём (не совпадает с полным объёмом памяти, причём сильно) и это всё автоматом вываливается в обычную компьютерную память с соответствующими издержками.

Evgueni ★★★★★
(28.01.15 13:02:57 MSK)
Последнее исправление: Evgueni 28.01.15 13:03:35 MSK (всего исправлений: 1)

Ответ на: комментарий от Evgueni 28.01.15 13:02:57 MSK

Угу.

Темный лес блин :)
Сейчас 290-я считает одну операцию, мониторю нагрузки:
загрузка ГПУ либот 0 либо 100%. Лесенка уже несколько часов. Памяти тратит тольо 1.5гб из 4.

А вот у процессора все 6 ядер лежат на 100% не отрываясь. Общекомповая оперативка занята далеко не вся. ССД - утилизирован процента на 2-3.

\\но без видяхи считает в 6-8 раз медленнее.

~~dk-~~ ☆
(28.01.15 13:05:25 MSK) автор топика

Ответ на: комментарий от dk- 28.01.15 13:05:25 MSK

Пока да, но ситуация выправляется, правда, выправляется в самых дорогих на сегодня моделях (ядра в GPU становятся больше похожи на независимые процессоры), а с другой стороны идёт работа над тем, чтобы в CPU напихать сотни ядер. Ну и почти всё зависит от используемого алгоритма. Та же лесенка возникает из-за того, что где-то стоит точка синхронизации.

Evgueni ★★★★★
(28.01.15 13:08:16 MSK)
Последнее исправление: Evgueni 28.01.15 13:10:20 MSK (всего исправлений: 2)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Беспроводные клава+мышь с двумя приемниками и выбором текущего активного?

Talks

Готовимся к FOSDEM

→

Похожие темы