LINUX.ORG.RU
ФорумTalks

[2Silvy][штеуд] А что, если?


0

1

Ковырялся со вторым своим ноутом на i5 (первый на i7), понял что оно стараниями маркетологов не поддерживает ни crc32, ни aes-ni.
И тут наткнулся на три интересных странички:
http://www.strchr.com/crc32_popcnt
http://www-sop.inria.fr/members/Sylvain.Pion/progs/mmx-emu/ и
http://developer.amd.com/cpu/Libraries/sseplus/
Посему вопрос - есть ли профит от написания библиотеки для эмуляции недостающих инструкций (возможно даже через sseX)?

★★★★★

нет смысла наверное, aes и crc32 функции итак сильно оптимизированы обычно, openssl например использует asm-sse2 версию AES (в генте или на x86-64)

Sylvia ★★★★★
()

В быстродействии - нет.
Т.к. эмуляция этих инструкций из библиотек будет дёргаться по исключению undefined instruction процессора, которое, в свою очередь дёргает прерывание и т.д.
Такие штуки использовались на arm<v5, но x86 не арм.

//фиксед.

anon_666
()
Ответ на: комментарий от Sylvia

Надо попробовать потестить чуть попозже, но идея мне кажется в целом интересной.

// А еще у меня куча свободного времени и хочется в каком-нибудь софте поковыряться)

devl547 ★★★★★
() автор топика
Ответ на: комментарий от megabaks

тут уже не раз обсуждали что из за особенностей обработки данных GPU (не любят ветвления) это непрактично

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

почему это?
профит то должен быть - пусть один поток, но таки профит
и можно было бы использовать для конвертеров (та же нвидия сделала же будабум(или как-то так))

megabaks ★★★★
()
Ответ на: комментарий от megabaks

Потому, что

не любят ветвления

тк нет блоков предсказания ветвлений.

и можно было бы использовать для конвертеров

Внезапно, уже используют.

anon_666
()
Ответ на: комментарий от megabaks

>профит то должен быть - пусть один поток, но таки профит

Если процесс нельзя распараллелить хотя бы на 20 потоков, выполняющих одни и те же простые операции, то это будет фейл, а не профит.

kranky ★★★★★
()
Ответ на: комментарий от anon_666

дык нет же вариантов - только велики свои
мплеер умеет, влц не то научили не то ещё нет - хз, кафеин вроде не умеет и т.д. и т.п.
дык почему ещё нет?

megabaks ★★★★
()
Ответ на: комментарий от megabaks

Что и? В один поток на видеокарте медленнее, чем в один поток на cpu.

anon_666
()
Ответ на: комментарий от anon_666

>Всё он правильно сказал.
что он праильно сказал? о_О
то что пусть дохлый, но таки доп-поток не даст профита? о_О

megabaks ★★★★
()
Ответ на: комментарий от megabaks

>ты упоролся

Это не отменяет того факта, что я знаю, о чём говорю. Почитай что-нибудь про то, как устроен GPU.

kranky ★★★★★
()
Ответ на: комментарий от megabaks

>дык почему ещё нет?

closed source, выгодв хотят.
Тут видел - кто-то свой h264 кодер для куды написал, закрытый.

anon_666
()
Ответ на: комментарий от megabaks

>доп-поток

Он будет слишком дохлый, чтобы на это тратить время.

anon_666
()
Ответ на: комментарий от megabaks

>то что пусть дохлый, но таки доп-поток не даст профита? о_О

Именно! Это порвёт тебе шаблон, но на GPU два потока с разными инструкциями выполняются дольше (в лучшем случае столько же), чем один поток.

kranky ★★★★★
()
Ответ на: комментарий от kranky

ладно - гпу гавно на фоне цпу - хорошо!
но разве плохо перегонять те же киношки на видяхе?
или несколько клипов на цпу, а несколько на гпу?
я не понимаю вас - лишних ресурсов чтоль мильён?
давайте ипы - для distcc использовать буду

megabaks ★★★★
()
Ответ на: комментарий от kranky

>на GPU два потока с разными инструкциями выполняются дольше (в лучшем случае столько же), чем один поток.
это я знаю!
но разве плохо к паре корко-ядер получить атом-ядро?(грубо)

megabaks ★★★★
()
Ответ на: комментарий от megabaks

>но разве плохо перегонять те же киношки на видяхе?

Так ты определись: тебе киношки перегонять, или канпелять?

Конвертирование видео распараллеливается, канпелирование - нет.

kranky ★★★★★
()
Ответ на: комментарий от anon_666

>Кодировать видео на гпу - значительно быстрее.
вот! я тебе об этом мильён раз уже написал!
почему бы не подсунув менкодеру например либу, не перегонять из * в * на видяхе?

megabaks ★★★★
()
Ответ на: комментарий от kranky

>тебе киношки перегонять, или канпелять?
всё равно!
лишь бы железка работала, а то видяха - самая ленивая (у меня) железка )

megabaks ★★★★
()
Ответ на: комментарий от megabaks

>но разве плохо к паре корко-ядер получить атом-ядро?(грубо)

Плохо. У видюхи своя оператива и узким местом будет перекидывание больших объёмов данных в видюху и обратно. Т.е. опять никакого профита, один фейл.

kranky ★★★★★
()
Ответ на: комментарий от anon_666

>Ну так купи и открой исходники :3
хм...в пару рублей уложимся?
если нет - мне проще проц поменять )

megabaks ★★★★
()
Ответ на: комментарий от megabaks

>ты мне либу - я тебе тесты

Не, от кодирования видео я, к сожалению, далёк. Вот если я когда-нибудь свою поделку доклепаю, тогда можно будет посидеть подумать =)

kranky ★★★★★
()
Ответ на: комментарий от megabaks

>вкусная поделка?

На любителя =) DSP на видеокарте.

kranky ★★★★★
()

Взял за основу Virus.Linux.FortyTwo.a, сейчас пишу либу.

devl547 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.