LINUX.ORG.RU
ФорумTalks

Ядро на GPU


0

0

Исследователи из университета Юты представили проект KGPU, в рамках которого разработан способ перенести исполнение частей кода ядра Linux на графический процессор, поддерживающий технологию NVIDIA CUDA. Код KGPU распространяется в рамках лицензии GPLv2.

NSK или Non-Stop Kernel представляет собой код, исполняемый на GPU и способный загружать дополнительные модули (сервисы в терминологии KGPU), каждый из которых может выполнять определенный вид работы по обработке данных. NSK принимает запросы, загружает сервис (для повышения производительности он может быть загружен заранее) и отдает ему данные, ожидая результатов исполнения, которые затем будут переданы обратно по цепочке модулю ядра. Для передачи данных между компонентами системы используется коммуникационный протокол, реализованный с помощью быстрой pinned-памяти, выделяемой драйвером CUDA.

Такая архитектура позволяет перенести фрагменты кода ядра на графический процессор просто переписав их в виде NSK-сервисов. В подтверждение авторы KGPU создали реализацию алгоритма AES, которая позволила поднять скорость шифрования файловой системы eCryptfs в 6 раз.

картиночки ---> http://code.google.com/p/kgpu/wiki/IozoneBenchmarkResults
хомпага ---> http://code.google.com/p/kgpu/

/////тупой копипаст с опеннета

★★★★
Ответ на: комментарий от timur_dav

> Выглядит как суровое творение немецкого гения. Габариты и «обводы» пугают :)

Тяжелый танк :) у меня внутри Q9650 десктопный и две 9800. До сих пор все новые игрушки бегают, хотя машинку брал в 2008.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

А не будет ли оно тормозить из-за постоянного копирования данных между оперативкой компьютера и оперативкой GPU?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от megabaks

> сомневаюсь, что не мартышкин труд получится

я о том же. Может, на Knights Corner (или как там этого внебрачного потомка Larrabee, все же оно х86) или на Tesla, но не массовом GeForce.

pekmop1024 ★★★★★
()
Ответ на: комментарий от Relan

А использование инструкций AES-NI увеличивает скорость шифрования в 11 раз. GPU сосёт.

Приготовиться к шоку:

$ openssl speed aes-128-cbc
OpenSSL 0.9.8e 23 Feb 2007
built on: Fri May  1 06:08:53 UTC 2009
options:bn(64,32) md2(int) rc4(idx,int) des(ptr,risc1,16,long) aes(partial) blowfish(idx) 
compiler: cc
available timing options: USE_TOD HZ=128 [sysconf value]
timing function used: getrusage
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes
aes-128 cbc       5343.07k     5588.57k     5691.04k     5698.88k     5730.26k
$ openssl speed -evp aes-128-cbc -engine cryptodev
OpenSSL 0.9.8e 23 Feb 2007
built on: Fri May  1 06:08:53 UTC 2009
options:bn(64,32) md2(int) rc4(idx,int) des(ptr,risc1,16,long) aes(partial) blowfish(idx) 
compiler: cc
available timing options: USE_TOD HZ=128 [sysconf value]
timing function used: getrusage
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes
aes-128-cbc      12548.06k   145210.77k   257257.85k  1187529.24k  3546281.77k

Более 600 раз! Вот как надо ускоряться :)

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav
The 'numbers' are in 1000s of bytes per second processed.
type 16 bytes 64 bytes 256 bytes 1024 bytes 8192 bytes
aes-128 cbc 88519.59k 96472.19k 98481.66k 207002.28k 210558.98k

У тебя что-то не так с openssl. Это чистый проц без всяких AES-NI.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Ты нолик пропустил, мой 3 мильона выдал, а не 200 тысяч :)

AES-NI изобретут через 10 лет. Это embedded решение от AMD с AMD Geode на борту :)

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

> Ты нолик пропустил, мой 3 мильона выдал, а не 200 тысяч :)

Не, вопрос был не по отношению к тесту с aes-ni, там все закономерно

AMD Geode


Теперь картинка сложилась. 486 на стероидах. :)

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Ну не знаю, может, тормозить и не будет - данные от пользователя получать не так уж и часто надо...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от pekmop1024

>>> 486 на стероидах. :)

Сильно лютые местами вещества... Фактически при определённой длине ключа шифрует на скорости чуть меньшей чем скорость памяти. TDP 2Вт

timur_dav ☆☆☆☆☆
()

Quod licet Jovi, поп licet bovi

В обозримом будущем GPU будет полностью загружен графическими 3D-числодробительными задачами, с которыми он пока не справляется.
Юникс-вей: для каждой спец.задачи - спец.процессор :)

quickquest ★★★★★
()
Ответ на: комментарий от pekmop1024

>>> неторопливым

fixed эффективным, ибо уделывает современные камни. Справедливости ради стоит сказать, что там только 128 аппаратно реализовано. Но для массового openvpn такой коробочки одной хватит.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

> Сильно лютые местами вещества...

есть еще Geode NX, который атомы уделывает :) чем кормили в этот раз 486, и 486 ли вообще, не смотрел.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

>>> есть еще Geode NX, который атомы уделывает :) чем кормили в этот раз 486, и 486 ли вообще, не смотрел.

Это первый атлон произведённый по более новому тех. процессу. Потребление энергии на уровне ноутбучных камней, более 15 Вт. Не конкурент атому вообще.

LX - это потомок Cyrix Media GX

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

Почему не конкурент? У первого атлона было замечательное ядро, на уровне P-III, а P-III при равных частотах - быстрее атомов.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Ну представь себе нетбук с процессором не TDP не 3-5 Вт, а 15Вт. Производительность на уровне атома, жручесть на уровне ноутбучного камня. Если б было шоколадно никто бы там в AMD не кочевряжился изобретая APU и прочие разные Neo, а клепали бы себе камни 10-летней давности. Хотя, стоит отметить, что в начале 2000-го атлон таки люто испугал интелофагов 200 МГц шиной, лютой производительностью и одновременным фейлом интела с выпуском большой партии бракованный третьепней.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

Атлоны больше испугали на фоне фейлов П4, я сам тогда как раз апгрейдился и с П3 ушел сначала на Sempron, а затем на AthlonXP

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

У типичного N270 - 2.5 Вт, у Pineview около 10, но проблема в том, что Pineview поглотил видеоподсистему в себя и почти всё остальное. А чипсеты для 945 серии как известно жрали порядка 20-25 Вт в неттопно-десктопной версии и порядка 7-8 Вт в нетбучной. В сумме сам считай.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

Тогда это было не столь очевидным. Самым большим шоком для народа было то, что редкий по тем временам P-III-S 1.33ГГц был значительно шустрее какого-нибудь P4 1.7GHz. Для моих одногруппников это был натуральный разрыв шаблона. :)

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Спорить не буду, не бенчмаркал, у меня слотовой второпень с процом на резинке от трусов сменился на Атлон 1Ггц с плавными апгрейдами. Игра с выходом первых четвёртопней с диковинной RIMM памятью не привлекла никого кроме мажоров.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

> на резинке от трусов

у меня до сих пор где-то валяется P-III 800 Coppermine в переходнике на Slot 1, тоже резинками крепил в слот, правда тоненькими :) а в переходнике был потому, что была хорошая мамка с BX, позволявшая этот самый пень до 1ГГц погнать.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Я то думал у одного меня такой изврат был :) Снимал заглушки под CD и все окружающие смеялись от голубенькой резинки через всю мамку и минитурбокальянчика на флоппи-драйве, припрятанного подальше от родителей :)

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от megabaks

Нет. Просто эта фича только на нвидиячх работать будет. А vendor lock-in не нужен. Было бы OpenCL- можно было бы поговорить.

Dorif ★★★
()
Ответ на: комментарий от megabaks

посему от их использования большого толку не будет

megabaks ★★★★
() автор топика
Ответ на: комментарий от megabaks

Интел библиотеку OpenCL запилила для работы на... камнях. Профит в эффективном использовании многоядерности. Про OpenCL в видео не слышал.

Про Виа ничего не слышал. Толи они там VDPAU умудрились поддержать... Совершенно внезапный был ход.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от megabaks

Не знаю, было бы логичным, если бы софт использовал библиотеку-прокладку которая в зав-ти от аппаратных возможностей и выбирала реализацию OpenCL, а fallback - программная, даже от неё небольшой профит был бы.

timur_dav ☆☆☆☆☆
()
Ответ на: комментарий от timur_dav

Ну и фиг с ним. Они всё равно свои чипы для своей продукции делают.

Dorif ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.