LINUX.ORG.RU

Проблемы hugepages


0

1

Есть железка которая собирает данные и по PCIe кладет их в память хоста. Данных много, больше гигабайта в секунду. Думаю кидать их в huge page размером около гига по кругу. А забирать на обработку просто по таймеру, типа сколько записал столько и съел в юзерспейсе. Приятно в таком подходе, что FPGA и драйвер простые как грабли.

Вопрос к разуму: какие могут быть проблемы с постоянно занятой большой страницей? Еще непонятно как huge page дружит с cudaMemcpy.

В гугле смотрел, ничего криминального не нашел. Буду признателен если ткнете где такое найдется.

Ответ на: комментарий от exception13

переносимость

В данном случае это не проблема. После обработки все просто уедет по езернету клиентну.

ebantrop
() автор топика

Уменьшай объём данных, делай предобработку данных на FPGA.

AlexVR ★★★★★
()

PCIe
больше гигабайта в секунду
cudaMemcpy

Ж***й чувствую, что ты не будешь успевать дважды/трижды пересылать такой объём данных GPGA->PCIe->Mem->PCIe->GPU->PCIe->Mem->PCIe->Ethernet, а не то что их обрабатывать.

AlexVR ★★★★★
()
Ответ на: комментарий от AlexVR

Ж***й чувствую, что ты не будешь успевать дважды/трижды пересылать такой объём данных GPGA->PCIe->Mem->PCIe->GPU->PCIe->Mem->PCIe->Ethernet, а не то что их обрабатывать.

Если не жопой, а головой подумать, то все должно успевать. Ессесно на FPGA делается обработка. От нее остается гиг в пиковой нагрузке. Средний поток будет в 2-3 раза меньше. К езернету от изначального объема остаются мегабайты. Вопрос был не в этом.

ebantrop
() автор топика
Ответ на: комментарий от ebantrop

У тебя на обработку данных на GPU остаётся мало времени. Я к тому, что в твоём случае надо максимум выжить из FPGA и задачу свести к забору мегабайтов из FPGA, а не с GPU.

AlexVR ★★★★★
()

Зачем здесь вообще нужны huge pages? Или железка настолько умная, ччто знает о виртуальной памяти?

tailgunner ★★★★★
()
Ответ на: комментарий от AlexVR

Я к тому, что в твоём случае надо максимум выжить из FPGA и задачу свести к забору мегабайтов из FPGA, а не с GPU.

FPGA не всесильна. Много чего на GPU быстрее, например DGEMM.

ebantrop
() автор топика
Ответ на: комментарий от ebantrop

Зачем здесь вообще нужны huge pages

Что б не парится со scatter/gather DMA.

Если ты рассчитываешь на то, тебе всегда будет доступен непрерывный кусок в 2M - окей. Но лично я бы лучше попарился со scatter-gather.

tailgunner ★★★★★
()
Ответ на: комментарий от mv

Грузишь ядро с memmap=foo@bar, и вперёд.

Тоже вариант, спасибо.

ebantrop
() автор топика
Ответ на: комментарий от tailgunner

Но лично я бы лучше попарился со scatter-gather.

Да, наверное придется. Все остальное слишком коряво получается. Со scatter-gather есть надежда что и direct gpu как то заработает.

ebantrop
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.