Проблемы hugepages

0

1

Есть железка которая собирает данные и по PCIe кладет их в память хоста. Данных много, больше гигабайта в секунду. Думаю кидать их в huge page размером около гига по кругу. А забирать на обработку просто по таймеру, типа сколько записал столько и съел в юзерспейсе. Приятно в таком подходе, что FPGA и драйвер простые как грабли.

Вопрос к разуму: какие могут быть проблемы с постоянно занятой большой страницей? Еще непонятно как huge page дружит с cudaMemcpy.

В гугле смотрел, ничего криминального не нашел. Буду признателен если ткнете где такое найдется.

Ссылка

←	Две строки заголовков в табице

Как отслеживать pull и clone?

→

какие могут быть проблемы

переносимость.

exception13 ★★★★★
(23.05.14 10:33:28 MSK)

Ответ на: комментарий от exception13 23.05.14 10:33:28 MSK

переносимость

В данном случае это не проблема. После обработки все просто уедет по езернету клиентну.

ebantrop ★
(23.05.14 11:00:33 MSK) автор топика

Ссылка

Уменьшай объём данных, делай предобработку данных на FPGA.

AlexVR ★★★★★
(23.05.14 12:46:09 MSK)

Ссылка

PCIe
больше гигабайта в секунду
cudaMemcpy

Ж***й чувствую, что ты не будешь успевать дважды/трижды пересылать такой объём данных GPGA->PCIe->Mem->PCIe->GPU->PCIe->Mem->PCIe->Ethernet, а не то что их обрабатывать.

AlexVR ★★★★★
(23.05.14 12:50:09 MSK)

Ответ на: комментарий от AlexVR 23.05.14 12:50:09 MSK

Ж***й чувствую, что ты не будешь успевать дважды/трижды пересылать такой объём данных GPGA->PCIe->Mem->PCIe->GPU->PCIe->Mem->PCIe->Ethernet, а не то что их обрабатывать.

Если не жопой, а головой подумать, то все должно успевать. Ессесно на FPGA делается обработка. От нее остается гиг в пиковой нагрузке. Средний поток будет в 2-3 раза меньше. К езернету от изначального объема остаются мегабайты. Вопрос был не в этом.

ebantrop ★
(23.05.14 13:11:13 MSK) автор топика

Ответ на: комментарий от ebantrop 23.05.14 13:11:13 MSK

У тебя на обработку данных на GPU остаётся мало времени. Я к тому, что в твоём случае надо максимум выжить из FPGA и задачу свести к забору мегабайтов из FPGA, а не с GPU.

AlexVR ★★★★★
(23.05.14 14:41:31 MSK)

Зачем здесь вообще нужны huge pages? Или железка настолько умная, ччто знает о виртуальной памяти?

tailgunner ★★★★★
(23.05.14 15:20:55 MSK)

Ответ на: комментарий от tailgunner 23.05.14 15:20:55 MSK

Зачем здесь вообще нужны huge pages

Что б не парится со scatter/gather DMA.

ebantrop ★
(23.05.14 15:36:25 MSK) автор топика

Ответ на: комментарий от AlexVR 23.05.14 14:41:31 MSK

Я к тому, что в твоём случае надо максимум выжить из FPGA и задачу свести к забору мегабайтов из FPGA, а не с GPU.

FPGA не всесильна. Много чего на GPU быстрее, например DGEMM.

ebantrop ★
(23.05.14 15:37:16 MSK) автор топика

Ссылка

Ответ на: комментарий от ebantrop 23.05.14 15:36:25 MSK

Что б не парится со scatter/gather DMA.

И не парься. Грузишь ядро с memmap=foo@bar, и вперёд.

mv ★★★★★
(24.05.14 06:06:33 MSK)

Ответ на: комментарий от ebantrop 23.05.14 15:36:25 MSK

Зачем здесь вообще нужны huge pages
Что б не парится со scatter/gather DMA.

Если ты рассчитываешь на то, тебе всегда будет доступен непрерывный кусок в 2M - окей. Но лично я бы лучше попарился со scatter-gather.

tailgunner ★★★★★
(24.05.14 07:14:25 MSK)

Ответ на: комментарий от mv 24.05.14 06:06:33 MSK

Грузишь ядро с memmap=foo@bar, и вперёд.

Тоже вариант, спасибо.

ebantrop ★
(25.05.14 15:40:09 MSK) автор топика

Ссылка

Ответ на: комментарий от tailgunner 24.05.14 07:14:25 MSK

Но лично я бы лучше попарился со scatter-gather.

Да, наверное придется. Все остальное слишком коряво получается. Со scatter-gather есть надежда что и direct gpu как то заработает.

ebantrop ★
(25.05.14 15:43:57 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Две строки заголовков в табице

Development

Как отслеживать pull и clone?

→

Похожие темы