Вопрос вот какой, уважаемые коллеги.
Есть некая структура с предопределенным размером - 100 байт. Встал вопрос об ультражесткой оптимизации копирования этого блока памяти.
Приоритет - минимальная латентность (работа идет на выделенных процессорных ядрах).
Подстроить размер блока можно в диапазоне 92-100 байт. Выравнивание - отдельная тема, но теоретически решаемо. Кроссплатформенности нет и не предвидится, решение штучное, заточенное под железо, на данный момент - ксеоны последнего поколения.
Какие последуют советы?
Спасибо всем заранее.