LINUX.ORG.RU

История изменений

Исправление intelfx, (текущая версия) :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто они будут меняться (сколько пар операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке из всех возможных результатов операции. Для двух полубайт табличка займёт всего 256 байт, а для двух байт — 64K. Последнее, конечно, в L1 не влезает, но в L2 точно. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ). prischeyadro прав, сложнее всего с выборкой/перемешиванием отдельных битов.

Исправление intelfx, :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто она будет меняться (сколько операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке из всех возможных результатов операции. Для двух полубайт табличка займёт всего 256 байт, а для двух байт — 64K. Последнее, конечно, в L1 не влезает, но в L2 точно. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ). prischeyadro прав, сложнее всего с выборкой/перемешиванием отдельных битов.

Исправление intelfx, :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто она будет меняться (сколько операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке из всех возможных результатов операции. Для двух полубайт табличка займёт всего 256 байт, а для двух байт — 64K. Последнее, конечно, в L1 не влезает, но в L2 точно. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ). prischeyadro прав, сложнее всего с выборкой/перемешиванием отдельных бит.

Исправление intelfx, :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто она будет меняться (сколько операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке из всех возможных результатов операции. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ). prischeyadro прав, сложнее всего с выборкой/перемешиванием отдельных бит.

Исправление intelfx, :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто она будет меняться (сколько операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ). prischeyadro прав, сложнее всего с выборкой/перемешиванием отдельных бит.

Исходная версия intelfx, :

Сколько разных «формул» ожидается? Известны ли все используемые «формулы» на момент запуска алгоритма? Если нет, то как часто она будет меняться (сколько операндов будет обработано по одной формуле до её смены)?

К чему я клоню: к табличке. Бегло посмотрел на MMX/SSE — там ничего подобного нет, потому что оно создавалось для другого (для работы со столбцами из floating-point чисел, а у тебя биты; см. пред. ответ).