[C] shift with zero fill.

0

1

Мне нужен побитовый сдвиг вправо.

Сдвиг делается над 32-битным unsigned.

Если кол-во битов для сдвига >= 32 выдает не 0. А нужен 0.

Нагуглил, что здесь undefined behaviour. Пока решил проблему вот так:

if (value_shift > 31)
{
  return 0;
}
return value >> value_shift;

Каким макаром можно сделать тоже самое, но без if?

Ссылка

←	QSmeta: программа для составления смет и калькуляций

[C++][Qt]Куда двигатся дальше?

→

Каким макаром можно сделать тоже самое, но без if?

Например, делением на 2**value_shift :)

~~power~~ ★
(13.11.10 12:21:49 MSK)

Ссылка


(!(shift - shift%32)) * (value >> shift)

(не знаю, во что компилируется "!", и всегда ли !0 == 1)

Если известны ограничения на размер shift, например, shift < 64, то

(1-(shift/32)) * (value >> shift);

ttnl ★★★★★
(13.11.10 12:24:18 MSK)

> Сдвиг делается над 32-битным unsigned.

Если кол-во битов для сдвига >= 32 выдает не 0.

А что выдаёт?

Sorcerer ★★★★★
(13.11.10 12:37:50 MSK)

Ответ на: комментарий от Sorcerer 13.11.10 12:37:50 MSK

>>Нагуглил, что здесь undefined behaviour.

Сдвиг делается над 32-битным unsigned. > Если кол-во битов для сдвига >= 32 выдает не 0.

А что выдаёт?

Читать-то умеете?

Dimanc ★★
(13.11.10 12:40:11 MSK)

Ответ на: комментарий от Dimanc 13.11.10 12:40:11 MSK

Да. Вы тоже?

Sorcerer ★★★★★
(13.11.10 12:42:11 MSK)

> Каким макаром можно сделать тоже самое, но без if?

?: ;)

зы: что за процессор и какой диапазон value_shift?

arsi ★★★★★
(13.11.10 12:43:22 MSK)

Ссылка

Ответ на: комментарий от Sorcerer 13.11.10 12:42:11 MSK

>Да. Вы тоже?

undefined behaviour.

Все написано в первом посте. Зачем спрашивать?

Dimanc ★★
(13.11.10 12:44:02 MSK)

Ответ на: комментарий от Dimanc 13.11.10 12:44:02 MSK

Да, вы тоже умеете читать. Поздравляю!

Sorcerer ★★★★★
(13.11.10 12:48:16 MSK)

Ссылка

Ответ на: комментарий от ttnl 13.11.10 12:24:18 MSK

> А что выдаёт?

Выдаёт значение, как если бы value_shift был взят по модулю 32.

зы: что за процессор и какой диапазон value_shift?

Процессор x86. Интересны в первую очередь переносимые варианты.

(!(shift - shift%32)) * (value >> shift)

Спасибо, попробую.

vladimir-vg ★★
(13.11.10 13:46:01 MSK) автор топика

Ответ на: комментарий от vladimir-vg 13.11.10 13:46:01 MSK

в общем случае от условия убежать не получится. !(…) — тоже ветвление, с условным присваиванием или переходом.

так что приведённый в стартовом посте пример и есть лучшее решение. если нужно сократить количество строк, то можно записать так:

для unsigned value_shift:

return value_shift > 31 ? 0 : value >> value_shift;

или, если value_shift может быть отрицательным:

return value_shift & ~31 ? 0 : value >> value_shift;

нет смысла запутывать компилятор навороченными выражениями. тем более, если результат будет не лучше.

зы: на последний вариант для х86_64 gcc-4.5.1 генерит более оптимальный код, чем icc-11.1 :)

arsi ★★★★★
(13.11.10 14:17:46 MSK)

Ответ на: комментарий от arsi 13.11.10 14:17:46 MSK

> если нужно сократить количество строк, то можно записать так:

Гыгы. Я скорее наоборот, не скуплюсь.

или, если value_shift может быть отрицательным:

value_shift : uint32_t

зы: на последний вариант для х86_64 gcc-4.5.1 генерит более оптимальный код, чем icc-11.1 :)

А как определяется оптимальность? Слышал, что даже меньшее кол-во инструкций может выполнятся медленней. Вроде как у icc есть особая voodoo-магия, учитывающая более тонкости реализации своих процессоров.

Но это так, с чужих слов.

vladimir-vg ★★
(13.11.10 14:26:52 MSK) автор топика

Ответ на: комментарий от vladimir-vg 13.11.10 13:46:01 MSK

> (!(shift - shift%32)) * (value >> shift)

Звиняюсь, вместо первой скобки надо !(shift>>5)...

Если генерирует операторы перехода, то плохо конечно

ttnl ★★★★★
(13.11.10 14:42:07 MSK)

Ссылка

Ответ на: комментарий от vladimir-vg 13.11.10 14:26:52 MSK

> А как определяется оптимальность?

визуально, по objdump -d :) icc добавил явно лишний mov.

провёл тест… но как толково протестировать, когда варианты отличаются на ±1 такт? :)

gcc — 1m55.869s, icc — 2m0.437s (это user). кроме того, проверял на amd64, а не на intel64…

arsi ★★★★★
(13.11.10 15:18:25 MSK)

Ответ на: комментарий от arsi 13.11.10 15:18:25 MSK

>icc — 2m0.437s (это user). кроме того, проверял на amd64, а не на intel64…

icc разве не определяет процессор и выбирает оптимальный код только для intel? //где-то здесь пробегал слух, я не знаю, как на самом деле

Dimanc ★★
(13.11.10 15:36:46 MSK)

Ответ на: комментарий от Dimanc 13.11.10 15:36:46 MSK

да в любом случае icc «недооптимизировал» ;)

icc (-O2):

   0:   33 d2                   xor    %edx,%edx
   2:   89 f1                   mov    %esi,%ecx
   4:   d3 ef                   shr    %cl,%edi
   6:   f7 c6 e0 ff ff ff       test   $0xffffffe0,%esi
   c:   0f 45 fa                cmovne %edx,%edi
   f:   89 f8                   mov    %edi,%eax
  11:   c3                      retq

gcc (-O2):

   0:   89 f1                   mov    %esi,%ecx
   2:   31 c0                   xor    %eax,%eax
   4:   d3 ef                   shr    %cl,%edi
   6:   83 e6 e0                and    $0xffffffffffffffe0,%esi
   9:   0f 44 c7                cmove  %edi,%eax
   c:   c3                      retq

если уж test так сильно круче and, то мог бы примерно так скомпилить:

mov    %esi,%ecx
xor    %eax,%eax
shr    %cl,%edi
test   $0xffffffe0,%esi
cmove  %edi,%eax
retq

т.е. –1 mov и –1 промежуточный регистр (edx).

arsi ★★★★★
(13.11.10 15:52:14 MSK)

Ссылка

Скастуй в 64 бита, сдвинь и скастуй обратно.

~~Yareg~~ ★★★
(13.11.10 16:57:02 MSK)

Ссылка

Обосраться сколько тут воннаби оптимизаторов собралось.

Профайлер в руки взять пробовали?

~~Love5an~~
(13.11.10 17:23:26 MSK)

Ссылка

Сколько на ЛОРе недопрограммистов ...

anonymous
(13.11.10 18:52:12 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	QSmeta: программа для составления смет и калькуляций

Development

[C++][Qt]Куда двигатся дальше?

→

Похожие темы