memcmp вместо strncmp для оптимизации?

c, c++, memcmp, strncmp

0

3

Приветствую.

Построено у меня взаимодействие с тысячами железок через mqtt сервер, из всего многообразия «сообщений» приходящих через либу в типе char * msg есть пересылка снимков в jpeg, которые тоже приходят одномоментно тысячами штук на свой сервис, весь «парсинг заголовка сообщения» на этом сервисе выполнял обычным strncmp и для жпега это выглядит как

if (!strncmp(msg, "\xFF\xD8\xFF", 3)) { ... }
else if ...

как я понимаю memcmp быстрее strncmp, тем более мне нужно сравнить байты а не строки и понятно что так тоже как минимум компилируется

if (!memcmp(msg, "\xFF\xD8\xFF", 3)) { ... }

а можно БЕЗ объявления переменной выполнять сравнение набора байт любой длины?

мне такой в голову пришел перл, но что то сомнительна его производительность )

if (memcmp(msg, std::array<uint8_t,3>({0xFF, 0xD8, 0xFF}).data(), 3) == 0)

←	Emacs, добавление заголовка к ссылке в org-mode (2)

Как заставить linux,epoll передавать управление программе после каждого полученного tcp сегментa?

→

← 1 2 3 →

Ответ на: комментарий от mittorn 18.09.24 19:25:13 MSK

почему? сообщение парсится бустом целиком и там все уже стринги или инты, но сначала проверяется что это не жпег

wolverin ★★★
(19.09.24 05:32:32 MSK) автор топика

Ответ на: комментарий от wolverin 19.09.24 05:32:32 MSK

но есть подозрение, что сделать какой то простой хеш было бы быстрее ) чем каждый раз сравнивать строки

wolverin ★★★
(19.09.24 05:34:56 MSK) автор топика

Ответ на: комментарий от wolverin 19.09.24 05:34:56 MSK

Да, быстрее. В зависимости от процента поступающих жпегов можно обойтись очень тупым хэшем с коллизиями и потом проверять, либо делать красивый хэш и доверять ему как есть.

Bfgeshka ★★★★★
(19.09.24 05:41:41 MSK)

Ответ на: комментарий от MKuznetsov 18.09.24 19:44:03 MSK

в принципе это идея - все месаги закодировать 2 байтами (хотя пока по количеству их видов и за 1 байт не выхожу) в начале и уже по ним выполнять switch

wolverin ★★★
(19.09.24 05:41:44 MSK) автор топика
Последнее исправление: wolverin 19.09.24 06:00:34 MSK (всего исправлений: 2)

Ответ на: комментарий от wolverin 19.09.24 05:32:32 MSK

boost зло, STL с недавних пор тоже зло. Вместо удобных утилит? которые ожидал получишь happy debug

mittorn ★★★★★
(19.09.24 07:18:03 MSK)

Ответ на: комментарий от mittorn 19.09.24 07:18:03 MSK

)) у меня еще 14 стл, так что я не дорос до «недавних пор»

wolverin ★★★
(19.09.24 07:24:44 MSK) автор топика

Ответ на: комментарий от wolverin 19.09.24 07:24:44 MSK

Тем хуже, в 17 и 20 хотя бы полезности какие-то добавили, 14+boost - аццкая смесь

mittorn ★★★★★
(19.09.24 07:32:18 MSK)

Ответ на: комментарий от wolverin 19.09.24 05:28:03 MSK

Никогда не трогал пахо, оно разве не умеет так?

connect();
subscribe("main/#, csllback1);
subscribe("special/images", callback2);

ya-betmen ★★★★★
(19.09.24 08:09:20 MSK)

Ответ на: комментарий от ya-betmen 19.09.24 08:09:20 MSK

не видел такого https://eclipse.dev/paho/files/mqttdoc/MQTTAsync/html/_m_q_t_t_async_8h.html#ae9ae8d61023e7029ef5a19f5219c3599

wolverin ★★★
(19.09.24 08:24:33 MSK) автор топика

Ответ на: комментарий от wolverin 19.09.24 05:30:47 MSK

ну причем тут разнос по топикам - т.е. топики сравнивать быстрее чем просто посмотреть о чем месага!?

в общем как принято: в топиках должны быть однотипные данные. Если топик про температуру, так там и должна быть температура а не фотка термометра. Назначение и типы данных не должны путаться.

чтобы mqtt автосредствами конвертировался в базы и другие протоколы. Например телеграфом лить измерения в базу.

и да, с топиками быстрее - ты всё равно так или иначе их смотришь и разбираешь.

MKuznetsov ★★★★★
(19.09.24 09:14:15 MSK)

Ответ на: комментарий от MKuznetsov 19.09.24 09:14:15 MSK

ты всё равно так или иначе их смотришь и разбираешь

сервис слушает почти все, поэтому разбирать конкретно ему разные топики никакого смысла нет.

wolverin ★★★
(19.09.24 09:29:40 MSK) автор топика
Последнее исправление: wolverin 19.09.24 09:29:49 MSK (всего исправлений: 1)

Ответ на: комментарий от MKuznetsov 19.09.24 09:14:15 MSK

единственный смысл разбирать топики, это именно их кодировать в байты, а не в самих сообщениях, тогда да можно условно последний 1-2 байта названия топика проверять.

wolverin ★★★
(19.09.24 09:32:48 MSK) автор топика

Ответ на: комментарий от wolverin 19.09.24 08:24:33 MSK

Хм. Ладно видимо такого нет, но в доке же написано, что топик у тебя в параметры колбека падает. Я бы лучше селект по топику делал чем по контенту угадывать.

ya-betmen ★★★★★
(19.09.24 09:57:42 MSK)

Используй строковый литерал и расслабься. memcmp вообще может инлайнится и превратится в какой нибудь cmp для случая 3 байт, без хранения строки в rodata. Чем меньше лишних сущностей в коде, тем проще его оптимизировать.

KivApple ★★★★★
(19.09.24 10:05:15 MSK)

Ответ на: комментарий от ya-betmen 19.09.24 09:57:42 MSK

контент разный даже в одном топике, ну не городить же 100500 топиков под однотипный контент, поэтому сравнивать ДВАЖДЫ придется, вот сейчас признак контента добавил перед сообщением и в итоге насчиталось 20 штук уже, но будут еще.

wolverin ★★★
(19.09.24 10:32:21 MSK) автор топика
Последнее исправление: wolverin 19.09.24 10:33:09 MSK (всего исправлений: 1)

Ответ на: комментарий от wolverin 19.09.24 05:32:32 MSK

парсится бустом целиком

Лучше Glaze, но там аж C++23. :)

dataman ★★★★★
(19.09.24 12:42:59 MSK)

Ответ на: комментарий от AlexVR 18.09.24 15:03:04 MSK

return (((const uint32_t)msg) & 0x00FFFFFFul) == 0x00FFB8FFul;

уб же, не? вот сравнение с безубешной версией, уже с O1 нет разницы

https://godbolt.org/z/KxcfTW59a

zurg ★
(19.09.24 15:57:27 MSK)

Ответ на: комментарий от anonymous 18.09.24 10:04:51 MSK

Компилятор заменил вызов strncmp на команду сравнения с константой

Ну и почему это минусят? Это реально так - если длина строки известна на этапе компиляции, то вызова функции не будет, будет подставлена константа, и с ней проведено сравнение.

Очень хороший способ оптимизации, если вызов memcmp действительно узкое место.

blex ★★★★
(30.09.24 10:53:14 MSK)

29 декабря 2024 г.

std::equal ?

safocl ★★
(29.12.24 16:44:57 MSK)

← 1 2 3 →

←	Emacs, добавление заголовка к ссылке в org-mode (2)

Development

Как заставить linux,epoll передавать управление программе после каждого полученного tcp сегментa?

→

Похожие темы