Психовизуальный хеш для кожаного

0

2

Есть задача – снабдить строчку текста картинкой, но места под них нету. 100 байт, 200 край. Картинка нужна такая, чтобы кожаный только узнал что там изображено, никакого качества, но чтобы была цветная. ЖпегХР картинку 32х32 жмёт в 400 байт при качестве 5%, ниже уже просто блоки.

Может есть какой нибудь формат, где психовизуальную модель стероидами накачали? Чтобы смотреть на кучку пикселей и однозначно в них узнавать например Джеймса Бонда?

←	Вопрос по C и C++: как определения автоматически превратить в декларации?

Вспомогательные задачи в Spring-приложении

→

← 1 2 →

Вставляй ссылку на картинку в ipfs

buddhist ★★★★★
(04.06.24 23:25:11 MSK)

Засунь ИИ и генерь джеймса бонда.

vbr ★★★★★
(04.06.24 23:31:37 MSK)

JXL советовали? Хотя, может чна таких размерах будет большой оверхед.

ad0c ★
(05.06.24 02:26:37 MSK)

Нужно свелоспедить свой векторный формат.

Скажем таблица картинок в нормальном разрешении а в 200байт просто номер позиции в таблице:-)

Или набирать картинку из примитивов - круг, квадрат и т.д. Для задания переходов цвета использовать градиенты.

~~AntonI~~ ★★★★★
(05.06.24 08:38:37 MSK)

Нужен ИИ, рисующий шаржи.

Хотя и шаржи, нарисованные кожаными, не каждый кожаный поймёт.

greenman ★★★★★
(05.06.24 08:46:42 MSK)

Ответ на: комментарий от CrX 04.06.24 13:43:47 MSK

Можно ещё на основе Z-кривой (октодерева) сваять свой упакованый растровый формат, как раз 4 бита на узел/лист - 16 цветов. Разрешение для 200байт должно быть выше чем 20х20 пикселей, 32х32 или даже 64х64 уже нормально.

В принципе за полдня на коленке легко делается, включая отладку.

~~AntonI~~ ★★★★★
(05.06.24 08:49:11 MSK)

Ответ на: комментарий от greenman 05.06.24 08:46:42 MSK

Каждому кожаному нужен будет свой ИИ обьясняющий что нарисовано, профит!

И вообще давно пора свести все общение кожаных к общению ИИ их телефонов, а те уже потом пусть доносят до хозяев то что важно/нужно/безопасно в понятной форме.

~~AntonI~~ ★★★★★
(05.06.24 08:51:13 MSK)

Ну, что там, как прогресс, ТС, натянул Джеймса Бонда на кожаного? Не тяни резину, давай.

Владимир

anonymous
(05.06.24 09:39:33 MSK)

https://i.kym-cdn.com/entries/icons/facebook/000/040/006/newsfeedjamesbondburger.jpg

anonymous
(05.06.24 09:41:02 MSK)

Ответ на: комментарий от CrX 04.06.24 19:13:09 MSK

Кстати, там первые 12 байт можно отрезать. В начале идёт «RIFF», затем 4 байта на размер файла (его можно высчитать же из собственно размера), и затем WEBP. Можно их отрезать, а потом обратно приделывать, когда нужны.

Давно я такого байтодрочерства не читал. Прямо как музыка для ушей после современного подхода(200Мб хелловорлд - пофиг) к разработке.

Loki13 ★★★★★
(05.06.24 10:22:20 MSK)
Последнее исправление: Loki13 05.06.24 10:25:43 MSK (всего исправлений: 1)

Сделай как у гитхаба дефолтные юзерпики. Чего мучаешься.

einhander ★★★★★
(05.06.24 10:31:03 MSK)

Ответ на: комментарий от anonymous 04.06.24 19:02:31 MSK

YUV422

вот, кстати, да, если использовать современные алгоритмы сжатия на нейросетях, которые сжимают с плотностью до 1 бита на байт, без потерь, то картинку 32x32, где всего 1024 пиксела, получится сжать в `(1024 + 512 + 512) / 8 = 256 байт. это lossless. если же взять YUV420, то получится уложиться в 192 байта.

а если lossy, то там до сотни раз можно сжатие получить.

но это в теории. на практике, конечно, чобы это реализовать, надо быть белларом, не меньше.

anonymous
(05.06.24 11:44:32 MSK)

Ответ на: комментарий от CrX 04.06.24 19:11:14 MSK

а вместо RGB использовать, например YUV

или hsl например 3,3,4

~~asdpm~~
(05.06.24 12:53:44 MSK)

Ответ на: комментарий от anonymous 05.06.24 11:44:32 MSK

современные алгоритмы сжатия на нейросетях

гуглится по «learned image compression».

вот, отличный алгоритм с готовыми моделями: https://github.com/JiangWeibeta/MLIC

в сравнении с другими алгоритмами, включая jpeg и bpg от беллара, на ультра низких bpp (bits per pixel): https://0x0.st/Xq0L.png

в публикации они почему-то не сравнивают свой алгоритм визуально с ещё одним очень крутым — ELIC, реализация которого тоже есть на гитхабе, на без готовых моделей.

если на один пиксел будет приходится 0.2 бита, то за 200 байт тс сможет передавать полноцветные картинки приемлемого качества размером 100x80 пикселов. в теории, опять же)

anonymous
(05.06.24 15:19:34 MSK)

Самый жесткий формат по сжатию что lossy что lossless из того что сейчас более-менее имеет библиотеки и разработчиков и не огорожено копирастами и патентами это JPEG XL

peregrine ★★★★★
(05.06.24 19:02:40 MSK)

Ответ на: комментарий от CrX 04.06.24 14:47:04 MSK

Но если там не пиксельное, а ресайз фоток, то такой вариант не пойдёт

можно нейронку подключить для ресайза пиксельного. Как финальную стилизацию делают всякими LoRA (кстати тут она и нужна), по идее можно взять/научить свою которая будет уменьшать количество цветов и вообще упрощать картинку

peregrine ★★★★★
(05.06.24 19:07:23 MSK)
Последнее исправление: peregrine 05.06.24 19:08:32 MSK (всего исправлений: 2)

Ответ на: комментарий от CrX 04.06.24 14:49:26 MSK

Тут можно про веса первого слоя или какого-то промежуточного нейронки подумать. Возможно там более компактно уже будет всё.

peregrine ★★★★★
(05.06.24 19:12:09 MSK)

Ответ на: комментарий от Nervous 04.06.24 18:37:20 MSK

Не уверен... Может у меня нос плохой конечно, но скорее память на запахи, но запахов я не так много запоминаю (представить себе картинку звук в голове как нефиг делать, представить запах можно, но гораздо труднее). Не больше пары десятков могу легко представить с которыми регулярно контактирую, например запах скошенной травы или сирени потому как и траву скошенную каждое лето встречаю и сирени кустов 10 у меня растёт. Хотя отличить один запах от другого могу без проблем.

peregrine ★★★★★
(05.06.24 19:20:59 MSK)

Ответ на: комментарий от AntonI 05.06.24 08:49:11 MSK

Ля, одинаково мыслим. Как вариант кривая гильберта не лучше будет?

peregrine ★★★★★
(05.06.24 19:25:06 MSK)

Ответ на: комментарий от peregrine 05.06.24 19:25:06 MSK

Её гораздо сложнее реализовывать емнип.

~~AntonI~~ ★★★★★
(05.06.24 19:40:03 MSK)

Ответ на: комментарий от peregrine 05.06.24 19:02:40 MSK

JPEG XL

a avif разве не лучше на низких bpp? да и с распространённостью у него, вроде бы получше.

где ты смотрел сравнения форматов? я весь интернет перерыл, ничего вразумительного не нашёл.

anonymous
(05.06.24 21:43:04 MSK)

Ответ на: комментарий от anonymous 05.06.24 21:43:04 MSK

С распространённостью точно хуже у avif, по крайней мере в перспективе, потому как на JPEG XL уже завязались крупные проекты.

peregrine ★★★★★
(06.06.24 10:48:55 MSK)

Ответ на: комментарий от peregrine 06.06.24 10:48:55 MSK

в перспективе — возможно, но в данный момент в браузерах jxl не поддерживается, а хром и вовсе задеприкейтил формат.

Status: Won’t fix (Obsolete)

ну да ладно, формат-то на самом деле топовый, особенно если учесть скорость кодирования.

я пошарился по исходниками и нашёл факт, который может быть интересен DumLemming’у. у avif заголовок файла, занимающий в лучшем случае около 300 байт (282) не сжимается компрессором и поэтому его можно отрезать, если у изображений будет один и тот же формат пикселей и разрешение.

(в jxl, к сожалению, жмётся всё, кроме первых двух магических байтов.)

вот, для примера, картинка 40x40 с джеймсом бондом, которая будет весить 201 байт, если отрезать от неё заголовок. оригинал в png.

скрипт для отрезания avif-заголовка: https://0x0.st/XbHC.py

convert any_image.ext -strip -resize 40x40\! -alpha off image.png
avifenc -s 0 --target-size 482 image.png image.avif
# или avifenc -s 0 -q ...
./avifx.py image.avif > image.avifx
./avifx.py -d image.avifx > image.avif

anonymous
(06.06.24 16:10:27 MSK)

Ответ на: комментарий от anonymous 06.06.24 16:10:27 MSK

Хромому надо своё проталкивать. Но его никто и спрашивать вместе с гуглом не будет.

peregrine ★★★★★
(06.06.24 16:13:35 MSK)

Ответ на: комментарий от peregrine 06.06.24 16:13:35 MSK

Но его никто и спрашивать вместе с гуглом не будет.

Хочется верить, но верится с трудом.

CrX ★★★★★
(06.06.24 16:16:19 MSK)

← 1 2 →

←	Вопрос по C и C++: как определения автоматически превратить в декларации?

Development

Вспомогательные задачи в Spring-приложении

→

Похожие темы