LINUX.ORG.RU

Есть ли отработаенные библиотеки или описания нечткого поиска по дистации?

 ,


1

1

Есть ли такие сделанные базы данных или просто описания алгоритмов, где можно находить множество наиболее ближайших объектов по дистации? Дистация это как вариант квадратичная разница свойств. Типа как если находить наиболее подобные изображения или звук из базы по заданному образцу.

Ответ на: комментарий от AKonia

Я у мамы инженер: неуросеточки и корреляция.

Плохо тебя мама учила.

victor79
() автор топика
Последнее исправление: victor79 (всего исправлений: 1)
Ответ на: комментарий от AKonia

Я у мамы инженер: неуросеточки и корреляция.

проблема не в сравнении двух картинок и вычисления дистации их различия, а в том что бы найти наиболее подобные среди миллионов картинок из базы. Вероятно какое-нибудь дерево на основе k-means.

victor79
() автор топика
Ответ на: комментарий от anonymous

Монохром ещё в некоторых алгоритмах бывает, но это, наверное, про поиск почти одинаковых картинок.

anonymous
()
Ответ на: комментарий от anonymous

Монохром ещё в некоторых алгоритмах бывает

Perceptual hashing library имеешь в виду? Так цели слегка разные: в данном случае просто сравнить, в phash - некий хэш.

anonymous
()
Ответ на: комментарий от anonymous

-> resize to 32x32 -> jpeg compare dct

это не избавляет от миллиона сравнений, если выбрать нужно из миллиона вариантов.

victor79
() автор топика
Ответ на: комментарий от victor79

это не избавляет от миллиона сравнений

Естественно. Только если ты сравниваем между собой, а не с заранее выбранными «темами». С «темами» сравнений будет значительно меньше (зависит от кол-ва «тем»).

anonymous
()
Ответ на: комментарий от anonymous

Естественно. Только если ты сравниваем между собой, а не с заранее выбранными «темами». С «темами» сравнений будет значительно меньше (зависит от кол-ва «тем»).

Ну естественно, сама по себе «тема» это разделитель вариантов, такой же как уровень дерева поиска. И определение темы это затраты по вычислениям такие же как и затраты на уровень дерева поиска.

Но меня сейчас интересует использование чего-то типа k-means в качестве разделителя.

victor79
() автор топика
Ответ на: комментарий от victor79

меня сейчас интересует использование чего-то типа k-means в качестве разделителя.

Для эффективного пользования k-means тебе всё-равно понадобится набор из N «ключевых» изображений. По N-мерному полю показателей «дистанций» построишь разбиение с помощью k-means, получишь «темы».

anonymous
()
Ответ на: комментарий от anonymous

Для эффективного пользования k-means тебе всё-равно понадобится набор из N «ключевых» изображений

Это все понятно, и даже понятно как организовать это в дерево разбивок. Интересует опыт других построения такого дерева поиска.

victor79
() автор топика
23 июля 2020 г.

Есть. Функция «дистанции» очень важна. Квадратичная разница свойств намного проще некоторых других, не менее важных функций для упорядочивания «расстояний».

Гугли «задачу поиска ближайшего соседа». Есть базы с встроенной поддержкой такого функционала.

anonymous
()
Ответ на: комментарий от anonymous

Квадратичная разница свойств намного проще некоторых других

Да щас прям: dist = (a < b) ? (b - a) : (a - b);

anonymous
()
Ответ на: комментарий от anonymous

Проще чем скалярное произведение.

anonymous
()

Дайте ему готовые решения целого класса задач. «Задача поиска ближайшего соседа». Например, это модная тема в модном машинном обучении, но это только малая часть. Там копать и копать, если копать в ширину - тебе жизни не хватит для изучения.

anonymous
()
Ответ на: комментарий от anonymous

Жизни то хватит.

Можешь за жизнь осилить всю топологию (раздел математики). А это всего лишь база для задачи поиска ближайшего соседа.

anonymous
()
Ответ на: комментарий от anonymous

за жизнь осилить всю топологию

Не надо приукрашать и превозносить возможности человека (любого). Человек будет лишь ориентироваться в «вопросе», а «осилит» он только то, чем сам непосредственно заниматься будет. Такое вот Се-Ля-Ви. Не веришь? Спроси любого.

anonymous
()
Ответ на: комментарий от anonymous

«осилит» он только то

Для этого надо задавать конкретный вопрос, а не общий. Для этого надо копать в глубину, а не в ширину, и надеяться что есть дно.

anonymous
()

То что ты описал похоже на кластеризацию.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 1)
Ответ на: комментарий от anonymous

Смотря как долго планировать жить.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.