LINUX.ORG.RU

История изменений

Исправление firkax, (текущая версия) :

Суй в поисковик. Иначе тебе придётся самостоятельно реализовывать значительную часть его алгоритма, и вряд ли ты за ними в этом угонишься.

А так, ну убери все знаки препинания, сделай промежутки между словами везде ровно 1 пробел, бей по 20 слов например. Только если индексировать образцы можно по 20 отдельных слов, то проверять схожесть придётся скользящим окном по 20 слов на проверяемом тексте. Или наоборот - индексировать скользящим окном, проверять отдельными.

Для картинок перцептивный хэш (perceptual hash).

Исходная версия firkax, :

Суй в поисковик. Иначе тебе придётся самостоятельно реализовывать значительную часть его алгоритма, и вряд ли ты за ними в этом угонишься.