История изменений
Исправление firkax, (текущая версия) :
Суй в поисковик. Иначе тебе придётся самостоятельно реализовывать значительную часть его алгоритма, и вряд ли ты за ними в этом угонишься.
А так, ну убери все знаки препинания, сделай промежутки между словами везде ровно 1 пробел, бей по 20 слов например. Только если индексировать образцы можно по 20 отдельных слов, то проверять схожесть придётся скользящим окном по 20 слов на проверяемом тексте. Или наоборот - индексировать скользящим окном, проверять отдельными.
Для картинок перцептивный хэш (perceptual hash).
Исходная версия firkax, :
Суй в поисковик. Иначе тебе придётся самостоятельно реализовывать значительную часть его алгоритма, и вряд ли ты за ними в этом угонишься.