Есть у меня вектора признаков, в которых 99% элементов == 0 (в данном случае - количество конкретных слов в тексте). Надобно найти N наиболее похожих текстов в базе (база не слишком большая, перебрать все - таки да, можно).
Какую метрику использовать в таких случаях? Евклидова, подозреваю, далеко не лучший вариант.