Например есть задача нахождения наиболее похожей строки в массиве известных.
Для «устаканивания» понятий: строка здесь — цепочка utf-8 символов конечной длинны. Массив известных строк — некая итерируемая коллекция (возможно неограниченного размера).
Возникают вопросы:
- Какими критериями пользоваться для вычисления расстояния между искаемой и исходными строками?
- Какую структуру данных для коллекции лучше всего выбрать?
- Существуют ли готовые алгоритмы для этого?
Язык реализации — не существенен.