Добрый день.
Есть задача идентификации похожих слов(пока только русский и англ. языки).
Рассматриваемые варианты:
- идентифицировать по корню слова - перечислить все приставки, суффиксы, окончания (или сами корни :) ) и выделять корни из слов.
- представлять слово, как график зависимости веса буквы от её положения в слове(к примеру параболическая зависимость). Тогда по сумме весов, помноженных на коэф. положения в слове(спектр), к примеру опять же, можно судить о похожести слов.
Как бы 2 варианта - первое что пришло в голову и вряд ли лучшее. Задача давно известна, наверняка здесь есть люди, знакомые с ней.
Также в зависимости от решения можно будет подумать о способе составления словаря.