классически метод:
берем фразу, бъем на слова, для каждого слова проводим морфологический анализ (часть речи, род, число) - лемматизация - склонение (inflection в моем случае по падежам)
склонение - проще всего и это уже есть (набор правил + исключения), а вот с определением части речи и т.п. - заморочка, найденные решения как правило построены на обучении и таскании с собой толстой модели языка
нужно что-то максимально простое - некий алгоритм который можно быстро нашкодить не притягивая всякие DAWG для алгоритма.
ps. яп - java