LINUX.ORG.RU

Ispell и aspell неправильно работают


0

0

Есть файл с большим количеством слов, в том числе большим количеством неправильных, точнее говоря, буквенного мусора. Отделение последнего удобно было бы с помощью проверки орфографии. Проверяю их

cat filename| ispell -a -d american >newfilename

cat filename |aspell -a >newfilename

После проверки в newfilename и от aspell, и от ispell много "слов" типа

aaabbbcccdddeeefffggghhhiiijjjkkklllmmmnnnooopppqqqrrrssstttuuuvvvwwwxxxyyyzzz, aaaf aaafcd aaag aaatt aabbc aabc aabcdghipqsuwwxxvvwxwpga

и подобной дребедени. при этом файл от aspell в 3 раза больше файла от ispell. У кого-нибудь такое есть? Куда копать?

Заранее спасибо за ответ.

anonymous
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.