Есть файл с большим количеством слов, в том числе большим количеством неправильных, точнее говоря, буквенного мусора. Отделение последнего удобно было бы с помощью проверки орфографии. Проверяю их
cat filename| ispell -a -d american >newfilename
cat filename |aspell -a >newfilename
После проверки в newfilename и от aspell, и от ispell много "слов" типа
aaabbbcccdddeeefffggghhhiiijjjkkklllmmmnnnooopppqqqrrrssstttuuuvvvwwwxxxyyyzzz, aaaf aaafcd aaag aaatt aabbc aabc aabcdghipqsuwwxxvvwxwpga
и подобной дребедени. при этом файл от aspell в 3 раза больше файла от ispell. У кого-нибудь такое есть? Куда копать?
Заранее спасибо за ответ.