Доброго времени суток!
Какие существуют открытые средства автоматической или автоматизированной обработки сканированных документов? Т.е. есть документ, в основном - печатный текст, возможно картинки (черно-белые или в градациях серого), его сканируют и превращают в набор графических файлов. Теперь надо провести обработку - выровнять крен, очистить от мусора, обрезать поля, отрегулировать контрастность, уменьшить кол-во цветов (если в градациях серого), разрезать сдвоенные страницы и т.д.
Пока нашел только unpaper - есть ли еще что-нибудь? Для массовой обработки предназначенное, графические редакторы общего назначения не интересуют.
Вообще, интересуют любые инструменты для облегчения процесса перевода документов в электронный формат. А также библиотеки реализации различных алгоритмов обработки подобных изображений.