Как спасать нерезкие снимки текста?
Следуя опыту великих дигитализаторов сканирую книги с помощью двух мыльниц Canon с CHDK. Получается замечательно, распознаётся релиабильно, но есть проблема - у одного аппарата поврежден объектив (или ещё что-то, он вообще б/ушный ударник) и один из углов кадра всегда вне фокуса.
К сожалению, я уже отсканировал этим фотоаппаратом несколько книг. Они вполне читаемы, даже с этим дефектом - лишь последние слова в нескольких строках размыты, из-за чего не оцрятся.
Можно ли исправить эту проблему хитрой обработкой изображения?
P.S. флатбед сканер не предлагать, это неоправданные затраты по времени. Из другого (полностью исправного) фотоаппарата страницы получаются вполне себе на уровне Цифровой Национальной Библиотеки «Полона». К тому же, чувствительные к разрешению вещи вроде карт и схем сканирую отдельно на обычным плоским сканере (если не лень если они достаточно важны и не продублированы в других источниках в гораздо лучшем качестве, как большинство фотографий, например)
Вопрос самого неисправного фотоаппарата уже решён, и в дальнейшем он не будет использоваться.
Часто задаваемые (и вполне резонные) вопросы
Нет ли здесь 6.2? Нет. Мои оцифровки никогда нигде не выкладывались. Это не по пиркоду, за то соответствует определённым в польском Законе об авторских правах принципам разрешённого законом частного использования (~fair use), вследствие чего не беспокоят ни лоеры правообладателей, ни пан аспирант, ни администрация говнообменников (последнее самое печальное - у нас не прижились торренты, самой большой трекер в стране был private и платным, итог немного предсказуем - в 2009 году канул в Лету, сидеры разбежались, сцена умирает. Лишь студентота активно обменивается академической литературой через говнообменники, причем платные.
Тогда какой смысл? Возможность создать полнотекстовый индекс используемой мною литературы - бесценна. Из-за этого мне ничуть не жалко ни полчаса потраченного с фотоаппаратом, ни часа-двух с плоским сканером.
Почему фотоаппараты? Камера, смотрящая перпендикулярно в страницу, это state of the art в этом деле. Конечно в библиотечных сканерах и камеры хорошие, и равномерное освещение, и калибровка цветов - но для самого текста всё это не особо-то и нужно.