LINUX.ORG.RU
решено ФорумTalks

Как спасать нерезкие снимки текста?

 , ,


2

1

Следуя опыту великих дигитализаторов сканирую книги с помощью двух мыльниц Canon с CHDK. Получается замечательно, распознаётся релиабильно, но есть проблема - у одного аппарата поврежден объектив (или ещё что-то, он вообще б/ушный ударник) и один из углов кадра всегда вне фокуса.

К сожалению, я уже отсканировал этим фотоаппаратом несколько книг. Они вполне читаемы, даже с этим дефектом - лишь последние слова в нескольких строках размыты, из-за чего не оцрятся.

Можно ли исправить эту проблему хитрой обработкой изображения?

P.S. флатбед сканер не предлагать, это неоправданные затраты по времени. Из другого (полностью исправного) фотоаппарата страницы получаются вполне себе на уровне Цифровой Национальной Библиотеки «Полона». К тому же, чувствительные к разрешению вещи вроде карт и схем сканирую отдельно на обычным плоским сканере (если не лень если они достаточно важны и не продублированы в других источниках в гораздо лучшем качестве, как большинство фотографий, например)

Вопрос самого неисправного фотоаппарата уже решён, и в дальнейшем он не будет использоваться.

Часто задаваемые (и вполне резонные) вопросы

Нет ли здесь 6.2? Нет. Мои оцифровки никогда нигде не выкладывались. Это не по пиркоду, за то соответствует определённым в польском Законе об авторских правах принципам разрешённого законом частного использования (~fair use), вследствие чего не беспокоят ни лоеры правообладателей, ни пан аспирант, ни администрация говнообменников (последнее самое печальное - у нас не прижились торренты, самой большой трекер в стране был private и платным, итог немного предсказуем - в 2009 году канул в Лету, сидеры разбежались, сцена умирает. Лишь студентота активно обменивается академической литературой через говнообменники, причем платные.

Тогда какой смысл? Возможность создать полнотекстовый индекс используемой мною литературы - бесценна. Из-за этого мне ничуть не жалко ни полчаса потраченного с фотоаппаратом, ни часа-двух с плоским сканером.

Почему фотоаппараты? Камера, смотрящая перпендикулярно в страницу, это state of the art в этом деле. Конечно в библиотечных сканерах и камеры хорошие, и равномерное освещение, и калибровка цветов - но для самого текста всё это не особо-то и нужно.

★★★★★

Последнее исправление: token_polyak (всего исправлений: 5)
Ответ на: комментарий от goingUp

Не переснимать же пару тысяч страниц.

token_polyak ★★★★★
() автор топика

Можно ли исправить эту проблему хитрой обработкой изображения?

Можно, например, SmartDeblur ©
и аналоги, основанные на инверсной винеровской фильтрации ©.

Ежели хочешь самодельный согласованный фильтр в частотной области, то сделай тестовое фото точечного поля дефектной камерой и найди её фурье-образ, далее коррекция спектра, умножение на спектр фотографий и обратное преобразование Фурье ©.

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Можно, например, SmartDeblur ©

и аналоги, основанные на инверсной винеровской фильтрации ©.

Спасибо - оказывается, ImageJ всё это умеет. Попробую.

тестовое фото точечного поля

Сгенерированного листа с равномерно распределёнными точками, что-ли?

token_polyak ★★★★★
() автор топика
Ответ на: комментарий от token_polyak

Сгенерированного листа с равномерно распределёнными точками, что-ли?

Ага.

quickquest ★★★★★
()

распознаётся релиабильно

Что это значит? Ты фотографируешь и загоняешь изображения в софт для распознавания текста?

hateWin ★☆
()
Ответ на: комментарий от hateWin

Да. И если фотоаппарат строго перпендикулярно странице, которая к тому же освещается достаточно мощным источником света, то текст распознаётся практически без ошибок.

token_polyak ★★★★★
() автор топика
Ответ на: комментарий от hateWin

По большому счету использую FineReader, он воистине лучший на рынке. Но и Тессеракт справляется.

Предобработку FineReader делает свою, но свободный ScanTailor получше.

token_polyak ★★★★★
() автор топика
Последнее исправление: token_polyak (всего исправлений: 1)
Ответ на: комментарий от hateWin

Переломным моментом в моем занятии этим делом было приобретение оргстеклянного кубика 30х30х30 см. К нему плотно прижимаются страницы, фотоаппарат закреплён на противоположной стенке, всё плоско, перпендикулярно и чётко (с другим фотоаппаратом, у которого нет дефекта).

token_polyak ★★★★★
() автор топика

Нет ли здесь 6.2? Нет

6.2. только про ссылки, а вообще неприятно что ты сходу оправдываешься на эту тему. Информацию можно и нужно неограниченно копировать не смотря ни никакие лицензии и авторские права.

slovazap ★★★★★
()
Последнее исправление: slovazap (всего исправлений: 1)
Ответ на: комментарий от quickquest

тестовое фото точечного поля

Вылезай из пещеры. У нас тут прогресс в 21 веке :)

Roland Shack, Characteristics of an Image-Forming system (C). В разделе 2.2 почему измерения точек плохи, и вместо них knife-edge method.

Для цифровых камер есть специфика, квадратные пиксели. Поэтому давно уже используют slanted-edge method, см. ISO 12233. Одна из реализаций: F. van den Bergh, MTF Mapper (C).

…фурье…

Консьюмерские объективы вообще non-space-invariant. А в специфике ТСа (дефектный угол) и подавно.

ТС, не слушай нас, будет проще переснять 10,000 страниц ;)

the1 ★★
()
Последнее исправление: the1 (всего исправлений: 4)
Ответ на: комментарий от the1

Вылезай из пещеры. У нас тут прогресс в 21 веке :)

ТС’у нужен быстрый результат в пакетном режиме, и искажения в углу, как я понял, не настолько большие, чтобы отказываться от «пещерных методов», тем более, что самодельный фильтр, используя готовые библиотеки, несложно сотворить за 1 вечер.

ТС, не слушай нас, будет проще переснять 10,000 страниц ;)

Ага, проще, но медленне-е-е :)

quickquest ★★★★★
()
Ответ на: комментарий от quickquest

Ну не знаю. Я помню ряд мест, где меня «макали». Улыбался, и благодарил за ссылки. А не продолжал упорно нести чушь.

the1 ★★
()
Ответ на: комментарий от the1

А не продолжал упорно нести чушь.

Инверсная винеровская фильтрация, применяемая в большинстве фоторедакторов – это чушь? И угол можно задать зоной фильтрации.

Для цифровых камер есть специфика, квадратные пиксели.

Дык, коррекция нужна не с точностью до пикселя для космической разведки, а с точностью до буквы, годной для распознавания.

quickquest ★★★★★
()
Ответ на: комментарий от frunobulax

Наоборот. Книга на грани кубика, один фотоаппарат на левую страницу, второй на правую. Сейчас кубик лежит стенкой на столе, но если повернуть его на 45 градусов - должно стать заметно удобнее.

За промежуток времени между приобретением кубика а покпупкой второго фотоаппарата снял одну книгу на один-единственный фотоаппарат нацеленный на переплёт - тогда, естественно, надо корректировать перспективу, но если солидно закрепить фотоаппарат (чего у меня не получилось - нечем было), то можно без разбора разрезать все изображения пополам в на определённой позиции, а затем применить одну коррекцию к всем левым/правым страницам.

token_polyak ★★★★★
() автор топика
Последнее исправление: token_polyak (всего исправлений: 1)
Ответ на: комментарий от quickquest

ТС’у нужен быстрый результат в пакетном режиме, и искажения в углу, как я понял, не настолько большие, чтобы отказываться от «пещерных методов»

В данном случае даже оверкилльный вариант на нейросетках тратит лишь полминуты на страницу, так что.

token_polyak ★★★★★
() автор топика

Щупая разные утилиты, успел хорошенько приглядеться изображениям и заметил, что дефект отчасти похож на нечёткость, но в то же время - напоминает двоение.

С плагинами для смазанных кадров я добился лучших результатов, чем с unsharp или focus.

Подобие кнопки «сделать заебись» предоставила утилита Topaz Sharpen AI, но а) платная проприетарщина и б) хотелось бы за 35 секунд обработать не одну страницу, а все (или хотя бы несколько), так что буду изучать винеровский фильтр и MTF.

token_polyak ★★★★★
() автор топика
Последнее исправление: token_polyak (всего исправлений: 1)
Ответ на: комментарий от the1

F. van den Bergh, MTF Mapper

Тупой вопрос: а чё с ним дальше делать? Получил кучу нумерических данных, а для каких методов коррекции они подходят? Можно ли из них сделать кернель для деконволюции? Как?

token_polyak ★★★★★
() автор топика
Последнее исправление: token_polyak (всего исправлений: 1)
Ответ на: комментарий от token_polyak

Извиняюсь, только что увидел твой пост.

для каких методов коррекции они подходят?

Для любых, каких хочешь. Зависит от задачи. Сейчас как я понял Винера никто не использует, Richardson-Lucy лучше.

Можно ли из них сделать кернель для деконволюции?

Извиняюсь, но вопрос показывает что ты совсем не в теме. Там квиквест давал ссылку, на wiki.technicalvision.ru. Я не люблю вики для технических целей, но там вроде всё это описано.

Если кратко: в координатном пространстве редко когда фильтруют. Фильтруют в фурье пр-ве. MTF – это модуль от фурье от отклика. Точнее модуль вдоль некоторой линии на фурье-плоскости. Именно она (только не модуль, а вся, комплексная, надо будет подумать как она получается) тебе и нужна. Делишь (фурье-образ) картинки на эту МТФ в фурье пространстве, и потом обратно.

Однако. Я повторюсь:

Консьюмерские объективы вообще non-space-invariant. А в специфике ТСа (дефектный угол) и подавно.

В юзер-гайде Берг пишет что МТФ сильно разная для направлений вдоль и поперёк радиуса. И зависит от радиуса. Поэтому для потребительской оптики это всё… мало-применимо, так скажем (для специализированной – безусловно, нужно, и используется). Можно пробовать разбивать на зоны (как предложил квиквест), но на границах зон будут артефакты. Насколько плохие – х.з. Возможно понадобится много зон. И потом как-то сшивать полученные картинки в разных зонах.

Я ещё по здравому смыслу забраковал идею квиквеста. Если бы так делалось для потребительской оптики, оно давно бы было в фотошопах. Примерно как есть коррекция дисторсии и виньетирования. Раз такого нет – значит тебя ждёт не быстрый квест. Поэтому я и написал:

не слушай нас, будет проще переснять 10,000 страниц ;)

PS.

У меня самого опыта здесь нет. Я просто об этом думал в своё время. Но во всём что написал – вполне уверен.

PS2.

Кстати, возможно поэтому Эппл перестали выдавать raw-данные с сенсоров в айфонах (раньше выдавали). Потому что сделали специализированную оптику, которая выглядит размытой (фотографы скажут фи!), но зато действительно space-invariant. А обработку (деконволюцию) делегировали софту. И их фотоаппараты на айфонах рвут всех, потому что там настоящий шарпенинг, а не дурацкий unsharp-mask. Нас (потребителей) возможно ещё ждёт революция в фото, когда до всех дойдёт что глупо требовать от оптики то, что можно легко делегировать софту.

the1 ★★
()
Последнее исправление: the1 (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.