История изменений
Исправление question4, (текущая версия) :
Copyfish
± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.
- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.
+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.
- Не умеет работать с фоновыми изображениями.
± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.
+ Кнопки Redo OCR и Recapture есть и работают.
+ Позволяет выбрать участок изображения. Полезно для «Страдающего Средневековья».
+ Копирует текст в буфер обмена.
- Нельзя распознавать несколько языков.
Исходная версия question4, :
Copyfish
± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.
- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.
+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.
- Не умеет работать с фоновыми изображениями.
± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.
+ Кнопка Redo OCR есть и работает.