LINUX.ORG.RU

История изменений

Исправление question4, (текущая версия) :

Copyfish

± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.

- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.

+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.

+ Кнопки Redo OCR и Recapture есть и работают.

+ Позволяет выбрать участок изображения. Полезно для «Страдающего Средневековья».

+ Копирует текст в буфер обмена.

- Нельзя распознавать несколько языков.

Исходная версия question4, :

Copyfish

± Использует свой собственный движок UI.Vision. Если я правильно понял их вебсайт, базовая версия открыто-свободная, но исходников модуля OCR я не нашёл.

- Для распознавания все изображения отсылаются на удалённый сервер. Или можно поставить закрытый(?) бинарник для анализа. Есть версии для Windows, MacOS и Linux.

+ Нормально распознаются изображения в <IMG ...> и в отдельных вкладках.

- Не умеет работать с фоновыми изображениями.

± Нормально распознал серый текст на сером фоне, с которым не справился Tesseract. Но тут же пропустил кусок чёрного текста на сером фоне, с которым у Tesseract-а проблем не бывало.

+ Кнопка Redo OCR есть и работает.