LINUX.ORG.RU

Как текст или как картинку? С сохранением логической структуры или без? В любом случае, однозначно не TeX :)

Deleted
()
Ответ на: комментарий от jackill

GOCR is an OCR (Optical Character Recognition) program,
developed under the GNU Public License.

- кто-нибудь пробовал? Что за зверь?

anonymous
()
Ответ на: комментарий от anonymous

Он не работает с русским. Поэтому он тебе не поможет. К тому же у него ограниченное распознавание шрифтов. На таймс много ошибок, например.

jackill ★★★★★
()
Ответ на: комментарий от anonymous

> 2 dimss С сохранением логической структуры... Как?

Нужно ли иметь логическое разделение на главы, абзацы и пр.? Если так, то документ удобно представлять во всяких XML и SGML. Вот только после распознавания придётся вручную восстанавливать эту структуру.

Deleted
()
Ответ на: комментарий от anonymous

Похрен. Смысл в том, что русский ему не распознать.

Я все эти темы пробовал. У него каждый язык поддерживается отдельно (4 штуки). Английский, напечатанный чем-то похожим на arial распознается хорошо, а все остально - в помойку.

jackill ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.