LINUX.ORG.RU

Ответ на: комментарий от Nazgul

Вроде он нормально(по крайней мере 5 версии) шел под CrossOver office.

mihelson
()
Ответ на: комментарий от mihelson

Есть, почему же.. ClaraOCR, например. А вообще Google в руки.. FineReader есть под линь. правда, только шестой. И требует серийник виндового Fine'а

GreyDoom ★★★★
()

Товарищи, Вы чего? Седьмой акробат имеет русский OCR (надо доп плагины ставить), да и полвина софта для для работы с djvu тоже поддерживает. Только конечно все требует серийников или работает ОЧЕНЬ медленно.

soomrack ★★★★★
()
Ответ на: комментарий от soomrack

>Седьмой акробат имеет русский OCR

Можно подробнее о чём тут речь?

>Только конечно все требует серийников или работает ОЧЕНЬ медленно.

Либо серийник и всё быстро, либо без него и с тормозами? ;)

vovans ★★★★★
()
Ответ на: комментарий от vovans

Седьмой акробат (не реадер!) поддерживает русский OCR, т.е. когда Вы открываете какой-нибудь текст у Вас есть возможность выполнить для него OCR. По-моему нужно ставить доп. плагин. Для винды у меня сие есть. Для линукса версией пока не озаботился.

Теперь на счет djvu. Ситуация аналогичная. Есть например, кажется, Editor --- только для поверхностного редактирования. Более мощный софт это... БЛИН ДИСК СПЕРЛИ!!! 8Гб софта для DjVu. Ну что за люди! Короче был у меня один пакетный преобразователь файлов в этот формат он тоже мог еще и OCR проводить. Разумеется требовал лицензии. Говорят есть и бесплатная версия, т.к. вначале djvu было в основном некоммерческим.

огромный список программ есть на http://www.djvu-soft.narod.ru/ когда-то у меня была копия этого сайта. В основном пользовался Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR), правда под винду.

Если найдешь там что-то с открытым кодом и OCR кинь ссылку, интересно.

soomrack ★★★★★
()
Ответ на: комментарий от soomrack

>Седьмой акробат (не реадер!) поддерживает русский OCR, т.е. когда Вы открываете какой-нибудь текст у Вас есть возможность выполнить для него OCR

Открой для себя kpdf =)) Но речь разве об этом шла? По-моему, это всё не совсем то.

vovans ★★★★★
()
Ответ на: комментарий от vovans

А где Вы в kpdf OCR нашли? В седьмом акробате в явном виде есть утилита позволяющая провести "OCR" распознование текста. "OCR" сказано в явном виде. В kpdf я этого не нашел.

soomrack ★★★★★
()
Ответ на: комментарий от vovans

Выделить Вы сможете только тот текст который записан как текст в
pdf-файле. OCR обрабатывает картинку. Гм, чтобы было понятнее приведу примерный план действий.

1) Сканируете страницу из книги, получаете jpg-файл.
2) Сохраняете его как pdf.
Итог: у вас есть pdf-файл в котором содержится только картинка в формате jpg. Выделить текст в ней Вы не сумеете, т.к. его там просто нет!
3) Теперь открываете его седьмым акробатом, у него есть где-то в меню
возможность применить OCR к файлу.
Итог: у Вас есть файл, в котором есть картинка + некоторый текст,
который получен OCR. Текст находится в "невидимом" слое. Т.е. при
просмотре Вы по-прежнему видите картинку, но теперь можете выделять
текст. Более подробно см. по ссылке, которую я указал ранее.

soomrack ★★★★★
()
Ответ на: комментарий от soomrack

Копировал из книг, которые выглядят как отсканированные. Ну, прям чёрные полосы по бокам... Это разве они как текст? Что-то не похоже ;)

vovans ★★★★★
()
Ответ на: комментарий от soomrack

т.е. это как? По страницам видно, что он и сканированные! Вообще, взял бы сам kpdf и проверил. А то говорим непонятно о чём. (у меня сейчас нет возможности проверить)

vovans ★★★★★
()
Ответ на: комментарий от vovans

Я еще раз повторяю, что OCR не означает ТОЛЬКО текст. Технология OCR позволяет совмещать текст распознанный и отсканированный, т.к. при распознавании неизбежны ошибки. Вы видите одновременно и ОТСКАНИРОВАННЫЙ текст (картинка, полосы, буквы...) и РАСПОЗНАННЫЙ текст (то, что Вы выделяете).

Более подробно об этом в djvu читайте на http://www.cqham.ru/djvu_ocr.htm

soomrack ★★★★★
()

По-моему ничего нет. FineReader толи был толи есть толи планируется под
linux, но там были каки-то странные заморочки. Толи только сервер. толи что-то ещё.

Но с Вашими талантами, глядишь скоро и поавится:-D

anonymous
()

Клара. Но только дорогущаая

Orlangoor ★★★★★
()
Ответ на: комментарий от anonymous

Это раньше не предусматривало, теперь есть отдельный OCR-слой.

dn2010 ★★★★★
()
Ответ на: комментарий от anonymous

Какой еще сервер????? SDK может быть? Так это не заморочка ;) Это вообще не то ;))))))))

vovans ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.