LINUX.ORG.RU

pdf to txt


0

0

Есть такая задача: конвертировать 100-мегабайтный pdf-файл, состоящий из отсканированного, но не распозанного текста (т.е. просто картинки, загнанные в pdf), в plain-text. У меня под cxoffice стоит ABBYY FineReader Sprint 5.0. Но он, похоже, pdf открывать не может. Тогда нужно как-то перегнать pdf в картинку и только тогда распознавать.

Внимание вопрос: Как сделать pdf => bmp или что-нибудь похожее?

★★★★

ghostscript

anonymous
()

Самый простой способ - 6-й FineReader.
И больше таких глюпых pdf не делай :)
Для нераспознанного текста хорош djvu

Shadow ★★★★★
()
Ответ на: комментарий от Shadow

>Самый простой способ - 6-й FineReader.

Только он у меня под crossover office не ставится :(

K48 ★★★★
() автор топика
Ответ на: комментарий от jackill

Спасибо, но: Error: Copying of images from this document is not allowed.

Что делать?

K48 ★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.