Oбработка PDF

0

0

Всем привет! Люди, может кому приходилось обрабатывать данные, содержащиеся в pdf-файлах? Под обрабатывать я понимаю извлечение текстовой части, несущей смысловую нагрузку. Я нашел несколько библиотек, но все они абсолютно некорректо обрабатывают текст, содержащий слова на русском языке. Если у кого есть какие соображения на этот счет, поделитесь, плс...

Сергей

Ссылка

←

gcc-3.2.1

Объясните сие явление!

→

Cоображения самого общего плана - man xpdfrc
Там есть что-то про in-encoding out-encoding - может это то что надо?

anonymous
(25.11.02 14:40:33 MSK)

Ссылка

К сожалению, нет:(, но все равно спасибо.

anonymous
(25.11.02 21:53:29 MSK)

Ссылка

?? ??????, ? ?? ??? ???? ?????? -enc! ??????? ???? ?????????:)

anonymous
(27.11.02 20:45:31 MSK)

Ссылка

?? ??????, ? ?? ??? ???? ?????? -enc! ??????? ???? ?????????:)

anonymous
(28.11.02 11:45:57 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←

gcc-3.2.1

Объясните сие явление!

→