LINUX.ORG.RU

Oбработка PDF


0

0

Всем привет! Люди, может кому приходилось обрабатывать данные, содержащиеся в pdf-файлах? Под обрабатывать я понимаю извлечение текстовой части, несущей смысловую нагрузку. Я нашел несколько библиотек, но все они абсолютно некорректо обрабатывают текст, содержащий слова на русском языке. Если у кого есть какие соображения на этот счет, поделитесь, плс...

Сергей

anonymous

Cоображения самого общего плана - man xpdfrc
Там есть что-то про in-encoding out-encoding - может это то что надо?

anonymous
()

К сожалению, нет:(, но все равно спасибо.

anonymous
()

?? ??????, ? ?? ??? ???? ?????? -enc! ??????? ???? ?????????:)

anonymous
()

?? ??????, ? ?? ??? ???? ?????? -enc! ??????? ???? ?????????:)

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.