LINUX.ORG.RU

работа с pdf файлами


0

0

Очень нужна помощь начинающему программисту!

Нужно вытянуть из pdf публикации: 1) название статьи 2) название журнала, в котором была опубликована статья 3) год публикации 4) авторы, которые работали над статьей 5) абстракт (краткое содержание статьи)

затем запихать это все в базу данных (желательно в MySQL)

Как это сделать? Желательно весь процесс автоматизировать...

Заранее благодарен за любую помощь...

anonymous

man pdftotext

man pdfinfo

как автоматизировать работу с plain text придумывай сам ;)

sS ★★★★★
()
Ответ на: комментарий от sS

И еще man pdftops, возможно, из PS достать проще.

qwe ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.